期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
求解线性约束最优化问题的有效集算法 被引量:3
1
作者 高旅端 陈志 李苏祥 《北京工业大学学报》 CAS CSCD 北大核心 2006年第3期283-288,共6页
为了保持投影梯度求解法的线性约束系数矩阵的稀疏性,且不降低算法的效率。在确定可行点处的可行方向时,使用了矩阵的隐式LU分解技术,构造有效约束的零空间.本文提出了求解线性约束最优化问题的有效集算法,对于线性约束系数矩阵是稀疏... 为了保持投影梯度求解法的线性约束系数矩阵的稀疏性,且不降低算法的效率。在确定可行点处的可行方向时,使用了矩阵的隐式LU分解技术,构造有效约束的零空间.本文提出了求解线性约束最优化问题的有效集算法,对于线性约束系数矩阵是稀疏矩阵时,能较好地保持稀疏性,提高了算法的效率.与数值试验的结果吻合. 展开更多
关键词 算法 矩阵代数 非线性规划 隐式LU分解 稀疏矩阵
在线阅读 下载PDF
块三对角矩阵的并行局部块分解预条件 被引量:4
2
作者 吴建平 王正华 李晓梅 《计算机学报》 EI CSCD 北大核心 2005年第3期414-419,共6页
该文首先分析了并行局部块分解预条件的特征分布,分析表明其与串行局部块分解预条件的特征分布基本相当,从而从理论上保证了利用该预条件进行并行计算时的高效性.其次分析了利用该预条件进行并行计算时影响加速比的因素,由此说明了当问... 该文首先分析了并行局部块分解预条件的特征分布,分析表明其与串行局部块分解预条件的特征分布基本相当,从而从理论上保证了利用该预条件进行并行计算时的高效性.其次分析了利用该预条件进行并行计算时影响加速比的因素,由此说明了当问题规模不大而处理机台数增加时,计算效率必然逐渐下降的原因.最后在由 6台微机连成的机群系统上将该预条件与利用多分裂技术构造的多种预条件进行了比较,实验结果说明该预条件效率高于其它预条件方法.同时在某巨型机上进行的实验表明对处理机台数比较多时,该预条件也仍然很有效. 展开更多
关键词 局部块分解 预条件 并行算法 多分裂技术
在线阅读 下载PDF
基于FPGA的稀疏矩阵向量乘的设计研究 被引量:9
3
作者 张禾 陈客松 《计算机应用研究》 CSCD 北大核心 2014年第6期1756-1759,共4页
作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。... 作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。在一维划分的行压缩稀疏矩阵数据存储技术以及计算部件的流水化设计的基础上,提出了一种基于单个浮点加法器的无阻塞累加器设计。通过实验验证表明,简化了算法的设计提高了算法执行的并行度和外部存储器的带宽利用率,获得了相对于传统处理器1.37-2.60倍的性能加速比。 展开更多
关键词 稀疏矩阵向量乘 现场可编程逻辑门阵列 可重构计算 并行算法
在线阅读 下载PDF
基于局部通信的有限元分析并行算法优化研究 被引量:2
4
作者 吴建平 蒋涛 +2 位作者 彭军 银福康 杨锦辉 《计算力学学报》 CAS CSCD 北大核心 2021年第1期51-59,共9页
针对有限元分析的计算问题,在现有采用全局通信方案的简单并行算法基础上,对其所涉核心算法,采用稀疏数据结构与局部通信进行并行算法优化设计,有效减少了通信所涉及的处理器个数与通信量。同时,通过采用非阻塞通信,并将与通信无关计算... 针对有限元分析的计算问题,在现有采用全局通信方案的简单并行算法基础上,对其所涉核心算法,采用稀疏数据结构与局部通信进行并行算法优化设计,有效减少了通信所涉及的处理器个数与通信量。同时,通过采用非阻塞通信,并将与通信无关计算进行分离与前置的方法,进行计算与通信重叠,以有效隐藏通信开销的影响。实验结果表明,优化所得算法相比现有算法具有明显改进,特别是对稀疏矩阵稠密向量乘与单元贡献装配,改进很大。同时,随着任务个数的增加,改进效果越明显。 展开更多
关键词 有限元 刚度矩阵 稀疏矩阵 并行算法 混凝土试件
在线阅读 下载PDF
分块带边结构线性规划并行算法
5
作者 杨林峰 李陶深 +1 位作者 李捷 陈燕 《计算机科学》 CSCD 北大核心 2011年第9期204-207,共4页
基于内点算法(Interior Point Method,IPM)框架,导出具有分块带边结构系数矩阵的线性规划(Linear Pro-gramming,LP)问题的简化和最简修正方程,并证明最简修正方程的对角分块具有正定性。结合正定矩阵的Cholesky分解和解耦技术设计了修... 基于内点算法(Interior Point Method,IPM)框架,导出具有分块带边结构系数矩阵的线性规划(Linear Pro-gramming,LP)问题的简化和最简修正方程,并证明最简修正方程的对角分块具有正定性。结合正定矩阵的Cholesky分解和解耦技术设计了修正方程的并行求解方法,给出了LP的并行内点算法结构。集群环境下的数值实验表明,所提算法具有很好的加速比和可扩展性,适合求解大规模结构化LP问题。 展开更多
关键词 线性规划 分块带边矩阵 并行算法 解耦 最简修正方程
在线阅读 下载PDF
大规模结构化二次规划并行算法
6
作者 李捷 李陶深 杨林峰 《计算机工程》 CAS CSCD 北大核心 2011年第16期48-50,共3页
在内点算法(IPM)框架基础上,分析具有分块带边结构系数矩阵与箭形结构二次项的二次规划(QP)问题,导出其既约与最简既约修正方程。对既约修正方程系数矩阵进行置换,使其具有箭形分块结构,并结合该结构与解耦技术给出修正方程的并行求解算... 在内点算法(IPM)框架基础上,分析具有分块带边结构系数矩阵与箭形结构二次项的二次规划(QP)问题,导出其既约与最简既约修正方程。对既约修正方程系数矩阵进行置换,使其具有箭形分块结构,并结合该结构与解耦技术给出修正方程的并行求解算法,设计QP问题的并行IPM结构。在集群环境下的数值实验结果表明,该算法具有较好的加速比和可扩展性,适合求解大规模结构化QP问题。 展开更多
关键词 二次规划 分块带边矩阵 并行算法 解耦 既约修正方程
在线阅读 下载PDF
基于MPI的并行计算集群通信及应用 被引量:9
7
作者 罗省贤 李录明 《计算机应用》 CSCD 北大核心 2003年第6期51-53,共3页
对能有效解大型稀疏矩阵方程的LSQR串行算法进行了并行化分析,并应用可移植消息传递标准MPI的集群通信机制在分布式存储并行系统上设计和实现了LSQR并行算法,该并行算法和程序在地震表层模型层析反演中得到了有效的应用。
关键词 集群通信 并行化 消息传递 稀疏矩阵方程 LSQR算法
在线阅读 下载PDF
一种基于FPGA并行加速的稀疏矩阵求解方法 被引量:8
8
作者 吴志勇 王晞阳 陈继林 《电力系统保护与控制》 CSCD 北大核心 2021年第11期155-162,共8页
研究了电力系统电磁暂态仿真中最耗时的稀疏矩阵快速求解问题。采用了算法定义架构的设计思想,提出了一种DAG静态并行调度算法,并设计了与之相适配的硬件并行加速阵列架构。在设计实现中,针对电磁暂态仿真运算中稀疏矩阵求解的特性,采... 研究了电力系统电磁暂态仿真中最耗时的稀疏矩阵快速求解问题。采用了算法定义架构的设计思想,提出了一种DAG静态并行调度算法,并设计了与之相适配的硬件并行加速阵列架构。在设计实现中,针对电磁暂态仿真运算中稀疏矩阵求解的特性,采用了精确的节拍级硬件资源调度,实现了高度融合的软硬件协同加速。在此基础上,进行了该设计的测试及性能分析。实验结果表明,该结构和方法在电力系统稀疏矩阵运算中的性能优于通用CPU和GPU。 展开更多
关键词 稀疏矩阵 DAG 数据流机 静态调度 并行算法 现场可编程门阵列(FPGA)
在线阅读 下载PDF
稀疏矩阵LU分解的FPGA实现
9
作者 邬贵明 王森 +1 位作者 谢向辉 窦勇 《高技术通讯》 CAS CSCD 北大核心 2013年第8期789-796,共8页
研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结... 研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结构不依赖于分解因子的稀疏结构信息,分解因子的数据结构可动态生成。与相关工作比较,这种新的硬件结构具有更好的通用性。实验结果表明,这种新的结构的性能优于通用处理器的软件实现。 展开更多
关键词 稀疏矩阵 LU分解 并行算法 现场可编程门阵列(FPGA) 任务并行
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部