题名 求解线性约束最优化问题的有效集算法
被引量:3
1
作者
高旅端
陈志
李苏祥
机构
北京工业大学应用数理学院
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2006年第3期283-288,共6页
文摘
为了保持投影梯度求解法的线性约束系数矩阵的稀疏性,且不降低算法的效率。在确定可行点处的可行方向时,使用了矩阵的隐式LU分解技术,构造有效约束的零空间.本文提出了求解线性约束最优化问题的有效集算法,对于线性约束系数矩阵是稀疏矩阵时,能较好地保持稀疏性,提高了算法的效率.与数值试验的结果吻合.
关键词
算法
矩阵代数
非线性规划
隐式LU分解
稀疏矩阵
Keywords
algorithm
matrix algebra
nonlinear programming
implicit LU decomposition
sparse matrix
分类号
O221.2
[理学—运筹学与控制论]
题名 块三对角矩阵的并行局部块分解预条件
被引量:4
2
作者
吴建平
王正华
李晓梅
机构
国防科技大学并行与分布处理重点实验室
装备指挥技术学院
出处
《计算机学报》
EI
CSCD
北大核心
2005年第3期414-419,共6页
基金
国家自然科学基金重点项目(69933030)
计算物理实验室基金(51479040103KG0201)资助.~~
文摘
该文首先分析了并行局部块分解预条件的特征分布,分析表明其与串行局部块分解预条件的特征分布基本相当,从而从理论上保证了利用该预条件进行并行计算时的高效性.其次分析了利用该预条件进行并行计算时影响加速比的因素,由此说明了当问题规模不大而处理机台数增加时,计算效率必然逐渐下降的原因.最后在由 6台微机连成的机群系统上将该预条件与利用多分裂技术构造的多种预条件进行了比较,实验结果说明该预条件效率高于其它预条件方法.同时在某巨型机上进行的实验表明对处理机台数比较多时,该预条件也仍然很有效.
关键词
局部块分解
预条件
并行算法
多分裂技术
Keywords
Iterative methods
matrix algebra
parallel algorithm s
Program processors
Theorem proving
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于FPGA的稀疏矩阵向量乘的设计研究
被引量:9
3
作者
张禾
陈客松
机构
西南石油大学电气信息学院
电子科技大学电子工程学院
出处
《计算机应用研究》
CSCD
北大核心
2014年第6期1756-1759,共4页
基金
国家重大专项课题资助项目(2008ZX05026-001-09)
四川省教育厅资助项目(112B020)
西南石油大学校自然科学基金资助项目(2012XJZ021)
文摘
作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。在一维划分的行压缩稀疏矩阵数据存储技术以及计算部件的流水化设计的基础上,提出了一种基于单个浮点加法器的无阻塞累加器设计。通过实验验证表明,简化了算法的设计提高了算法执行的并行度和外部存储器的带宽利用率,获得了相对于传统处理器1.37-2.60倍的性能加速比。
关键词
稀疏矩阵向量乘
现场可编程逻辑门阵列
可重构计算
并行算法
Keywords
sparse matrix vector multiplication (SpMV)
field-programmable gate array (FPGA)
reconfigurable computing
parallel algorithm
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 基于局部通信的有限元分析并行算法优化研究
被引量:2
4
作者
吴建平
蒋涛
彭军
银福康
杨锦辉
机构
国防科技大学气象海洋学院
国防科技大学计算机学院
出处
《计算力学学报》
CAS
CSCD
北大核心
2021年第1期51-59,共9页
基金
国家自然科学基金(41875121,61379022)资助项目.
文摘
针对有限元分析的计算问题,在现有采用全局通信方案的简单并行算法基础上,对其所涉核心算法,采用稀疏数据结构与局部通信进行并行算法优化设计,有效减少了通信所涉及的处理器个数与通信量。同时,通过采用非阻塞通信,并将与通信无关计算进行分离与前置的方法,进行计算与通信重叠,以有效隐藏通信开销的影响。实验结果表明,优化所得算法相比现有算法具有明显改进,特别是对稀疏矩阵稠密向量乘与单元贡献装配,改进很大。同时,随着任务个数的增加,改进效果越明显。
关键词
有限元
刚度矩阵
稀疏矩阵
并行算法
混凝土试件
Keywords
finite element
stiffness matrix
sparse matrix
parallel algorithm
concrete specimen
分类号
TP301
[自动化与计算机技术—计算机系统结构]
O242.21
[理学—计算数学]
题名 分块带边结构线性规划并行算法
5
作者
杨林峰
李陶深
李捷
陈燕
机构
广西大学
广西职业技术学院计算机与电子信息工程系
出处
《计算机科学》
CSCD
北大核心
2011年第9期204-207,共4页
基金
国家自然科学基金(60963022)
广西自然科学基金项目(桂科自0832056)
+1 种基金
广西高校人才小高地建设创新团队资助计划(桂教人[2007]71号)
广西研究生教育创新计划资助项目(105930901022)资助
文摘
基于内点算法(Interior Point Method,IPM)框架,导出具有分块带边结构系数矩阵的线性规划(Linear Pro-gramming,LP)问题的简化和最简修正方程,并证明最简修正方程的对角分块具有正定性。结合正定矩阵的Cholesky分解和解耦技术设计了修正方程的并行求解方法,给出了LP的并行内点算法结构。集群环境下的数值实验表明,所提算法具有很好的加速比和可扩展性,适合求解大规模结构化LP问题。
关键词
线性规划
分块带边矩阵
并行算法
解耦
最简修正方程
Keywords
Linear programming
Block bordered matrix
parallel algorithm
Decoupling
Simplest correction equation
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 大规模结构化二次规划并行算法
6
作者
李捷
李陶深
杨林峰
机构
广西大学计算机与电子信息学院
广西职业技术学院计算机技术与电子信息工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第16期48-50,共3页
基金
国家自然科学基金资助项目(60963022)
广西自然科学基金资助项目(0832056)
广西研究生教育创新计划基金资助项目(105930901022)
文摘
在内点算法(IPM)框架基础上,分析具有分块带边结构系数矩阵与箭形结构二次项的二次规划(QP)问题,导出其既约与最简既约修正方程。对既约修正方程系数矩阵进行置换,使其具有箭形分块结构,并结合该结构与解耦技术给出修正方程的并行求解算法,设计QP问题的并行IPM结构。在集群环境下的数值实验结果表明,该算法具有较好的加速比和可扩展性,适合求解大规模结构化QP问题。
关键词
二次规划
分块带边矩阵
并行算法
解耦
既约修正方程
Keywords
Quadratic programming (QP)
block bordered matrix
parallel algorithm
decoupling
simpler correction equation
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于MPI的并行计算集群通信及应用
被引量:9
7
作者
罗省贤
李录明
机构
成都理工大学计算机工程系
出处
《计算机应用》
CSCD
北大核心
2003年第6期51-53,共3页
文摘
对能有效解大型稀疏矩阵方程的LSQR串行算法进行了并行化分析,并应用可移植消息传递标准MPI的集群通信机制在分布式存储并行系统上设计和实现了LSQR并行算法,该并行算法和程序在地震表层模型层析反演中得到了有效的应用。
关键词
集群通信
并行化
消息传递
稀疏矩阵方程
LSQR算法
Keywords
collective communication
parallel ism
Message Passing
sparse matrix equation
LSQR algorithm
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种基于FPGA并行加速的稀疏矩阵求解方法
被引量:8
8
作者
吴志勇
王晞阳
陈继林
机构
国家超级计算无锡中心
中国电力科学研究院有限公司
出处
《电力系统保护与控制》
CSCD
北大核心
2021年第11期155-162,共8页
基金
国家电网有限公司总部科技项目“适应于电力系统应用的高性能计算技术研究与开发”(XTB17201900305)。
文摘
研究了电力系统电磁暂态仿真中最耗时的稀疏矩阵快速求解问题。采用了算法定义架构的设计思想,提出了一种DAG静态并行调度算法,并设计了与之相适配的硬件并行加速阵列架构。在设计实现中,针对电磁暂态仿真运算中稀疏矩阵求解的特性,采用了精确的节拍级硬件资源调度,实现了高度融合的软硬件协同加速。在此基础上,进行了该设计的测试及性能分析。实验结果表明,该结构和方法在电力系统稀疏矩阵运算中的性能优于通用CPU和GPU。
关键词
稀疏矩阵
DAG
数据流机
静态调度
并行算法
现场可编程门阵列(FPGA)
Keywords
sparse matrix
DAG
data-flow computer
static scheduling
parallel algorithm
field programmable gate array(FPGA)
分类号
TM743
[电气工程—电力系统及自动化]
题名 稀疏矩阵LU分解的FPGA实现
9
作者
邬贵明
王森
谢向辉
窦勇
机构
数学工程与先进计算国家重点实验室
江南计算技术研究所
国防科学技术大学计算机学院
出处
《高技术通讯》
CAS
CSCD
北大核心
2013年第8期789-796,共8页
基金
国家自然科学基金(61125201)资助项目
文摘
研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结构不依赖于分解因子的稀疏结构信息,分解因子的数据结构可动态生成。与相关工作比较,这种新的硬件结构具有更好的通用性。实验结果表明,这种新的结构的性能优于通用处理器的软件实现。
关键词
稀疏矩阵
LU分解
并行算法
现场可编程门阵列(FPGA)
任务并行
Keywords
sparse matrix
LU decomposition
parallel algorithm
FPGA
task parallel ism
分类号
O241.6
[理学—计算数学]