期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
矩阵的LU并行递归分解算法的设计研究 被引量:1
1
作者 黄丽嫦 《科学技术与工程》 北大核心 2012年第15期3626-3629,3635,共5页
分析了矩阵的LU分解原理,并在双核微机上设计实现了一种矩阵的LU并行递归分解算法.该算法的特点是引入分块矩阵把LU分解形成迭代递归的形式,进而较好地发挥了新型微机的并行运算和高速缓冲存储器的功能.实验结果表明该算法是可行和有效的。
关键词 矩阵 lu分解 并行递归算法
在线阅读 下载PDF
可选主元LU分解流水线算法设计与FPGA实现
2
作者 牛新 周杰 +1 位作者 窦勇 雷元武 《高技术通讯》 EI CAS CSCD 北大核心 2009年第5期511-518,共8页
提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与... 提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与Celeron(R) 3.07GHz通用处理器主机相比可以得到平均6到7倍的加速比。与其他在FP-GA上实现的LU分解算法相比,该算法在占用相对较少资源和保持高分解效率的前提下提高了计算的精确度和稳定性。 展开更多
关键词 lu 分解 流水线 并行算法 列主元选取 现场编程门阵列(FPGA)
在线阅读 下载PDF
并行稀疏系统直接求解库SuperLU_MT在状态估计中的应用 被引量:5
3
作者 陈荃韡 龚成明 +2 位作者 赵晋泉 王毅 邹德虎 《电力系统自动化》 EI CSCD 北大核心 2017年第3期83-88,共6页
利用基于超节点LU分块分解算法、列消去树和多核多线程并行计算原理的并行稀疏系统直接求解库Super LU_MT实现电力系统状态估计,主要在求解迭代方程、不良数据检测辨识环节调用Super LU_MT实现加速。通过对电气与电子工程师协会(IEEE)... 利用基于超节点LU分块分解算法、列消去树和多核多线程并行计算原理的并行稀疏系统直接求解库Super LU_MT实现电力系统状态估计,主要在求解迭代方程、不良数据检测辨识环节调用Super LU_MT实现加速。通过对电气与电子工程师协会(IEEE)测试系统以及实际电网算例验证,表明通用的并行稀疏系统直接求解库适用于电力系统状态估计,能够获得较显著的并行计算效果,在多核计算机上缩短了状态估计的计算时间。 展开更多
关键词 电力系统状态估计 并行矩阵计算库 超节点 lu分块分解 多核多线程并行计算
在线阅读 下载PDF
一种基于图形处理器加速的批量LU分解算法 被引量:2
4
作者 李梦月 王颖 +1 位作者 马刚 周赣 《电力工程技术》 2019年第2期57-63,共7页
潮流计算是电力系统计算的基础,其核心是LU分解计算,因此电力系统潮流计算加速的关键在于LU分解加速。当前,基于中央处理器(CPU)的并行算法已经成熟,性能提升空间有限。图形处理器(GPU)作为协处理器,在科学计算方面具有强大的优越性,被... 潮流计算是电力系统计算的基础,其核心是LU分解计算,因此电力系统潮流计算加速的关键在于LU分解加速。当前,基于中央处理器(CPU)的并行算法已经成熟,性能提升空间有限。图形处理器(GPU)作为协处理器,在科学计算方面具有强大的优越性,被广泛应用到电力系统潮流计算中。文中首先分析了GPU结构和并行运行架构,然后介绍了LU分解原理,并选择了合适的矩阵排序算法和稀疏矩阵存储模型,借助统一计算设备架构(CUDA)编程模型实现了基于GPU的单个LU分解和批量LU分解并行加速,最后在仿真设备上测试了5个不同的案例,对比分析其并行算法的加速效果。仿真测试结果表明,基于GPU的批量稀疏LU分解并行算法,平均可以获得25~50倍的加速效果。 展开更多
关键词 图形处理器 潮流计算 批处理 lu分解 并行算法
在线阅读 下载PDF
稀疏矩阵LU分解的FPGA实现
5
作者 邬贵明 王森 +1 位作者 谢向辉 窦勇 《高技术通讯》 CAS CSCD 北大核心 2013年第8期789-796,共8页
研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结... 研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结构不依赖于分解因子的稀疏结构信息,分解因子的数据结构可动态生成。与相关工作比较,这种新的硬件结构具有更好的通用性。实验结果表明,这种新的结构的性能优于通用处理器的软件实现。 展开更多
关键词 稀疏矩阵 lu分解 并行算法 现场可编程门阵列(FPGA) 任务并行
在线阅读 下载PDF
基于可重构计算系统的矩阵三角化分解硬件并行结构研究 被引量:6
6
作者 刘书勇 吴艳霞 +2 位作者 张博为 张国印 戴葵 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1642-1650,共9页
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩... 可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比. 展开更多
关键词 矩阵三角化分解 三角化过程 并行算法 lu分解 现场可编程门阵列
在线阅读 下载PDF
基于GPU的机电暂态仿真细粒度并行算法 被引量:14
7
作者 张宁宇 高山 赵欣 《电力系统自动化》 EI CSCD 北大核心 2012年第9期54-60,共7页
提出一种基于图形处理器(GPU)并采用隐形梯度法的机电暂态仿真细粒度并行算法。该算法将整个系统分为发电机节点系统和非发电机节点系统,对发电机节点系统求解时,先将在网络中直接相连的发电机节点合并成一个子系统,然后在GPU中给每个... 提出一种基于图形处理器(GPU)并采用隐形梯度法的机电暂态仿真细粒度并行算法。该算法将整个系统分为发电机节点系统和非发电机节点系统,对发电机节点系统求解时,先将在网络中直接相连的发电机节点合并成一个子系统,然后在GPU中给每个子系统分配相应线程块进行并行求解,其中采用了LU并行分解来求解线性方程组。求解完成后,利用从发电机节点系统传递来的LU分解信息,再对非发电机节点系统使用GPU进行求解。通过对不同规模的算例进行分析表明:所提出的GPU并行算法的计算结果与CPU串行算法和BPA软件的计算结果大致相同,且随着系统规模的增加,GPU并行算法的加速效果更为明显。 展开更多
关键词 机电暂态仿真 图形处理器 隐式梯度法 lu分解 并行算法
在线阅读 下载PDF
基于矩阵对角化的电磁暂态时间并行计算方法 被引量:7
8
作者 汪芳宗 王永 +2 位作者 宋墩文 杨学涛 宋新立 《电网技术》 EI CSCD 北大核心 2017年第8期2521-2527,共7页
为提高电力系统电磁暂态数值计算的效率,在采用经典的临界阻尼调整算法的基础上,利用系数矩阵的实特征值分解即矩阵对角化方法,提出了一类新的电磁暂态时间并行计算方法。对线性微分系统或非线性微分系统,所提算法均可以实现精确的时间... 为提高电力系统电磁暂态数值计算的效率,在采用经典的临界阻尼调整算法的基础上,利用系数矩阵的实特征值分解即矩阵对角化方法,提出了一类新的电磁暂态时间并行计算方法。对线性微分系统或非线性微分系统,所提算法均可以实现精确的时间解耦并行计算。算例测试结果表明:所提出的算法具有很好的并行性,可以获得有效的加速比,因而可以显著提高电力系统电磁暂态数值仿真计算的效率及实时性。 展开更多
关键词 电磁暂态 数值计算 临界阻尼调整 特征值分解 矩阵对角化 时间并行算法
在线阅读 下载PDF
一种不完全信息下递推辨识方法及收敛性分析 被引量:8
9
作者 杜大军 商立立 +1 位作者 漆波 费敏锐 《自动化学报》 EI CSCD 北大核心 2015年第8期1502-1515,共14页
针对信号在网络环境下传输带来不完全信息使得在线参数辨识算法和收敛性困难的问题,不同于传统递推最小二乘方法,本文提出了一种不完全信息下递推辨识方法并分析其收敛性.首先运用伯努利分布刻画引起不完全信息的数据丢包特性,然后基于... 针对信号在网络环境下传输带来不完全信息使得在线参数辨识算法和收敛性困难的问题,不同于传统递推最小二乘方法,本文提出了一种不完全信息下递推辨识方法并分析其收敛性.首先运用伯努利分布刻画引起不完全信息的数据丢包特性,然后基于辅助模型方法补偿不完全信息并构造了新的数据信息矩阵,并运用矩阵正交变换性质对数据信息矩阵进行QR分解,推导了融合网络参数的递推辨识新算法,理论证明了在不完全信息下递推参数辨识算法的收敛性.最后仿真结果验证了所提方法的可行性和有效性. 展开更多
关键词 数据丢包 参数估计 递推最小二乘 矩阵QR分解 算法收敛性
在线阅读 下载PDF
基于GPU的电磁暂态并行仿真研究 被引量:6
10
作者 姚蜀军 韩民晓 +2 位作者 张硕 林芝茂 李昊 《电工电能新技术》 CSCD 北大核心 2019年第1期10-16,共7页
随着电力系统大量高压直流、新能源、柔性交流输电系统的接入,传统电磁暂态仿真由于步长小、仿真速度慢,已无法满足大规模系统的仿真需求。近年来,图形处理器(GPU)在高性能计算领域发展迅速,通过GPU优化从而提高电磁暂态仿真计算效率成... 随着电力系统大量高压直流、新能源、柔性交流输电系统的接入,传统电磁暂态仿真由于步长小、仿真速度慢,已无法满足大规模系统的仿真需求。近年来,图形处理器(GPU)在高性能计算领域发展迅速,通过GPU优化从而提高电磁暂态仿真计算效率成为可能。本文在研究了GPU结构特点后,提出了一种适用于电磁暂态仿真线性方程组的并行LU分解算法,从三个方面对传统算法进行了加速。通过和基于CPU的传统算法的仿真结果对比,证明了本算法的优越性。 展开更多
关键词 电磁暂态仿真 图形处理器 lu分解 并行算法
在线阅读 下载PDF
一种新的快速BP神经网络算法——QLMBP 被引量:14
11
作者 李炯城 黄汉雄 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第6期49-54,共6页
对反向传播(BP)算法中收敛速度最快的改进版本Levenberg-Marquardt BP(LMBP)进行了研究,找出了收敛速度的瓶颈:迭代控制参数的初始化会严重地影响到算法的迭代次数;涉及的矩阵求逆是每次迭代中最耗时的计算;如果每次迭代中的误差平方和... 对反向传播(BP)算法中收敛速度最快的改进版本Levenberg-Marquardt BP(LMBP)进行了研究,找出了收敛速度的瓶颈:迭代控制参数的初始化会严重地影响到算法的迭代次数;涉及的矩阵求逆是每次迭代中最耗时的计算;如果每次迭代中的误差平方和没有变小,该次迭代可能需要很长时间.本文通过上下三角(LU)分解去除耗时的矩阵求逆,并采取一维搜索来加速目标函数值的下降,使得LMBP不再依赖于迭代控制参数,从而提出了一种快速神经网络算法QLMBP.QLMBP算法的收敛速度比LMBP算法快100倍左右. 展开更多
关键词 BP算法 LEVENBERG-MARQUARDT算法 上下三角(lu)分解 Marquardt灵敏度矩阵
在线阅读 下载PDF
求解线性约束最优化问题的有效集算法 被引量:3
12
作者 高旅端 陈志 李苏祥 《北京工业大学学报》 CAS CSCD 北大核心 2006年第3期283-288,共6页
为了保持投影梯度求解法的线性约束系数矩阵的稀疏性,且不降低算法的效率。在确定可行点处的可行方向时,使用了矩阵的隐式LU分解技术,构造有效约束的零空间.本文提出了求解线性约束最优化问题的有效集算法,对于线性约束系数矩阵是稀疏... 为了保持投影梯度求解法的线性约束系数矩阵的稀疏性,且不降低算法的效率。在确定可行点处的可行方向时,使用了矩阵的隐式LU分解技术,构造有效约束的零空间.本文提出了求解线性约束最优化问题的有效集算法,对于线性约束系数矩阵是稀疏矩阵时,能较好地保持稀疏性,提高了算法的效率.与数值试验的结果吻合. 展开更多
关键词 算法 矩阵代数 非线性规划 隐式lu分解 稀疏矩阵
在线阅读 下载PDF
块三对角矩阵局部块分解及其在预条件中的应用 被引量:3
13
作者 吴建平 李晓梅 《计算机学报》 EI CSCD 北大核心 2002年第8期823-829,共7页
该文利用块三对角阵分解因子的估值分析了其局部依赖性 ,并用其构造了一类不完全分解型预条件子 ,给出了五点差分矩阵预条件后的条件数估计 ,并比较了条件数估计值与实际值 ,表明了估计值的准确性与预条件的有效性 .在具体实现时 ,考虑... 该文利用块三对角阵分解因子的估值分析了其局部依赖性 ,并用其构造了一类不完全分解型预条件子 ,给出了五点差分矩阵预条件后的条件数估计 ,并比较了条件数估计值与实际值 ,表明了估计值的准确性与预条件的有效性 .在具体实现时 ,考虑了预条件的 6个串行实现方案并提出了一个有效的并行化方法 ,该并行算法具有通信量少的特点 .最后在由 4台微机通过高速以太网连成的机群系统上作了大量数值实验 ,并将其与其它较有效的预条件方法进行了比较 ,结果表明该预条件方法效果较好 ,尤其适用于并行计算 . 展开更多
关键词 块三对角矩阵 局部块分解 预条件 并行算法 数值解 微机
在线阅读 下载PDF
块三对角线性方程组的并行直接解法 被引量:1
14
作者 樊艳红 吕全义 聂玉峰 《计算机工程与应用》 CSCD 北大核心 2009年第3期60-63,共4页
提出了分布式环境下求解块三对角线性方程组的一种并行算法,该算法充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当分解及近似处理,使算法只在相邻处理机间通信两次。并从理论上给出了算法有效的一个充分条件。最后,在HPrx2600集... 提出了分布式环境下求解块三对角线性方程组的一种并行算法,该算法充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当分解及近似处理,使算法只在相邻处理机间通信两次。并从理论上给出了算法有效的一个充分条件。最后,在HPrx2600集群上进行了数值实验,结果表明,实算与理论是一致的,并行性也很好。 展开更多
关键词 块三对角线性方程组 矩阵分解 并行算法 并行效率 HP rx2600集群
在线阅读 下载PDF
求分块鳞状因子循环矩阵逆矩阵的一种快速算法 被引量:1
15
作者 卢诚波 《浙江大学学报(理学版)》 CAS CSCD 2013年第1期1-6,10,共7页
给出了一种计算分块鳞状因子循环矩阵逆矩阵的快速算法,该算法主要利用了离散傅立叶变换和对角块矩阵求逆的递归算法,与标准的利用LU分解法求逆的算法相比,在计算复杂性上有很大的优势.
关键词 分块鳞状因子循环矩阵 离散傅立叶变换 递归算法 lu分解法 计算复杂性
在线阅读 下载PDF
基于二分递推SVD的牵引网故障测距研究 被引量:1
16
作者 赵峰 段启凡 +1 位作者 杨桐 周榆晓 《控制工程》 CSCD 北大核心 2017年第10期2144-2150,共7页
行波信号奇异点的精确提取与否以及波速、线路长度的参数设置是影响牵引网故障测距精度的主要原因。针对这一问题,提出利用二分递推奇异值分解与改进的D型测距算法相结合的故障测距算法。利用二分递推奇异值分解法对行波信号进行奇异点... 行波信号奇异点的精确提取与否以及波速、线路长度的参数设置是影响牵引网故障测距精度的主要原因。针对这一问题,提出利用二分递推奇异值分解与改进的D型测距算法相结合的故障测距算法。利用二分递推奇异值分解法对行波信号进行奇异点的提取,得到奇异点对应的故障行波和反射波到达检测端的时间,将该时间带入不受波速和线路长度变化干扰的改进D型测距算法中。其中,二分递推奇异值分解较常规的奇异值分解具有计算速度快、精度高的特点。改进的D型测距算法能有效消除谐波的干扰和减弱负荷变化对测距结果的影响。仿真结果表明,基于二者相结合的故障测距方法可以准确计算出故障点位置。 展开更多
关键词 全并联AT供电 故障测距 二分递推SVD D型测距算法
在线阅读 下载PDF
T矩阵递推算法用于二维混合目标RCS计算
17
作者 刘红星 赵伯琳 +1 位作者 高正平 李言荣 《电波科学学报》 EI CSCD 2003年第6期663-667,共5页
利用递推算法计算任意形状二维导体加介质体目标的电磁散射。建立导体部分单独存在时的T矩阵 ,对于内谐振频率点上生成的病态矩阵用奇异值分解方法解决 ,用广义递推算法求出有耗介质单体T矩阵。然后采用二体散射的方法求得总散射场。
关键词 T矩阵 广义递推算法 二维混合目标 RCS 雷达散射截面 奇异值分解 电磁散射
在线阅读 下载PDF
关于矩阵最优路径算法的探讨
18
作者 谭国律 陈博政 《计算机应用与软件》 CSCD 北大核心 2005年第1期115-117,共3页
本文讨论了矩阵最优路径的串行和并行算法。在串行方面讨论了用动态规划思想的求解算法 ;在并行方面给出了计算模型。并给出算法描述和算法复杂性分析。
关键词 串行 并行算法 最优路径 算法复杂性 求解算法 动态规划 矩阵 描述
在线阅读 下载PDF
基于LDL^T分解求实对称矩阵特征值的递归算法 被引量:1
19
作者 张鹍 张有志 《计算机工程与应用》 CSCD 北大核心 2008年第3期78-80,共3页
基于线性代数与矩阵理论,给出利用LDLT分解计算实对称矩阵特征值的递归算法。该算法可求出实对称矩阵在给定区间内的特征值的个数,并可计算满足精度要求的特征值。理论分析和实际测试证明该算法是有效的。
关键词 LDL^T分解 实对称矩阵 特征值 递归算法
在线阅读 下载PDF
广义Lehmer矩阵求逆问题研究 被引量:2
20
作者 邓勇 《华中师范大学学报(自然科学版)》 CAS 北大核心 2015年第6期827-830,共4页
利用矩阵的LU和Cholesky分解推导出Lehmer矩阵行列式和逆的解析表达式.在此基础上,定义了广义Lehmer矩阵,并获得了其LU分解和Cholesky分解公式,进而简化了广义Lehmer矩阵行列式和求逆的计算问题.
关键词 递归数列 广义Lehmer矩阵 逆矩阵 lu分解 CHOLESKY分解
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部