期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法 被引量:18
1
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2018年第15期4329-4338,共10页
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中... 随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。 展开更多
关键词 N-1潮流计算 GPU-CPU异构运算架构 并行化 拼接求解 迭代法
在线阅读 下载PDF
基于异构系统的多级并行稀疏张量向量乘算法 被引量:1
2
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 cpu-gpu 异构并行计算 多级并行 稀疏张量 张量运算
在线阅读 下载PDF
电力系统全纯嵌入潮流的并行计算 被引量:1
3
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 cpu-gpu异构运算平台 预处理器
在线阅读 下载PDF
基于不完全LU分解预处理迭代法的电力系统潮流算法 被引量:19
4
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2017年第S1期55-62,共8页
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运... 随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运算架构,根据CPU和GPU的不同特点,将潮流算法分为CPU处理部分和GPU处理部分,其中GPU用于并行处理计算量最为密集的线性方程组求解步骤,CPU用于处理潮流算法的其他步骤,实现快速求解。算例表明,所提算法收敛性能稳定、收敛速度快、算法效率高,在系统规模较大时,与传统基于LU分解的潮流算法相比具有明显优势,能够满足大规模电网在线潮流计算的需求,具有工程应用价值。 展开更多
关键词 KRYLOV子空间 不完全LU分解 大规模稀疏线性方程组 潮流计算 cpu-gpu异构运算架构
在线阅读 下载PDF
基于混合编程模型的支持向量机训练并行化 被引量:2
5
作者 李涛 刘学臣 +2 位作者 张帅 王恺 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1098-1108,共11页
支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储... 支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture,CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface,MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力. 展开更多
关键词 支持向量机训练 计算统一设备架构 消息传递接口 页锁定内存 cpu-gpu异构系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部