期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法
被引量:
18
1
作者
唐坤杰
董树锋
宋永华
《中国电机工程学报》
EI
CSCD
北大核心
2018年第15期4329-4338,共10页
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中...
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。
展开更多
关键词
N-1潮流计算
GPU-CPU
异构
运算
架构
并行化
拼接求解
迭代法
在线阅读
下载PDF
职称材料
基于异构系统的多级并行稀疏张量向量乘算法
被引量:
1
2
作者
陈玥丹
肖国庆
+3 位作者
阳王东
金纪勇
龙军
李肯立
《计算机学报》
EI
CSCD
北大核心
2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,...
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比.
展开更多
关键词
cpu-gpu
异构
并行计算
多级并行
稀疏张量
张量
运算
在线阅读
下载PDF
职称材料
电力系统全纯嵌入潮流的并行计算
被引量:
1
3
作者
李雪
高翔
+2 位作者
姜涛
王长江
李国庆
《电工技术学报》
EI
CSCD
北大核心
2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的...
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。
展开更多
关键词
全纯嵌入法
潮流计算
Aitken差分法
cpu-gpu
异构
运算
平台
预处理器
在线阅读
下载PDF
职称材料
基于不完全LU分解预处理迭代法的电力系统潮流算法
被引量:
19
4
作者
唐坤杰
董树锋
宋永华
《中国电机工程学报》
EI
CSCD
北大核心
2017年第S1期55-62,共8页
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运...
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运算架构,根据CPU和GPU的不同特点,将潮流算法分为CPU处理部分和GPU处理部分,其中GPU用于并行处理计算量最为密集的线性方程组求解步骤,CPU用于处理潮流算法的其他步骤,实现快速求解。算例表明,所提算法收敛性能稳定、收敛速度快、算法效率高,在系统规模较大时,与传统基于LU分解的潮流算法相比具有明显优势,能够满足大规模电网在线潮流计算的需求,具有工程应用价值。
展开更多
关键词
KRYLOV子空间
不完全LU分解
大规模稀疏线性方程组
潮流计算
cpu-gpu异构运算架构
在线阅读
下载PDF
职称材料
基于混合编程模型的支持向量机训练并行化
被引量:
2
5
作者
李涛
刘学臣
+2 位作者
张帅
王恺
杨愚鲁
《计算机研究与发展》
EI
CSCD
北大核心
2015年第5期1098-1108,共11页
支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储...
支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture,CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface,MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力.
展开更多
关键词
支持向量机训练
计算统一设备
架构
消息传递接口
页锁定内存
cpu-gpu
异构
系统
在线阅读
下载PDF
职称材料
题名
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法
被引量:
18
1
作者
唐坤杰
董树锋
宋永华
机构
浙江大学电气工程学院
出处
《中国电机工程学报》
EI
CSCD
北大核心
2018年第15期4329-4338,共10页
基金
国家重点研发计划项目(2016YFB0901300)~~
文摘
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。
关键词
N-1潮流计算
GPU-CPU
异构
运算
架构
并行化
拼接求解
迭代法
Keywords
N-1 power flow calculation
GPU-CPUheterogeneous computing framework
parallel processing
concatenation algorithm
iterative method
分类号
TM744 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于异构系统的多级并行稀疏张量向量乘算法
被引量:
1
2
作者
陈玥丹
肖国庆
阳王东
金纪勇
龙军
李肯立
机构
中南大学大数据研究院
湖南大学信息科学与工程学院
国家超级计算长沙中心
湖南大学深圳研究院
之江实验室基础理论研究院-应用数学与机器智能研究中心
出处
《计算机学报》
EI
CSCD
北大核心
2024年第2期441-455,共15页
基金
广东省重点领域研究计划(2021B0101190004)
国家自然科学基金(62172157、62202149)
+3 种基金
湖南省科技项目(2023GK2002、2021RC3062、2023JJ60002)
广东省自然科学基金(2023A1515012915)
深圳市基础研究面上项目(JCYJ20210324135409026)
之江实验室开放课题(2022RC0AB03)资助。
文摘
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比.
关键词
cpu-gpu
异构
并行计算
多级并行
稀疏张量
张量
运算
Keywords
cpu-gpu
heterogeneous and parallel computing
hierarchical parallelism
sparse tensors
tensor operations
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
电力系统全纯嵌入潮流的并行计算
被引量:
1
3
作者
李雪
高翔
姜涛
王长江
李国庆
机构
现代电力系统仿真控制与绿色电能新技术教育部重点实验室(东北电力大学)
出处
《电工技术学报》
EI
CSCD
北大核心
2024年第18期5839-5854,共16页
基金
国家自然科学基金资助项目(52077029,52377083,U2066208,U23B20131)。
文摘
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。
关键词
全纯嵌入法
潮流计算
Aitken差分法
cpu-gpu
异构
运算
平台
预处理器
Keywords
Holomorphic embedding method(HEM)
power flow calculation
Aitken difference method
cpu-gpu
heterogeneous platform
preconditioner
分类号
TM744 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于不完全LU分解预处理迭代法的电力系统潮流算法
被引量:
19
4
作者
唐坤杰
董树锋
宋永华
机构
浙江大学电气工程学院
出处
《中国电机工程学报》
EI
CSCD
北大核心
2017年第S1期55-62,共8页
文摘
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运算架构,根据CPU和GPU的不同特点,将潮流算法分为CPU处理部分和GPU处理部分,其中GPU用于并行处理计算量最为密集的线性方程组求解步骤,CPU用于处理潮流算法的其他步骤,实现快速求解。算例表明,所提算法收敛性能稳定、收敛速度快、算法效率高,在系统规模较大时,与传统基于LU分解的潮流算法相比具有明显优势,能够满足大规模电网在线潮流计算的需求,具有工程应用价值。
关键词
KRYLOV子空间
不完全LU分解
大规模稀疏线性方程组
潮流计算
cpu-gpu异构运算架构
Keywords
Krylov subspace
incomplete LU decomposition preconditioning
large scale sparse linear equations
power flow calculation
cpu-gpu
heterogeneous computing architecture
分类号
TM744 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于混合编程模型的支持向量机训练并行化
被引量:
2
5
作者
李涛
刘学臣
张帅
王恺
杨愚鲁
机构
南开大学计算机科学与信息安全系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第5期1098-1108,共11页
基金
国家自然科学青年基金项目(61212005
61201424)
+2 种基金
天津市自然科学基金项目(12JCYBJC10100)
中央高校基本科研业务费专项资金项目(65012101
65012131)
文摘
支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture,CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface,MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力.
关键词
支持向量机训练
计算统一设备
架构
消息传递接口
页锁定内存
cpu-gpu
异构
系统
Keywords
support vector machine (SVM) training
compute unified device architecture (CUDA)
message passing interface (MPI)
page-locked host memory
cpu-gpu
heterogeneous system
分类号
TP302 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法
唐坤杰
董树锋
宋永华
《中国电机工程学报》
EI
CSCD
北大核心
2018
18
在线阅读
下载PDF
职称材料
2
基于异构系统的多级并行稀疏张量向量乘算法
陈玥丹
肖国庆
阳王东
金纪勇
龙军
李肯立
《计算机学报》
EI
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
3
电力系统全纯嵌入潮流的并行计算
李雪
高翔
姜涛
王长江
李国庆
《电工技术学报》
EI
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
4
基于不完全LU分解预处理迭代法的电力系统潮流算法
唐坤杰
董树锋
宋永华
《中国电机工程学报》
EI
CSCD
北大核心
2017
19
在线阅读
下载PDF
职称材料
5
基于混合编程模型的支持向量机训练并行化
李涛
刘学臣
张帅
王恺
杨愚鲁
《计算机研究与发展》
EI
CSCD
北大核心
2015
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部