期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于岩层运动并行计算系统StrataKing的岩层运动模拟 被引量:1
1
作者 王学滨 余保健 +2 位作者 李小帅 张钦杰 郑一方 《矿业科学学报》 北大核心 2025年第2期214-225,共12页
目前,我国煤炭行业岩层运动模拟主要靠国外通用商业软件,存在计算效率低、计算规模小、矿业特色不明显等问题。基于自主开发的岩层运动并行计算系统StrataKing,通过GPU并行提升计算效率和计算规模,单元数为国外通用商业软件的10倍。Stra... 目前,我国煤炭行业岩层运动模拟主要靠国外通用商业软件,存在计算效率低、计算规模小、矿业特色不明显等问题。基于自主开发的岩层运动并行计算系统StrataKing,通过GPU并行提升计算效率和计算规模,单元数为国外通用商业软件的10倍。StrataKing的新突破包括垮落岩石的膨胀、煤层和巷道开挖后的逐渐卸荷及支护作用下的随采随充等,分别用于探究110工法、长壁开采和充填开采的岩层运动规律。结果表明,对于110工法,得以保留的左巷的最大下沉量为0.103 m,与现场结果基本相符;对于长壁开采,工作面两侧一定范围内的煤体开裂,应力向远处转移,在此掘巷有利于巷道维护,弯曲下沉带下边界与煤层下表面的距离和相似模拟结果基本相符;对于充填开采,模型上表面最大下沉量比未充填模型减少56.52%,占采高的比例降低55.55%,若干岩层裂而未断。 展开更多
关键词 煤矿 岩层运动 并行计算 云计算 采矿方法
在线阅读 下载PDF
比特并行Reed-Solomon编码器的设计 被引量:4
2
作者 于伟 李文 鞠德航 《中国空间科学技术》 EI CSCD 北大核心 1999年第2期66-71,共6页
研究高速RS码编码器设计问题。给出了最优对偶基的计算方法,研究了用对偶基下的bit-paralel乘法器构成RS码系统码编码器。编码器可以达到较高的吞吐率。
关键词 乘法器 并行计算 编码器 RS码 设计
在线阅读 下载PDF
直流换流站阀厅内三维电场的分布式并行计算 被引量:53
3
作者 田冀焕 周远翔 +3 位作者 郭绍伟 聂琼 孙清华 梁曦东 《高电压技术》 EI CAS CSCD 北大核心 2010年第5期1205-1210,共6页
直流换流站阀厅的三维电场计算对金具结构设计与厅内场强控制具有重要的指导作用。然而,由于阀厅内部设备多、结构复杂,其几何建模与数值仿真较为困难。为此基于ANSYS分布式并行计算平台,通过对ANSYS模型实体进行自动化相对编号,提出了... 直流换流站阀厅的三维电场计算对金具结构设计与厅内场强控制具有重要的指导作用。然而,由于阀厅内部设备多、结构复杂,其几何建模与数值仿真较为困难。为此基于ANSYS分布式并行计算平台,通过对ANSYS模型实体进行自动化相对编号,提出了模块化与独立化的建模方法,并使ANSYS模型的APDL(ANSYS参数化设计语言)代码具有重用性。基于该方法建立了直流换流站阀厅内部交流侧设备的模型。通过选择适合分布式并行计算的ANSYS求解器,计算出阀厅内部的三维电场分布。计算结果表明,在当前设计方案下,阀厅内部金具表面最大场强为27.51 kV/cm,以球-板电极起晕场强作为判据,阀厅内无起晕现象。该数据为换流站阀厅的设计规划提供了可靠支撑,具有重要的指导意义。 展开更多
关键词 直流换流阀厅 ANSYS 分布式并行计算 三维电场计算 建模方法 起晕场强
在线阅读 下载PDF
基于云计算的电磁问题并行计算方法 被引量:10
4
作者 金亮 邱运涛 +2 位作者 杨庆新 牛萍娟 祝丽花 《电工技术学报》 EI CSCD 北大核心 2016年第22期5-11,共7页
针对电工装备性能分析与优化所需的易用高性能计算问题,使用云计算技术搭建了弹性集群,实现了典型电磁问题在弹性集群中的并行计算。使用虚拟化技术将计算机资源整合为资源池,搭建并部署了可实现弹性计算的云平台及并行计算所需的弹性... 针对电工装备性能分析与优化所需的易用高性能计算问题,使用云计算技术搭建了弹性集群,实现了典型电磁问题在弹性集群中的并行计算。使用虚拟化技术将计算机资源整合为资源池,搭建并部署了可实现弹性计算的云平台及并行计算所需的弹性集群。计算节点通过千兆路由器相连,节点之间使用SSH通信协议。选取感应电机和变压器作为计算案例,使用Fortran编写静磁场计算程序。对云计算的并行架构Open Mpi与Map Reduce进行了分析研究,使用Open Mpi并行化方法实现了数百万计算节点的并行计算。并通过与商业软件计算结果的对比验证了计算的正确性。研究结果表明,可在云计算的弹性集群上使用Open Mpi实现大规模并行计算。相比超级计算机提供的并行计算方案,本文使用云计算建立的弹性机群具有便捷、按需、可配置的优点,这为高性能计算提供了一种更易获取、易用的解决方法,为开展复杂真实机构的集成计算提供了高性能计算的理论和实践依据。 展开更多
关键词 云计算 并行计算 电磁场数值计算 有限元法
在线阅读 下载PDF
基于Beowulf集群的大规模电力系统牛顿法潮流求解的并行GMRES方法 被引量:12
5
作者 胡博 谢开贵 曹侃 《电工技术学报》 EI CSCD 北大核心 2011年第4期145-152,共8页
大规模电力系统牛顿法潮流计算中,修正方程组的系数矩阵具有高维、稀疏、非对称的特点,结合该特点,提出基于预条件GMRES的并行牛顿法潮流计算方法。其中,对块Jacobi预条件子矩阵而言,根据处理器数确定其分块数,依此设计出高效的准对角... 大规模电力系统牛顿法潮流计算中,修正方程组的系数矩阵具有高维、稀疏、非对称的特点,结合该特点,提出基于预条件GMRES的并行牛顿法潮流计算方法。其中,对块Jacobi预条件子矩阵而言,根据处理器数确定其分块数,依此设计出高效的准对角并行预条件子矩阵;通过对Jacobi矩阵更新过程的矢量化处理,结合并行稀疏矩阵向量运算技术,提出Jacobi矩阵更新的并行化计算方法。对7 680节点、12 000节点等多个大规模电力系统进行潮流计算,结果表明:随着系统规模的增大(达到3 000节点及以上时),本文提出的并行潮流计算方法比传统并行LU分解法在并行加速比、并行效率等方面有明显优势。 展开更多
关键词 潮流计算 准对角预条件子矩阵 Jacobi矩阵更新 并行计算 GMRES方法
在线阅读 下载PDF
基于图形处理器的多波前潮流计算方法 被引量:3
6
作者 徐得超 陈勇 +2 位作者 王伟 江涵 郑然 《高电压技术》 EI CAS CSCD 北大核心 2016年第10期3301-3307,共7页
为提高潮流计算中线性方程组的求解速度,提出了基于图形处理器(GPU)的多波前潮流计算方法。采用多波前方法将稀疏的Jacobia矩阵分解成一系列小的稠密矩阵;再采用中央处理器-图形处理器(CPU–GPU)异构模式对得到的稠密矩阵进行处理,将计... 为提高潮流计算中线性方程组的求解速度,提出了基于图形处理器(GPU)的多波前潮流计算方法。采用多波前方法将稀疏的Jacobia矩阵分解成一系列小的稠密矩阵;再采用中央处理器-图形处理器(CPU–GPU)异构模式对得到的稠密矩阵进行处理,将计算耗时的矩阵分配给GPU,不耗时的分配给CPU;并设计了下三角矩阵按列存储、上三角矩阵按行存储的LU矩阵乘算法。对3个实际算例和5个人工算例进行了测试。实验结果表明,所提方案的性能与佛罗里达州立大学UMFPACK软件包实现的性能相比有显著提高;且随着测试数据规模的增大,GPU对更新矩阵的处理速度越快,最高可达到3.95倍的加速比。 展开更多
关键词 潮流计算 多波前方法 图形处理器 任务分配 矩阵乘算法 并行计算
在线阅读 下载PDF
基于冗余符号数的定点乘法器的设计 被引量:3
7
作者 姚若河 徐新才 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期27-34,共8页
为提高定点乘法器速度,减少乘法器面积,基于Radix-16冗余并行乘法器,将奇数倍部分积用冗余差分形式表示;将部分积的修正位与部分积进行压缩,减少了部分积数量;通过优化控制信号产生电路、Booth解码电路和二进制转换电路的结构,进一步减... 为提高定点乘法器速度,减少乘法器面积,基于Radix-16冗余并行乘法器,将奇数倍部分积用冗余差分形式表示;将部分积的修正位与部分积进行压缩,减少了部分积数量;通过优化控制信号产生电路、Booth解码电路和二进制转换电路的结构,进一步减少了乘法器延时和面积.TSMC 180nm工艺下的Design Complier综合结果表明,改进后冗余乘法器的面积相对减少8%,延时相对减少11%. 展开更多
关键词 乘法器 冗余 逻辑设计 解码 计算方法
在线阅读 下载PDF
联合编码模式选择的码率控制算法 被引量:11
8
作者 陈川 余松煜 《电子学报》 EI CAS CSCD 北大核心 2004年第5期763-768,共6页
本文提出了一种丢包网络中联合信源信道码率控制算法 .该算法克服了以往码率控制方法和误码复原技术互不关联的弊病 ,在统计率失真模型的基础上 ,联合最优地计算图像级量化参数和寻找最佳宏块编码模式 ,在给定的受限码率下能充分利用可... 本文提出了一种丢包网络中联合信源信道码率控制算法 .该算法克服了以往码率控制方法和误码复原技术互不关联的弊病 ,在统计率失真模型的基础上 ,联合最优地计算图像级量化参数和寻找最佳宏块编码模式 ,在给定的受限码率下能充分利用可用信道带宽 ,使得视频信源编码和信道传输总失真最小 .实验结果表明该算法能够获得比传统算法更高的性能增益 . 展开更多
关键词 H.264/AVC 率失真 帧内刷新 码率控制
在线阅读 下载PDF
大规模工程电磁场的亿自由度可扩展并行计算方法 被引量:6
9
作者 金亮 李育增 +2 位作者 杨庆新 张闯 闫帅 《电工技术学报》 EI CSCD 北大核心 2022年第3期589-598,共10页
精确和快速的电磁场计算,是电工装备精细模拟和优化设计的基础。该文在高性能云平台的高速互联弹性集群上开展可扩展并行计算研究,使用OpenMpi作为消息传递库,选取的区域分解算法为对偶原始有限元撕裂内联(FETI-DP)法,通过改进主从/对... 精确和快速的电磁场计算,是电工装备精细模拟和优化设计的基础。该文在高性能云平台的高速互联弹性集群上开展可扩展并行计算研究,使用OpenMpi作为消息传递库,选取的区域分解算法为对偶原始有限元撕裂内联(FETI-DP)法,通过改进主从/对等的并行程序框架实现电导率不变时涡流场磁矢势A的并行计算,在降低编程复杂度的同时提高了并行计算效率。使用C语言编写程序,用国际TEAMProblem7基准问题验证可扩展并行计算方法。该文将主从/对等并行程序框架和对偶原始有限元撕裂内联(FETI-DP)法引入电磁计算领域,提高了并行计算效率和可扩展性,为大规模工程电磁场计算提供了一种新的实践和理论方法。 展开更多
关键词 并行计算 电磁场数值计算 有限元法 对偶原始有限元撕裂内联法
在线阅读 下载PDF
喷管内流场并行计算方法研究 被引量:2
10
作者 徐旭 张振鹏 《推进技术》 EI CAS CSCD 北大核心 1998年第5期30-33,共4页
建立了基于区域分解的并行计算方法,将已有的后台阶喷管内流场三维TVDMac-Cormack显式格式的串行计算程序改造成为并行程序,获得了较高的并行加速比。并行计算结果同串行结果进行了对比,证明计算是成功的。
关键词 喷管气流 并行计算 计算方法 火箭发动机
在线阅读 下载PDF
基于自适应区域分解的电磁场有限元求解方法研究 被引量:9
11
作者 张云鹏 杨新生 +3 位作者 邵定国 张长庚 王清旋 傅为农 《高电压技术》 EI CAS CSCD 北大核心 2022年第7期2754-2761,共8页
为了高效利用现有并行计算资源、提高电磁场数值分析效率,提出一种自适应区域分解有限元法用以电磁场求解。该方法是在加性Schwarz区域分解法中引入基于度量张量的各向异性网格自适应方法,将h型自适应有限元方法与区域分解方法的优点结... 为了高效利用现有并行计算资源、提高电磁场数值分析效率,提出一种自适应区域分解有限元法用以电磁场求解。该方法是在加性Schwarz区域分解法中引入基于度量张量的各向异性网格自适应方法,将h型自适应有限元方法与区域分解方法的优点结合起来,在求解过程中生成对场分布响应更好的网格。为避免子区域独立网格自适应可能导致的悬点,在每步求解结束后对整个定义域的网格进行统一调整。计算过程中的多次子区域划分通过METIS实现,以基于当前网格对计算量在多处理器间进行合理分配。为进一步提高求解效率,在代数方程求解中将区域分解法用作Krylov子空间法的预处理算子。最后通过两个典型数值算例对所提方法在精度和效率方面的性能做了验证。结果表明:所提方法在保证求解精度的同时,所需自由度数目有显著降低(两个算例分别降低50%和36%),计算效率得到有效提高,验证了所提方法的有效性。 展开更多
关键词 电磁场数值计算 有限元法 自适应法 区域分解 并行计算 Krylov子空间法
在线阅读 下载PDF
基于GPU的电力系统并行潮流计算的实现 被引量:35
12
作者 夏俊峰 杨帆 +1 位作者 李静 郑秀玉 《电力系统保护与控制》 EI CSCD 北大核心 2010年第18期100-103,110,共5页
在研究GPU通用计算方法和潮流计算算法的基础上,针对GPU计算密集、高度并行化等特点,对潮流计算牛顿法进行了适当的简化,并应用统一计算设备架构(Compute Unified Device Architecture,CUDA)的开发平台,提出了一种基于GPU的并行潮流计... 在研究GPU通用计算方法和潮流计算算法的基础上,针对GPU计算密集、高度并行化等特点,对潮流计算牛顿法进行了适当的简化,并应用统一计算设备架构(Compute Unified Device Architecture,CUDA)的开发平台,提出了一种基于GPU的并行潮流计算程序的设计方法。仿真计算结果表明此算法可行,并具有较高的计算效率,为电力系统并行潮流计算的研究提供了一种可行的方法。 展开更多
关键词 潮流计算 并行计算 GPU通用计算 统一计算设备架构 牛顿法
在线阅读 下载PDF
一种GPU-CPU异构运算框架加速的实时N-1交流潮流计算方法 被引量:18
13
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2018年第15期4329-4338,共10页
随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中... 随着电力系统规模的扩大,为了适应N-1安全校验日益上升的实时性和精确性的需求,提出一种图形处理单元—中央处理单元(graphics processing unit-central processing unit,GPU-CPU)异构运算框架加速的实时N-1交流潮流计算方法。算法中设计一种N-1潮流问题的拼接求解方法,将原本多个独立的潮流问题组合为一个。雅可比矩阵的拼接生成采用并行化处理,线性方程组的求解根据规模大小选择直接法或迭代法处理,其中迭代法采用并行化处理。算法整体分为CPU处理部分和GPU处理部分,CPU处理迭代初值的设定、节点导纳矩阵的形成、校验集合的形成、迭代值的修正、收敛性判断等步骤,GPU处理雅可比矩阵的拼接生成等步骤,修正方程组的求解根据其规模选择CPU求解或GPU求解,以达到快速求解的目的。算例表明,所提算法效率和精度高、空间占用小,与传统N-1潮流算法相比具有明显优势,能够满足电网实时N-1潮流计算的需求,具有工程应用价值。 展开更多
关键词 N-1潮流计算 GPU-CPU异构运算架构 并行化 拼接求解 迭代法
在线阅读 下载PDF
基于GPU并行计算的雷达杂波模拟研究 被引量:6
14
作者 徐国伟 陈建 成怡 《计算机工程》 CAS CSCD 北大核心 2020年第11期306-314,共9页
现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下... 现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下,对相关相干K分布杂波算法进行多任务串-并行分析,采用cuBLAS库对细粒度卷积计算进行优化,利用OpenMP+CUDA多任务调度机制改进粗粒度任务并行计算,以提高CPU-GPU利用率并减少数据等待时间。实验结果表明,该方法生成杂波数据的实时性显著提升,且随着杂波数据量增大其加速效果更好,相较传统GPU方法计算速率提高61%。 展开更多
关键词 雷达杂波 GPU并行计算 球不变随机过程法 卷积计算 cuBLAS库
在线阅读 下载PDF
基于区域分解的大规模并行有限元快速算法 被引量:4
15
作者 王卫杰 陈晓洁 周海京 《电子学报》 EI CAS CSCD 北大核心 2019年第3期741-747,共7页
区域分解方法是近来发展迅速的有限元求解方法之一.基于有限元区域分解方法以及多重网格的思想,我们研究了自适应求解以及离散扫频快速算法,并采用自主研发的高性能计算并行框架,将基于区域分解的大规模并行有限元快速算法进行了实现,... 区域分解方法是近来发展迅速的有限元求解方法之一.基于有限元区域分解方法以及多重网格的思想,我们研究了自适应求解以及离散扫频快速算法,并采用自主研发的高性能计算并行框架,将基于区域分解的大规模并行有限元快速算法进行了实现,并行规模能够扩展到数万CPU核.我们在文中将展示程序的核心架构,以及如何采用多重网格算法的思想实现有效的粗网格校正技术,从而实现有限元线性系统的多次快速求解,加速自适应求解和离散扫频.最后,对算法进行了准确性验证以及大规模并行测试. 展开更多
关键词 电磁场 有限元 区域分解 多重网格 自适应计算 离散扫频 并行计算
在线阅读 下载PDF
提升PD效率的粒子对方法及信息传递接口并行方法
16
作者 韩康 张媛 +2 位作者 王超 叶礼裕 郭春雨 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第8期1451-1459,共9页
为了避免近场动力方法中粒子间物理信息重复求解消耗的计算成本和占据的额外内存,克服近场动力学低效率计算过程对其工程应用的制约,本文提出一种提升PD计算效率的粒子对方法并建立了该方法的信息传递接口并行方法。利用粒子对方法的信... 为了避免近场动力方法中粒子间物理信息重复求解消耗的计算成本和占据的额外内存,克服近场动力学低效率计算过程对其工程应用的制约,本文提出一种提升PD计算效率的粒子对方法并建立了该方法的信息传递接口并行方法。利用粒子对方法的信息传递接口并行策略并分析其计算效率的优越性,通过大型的工程应用实例给出了本文方法的工程实用性。研究结果表明:粒子对方法的应用不仅提升了计算效率,也优化了邻域粒子信息储存数组占据的内存和计算时间,粒子对方法可与信息传递接口并行编程相结合,能够进一步提升其计算效率,并且在较多线程并行时,计算效率高于OpenMP并行方法,而在实际计算中,加速效果也会受到不同线程间的通信任务影响。 展开更多
关键词 粒子对方法 近场动力学 计算效率 信息传递接口并行 工程应用 数值计算 并行计算 粒子搜索
在线阅读 下载PDF
基于2级3阶Radau Ⅱ A方法的电磁暂态并行计算方法 被引量:6
17
作者 谭炜东 郝斌 李坤 《南方电网技术》 北大核心 2018年第6期45-51,共7页
为了解决电磁暂态计算中的数值震荡问题并提高电磁暂态仿真的计算效率,在多个时间点上运用2级3阶Radau Ⅱ A方法连续离散,然后运用牛顿法求解,形成一种新的电磁暂态并行计算方法。由于2级3阶Radau Ⅱ A方法具有良好的计算精度和稳定性,... 为了解决电磁暂态计算中的数值震荡问题并提高电磁暂态仿真的计算效率,在多个时间点上运用2级3阶Radau Ⅱ A方法连续离散,然后运用牛顿法求解,形成一种新的电磁暂态并行计算方法。由于2级3阶Radau Ⅱ A方法具有良好的计算精度和稳定性,本文方法不仅可以采用更大的步长进行并行计算,还可以消除数值震荡。算例检验证明,所提方法不仅消除了数值震荡,还有效的提高了电力系统电磁暂态数值仿真计算的精度、效率及实时性。 展开更多
关键词 电磁暂态计算 RadauⅡA方法 牛顿法 数值震荡 并行计算
在线阅读 下载PDF
基于非局部低秩约束的改进灵敏度编码重建算法
18
作者 潘婷 段继忠 《数据采集与处理》 CSCD 北大核心 2023年第1期193-208,共16页
灵敏度编码(Sensitivity encoding,SENSE)是一种应用广泛的并行磁共振成像(Magnetic resonance imaging,MRI)重建模型。目前已有的针对SENSE模型的改进方法的重建图像中依然有较多伪影,尤其在较高加速因子时很难重建出比较清晰的图像。... 灵敏度编码(Sensitivity encoding,SENSE)是一种应用广泛的并行磁共振成像(Magnetic resonance imaging,MRI)重建模型。目前已有的针对SENSE模型的改进方法的重建图像中依然有较多伪影,尤其在较高加速因子时很难重建出比较清晰的图像。因此,本文基于非局部低秩约束(Nonlocal low-rank,NLR),提出了一种改进的SENSE模型,称为NLR-SENSE。该模型使用加权核范数作为秩代理函数,并使用交替方向乘子法(Alternating direction multiplier method,ADMM)进行求解。仿真实验结果表明,与其他几种并行磁共振成像方法相比,NLR-SENSE方法在视觉比较和3个不同的客观指标上均表现优异,能有效提升重建图像的质量。 展开更多
关键词 图像重建 并行磁共振成像 非局部低秩 灵敏度编码 加权核范数 交替方向乘子法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部