期刊文献+
共找到191篇文章
< 1 2 10 >
每页显示 20 50 100
面向国产异构众核系统的Parallel C语言设计与实现 被引量:10
1
作者 何王全 刘勇 +2 位作者 方燕飞 魏迪 漆锋滨 《软件学报》 EI CSCD 北大核心 2017年第4期764-785,共22页
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、... 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 展开更多
关键词 异构众核 编程模型 并行语言 parallel C 编译器 消息传递
在线阅读 下载PDF
一种基于Message Passing的并行程序设计技术 被引量:1
2
作者 温钰洪 王鼎兴 +1 位作者 沈美明 郑纬民 《小型微型计算机系统》 CSCD 北大核心 1995年第5期7-13,共7页
本文首先分析介绍构造并行计算机系统的两种方法:Multiprocessors和Multicomputers,然后介绍一种Multicomputers并行计算机系统中基于messagepassing的并行程序设计环境以... 本文首先分析介绍构造并行计算机系统的两种方法:Multiprocessors和Multicomputers,然后介绍一种Multicomputers并行计算机系统中基于messagepassing的并行程序设计环境以及并行程序设计方法,它具有程序设计简单、直观等特点,易于构造程序模型,并能获得较好的加速比。 展开更多
关键词 程序设计 并行程序 并行计算机
在线阅读 下载PDF
基于Message Passing的并行编程环境 被引量:2
3
作者 刘欣然 胡铭曾 《计算机工程》 EI CAS CSCD 北大核心 1997年第5期17-20,共4页
在分布式并行计算机系统中,由于处理机间无共事内存,因此采用了MessagePassins方式实现处理机间的通信.文中讨论了基于MessagePassing把的并行编程环境所应具备的特点,然后介绍几种被人们普遍接受的并行编程环境.
关键词 消息传递 并行编程 并行计算机
在线阅读 下载PDF
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
4
作者 朱琦 戴艺 +5 位作者 彭晋韬 谢旻 梁崇山 刘鹏 杨博 刘杰 《计算机工程与科学》 北大核心 2025年第3期400-411,共12页
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限... Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。 展开更多
关键词 MPI BARRIER 大规模并行应用 NIC聚合通信卸载
在线阅读 下载PDF
电大涂覆目标SBR算法与MPI并行加速技术
5
作者 吴扬 王思凡 +5 位作者 申子昂 贾浩文 祝强强 徐若锋 郭卿超 赵雷 《电波科学学报》 北大核心 2025年第3期407-414,共8页
为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并... 为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并将其与SBR法耦合,精确计算了多层介质涂覆目标的雷达散射截面(radar cross section,RCS);为进一步提高计算效率,采用基于CPU平台的MPI并行加速技术,实现了SBR算法的高效并行。数值结果表明:所计算的二面角反射器模型和舰船模型RCS结果与商业软件FEKO结果之间吻合良好,其中二面角反射器的均方根误差小于3 dBsm;针对电大涂覆飞行器目标,各计算进程的并行效率均达到80%以上。该方法有效解决了电大涂覆目标电磁散射计算的精度和速度,为电大复杂目标隐身性能的评估计算提供了高效的解决方案。 展开更多
关键词 弹跳射线(SBR)法 广义传播矩阵法 MPI并行 雷达散射截面(RCS) 雷达吸波材料(RAM)
在线阅读 下载PDF
MPI:大有希望的massage_passing标准 被引量:1
6
作者 王继龙 唐朔飞 方滨兴 《计算机科学》 CSCD 北大核心 1996年第4期31-34,共4页
message-passing是一个被广泛应用的并行计算模型,但至今,无论从语法或语义上message-Passing都还没有形成一个标准.并行计算机厂商在提供标准串行语言的同时,提供了各自不同的专有message一passing库,并行程序设计难免依赖于具体的系... message-passing是一个被广泛应用的并行计算模型,但至今,无论从语法或语义上message-Passing都还没有形成一个标准.并行计算机厂商在提供标准串行语言的同时,提供了各自不同的专有message一passing库,并行程序设计难免依赖于具体的系统和应用,这既限制了可移植性,也限制了听取用户对某些不易获得或对当前的应用不合适的系统的意见。没有一个标准,厂商们非常自然地把他们的专有库的优点视为有竟争力的优势,更加着力与众不同(因而不可移植)。为了应付可移植问题,研究团体已经开发了许多库来收集其它库之间的不同点. 展开更多
关键词 并行程序设计 MPI MASSAGE passing 标准
在线阅读 下载PDF
一种面向通用计算设备的自动流水线并行训练框架
7
作者 钟震宇 林勇良 +3 位作者 王昊天 李东闻 孙羽菲 张玉志 《计算机科学》 CSCD 北大核心 2024年第12期129-136,共8页
训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现。现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备。为支持大规模深度神经网络的高效训... 训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现。现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备。为支持大规模深度神经网络的高效训练,实现了一种通用的自动流水线并行分布式训练框架。本框架通过结合基于流水线并行的模型并行策略与神经网络模型自动拆分算法,实现了在包括国内新一代超级计算机在内的通用计算机集群上,对大规模神经网络模型与训练数据进行自动并行化处理和训练,显著减轻单个计算节点的内存和计算压力。该框架无需人工调整,可以自动高效地在多节点分布式环境中部署深度神经网络,不仅适用于超级计算机等高性能计算机集群,还可以部署到其他通用的分布式计算环境中,为大规模神经网络的自动化分布式训练提供支持。 展开更多
关键词 流水线并行 深度神经网络 超级计算机 MPI 并行计算
在线阅读 下载PDF
基于模式记忆并行蚁群算法的输电网规划 被引量:35
8
作者 翟海保 程浩忠 +2 位作者 吕干云 陈小良 马则良 《中国电机工程学报》 EI CSCD 北大核心 2005年第9期17-22,共6页
该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上... 该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上,设计了一种基于模式记忆的并行蚁群算法,该算法通过模式记忆实现了解空间分解,能够有效地识别、记忆和跳出局部最优解;通过局部细化搜索进一步加强了局部搜索能力;通过并行计算提高了计算速度。某实际77 节点的算例分析表明了该算法具有很高的计算效率和优秀的局部、全局收敛性,有效克服了现代启发式算法在求解输电网规划问题时存在的效率不高及未成熟收敛等现象。 展开更多
关键词 输电网规划 蚁群算法 记忆 模式 现代启发式算法 未成熟收敛 局部搜索能力 全局最优解 局部最优解 全局收敛性 规划求解 规划模型 空间分解 计算速度 并行计算 计算效率 规划问题 解空间 分析表
在线阅读 下载PDF
梯级水电站群长期优化调度云计算随机动态规划算法 被引量:17
9
作者 周东清 彭世玉 +1 位作者 程春田 王健 《中国电机工程学报》 EI CSCD 北大核心 2017年第12期3437-3448,共12页
为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式... 为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式计算平台能够充分利用资源,具有诸多优势。为了探索云平台下的分布式并行随机动态规划模型,该文基于消息传递接口(message passing interface,MPI)和Spark框架分别实现了传统集群计算和云计算分布式随机动态规划算法,后者将计算模型转换为数据处理模型进行计算,并通过三库优化调度实验对算法进行了比较。算法分析及实验结果表明,基于云计算的分布式并行随机动态规划算法则可以有效利用云平台的优势,同时拥有完善的容错以及负载均衡机制,具有广阔的应用前景。 展开更多
关键词 随机动态规划 并行计算 云计算 消息传递接口(MPI) spark框架
在线阅读 下载PDF
地理栅格数据的并行访问方法研究 被引量:8
10
作者 欧阳柳 熊伟 +2 位作者 程果 陈宏盛 陈荦 《计算机科学》 CSCD 北大核心 2012年第11期116-121,共6页
在海量地理栅格数据处理中,数据I/O性能是影响处理算法程序整体性能的关键。目前针对地理栅格数据I/O优化问题的研究成果还很有限,通过对并行程序中的数据I/O模式进行深入分析,结合栅格数据逻辑模型和物理模型的特点,提出了面向地理栅... 在海量地理栅格数据处理中,数据I/O性能是影响处理算法程序整体性能的关键。目前针对地理栅格数据I/O优化问题的研究成果还很有限,通过对并行程序中的数据I/O模式进行深入分析,结合栅格数据逻辑模型和物理模型的特点,提出了面向地理栅格数据的并行I/O框架;基于消息传递模型,实现了4种并行访问方法。实验证明,并行访问方法优于传统的串行访问方法和分时多进程访问方法。该研究成果可以提高并行栅格处理程序的I/O访问效率,进而提高其整体并行性能。 展开更多
关键词 地理栅格数据 并行数据访问 并行栅格数据处理 消息传递模型
在线阅读 下载PDF
用三维并行时域有限差分算法研究光子晶体薄板W3波导传输特性 被引量:7
11
作者 朱志宏 叶卫民 +2 位作者 季家镕 袁晓东 曾淳 《光子学报》 EI CAS CSCD 北大核心 2006年第6期815-818,共4页
构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究·性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比·具体计算了W3波导的透射率... 构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究·性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比·具体计算了W3波导的透射率频谱和光场分布·结果表明:光子晶体薄板W3波导能够实现光的三维约束,其导带中存在着微小禁带(mini-gap)· 展开更多
关键词 光子晶体 时域有限差分 并行计算 消息传递接口 W3波导
在线阅读 下载PDF
改进的并行高斯全主元消去法 被引量:7
12
作者 孙济洲 樊莉亚 +2 位作者 孙敏 于策 张绍敏 《天津大学学报》 EI CAS CSCD 北大核心 2006年第9期1115-1119,共5页
为减少Gauss全主元消法的运行时间,用多进程与多线程混合的方式对其进行了并行化,同时对该算法进行了改进.采用MPI并行I/O技术提高读取数据文件的速度,降低对内存的需求;采用标志数组避免了选主元后换行带来的通信开销;使用线程模型... 为减少Gauss全主元消法的运行时间,用多进程与多线程混合的方式对其进行了并行化,同时对该算法进行了改进.采用MPI并行I/O技术提高读取数据文件的速度,降低对内存的需求;采用标志数组避免了选主元后换行带来的通信开销;使用线程模型确定最优线程数,提高运行消去的速度;通过预先发布机制降低回代求解步骤的时间复杂度.实际运行结果表明,随着方程组阶数增大,加速比也逐渐增大,对于5000元的方程组,8进程同时运行,加速比可达6.68,并行效率稳定在0.85左右.这表明该算法具有可扩展性和稳定的并行效率,适用于大规模并行计算. 展开更多
关键词 Gauss全主元消去法 MPI Pthreads 并行算法
在线阅读 下载PDF
网络环境中MPI和PVM的分析与比较 被引量:5
13
作者 赵晨 李仕锋 +1 位作者 许小刚 王萃寒 《计算机工程与应用》 CSCD 北大核心 2003年第3期181-183,共3页
消息传递接口(MessagePassingInterface,MPI)和并行虚拟机(ParallelVirtualMachine,PVM)是两种广泛应用的网络分布式并行计算环境。论文首先介绍了消息传递接口和并行虚拟机两者各自的起源和特点,然后在此基础上从可移植性、点对点通信... 消息传递接口(MessagePassingInterface,MPI)和并行虚拟机(ParallelVirtualMachine,PVM)是两种广泛应用的网络分布式并行计算环境。论文首先介绍了消息传递接口和并行虚拟机两者各自的起源和特点,然后在此基础上从可移植性、点对点通信、集体通信、资源管理和容错能力等多方面分析和比较了这两者的功能特点。 展开更多
关键词 网络环境 MPI PVM 消息传递接口 并行虚拟机 分布式并行计算 点对点通信 集体通信 计算机网络
在线阅读 下载PDF
作物生长模型分布式并行调度方案的比较 被引量:4
14
作者 姜海燕 尹言 +2 位作者 彭川阳 汤亮 曹卫星 《农业工程学报》 EI CAS CSCD 北大核心 2011年第6期237-243,共7页
为了提高作物生长模型的计算速度,论文提出了多种分布式并行调度方案。综合分析了田块尺度下作物生长子模型以及子模型内部组分的数据依赖关系和计算流程。以流水线技术和分治策略为基础,分别在模型组分层、子模型层和驱动数据层设计了... 为了提高作物生长模型的计算速度,论文提出了多种分布式并行调度方案。综合分析了田块尺度下作物生长子模型以及子模型内部组分的数据依赖关系和计算流程。以流水线技术和分治策略为基础,分别在模型组分层、子模型层和驱动数据层设计了不同的分布式并行调度方案。在WCCS2003(Windows Compute Cluster Server 2003)组成的PC集群环境下,分别采用了OpenMP、MPI_OpenMP混合以及MPI编程模型实现了多种调度方案的并行模拟。并行加速比的实验分析表明,优化后的子模型层并行调度方案,在6个双核CPUs组成的PC集群上的平均加速比可达到8.2,更接近模型并行计算加速比的预测值。在分布式集群环境下,采用基于MPI的子模型层中等粒度的并行调度方案具有更快的计算速度,更适合于作物生长模拟系统。 展开更多
关键词 作物 并行算法 消息传递 生长模拟模型 集群 共享内存
在线阅读 下载PDF
作物生育期模拟并行调度算法的研究与设计 被引量:5
15
作者 姜海燕 彭川阳 +2 位作者 尹言 朱艳 曹卫星 《江苏农业学报》 CSCD 北大核心 2010年第6期1210-1216,共7页
探明作物生育期模拟在PC集群环境下的并行调度算法,有助于提高模型的计算效率。该研究综合应用划分策略和流水线技术,具体分析了已有作物的生长发育和物候期模拟算法的输入输出参数特性,确定了作物生育期模拟通用算法框架,包括热效应、... 探明作物生育期模拟在PC集群环境下的并行调度算法,有助于提高模型的计算效率。该研究综合应用划分策略和流水线技术,具体分析了已有作物的生长发育和物候期模拟算法的输入输出参数特性,确定了作物生育期模拟通用算法框架,包括热效应、光周期效应、春化效应、有效积温、生理发育时间和物候期共6个计算单元;进一步明确了具有独立、自依赖和相互依赖关系的作物模型的计算任务划分和数据分解方法。为达到数据通讯和同步开销最小的目标,设计了多节点混合调度的优化模型。该研究提出了基于OpenMP的多处理机并行调度算法和基于MPI/OpenMP混合的多节点并行调度算法,并在Windows Compute Cluster Server2003组成的PC集群环境下,在加速比、计算缓冲区大小和计算节点个数等方面进行了性能度量与比较。结果表明:两种并行调度算法均可有效提高小麦生育期模拟的计算效率,第1种算法简单易行,平均加速比为1.55,对集群计算资源的利用率有限;第2种算法的平均加速比是3.37,当计算量较大时,具有更好的计算性能。 展开更多
关键词 生长发育与物候期 模拟模型 小麦 并行算法 共享内存 消息传递
在线阅读 下载PDF
GRAPES全球格点模式的并行计算负载平衡策略 被引量:7
16
作者 伍湘君 陈德辉 +3 位作者 宋君强 金之雁 杨学胜 张红亮 《气象学报》 CAS CSCD 北大核心 2010年第5期591-597,共7页
随着高性能计算机技术的发展和应用,并行计算已成为保证数值天气预报模式业务运行时效的关键技术之一。目前高性能计算机计算能力已达到每秒千万亿次浮点计算,系统中处理器数量也早已达十万甚至更多,如此巨大的计算资源对应用软件系统... 随着高性能计算机技术的发展和应用,并行计算已成为保证数值天气预报模式业务运行时效的关键技术之一。目前高性能计算机计算能力已达到每秒千万亿次浮点计算,系统中处理器数量也早已达十万甚至更多,如此巨大的计算资源对应用软件系统的设计也提出了挑战。数值天气预报软件系统要充分利用高性能计算机提供的计算资源,必须依靠并行计算方法,这包括适合计算问题的可扩展并行算法的设计、合适的数据分配方案以及良好的任务负载平衡方案。作为中国新一代数值天气预报格点模式,GRAPES(Global and Regional Assimilation and PrEdiction System)设计的最终目标是一个科研/业务通用,区域/全球通用模式。作为一个格点模式,GRAPES的并行计算具有与欧洲中期数值预报研究中心谱模式并行计算不同的特点,GRAPES的并行计算采用了经典的水平网格数据划分。但对于全球的GRAPES模式,由于采用拉格朗日差分方案,模式极地及附近区域格点与格点之间距离的减小,使得模式并行计算在采用简单的经纬网格划分方式实现时,必须考虑极地区域并行计算跨越多个处理器时导致的频繁通讯解决途径。本研究提出了利用消息传递组通讯实现全球格点模式并行计算的一种方法,其核心思想是将极点附近一定区域内的处理器按纬向划归不同的处理器组。文中还给出了该实现方法的任务分配算法,提出了改进的任务分配负载平衡方案。在中国气象局高性能计算机IBM-cluster1600上的测试表明,算法具有较好的可扩展性,其负载平衡方案改善了计算的绝对墙钟时间,使并行计算效率提高10%以上。模式的准业务运行结果表明计算墙钟时间基本可以满足数值预报业务的实时性要求。 展开更多
关键词 GRAPES模式 并行计算 消息传递组通讯 负载平衡 IBM-cluster1600
在线阅读 下载PDF
并行最短路径搜索算法的设计与实现 被引量:21
17
作者 卢照 师军 《计算机工程与应用》 CSCD 北大核心 2010年第3期69-71,共3页
针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,... 针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,该算法搜索速度快且性能稳定,当结点数目相当庞大时,算法的优越性更加明显。 展开更多
关键词 最短路径 并行机环境 message passing Interface(MPI) 并行搜索算法
在线阅读 下载PDF
分布式并行混合遗传算法在无功优化中的应用 被引量:9
18
作者 李运华 吴宏昺 +1 位作者 盛万兴 刘科研 《电力系统及其自动化学报》 CSCD 北大核心 2008年第2期36-41,共6页
将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标... 将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标准数据运算,证明了这种算法在电力系统无功优化计算中具有很高的稳定性和快速求解能力。 展开更多
关键词 无功优化 消息传递界面 分布式并行混合遗传算法 模拟退火 个体迁移 最优值恢复
在线阅读 下载PDF
一种基于检查点的并行程序调试器的设计与实现 被引量:6
19
作者 刘建 汪东升 +1 位作者 沈美明 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2002年第12期1580-1586,共7页
为支持大规模长时间运行并行程序的调试 ,有必要将检查点机制引入到并行程序调试器中 .检查点设置与卷回应用中需要解决中途消息、孤儿消息和多米诺效应、活锁 4个问题 ;并行程序调试中需要解决不确定性问题 .提出的基于状态冻结的确定... 为支持大规模长时间运行并行程序的调试 ,有必要将检查点机制引入到并行程序调试器中 .检查点设置与卷回应用中需要解决中途消息、孤儿消息和多米诺效应、活锁 4个问题 ;并行程序调试中需要解决不确定性问题 .提出的基于状态冻结的确定性检查点设置方法 ,可以避免检查点应用中孤儿消息和多米诺效应、活锁 3个问题 ,通过消息记录的方法处理中途消息问题 ;采用记录 /重放方法解决并行调试中的不确定性问题 .基于状态冻结的确定性检查点设置方法 ,有效地解决了并行程序调试器和检查点结合时产生的诸多问题 .该方法具有结构清晰、易于实现的优点 .基于此技术 ,设计并实现了一个并行调试工具—— DENNET. 展开更多
关键词 检查点 并行程序调试器 设计 消息传递
在线阅读 下载PDF
电力系统动态无功优化并行算法及其实现 被引量:40
20
作者 缪楠林 刘明波 赵维兴 《电工技术学报》 EI CSCD 北大核心 2009年第2期150-157,共8页
由于全天24个时段的动态无功优化模型需要考虑变压器分接头和电容器投切开关的允许动作次数限制,当采用引入离散惩罚机制的非线性原对偶内点法求解时,其修正方程的维数会随系统规模的增大而急剧增大,但不难发现其修正方程系数矩阵具有... 由于全天24个时段的动态无功优化模型需要考虑变压器分接头和电容器投切开关的允许动作次数限制,当采用引入离散惩罚机制的非线性原对偶内点法求解时,其修正方程的维数会随系统规模的增大而急剧增大,但不难发现其修正方程系数矩阵具有对角加边分块结构,可将其解耦为25个低维线性方程组。从而提出一种粗粒度的并行计算方法,并在基于消息传递接口(MPI)机制的并行计算环境下实现。将所提算法应用于一个实际的14节点和IEEE118节点系统的实践表明,它能够有效地提升计算速度,在大型电力系统中有着良好的应用潜力。 展开更多
关键词 动态无功优化 非线性原对偶内点法 离散惩罚 并行计算 消息传递接口
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部