期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
面向深度神经网络大规模分布式数据并行训练的MC^(2)能耗模型 被引量:1
1
作者 魏嘉 张兴军 +2 位作者 王龙翔 赵明强 董小社 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期2985-3004,共20页
深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性... 深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性能计算平台过量能耗方面起着至关重要的作用.目前,大部分的能耗模型都是从设备的角度出发对单个设备或多个设备构成的集群进行能耗建模,由于缺乏从能耗角度对分布式并行DNN应用进行分解剖析,导致罕有针对分布式DNN应用特征进行建模的能耗模型.针对目前最常用的DNN分布式数据并行训练模式,从DNN模型训练本质特征角度出发,提出了“数据预处理(materials preprocessing)-前向与反向传播(computing)-梯度同步与更新(communicating)”三阶段MC^(2)能耗模型,并通过在国产E级原型机天河三号上使用最多128个MT节点和32个FT节点训练经典的VGG16和ResNet50网络以及最新的Vision Transformer网络验证了模型的有效性和可靠性.实验结果表明,MC^(2)与真实能耗测量结果相差仅为2.84%,相较4种线性比例能耗模型以及AR,SES,ARIMA时间预测模型准确率分别提升了69.12个百分点,69.50个百分点,34.58个百分点,13.47个百分点,5.23个百分点,22.13个百分点,10.53个百分点.通过使用的模型可以在超算平台得到DNN模型的各阶段能耗和总体能耗结果,为评估基于能耗感知的DNN大规模分布式数据并行训练及推理各阶段任务调度、作业放置、模型分割、模型裁剪等优化策略的效能提供了基础. 展开更多
关键词 深度神经网络 能耗模型 大规模分布式训练 数据并行 超级计算机
在线阅读 下载PDF
基于混合式IP组播的大规模分布式仿真数据传输分配策略
2
作者 刘晓建 钟海荣 +1 位作者 叶超群 金士尧 《电子学报》 EI CAS CSCD 北大核心 2003年第11期1678-1681,共4页
在涉及到“一对多”或“多对多”数据传输时 ,人们通常假定只有广播、IP组播和多次“点对点”方式可用 ,研究点对点和IP组播两种数据传输方式的分配策略 .本文针对这些传输方式的缺陷 ,提出了混合式IP组播传输方式 ,并分析、比较了各种... 在涉及到“一对多”或“多对多”数据传输时 ,人们通常假定只有广播、IP组播和多次“点对点”方式可用 ,研究点对点和IP组播两种数据传输方式的分配策略 .本文针对这些传输方式的缺陷 ,提出了混合式IP组播传输方式 ,并分析、比较了各种传输方式的性能 ,进而提出了基于混合式IP组播优先的信息流归并IP组播组分配算法 .测试表明 ,本算法优于以往相关工作 . 展开更多
关键词 大规模分布式仿真 IP组播 组播组分配 混合式IP组播
在线阅读 下载PDF
面向大规模汇聚接入网的分布式VoD服务的性能仿真 被引量:1
3
作者 林珉 王新 +2 位作者 郑常熠 汪斌强 薛向阳 《电子学报》 EI CAS CSCD 北大核心 2008年第10期2035-2039,共5页
流媒体应用有着实时性、连续性、带宽消耗大等特点,对传输网络提出了较高的要求.用户接入网作为传输网络的重要组成部分,对流媒体服务质量有重要影响.新一代高性能宽带信息网的试运行,初步验证了大规模汇聚接入网络技术在某些条件下支... 流媒体应用有着实时性、连续性、带宽消耗大等特点,对传输网络提出了较高的要求.用户接入网作为传输网络的重要组成部分,对流媒体服务质量有重要影响.新一代高性能宽带信息网的试运行,初步验证了大规模汇聚接入网络技术在某些条件下支持流媒体的有效性.然而,由于某些限制,在试运行中还不能实现在大规模用户并发访问流媒体服务器的条件下的验证,而在仿真中却可以实现这种验证.在本文中,我们对于面向不同接入网的分布式VoD系统作了仿真比较.结果表明,面向大规模汇聚接入网的VoD系统在接入路由器无拥塞时,在相同的硬件成本下,在端到端时延及其抖动指标上有较大的提高. 展开更多
关键词 大规模汇聚 接入网络 视频点播 分布式服务 仿真
在线阅读 下载PDF
基于多核心处理器的分布式发电微网系统暂态并行仿真方法 被引量:22
4
作者 李鹏 丁承第 +4 位作者 王成山 高菲 于浩 李海涛 黄小耘 《中国电机工程学报》 EI CSCD 北大核心 2013年第16期171-178,4,共8页
分布式发电技术的多样性和微网运行的复杂性使得分布式发电微网系统中的动态过程更为复杂,必须借助相关的暂态仿真工具才能较为准确地了解其动态特性以及对外部电网产生的影响。然而,当微网及其所接入的配网规模庞大,控制复杂,并同时含... 分布式发电技术的多样性和微网运行的复杂性使得分布式发电微网系统中的动态过程更为复杂,必须借助相关的暂态仿真工具才能较为准确地了解其动态特性以及对外部电网产生的影响。然而,当微网及其所接入的配网规模庞大,控制复杂,并同时含有多种分布式电源和储能装置时,暂态仿真的计算性能是限制其应用的主要障碍。提出了一种面向分布式发电微网系统暂态仿真的并行计算方法,该方法首先将电气系统与控制系统的求解过程进行解耦,并利用各分布式发电单元中的分布式电源及其控制器模型在控制系统中建模求解时具有自然解耦的特点,进一步实现计算任务的分解,从而能够并行求解,加快了仿真计算速度。该方法简单、易于实现,可充分利用多核心处理器计算机的计算资源。考虑到分布式发电系统的典型结构,微网中的多个分布式发电单元在利用自然解耦关系降维时具有相近的计算规模,能够充分发挥并行计算的性能。 展开更多
关键词 分布式发电 微网 暂态仿真 并行算法
在线阅读 下载PDF
分布式小卫星SAR回波仿真的并行化研究 被引量:8
5
作者 路兴强 梁甸农 +1 位作者 王敏 余安喜 《信号处理》 CSCD 北大核心 2006年第3期343-347,共5页
分布式小卫星SAR系统回波仿真的计算量和存储量巨大,本文分析了回波仿真及其快速算法,提出了基于仿真时间分解和基于场景分解的两种并行任务分解方法;性能分析表明,前者能够显著提高算法的加速效率,后者在处理大尺寸场景时能有效克服内... 分布式小卫星SAR系统回波仿真的计算量和存储量巨大,本文分析了回波仿真及其快速算法,提出了基于仿真时间分解和基于场景分解的两种并行任务分解方法;性能分析表明,前者能够显著提高算法的加速效率,后者在处理大尺寸场景时能有效克服内存不足的问题。最后,一组小型集群系统环境下的仿真实验数据证实了两种方法的可行性和有效性。 展开更多
关键词 分布式小卫星SAR 回波仿真 集群 并行
在线阅读 下载PDF
并行/分布式仿真微内核μsik的研究与改进 被引量:3
6
作者 乔海泉 鞠儒生 +2 位作者 张锰 李革 黄柯棣 《系统仿真学报》 CAS CSCD 北大核心 2006年第z2期214-217,221,共5页
在大规模分布式仿真中,要开发一个内部实体能并行处理的联邦成员,目前还没有比较通用的开发工具。并行/分布式仿真微内核μsik使这类联邦成员的开发不必从零开始。该文首先阐明并行仿真与分布仿真的异同,以及并行仿真中的同步与回退机制... 在大规模分布式仿真中,要开发一个内部实体能并行处理的联邦成员,目前还没有比较通用的开发工具。并行/分布式仿真微内核μsik使这类联邦成员的开发不必从零开始。该文首先阐明并行仿真与分布仿真的异同,以及并行仿真中的同步与回退机制,接下来对μsik从体系结构、数据结构、调度过程和事件发送过程等方面进行分析,然后在μsik中增加了两种事件发送机制:保守发送机制和限制的乐观发送机制,对改进的内核进行测试并对测试结果做了详细分析,结果表明增加的事件发送机制能够提高系统性能。 展开更多
关键词 并行仿真 分布式仿真 乐观机制 保守机制 回退 反消息
在线阅读 下载PDF
改进的暂态稳定分布式并行仿真算法 被引量:21
7
作者 王成山 张家安 《电力系统自动化》 EI CSCD 北大核心 2003年第19期30-33,60,共5页
针对基于支路分割和区域迭代的暂态稳定分布式并行算法的计算效率问题 ,根据电力系统机电暂态过程电气变量的响应特点和分布式协同计算实现过程中子系统间的信息交接特点 ,提出了改善暂态稳定仿真分布式计算效率的积分步初值估计法和积... 针对基于支路分割和区域迭代的暂态稳定分布式并行算法的计算效率问题 ,根据电力系统机电暂态过程电气变量的响应特点和分布式协同计算实现过程中子系统间的信息交接特点 ,提出了改善暂态稳定仿真分布式计算效率的积分步初值估计法和积分步内交接变量修正调节法。应用10 0 0母线 2 0 0机系统算例 ,在暂态稳定虚拟并行计算平台VAPP TSSP上对改进算法进行了验证。改进算法降低了系统计算收敛交接变量的必要通信频度 ,改善了数值仿真系统的迭代收敛特性 。 展开更多
关键词 暂态稳定 电力系统 仿真 并行算法 分布式计算
在线阅读 下载PDF
基于网络的并行仿真和分布式仿真 被引量:9
8
作者 郭彤城 慕春棣 《系统仿真学报》 CAS CSCD 2002年第5期602-606,共5页
随着网络高速化及低成本的集群系统的出现,使并行和分布式仿真的广泛应用成为可能。本文首先系统概括了各种并行计算机的特点,辨析了并行仿真和分布式仿真的概念,然后总结了已有的并行连续系统和离散事件仿真策略,分析了它们的优缺点,... 随着网络高速化及低成本的集群系统的出现,使并行和分布式仿真的广泛应用成为可能。本文首先系统概括了各种并行计算机的特点,辨析了并行仿真和分布式仿真的概念,然后总结了已有的并行连续系统和离散事件仿真策略,分析了它们的优缺点,并提出了针对集群系统的特点对这些策略进行优化的方法。最后比较了分布式仿真系统的集成工具,得出了CORBA适合于中小规模应用的结论。 展开更多
关键词 网络 并行仿真 分布式仿真 系统仿真 集群系统 计算机仿真
在线阅读 下载PDF
一种面向大规模HLA仿真的并行区域匹配算法 被引量:5
9
作者 梁洪波 朱卫国 +3 位作者 姚益平 刘步权 慕晓冬 杨勇 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第3期84-91,共8页
HLA仿真中,数据分发管理实现基于值的过滤,可以有效减少盟员接收冗余数据的可能性和网络中的数据流量。大规模HLA仿真系统在仿真推进中需要大量的区域匹配计算以维护数据分发管理的正确性。现有的区域匹配算法大多需要对所有区域进行匹... HLA仿真中,数据分发管理实现基于值的过滤,可以有效减少盟员接收冗余数据的可能性和网络中的数据流量。大规模HLA仿真系统在仿真推进中需要大量的区域匹配计算以维护数据分发管理的正确性。现有的区域匹配算法大多需要对所有区域进行匹配计算,造成了大量计算资源的浪费;同时,主要基于串行匹配思想,难以充分发挥多核平台的并行计算优势。针对现有区域匹配算法的局限性,提出了一种面向大规模HLA仿真的并行区域匹配算法,该算法能够实现对一次仿真推进中多个改变区域的并行匹配计算,同时在匹配计算中采用基于移动相交的基本思想,利用区域范围移动前后的历史信息,将匹配限定在移动区间之内,减少了大量的无关计算。理论分析与实验结果表明该算法尤其适合基于多核计算平台构建大规模分布式仿真的应用需求。 展开更多
关键词 分布式交互仿真 运行支撑环境(RTI) 数据分发管理(DDM) 区域匹配 并行计算
在线阅读 下载PDF
基于CUDA的大规模群体行为实时仿真并行实现及优化 被引量:3
10
作者 贺毅辉 叶晨 +1 位作者 刘志忠 彭伟 《计算机应用》 CSCD 北大核心 2012年第9期2466-2469,共4页
群体仿真中个体从环境中查找相关对象时会导致较高的时间复杂度。要使大规模群体能够实时仿真,必须降低模型运算的时间复杂度或者提高计算平台的能力。通过对Biods模型为典型案例进行研究,提出一种基于统一计算架构(CUDA)的大规模群体... 群体仿真中个体从环境中查找相关对象时会导致较高的时间复杂度。要使大规模群体能够实时仿真,必须降低模型运算的时间复杂度或者提高计算平台的能力。通过对Biods模型为典型案例进行研究,提出一种基于统一计算架构(CUDA)的大规模群体行为实时仿真并行实现及优化的方法。实现中将个体与GPU逻辑线程一一对应,通过将仿真环境离散化来提高相关个体查找的效率,通过并行化基数排序法将个体信息组织成具有空间局部性的数组,提高图形处理器(GPU)内存带宽的利用率。通过实验验证了该方法将仿真个体的数量提升到CPU方法的约7.3倍。 展开更多
关键词 大规模群体行为 统一计算架构 并行计算 实时仿真
在线阅读 下载PDF
分布式星载SAR回波仿真的并行化计算研究 被引量:6
11
作者 王曦爽 黄立胜 王贞松 《系统仿真学报》 CAS CSCD 北大核心 2006年第8期2097-2100,2104,共5页
对分布式星载SAR系统地面回波仿真程序并行化算法进行了研究。重点介绍了分布式小卫星SAR系统多星协同工作的仿真策略、各并行节点任务的分配策略和并行节点间大量数据传输的策略。实验证明此并行化算法具有较高的加速性能,具有实际的... 对分布式星载SAR系统地面回波仿真程序并行化算法进行了研究。重点介绍了分布式小卫星SAR系统多星协同工作的仿真策略、各并行节点任务的分配策略和并行节点间大量数据传输的策略。实验证明此并行化算法具有较高的加速性能,具有实际的应用前景。 展开更多
关键词 分布式星载合成孔径雷达 仿真系统 并行算法 地面目标回波数据
在线阅读 下载PDF
分布式并行计算在交通网络仿真中的应用 被引量:3
12
作者 高林杰 隽志才 张伟华 《计算机应用研究》 CSCD 北大核心 2007年第8期251-254,共4页
根据交通网络仿真的并行特征采用域分解方法设计交通并行仿真系统的框架,把交通网络分为几个子网,集群系统的每个节点机分别负责其中的一个子网,提出基于车辆数负载的网络分割算法来平衡各子网的负载量,并分析子网之间的通信机理。同时... 根据交通网络仿真的并行特征采用域分解方法设计交通并行仿真系统的框架,把交通网络分为几个子网,集群系统的每个节点机分别负责其中的一个子网,提出基于车辆数负载的网络分割算法来平衡各子网的负载量,并分析子网之间的通信机理。同时,在基于MPI的并行计算平台上实现设计的并行仿真系统。通过实例表明,提出的并行算法能大大提高交通网络仿真的速度和效率。 展开更多
关键词 交通网络仿真 分布式并行计算 域分解 网络分割算法
在线阅读 下载PDF
扩展UML语义以支持并行和分布式仿真系统设计 被引量:3
13
作者 胡四泉 范植华 佘春东 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期1030-1036,共7页
标准UML中不包含虚拟时间和时间同步语义 ,因而缺乏对并行和分布式仿真 (parallelanddistributedsimula tion ,PADS)系统设计的支持 对标准UML语义进行扩展以支持PADS领域的概念并降低PADS系统构造的复杂性 主要的工作包括在UML中引入... 标准UML中不包含虚拟时间和时间同步语义 ,因而缺乏对并行和分布式仿真 (parallelanddistributedsimula tion ,PADS)系统设计的支持 对标准UML语义进行扩展以支持PADS领域的概念并降低PADS系统构造的复杂性 主要的工作包括在UML中引入虚拟时间语义 ,用包含虚拟时间标记和约束的状态图和交互图来描述仿真实体的功能属性 另外 ,通过创建虚拟时间同步构造型 (stereotype) ,提出“分离法”将时间同步细节与仿真模型内部的功能属性逻辑地分离 ,不仅使得仿真对象建模更加容易 。 展开更多
关键词 并行分布式仿真(PADS) 统一建模语言(UML)仿真建模 面向对象设计
在线阅读 下载PDF
基于并行计算的大规模群体行为建模与仿真方法研究 被引量:3
14
作者 孟凡亮 胡晓峰 +2 位作者 蒋亚群 禹海全 徐旭林 《计算机应用》 CSCD 北大核心 2010年第6期1679-1681,1686,共4页
为解决当前群体行为模型因规模扩大而导致计算量剧增的问题,采用并行离散事件方法构建了大规模群体行为模型,利用YH-SUPE仿真引擎实现了群体行为模型的并行计算。重点介绍了模型中仿真对象和仿真对象信息交互的设计方法,并对该模型在不... 为解决当前群体行为模型因规模扩大而导致计算量剧增的问题,采用并行离散事件方法构建了大规模群体行为模型,利用YH-SUPE仿真引擎实现了群体行为模型的并行计算。重点介绍了模型中仿真对象和仿真对象信息交互的设计方法,并对该模型在不同数量的节点和仿真实体的环境下进行了测试。实验结果表明,将并行计算引入群体行为建模之中,可以显著提高仿真个体的数量,更加有效地支持了群体模型的实时运行。 展开更多
关键词 并行计算 大规模群体行为 YH-SUPE仿真引擎 并行离散事件仿真
在线阅读 下载PDF
面向5G的分布式并行无线通信仿真平台设计 被引量:3
15
作者 周华 刘壮 +1 位作者 韩玮 黄伟芳 《计算机工程与应用》 CSCD 北大核心 2016年第22期15-21,85,共8页
为了满足社会对无线通信不断增长的需求,METIS组织提出了5G通信的目标、场景和可能的技术方案,面临的需求越来越苛刻,通信技术越来越复杂,对各种无线通信技术的分析和评估需要处理更多数据和进行更复杂的运算,单核仿真平台不论是内存还... 为了满足社会对无线通信不断增长的需求,METIS组织提出了5G通信的目标、场景和可能的技术方案,面临的需求越来越苛刻,通信技术越来越复杂,对各种无线通信技术的分析和评估需要处理更多数据和进行更复杂的运算,单核仿真平台不论是内存还是运算速度都无法满足5G无线通信技术的仿真需求,基于Matlab提供的分布式并行计算服务器设计一种用于评估未来5G无线通信技术和性能的仿真平台。 展开更多
关键词 分布式并行 无线通信仿真 大规模复杂网络 灵活组网 多制式共存
在线阅读 下载PDF
面向大规模人工社会的异构并行仿真引擎设计 被引量:2
16
作者 李祯 邱晓刚 +1 位作者 郭刚 陈彬 《系统仿真学报》 CAS CSCD 北大核心 2014年第10期2285-2292,共8页
大规模人工社会仿真是研究社会科学的有效手段,日益发展的高性能计算资源,如GPU等为发展大规模人工社会仿真研究带来了新的机遇。基于保守同步时间策略提出了一种CPU/GPU异构协同的仿真引擎架构,CPU与GPU协同独立地完成模型的调度和执... 大规模人工社会仿真是研究社会科学的有效手段,日益发展的高性能计算资源,如GPU等为发展大规模人工社会仿真研究带来了新的机遇。基于保守同步时间策略提出了一种CPU/GPU异构协同的仿真引擎架构,CPU与GPU协同独立地完成模型的调度和执行。详细阐述了GPU并行仿真内核设计方法,针对大规模人工社会仿真的模型特点,对数据结构,调度算法等进行了重点分析。通过3层引擎管理架构,保证了各CPU与GPU之间的时间同步和消息通信的完成。最后以GameOfLife测试模型对GPU并行仿真内核的运行效率进行了评估,获得了相对CPU最高11.2倍的性能加速。 展开更多
关键词 人工社会 大规模Agent仿真 CPU/GPU 保守并行仿真
在线阅读 下载PDF
网格环境下大规模交通仿真及应用研究 被引量:9
17
作者 张栋良 沙静 蒋昌俊 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第16期4330-4333,共4页
网格为大规模的交通仿真提供了高性能的计算资源。在网格环境下大规模仿真从模型的准确性、运算的高效性、系统的可用性等方面都得到了很大的提升。通过对海量流动车辆的GPS历史数据的整合,并结合实时GPS数据估计出大范围的时变OD矩阵... 网格为大规模的交通仿真提供了高性能的计算资源。在网格环境下大规模仿真从模型的准确性、运算的高效性、系统的可用性等方面都得到了很大的提升。通过对海量流动车辆的GPS历史数据的整合,并结合实时GPS数据估计出大范围的时变OD矩阵。通过Web Service的应用使仿真成为一种互联网上的服务。通过并行计算使得后台的仿真计算能力得到了提升。 展开更多
关键词 网格 大规模交通仿真 OD矩阵 并行计算
在线阅读 下载PDF
分布式任务调度算法的仿真环境研究 被引量:4
18
作者 陈华平 安虹 +1 位作者 黄刘生 陈国良 《中国科学技术大学学报》 CAS CSCD 北大核心 1999年第4期421-426,共6页
主要研究了分布式任务调度算法的仿真环境.首先给出了分布式任务调度算法的主要规则构成,然后提出了分布式任务调度算法仿真环境的一种系统结构。
关键词 分布式任务调度 仿真环境 算法 并行分布计算
在线阅读 下载PDF
暂态稳定分布式仿真计算的改进算法 被引量:13
19
作者 王成山 张家安 《电力系统自动化》 EI CSCD 北大核心 2004年第14期28-32,99,共6页
电网互联和电力系统市场化发展趋势对暂态稳定分布式计算提出了要求。文中研究了电力非线性网络暂态稳定分布式仿真算法的计算效率问题,指出算法的瓶颈主要是子系统边界值的迭代求解计算,提出了改善非线性网络分布式求解效率的交接变量... 电网互联和电力系统市场化发展趋势对暂态稳定分布式计算提出了要求。文中研究了电力非线性网络暂态稳定分布式仿真算法的计算效率问题,指出算法的瓶颈主要是子系统边界值的迭代求解计算,提出了改善非线性网络分布式求解效率的交接变量估计法,进行了数值验证,并与适于线性网络求解的并行处理方法、已有的电力网络暂态稳定初值估计法和交接变量调节法进行了比较。数值实验表明,文中提出的方法可在较大程度上稳定地改善暂态稳定分布式仿真分析的计算效率,与电力市场条件有一定的适应性。 展开更多
关键词 电力系统 非线性网络 暂态稳定仿真 分布式计算 并行算法
在线阅读 下载PDF
分布式电台仿真训练平台的研究 被引量:2
20
作者 黄一斌 王凯 +1 位作者 彭文成 赵定海 《系统仿真学报》 CAS CSCD 北大核心 2009年第13期3951-3954,共4页
研发的新系统主要用于新型通信装备的教学、训练及考核。该复杂系统通过一个集成应用平台得以实现,它负责对4个串口、3个网卡、3个声卡等硬件设备以及3种虚拟电台及其教学软件的实时调度,状态匹配和数据处理,语音采样编码及其格式转换,... 研发的新系统主要用于新型通信装备的教学、训练及考核。该复杂系统通过一个集成应用平台得以实现,它负责对4个串口、3个网卡、3个声卡等硬件设备以及3种虚拟电台及其教学软件的实时调度,状态匹配和数据处理,语音采样编码及其格式转换,以实现电台话音和指控数据的通信。研制了多种类型的虚拟电台,开发了分布式服务代理等几十种模块及软件,并系统地解决了虚拟电台与半实物仿真电台之间的互联互通的难点,在单机上实现多台多种虚拟电台的并行仿真等问题。 展开更多
关键词 分布式电台仿真训练平台 并行仿真 虚拟电台 仿真电台 服务代理
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部