期刊文献+
共找到95篇文章
< 1 2 5 >
每页显示 20 50 100
面向深度神经网络大规模分布式数据并行训练的MC^(2)能耗模型 被引量:1
1
作者 魏嘉 张兴军 +2 位作者 王龙翔 赵明强 董小社 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期2985-3004,共20页
深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性... 深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性能计算平台过量能耗方面起着至关重要的作用.目前,大部分的能耗模型都是从设备的角度出发对单个设备或多个设备构成的集群进行能耗建模,由于缺乏从能耗角度对分布式并行DNN应用进行分解剖析,导致罕有针对分布式DNN应用特征进行建模的能耗模型.针对目前最常用的DNN分布式数据并行训练模式,从DNN模型训练本质特征角度出发,提出了“数据预处理(materials preprocessing)-前向与反向传播(computing)-梯度同步与更新(communicating)”三阶段MC^(2)能耗模型,并通过在国产E级原型机天河三号上使用最多128个MT节点和32个FT节点训练经典的VGG16和ResNet50网络以及最新的Vision Transformer网络验证了模型的有效性和可靠性.实验结果表明,MC^(2)与真实能耗测量结果相差仅为2.84%,相较4种线性比例能耗模型以及AR,SES,ARIMA时间预测模型准确率分别提升了69.12个百分点,69.50个百分点,34.58个百分点,13.47个百分点,5.23个百分点,22.13个百分点,10.53个百分点.通过使用的模型可以在超算平台得到DNN模型的各阶段能耗和总体能耗结果,为评估基于能耗感知的DNN大规模分布式数据并行训练及推理各阶段任务调度、作业放置、模型分割、模型裁剪等优化策略的效能提供了基础. 展开更多
关键词 深度神经网络 能耗模型 大规模分布式训练 数据并行 超级计算机
在线阅读 下载PDF
基于网络的并行仿真和分布式仿真 被引量:9
2
作者 郭彤城 慕春棣 《系统仿真学报》 CAS CSCD 2002年第5期602-606,共5页
随着网络高速化及低成本的集群系统的出现,使并行和分布式仿真的广泛应用成为可能。本文首先系统概括了各种并行计算机的特点,辨析了并行仿真和分布式仿真的概念,然后总结了已有的并行连续系统和离散事件仿真策略,分析了它们的优缺点,... 随着网络高速化及低成本的集群系统的出现,使并行和分布式仿真的广泛应用成为可能。本文首先系统概括了各种并行计算机的特点,辨析了并行仿真和分布式仿真的概念,然后总结了已有的并行连续系统和离散事件仿真策略,分析了它们的优缺点,并提出了针对集群系统的特点对这些策略进行优化的方法。最后比较了分布式仿真系统的集成工具,得出了CORBA适合于中小规模应用的结论。 展开更多
关键词 网络 并行仿真 分布式仿真 系统仿真 集群系统 计算机仿真
在线阅读 下载PDF
分布式并行计算在交通网络仿真中的应用 被引量:3
3
作者 高林杰 隽志才 张伟华 《计算机应用研究》 CSCD 北大核心 2007年第8期251-254,共4页
根据交通网络仿真的并行特征采用域分解方法设计交通并行仿真系统的框架,把交通网络分为几个子网,集群系统的每个节点机分别负责其中的一个子网,提出基于车辆数负载的网络分割算法来平衡各子网的负载量,并分析子网之间的通信机理。同时... 根据交通网络仿真的并行特征采用域分解方法设计交通并行仿真系统的框架,把交通网络分为几个子网,集群系统的每个节点机分别负责其中的一个子网,提出基于车辆数负载的网络分割算法来平衡各子网的负载量,并分析子网之间的通信机理。同时,在基于MPI的并行计算平台上实现设计的并行仿真系统。通过实例表明,提出的并行算法能大大提高交通网络仿真的速度和效率。 展开更多
关键词 交通网络仿真 分布式并行计算 域分解 网络分割算法
在线阅读 下载PDF
异构环境感知的分布式神经网络训练模型 被引量:2
4
作者 咸琳涛 刘晓兰 +1 位作者 王淦 刘建明 《计算机工程与设计》 北大核心 2024年第9期2821-2827,共7页
针对分布式神经网络训练在异构环境中训练速度慢、资源利用率低的问题,提出一种异构环境感知的分布式神经网络训练模型(H-PS)。根据计算节点当前状态动态调度训练任务,使计算节点能够在相同时间完成训练任务,提高资源利用率。提出通信... 针对分布式神经网络训练在异构环境中训练速度慢、资源利用率低的问题,提出一种异构环境感知的分布式神经网络训练模型(H-PS)。根据计算节点当前状态动态调度训练任务,使计算节点能够在相同时间完成训练任务,提高资源利用率。提出通信与计算并行策略,参数服务器与计算节点传输模型参数期间,计算节点持续模型计算,进一步提高资源利用率。使用灵活的量化策略,压缩神经网络模型参数,减少参数服务器与计算节点的通信开销。使用新兴的容器集群进行实验,结果表明,与现有方法相比,H-PS训练时间缩短1.4~3.5倍。 展开更多
关键词 分布式机器学习 异构环境 任务动态规划 通信与计算并行 参数动态量化 深度神经网络 容器集群
在线阅读 下载PDF
移动Ad hoc网络分布式并行接入控制协议分析 被引量:4
5
作者 何敏 赵东风 刘心松 《系统工程与电子技术》 EI CSCD 北大核心 2007年第3期443-448,共6页
通过对无线令牌环协议(WTRP)进行改进,提出了一种新的具有QoS保障且无竞争的分布式并行接入协议(DP-BSCP)。采用嵌入Markov链和概率母函数的分析方法,用限定服务规则进行系统建模,在系统模型的基础上得到了系统的平均排队队长以及平均... 通过对无线令牌环协议(WTRP)进行改进,提出了一种新的具有QoS保障且无竞争的分布式并行接入协议(DP-BSCP)。采用嵌入Markov链和概率母函数的分析方法,用限定服务规则进行系统建模,在系统模型的基础上得到了系统的平均排队队长以及平均等待时间的解析结果,同时也分析了不同优先级队列间的性能关系。理论分析和仿真结果是一致的,表明该协议的平均排队等待延迟和平均等待队列长度均比WTRP有很大降低;对不同优先级的数据包均有良好的适应性,满足不同优先级的性能需求且稳定性大大增强,更加适用于多业务的综合服务系统。 展开更多
关键词 无线网络 并行控制 分布式并行
在线阅读 下载PDF
分布式并行网络拓扑计算关键技术研究 被引量:15
6
作者 王健 陈威 +2 位作者 汤卫东 王昊 金芬兰 《电力系统保护与控制》 EI CSCD 北大核心 2017年第2期117-122,共6页
为解决由于不断扩大的电网规模和不断复杂的网络拓扑复杂程度,导致传统拓扑着色分析方法速度慢、效率低,无法适应电力系统应用软件高时效性要求的问题,研究了分布式并行网络拓扑计算关键技术。通过研究合理的网络拓扑模型划分算法,首先... 为解决由于不断扩大的电网规模和不断复杂的网络拓扑复杂程度,导致传统拓扑着色分析方法速度慢、效率低,无法适应电力系统应用软件高时效性要求的问题,研究了分布式并行网络拓扑计算关键技术。通过研究合理的网络拓扑模型划分算法,首先对拓扑计算程序改造成多线程并行处理的方式;再充分利用集群和网络的资源,将整个网络拓扑进行划分,由不同的服务器进行并行的分析与计算;最后每台并行的服务器再采用高效率的网络拓扑分析算法。经过以上几个步骤,分布式并行的网络拓扑计算可以提高可扩展性和可靠性,并且可以充分提高拓扑计算和程序运行的效率。 展开更多
关键词 分布式 并行 网络拓扑计算 邻接矩阵 局部拓扑
在线阅读 下载PDF
基于虚拟仪器的分布式并行网络实验室 被引量:3
7
作者 江建军 范少春 +2 位作者 刘继光 明繁华 杨彪 《计算机工程与科学》 CSCD 2007年第4期27-30,共4页
本文分析了网络实验室的类型及功能,对实验进行了分类,提出了一种基于虚拟仪器软硬件技术的分布式并行网络实验室结构。实验表明,该模型具有很好的并行性,对电工电子辅助实验教学有积极的意义。
关键词 网络实验室 虚拟仪器 并行 分布式
在线阅读 下载PDF
并行片上网络仿真器ParaNSim的设计及性能分析 被引量:1
8
作者 唐轶轩 吴俊敏 +2 位作者 陈国良 朱小东 胡蝶 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期24-30,82,共8页
为了减少使用仿真器对片上网络的性能、结构等进行仿真的时间,提高仿真效率,利用当代计算机的并行计算能力,设计并实现了一个并行片上网络仿真器ParaNSim.该仿真器可配置拓扑、路由算法以及虚通道等参数,既可以作为独立的仿真器使用,也... 为了减少使用仿真器对片上网络的性能、结构等进行仿真的时间,提高仿真效率,利用当代计算机的并行计算能力,设计并实现了一个并行片上网络仿真器ParaNSim.该仿真器可配置拓扑、路由算法以及虚通道等参数,既可以作为独立的仿真器使用,也可以作为一个子模块嵌入其他仿真器(如Multi2Sim)中;经过实验验证,其并行仿真能达到的加速比平均约为210%,最大加速比可达250%,因此它能有效地减少仿真时间,为大规模片上网络的仿真提供支持. 展开更多
关键词 仿真器 并行仿真 片上网络
在线阅读 下载PDF
分布式并行网络数据存储技术 被引量:2
9
作者 杨峰 刘心松 罗朝劲 《计算机科学》 CSCD 北大核心 2002年第12期109-111,共3页
The bases of distributed parallel network data storage technology(DPNDS) are high speed network tech-nology, database technology, artificial intelligence and multimedia technology. It will become the foundation of mod... The bases of distributed parallel network data storage technology(DPNDS) are high speed network tech-nology, database technology, artificial intelligence and multimedia technology. It will become the foundation of mod-ern information society because of the excellent management efficiency, reliability, availability, expansibility and lowcost. In this paper, we discuss the key technology of DPNDS which includes data distributing, parallel data process-ing, data network storage, object-oriented data storage and then give some suggestions about the new research direc-tion. 展开更多
关键词 分布式并行网络数据存储 存储器 磁盘系统 计算机
在线阅读 下载PDF
基于高速网络的广域高性能并行与分布式计算 被引量:6
10
作者 卢锡城 肖侬 刘波 《计算机工程与科学》 CSCD 1998年第3期1-5,共5页
本文试图说明以下观点:越来越多的高性能应用要求利用地理上分布的、各式各样的计算和数据资源。这些应用希望能够通过高速网络将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等连接并集... 本文试图说明以下观点:越来越多的高性能应用要求利用地理上分布的、各式各样的计算和数据资源。这些应用希望能够通过高速网络将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等连接并集成起来,形成一个网络虚拟计算机(称为元计算机),来实现应用计算问题。这种元计算实质上就是基于高速网络的广域高性能并行与分布式计算。 展开更多
关键词 广域 元计算 计算机网络 并行计算 分布式计算
在线阅读 下载PDF
并行分布式增强现实场景仿真系统的构建 被引量:1
11
作者 张金玲 贾庆轩 +1 位作者 孙汉旭 刘亚辉 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2009年第1期70-73,共4页
针对空间舱内机器人遥操作对仿真信息反馈速度以及用户视野方面的要求,提出了一种并行分布式的增强场景构建体系结构。系统基于静态增强现实技术,通过同步控制机制和网络数据传输,采用多组相机协同拍摄场景图像,多个处理节点并行地进行... 针对空间舱内机器人遥操作对仿真信息反馈速度以及用户视野方面的要求,提出了一种并行分布式的增强场景构建体系结构。系统基于静态增强现实技术,通过同步控制机制和网络数据传输,采用多组相机协同拍摄场景图像,多个处理节点并行地进行三维注册和虚实图像融合处理,拼接得到的宽视场角融合图像经过220度多投影面大型环幕立体显示系统输出显示。实验结果证明本系统具有实时、宽视场、高沉浸感和扩展灵活的特点。 展开更多
关键词 增强现实 并行分布式结构 同步控制 网络传输
在线阅读 下载PDF
嵌入式网络分布式负载任务并行计算系统设计 被引量:3
12
作者 熊聪聪 冯阔 《现代电子技术》 北大核心 2020年第15期143-147,共5页
传统的嵌入式网络分布式负载任务并行计算系统工作性能差。针对这一问题,设计一种新的并行计算系统,系统硬件由存储层、缓存层、执行层组成架构。通过STORE selection模块连接各层数据,Zookeeper模块监控系统的整体运行变化,data loade... 传统的嵌入式网络分布式负载任务并行计算系统工作性能差。针对这一问题,设计一种新的并行计算系统,系统硬件由存储层、缓存层、执行层组成架构。通过STORE selection模块连接各层数据,Zookeeper模块监控系统的整体运行变化,data loader模块负责引入外部数据,利用分布式索引结构将得到的数据存储在系统中,设计失效节点检测机制增加系统的容错性,每个节点都设计对应的常驻进程,优化构建查询模块,提高用户查询效率。软件由准备阶段、执行阶段和完成阶段组成,每个阶段的任何一个环节出现问题,都会直接导致进程失败。设计对比实验检测系统效果,结果表明,相较于传统系统,文中给出的并行计算系统在计算过程中消耗的索引量更少,并行计算性能更强,所有的计算都可以在系统中进行,确保系统的负载均衡特性得以提高。 展开更多
关键词 嵌入式网络 分布式任务 负载任务 并行计算 计算系统 参数设置
在线阅读 下载PDF
基于分布式网络并行环境的惩罚函数法 被引量:1
13
作者 范波芹 索丽生 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第2期116-118,共3页
基于PVM分布式编程环境 ,将传统的惩罚函数法加以改进 ,提出惩罚函数并行算法的概念 .该算法不但具有编程方便、可移植性强和能有效地减少计算时间等优点 ,而且通讯量少 ,对传统的惩罚函数法改动少 ,只需有一网络和PVM并行编程环境就能... 基于PVM分布式编程环境 ,将传统的惩罚函数法加以改进 ,提出惩罚函数并行算法的概念 .该算法不但具有编程方便、可移植性强和能有效地减少计算时间等优点 ,而且通讯量少 ,对传统的惩罚函数法改动少 ,只需有一网络和PVM并行编程环境就能实现 . 展开更多
关键词 网络并行环境 分布式 惩罚函数法
在线阅读 下载PDF
网络分布式并行计算的负载平衡 被引量:5
14
作者 胡凯 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2004年第11期1121-1124,共4页
利用分布式系统动态负载平衡的原理 ,设计了一种适应网络分布式并行计算环境的负载平衡实现机制 ,采用集中式负载信息收集策略 ,集中和分布式相结合的传输控制策略 .定义了一种新的复合型负载指标来衡量各处理机的负载程度 .讨论了相应... 利用分布式系统动态负载平衡的原理 ,设计了一种适应网络分布式并行计算环境的负载平衡实现机制 ,采用集中式负载信息收集策略 ,集中和分布式相结合的传输控制策略 .定义了一种新的复合型负载指标来衡量各处理机的负载程度 .讨论了相应的理论和实现中的关键问题 ,给出了主要的实现策略和算法 .仿真比较研究表明这种体系结构和相应策略能对网络环境下分布式并行计算提供有力支持 . 展开更多
关键词 网络分布式并行计算 负载平衡 负载指标 进程迁移
在线阅读 下载PDF
适用于稀疏动态无线传感器网络的并行融合分布式无迹信息滤波算法 被引量:10
15
作者 汤文俊 张国良 +2 位作者 曾静 徐君 姚二亮 《控制理论与应用》 EI CAS CSCD 北大核心 2016年第7期903-914,共12页
稀疏和随机动态变化是实际无线传感器网络(wireless sensor network,WSN)中普遍共同存在的两种通信拓扑不稳定因素,使基于一致性算法的分布式无迹信息滤波(distributed unscented information filter,DUIF)算法适用于稀疏动态WSN,将极... 稀疏和随机动态变化是实际无线传感器网络(wireless sensor network,WSN)中普遍共同存在的两种通信拓扑不稳定因素,使基于一致性算法的分布式无迹信息滤波(distributed unscented information filter,DUIF)算法适用于稀疏动态WSN,将极大提高其实用性.为此,本文提出一种并行融合DUIF(parallel fusion DUIF,PF–DUIF)算法.在PF–DUIF算法中,通过将实时局部后验估计均值和协方差用于局部无迹信息滤波器(local unscented information filter,LUIF)的Sigma点采样,使LUIF和加权平均一致性滤波器(weighted average consensus filter,WACF)得以并行运行,从而有效抵制由通信拓扑随机动态变化带来的较大一致跟踪误差的困扰;同时,WACF通过对LUIF输出的无偏局部信息矩阵和向量分别进行平均一致性滤波,最终得到不包含由稀疏通信拓扑引起的平均一致误差的分布式后验估计结果;进而,建立即时更新机制有效抑制随机动态通信拓扑引起的PF–DUIF算法滤波异步问题,同时,基于稀疏动态WSN的平均网络模型,在通信能量消耗受限条件下优化WACF均方收敛速率,从而提高PF–DUIF算法的整体滤波效率.仿真实验结果表明,PF–DUIF算法能够有效应用于稀疏动态WSN机动目标跟踪. 展开更多
关键词 稀疏动态无线传感器网络 分布式无迹信息滤波 局部无迹信息滤波器 加权平均一致性滤波器 并行融合 均方收敛速率
在线阅读 下载PDF
一种应用于宽带分布式并行服务器Ad hoc网络的MAC协议
16
作者 何敏 刘心松 赵东风 《计算机科学》 CSCD 北大核心 2006年第7期34-39,共6页
分布式并行服务器具有高的整体性能,用它作为网络服务器的Ad hoc网络,会体现出更好的服务性能。然而,无线系统的带宽有限,因此信道资源分配算法直接影响着分布式并行Ad hoc网络的性能。本文提出了一种适用于分布式并行Ad hoc网络的MAC协... 分布式并行服务器具有高的整体性能,用它作为网络服务器的Ad hoc网络,会体现出更好的服务性能。然而,无线系统的带宽有限,因此信道资源分配算法直接影响着分布式并行Ad hoc网络的性能。本文提出了一种适用于分布式并行Ad hoc网络的MAC协议DPACP,它根据通信节点的状态进行有选择的区分服务,采用混合服务规则满足不同优先级分组、不同通信节点的QoS需求。仿真表明,该协议对不同优先级分组均有良好的适应性,满足不同优先级的性能需求,对多业务的综合服务系统具有很强的适应性,从而使系统的稳定性大大增强,适用于分布式并行Ad hoc服务网络和用户网络。 展开更多
关键词 无线移动自组织网络 分布式并行 DPACP
在线阅读 下载PDF
一种适用于无线移动Ad Hoc网络的分布式并行MAC协议
17
作者 何敏 刘心松 赵东风 《计算机科学》 CSCD 北大核心 2006年第2期48-51,共4页
众所周知,无线系统是带宽受限系统,信道分配算法至关重要。本文研究了 Ad hoc 网络的 MAC 层协议,通过对无线令牌环协议 WTRP 进行改进,提出了一种新的具有 QoS 保障的无竞争的分布式并行 MAC 协议,即基于动态优先级的缓冲区状态控制协... 众所周知,无线系统是带宽受限系统,信道分配算法至关重要。本文研究了 Ad hoc 网络的 MAC 层协议,通过对无线令牌环协议 WTRP 进行改进,提出了一种新的具有 QoS 保障的无竞争的分布式并行 MAC 协议,即基于动态优先级的缓冲区状态控制协议(DP-BSCP)。仿真结果分析表明,该协议的平均排队等待延迟和平均等待队列长度均比 WTRP 有很大降低;对不同优先级的数据包均有良好的适应性,满足不同优先级的性能需求。从而使系统的稳定性大大增强,更加适用于多业务的综合服务系统。 展开更多
关键词 移动分布式无线网络 无线令牌环协议 分布式并行 DP-BSCP 媒体接入控制
在线阅读 下载PDF
网络环境下分布式并行计算研究
18
作者 史金松 陈贵海 《小型微型计算机系统》 CSCD 北大核心 1994年第1期31-36,共6页
本文讨论网络环境下的分布式并行计算,以区域分裂法与混乱块迭代为基础,在Novell网上利用多台微机作分布式计算。文中给出了温度场、薄膜障碍、弹塑性杆的自由扭转等实例,讨论了它的计算效率、时效性及数据完整性等有关问题。
关键词 并行计算机 分布式计算 局域网络
在线阅读 下载PDF
面向5G的分布式并行无线通信仿真平台设计 被引量:3
19
作者 周华 刘壮 +1 位作者 韩玮 黄伟芳 《计算机工程与应用》 CSCD 北大核心 2016年第22期15-21,85,共8页
为了满足社会对无线通信不断增长的需求,METIS组织提出了5G通信的目标、场景和可能的技术方案,面临的需求越来越苛刻,通信技术越来越复杂,对各种无线通信技术的分析和评估需要处理更多数据和进行更复杂的运算,单核仿真平台不论是内存还... 为了满足社会对无线通信不断增长的需求,METIS组织提出了5G通信的目标、场景和可能的技术方案,面临的需求越来越苛刻,通信技术越来越复杂,对各种无线通信技术的分析和评估需要处理更多数据和进行更复杂的运算,单核仿真平台不论是内存还是运算速度都无法满足5G无线通信技术的仿真需求,基于Matlab提供的分布式并行计算服务器设计一种用于评估未来5G无线通信技术和性能的仿真平台。 展开更多
关键词 分布式并行 无线通信仿真 大规模复杂网络 灵活组网 多制式共存
在线阅读 下载PDF
并行/分布式网络模拟系统PDNS的实现及其性能分析 被引量:2
20
作者 赵海明 马殿富 赵路 《系统仿真学报》 CAS CSCD 2001年第S2期429-432,共4页
网络模拟是进行计算机网络性能研究、系统分析、设计和实现的一种重要方法。采用并行/分布式的计算方法可以较为准确、有效的模拟大规模的网络拓扑结构。本文介绍分析了基于NS的并行/分布式网络模拟平台PDNS,并分析了局域网内PDNS的模... 网络模拟是进行计算机网络性能研究、系统分析、设计和实现的一种重要方法。采用并行/分布式的计算方法可以较为准确、有效的模拟大规模的网络拓扑结构。本文介绍分析了基于NS的并行/分布式网络模拟平台PDNS,并分析了局域网内PDNS的模拟性能。 展开更多
关键词 网络模拟 并行/分布式 NS PDNS 同步 加速比
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部