期刊文献+
共找到323篇文章
< 1 2 17 >
每页显示 20 50 100
面向深度神经网络大规模分布式数据并行训练的MC^(2)能耗模型 被引量:1
1
作者 魏嘉 张兴军 +2 位作者 王龙翔 赵明强 董小社 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期2985-3004,共20页
深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性... 深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性能计算平台过量能耗方面起着至关重要的作用.目前,大部分的能耗模型都是从设备的角度出发对单个设备或多个设备构成的集群进行能耗建模,由于缺乏从能耗角度对分布式并行DNN应用进行分解剖析,导致罕有针对分布式DNN应用特征进行建模的能耗模型.针对目前最常用的DNN分布式数据并行训练模式,从DNN模型训练本质特征角度出发,提出了“数据预处理(materials preprocessing)-前向与反向传播(computing)-梯度同步与更新(communicating)”三阶段MC^(2)能耗模型,并通过在国产E级原型机天河三号上使用最多128个MT节点和32个FT节点训练经典的VGG16和ResNet50网络以及最新的Vision Transformer网络验证了模型的有效性和可靠性.实验结果表明,MC^(2)与真实能耗测量结果相差仅为2.84%,相较4种线性比例能耗模型以及AR,SES,ARIMA时间预测模型准确率分别提升了69.12个百分点,69.50个百分点,34.58个百分点,13.47个百分点,5.23个百分点,22.13个百分点,10.53个百分点.通过使用的模型可以在超算平台得到DNN模型的各阶段能耗和总体能耗结果,为评估基于能耗感知的DNN大规模分布式数据并行训练及推理各阶段任务调度、作业放置、模型分割、模型裁剪等优化策略的效能提供了基础. 展开更多
关键词 深度神经网络 能耗模型 大规模分布式训练 数据并行 超级计算机
在线阅读 下载PDF
大规模问题数据并行性能的分析 被引量:14
2
作者 舒继武 est4.cs.tsinghua.edu.cn +2 位作者 郑纬民 沈美明 汪东升 《软件学报》 EI CSCD 北大核心 2000年第5期628-633,共6页
从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 ... 从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 .最后 ,给出的例子证明了模型的有效性 . 展开更多
关键词 数据并行 并行处理 性能分析 加速比
在线阅读 下载PDF
提升小波变换的数据并行计算方法研究 被引量:11
3
作者 钟升 沈绪榜 +1 位作者 郑江滨 王艳玲 《计算机学报》 EI CSCD 北大核心 2011年第7期1323-1331,共9页
研究了基于SIMD PE阵列对G级像素帧进行9/7提升小波变换的数据并行计算实现方法.首先,在分析9/7提升小波变换运算公式的局部计算特点的基础上,提出了PE状态标识法和基于PE标识的条件计算方法;其次,提出了SIMD PE阵列的虚拟化实现方法.... 研究了基于SIMD PE阵列对G级像素帧进行9/7提升小波变换的数据并行计算实现方法.首先,在分析9/7提升小波变换运算公式的局部计算特点的基础上,提出了PE状态标识法和基于PE标识的条件计算方法;其次,提出了SIMD PE阵列的虚拟化实现方法.研究表明,该方法提高了计算的并行度和规则性,并行度仅受限于阵列的规模且具备可裁减性和通用性,很适合于MPP系统芯片实现. 展开更多
关键词 数据并行 提升小波变换 SIMDPE阵列
在线阅读 下载PDF
区域生长法图像分割的数据并行方法研究 被引量:7
4
作者 张发存 赵晓红 +1 位作者 王忠 沈绪榜 《计算机工程》 CAS CSCD 北大核心 2004年第17期14-16,共3页
针对基于区域增长的图像分割方法,讨论和研究了其数据并行实现方法,证明了这种数据并行方法的正确性,并简要对算法性能进行了分析。对有关结论进行了仿真验证,结果表明,这种基于区域生长法的图像分割的数据并行方法是正确且切实可行的。
关键词 数据并行 图像分割 区域生长法
在线阅读 下载PDF
遥感卫星图像几何粗校正的数据并行方法研究 被引量:4
5
作者 张发存 王忠 +1 位作者 赵晓红 沈绪榜 《计算机研究与发展》 EI CSCD 北大核心 2004年第7期1200-1206,共7页
主要研究星上遥感图像的实时几何粗校正问题 卫星遥感图像现在一般都大到上万个像素行和列 ,采用传统的单个处理器的串行方式在星上进行实时处理是难以满足应用要求的 提出了一种在一维PE阵列的SIMD计算机上采用基于处理元阵列平移的... 主要研究星上遥感图像的实时几何粗校正问题 卫星遥感图像现在一般都大到上万个像素行和列 ,采用传统的单个处理器的串行方式在星上进行实时处理是难以满足应用要求的 提出了一种在一维PE阵列的SIMD计算机上采用基于处理元阵列平移的数据并行校正方法 ,并根据NASA的LANDSAT 1卫星的有关的参数 ,对该方法进行了详细讨论 ,给出了具体的实现方法 通过对复杂性和加速比的讨论 。 展开更多
关键词 遥感图像 几何粗校正 数据并行 PE阵列平移
在线阅读 下载PDF
一种数据并行中的群通信优化策略 被引量:3
6
作者 王珏 胡长军 +1 位作者 张纪林 李建江 《计算机学报》 EI CSCD 北大核心 2008年第2期318-328,共11页
群通信是影响大规模数据并行系统效率的关键因素,其主要发生在程序不同阶段间的数组重分布与循环划分后的数组重映射这两种情况.在一次通信中显著影响群通信效率常被忽视的因素是消息冲突和消息长度的不一致.因为它们会导致进程间大量... 群通信是影响大规模数据并行系统效率的关键因素,其主要发生在程序不同阶段间的数组重分布与循环划分后的数组重映射这两种情况.在一次通信中显著影响群通信效率常被忽视的因素是消息冲突和消息长度的不一致.因为它们会导致进程间大量的空闲等待时间.然而以前的研究要么不能完全避免消息冲突,要么针对某些特殊情况.对此,提出了在数组分布为Block_Cyclic(k)情况下的一种更具有普遍适用性的通信调度策略CSS.通过证明表明该策略能使一个通信步内的消息互不冲突且消息长度尽量相等.从而最小化通信调度生成时间和实际通信时间.最后的测试结果也表明,与传统的通信优化算法和MPI_Alltoallv实现相比,CSS策略使得通信效率得以明显提高. 展开更多
关键词 并行编译 数据并行 组通信 数组重分布 分布内存
在线阅读 下载PDF
科学计算可视化并行处理建模及其数据并行技术研究 被引量:3
7
作者 周海芳 杨学军 +1 位作者 刘衡竹 李思昆 《系统仿真学报》 CAS CSCD 北大核心 2006年第z1期308-311,共4页
科学计算规模的不断增长使得对科学数据的可视化也必须采用并行处理技术。针对可视化应用的特点,一方面,分类建立了可视化并行处理模型,给出了形式化描述,并对其并行性进行了定量的分析;另一方面,提出了一种可扩展的可视化数据并行体系... 科学计算规模的不断增长使得对科学数据的可视化也必须采用并行处理技术。针对可视化应用的特点,一方面,分类建立了可视化并行处理模型,给出了形式化描述,并对其并行性进行了定量的分析;另一方面,提出了一种可扩展的可视化数据并行体系结构,并深入探讨了实现该结构的数据划分技术和并行绘制方法;最后基于上述理论实现了一个数据并行可视化处理软件原型系统YH-PView,并通过实验验证了理论分析的正确性。 展开更多
关键词 科学计算 可视化 并行处理 数据并行
在线阅读 下载PDF
一个用于数据并行语言计算划分的时序优化模型(英文) 被引量:2
8
作者 余华山 胡长军 +2 位作者 黄其军 丁文魁 许卓群 《软件学报》 EI CSCD 北大核心 2001年第10期1434-1446,共13页
一个程序中数据并行语句的计算划分 (CP)对该程序的运行性能有决定性的作用 .尽管人们对这一问题已经进行了广泛的研究 ,但这些研究的重点都集中在如何提高被选择计算划分的空间局部性上 .针对并行循环结构的计算划分问题 ,提出了一个... 一个程序中数据并行语句的计算划分 (CP)对该程序的运行性能有决定性的作用 .尽管人们对这一问题已经进行了广泛的研究 ,但这些研究的重点都集中在如何提高被选择计算划分的空间局部性上 .针对并行循环结构的计算划分问题 ,提出了一个时序优化模型 .在该模型中 ,一个计算划分被表示成一个有向图 ,在把并行语句中的操作映射到各个处理器的同时 ,给出了被分配到不同处理器上的操作之间的相关性 .对于一条数据并行语句 ,时序优化模型对它的每个计算划分选择方案分别采用多种有效的优化策略进行优化 ;并综合考虑各个计算划分选择方案的负载平衡性、处理器间的操作依赖性、数据访问的空间局部性和时间局部性四个方面的因素 ,估算每个方案的执行效率 ;最后从这些方案中选择一个执行效率最优的方案作为该语句的计算划分 .作者已在 HPF编译器 p-HPF采用时序优化模型实现了对 FORAL L结构的支持 .实验结果表明 ,该模型具有非常好的通用性 ,对不同领域多种数据并行问题均取得了理想的加速比 .同时 ,只需略微改动 ,该模型也可用于其他类型数据并行语句的计算划分 . 展开更多
关键词 计算划分 数据相关 数据重用 时序优化模型 数据并行语言 程序
在线阅读 下载PDF
数字图像几何变换的数据并行方法研究 被引量:3
9
作者 张发存 王馨梅 张毅坤 《计算机工程》 CAS CSCD 北大核心 2005年第22期159-161,196,共4页
针对SIMD计算机上的数字图像的几何变换问题,提出了一个新颖的基于阵列平移的数据并行实现方法。在此基础上,给出了数字图像几何变换的数据并行实现算法,并详细分析和讨论了算法的复杂性以及精度要求。
关键词 数据并行 几何变换 阵列平移
在线阅读 下载PDF
直方图计算的数据并行实现方法 被引量:2
10
作者 赵晓红 沈绪榜 +2 位作者 张艳宁 王忠 张发存 《信号处理》 CSCD 北大核心 2005年第2期111-114,共4页
灰度直方图计算是图像分割与图像灰度变换等图像处理操作中一种重要的分析工具。本文将首先讨论直方图计算在单处理机上的执行效率,并讨论两维处理元阵列上直方图计算的数据并行实现方法,然后以每个处理元中至少有256个寄存器的一维处... 灰度直方图计算是图像分割与图像灰度变换等图像处理操作中一种重要的分析工具。本文将首先讨论直方图计算在单处理机上的执行效率,并讨论两维处理元阵列上直方图计算的数据并行实现方法,然后以每个处理元中至少有256个寄存器的一维处理元阵列为应用背景,提出了一种新的直方图计算的数据并行实现方法,使处理元阵列的执行效率达到了每个像素只需1次数据并行的计数操作。 展开更多
关键词 并行实现 计算 执行效率 灰度直方图 分析工具 图像处理 灰度变换 图像分割 单处理机 数据并行 阵列 寄存器 操作 两维
在线阅读 下载PDF
考虑节点信誉度的传感器网络数据并行聚集 被引量:2
11
作者 周海飞 芦翔 胡春芬 《传感技术学报》 CAS CSCD 北大核心 2022年第4期545-549,共5页
为降低传感器网络的数据积聚量、提高数据并行聚集精度,提出了一种考虑节点信誉度的传感器网络数据并行聚集方法。将传感器网络数据并行聚集过程分为两个阶段。首先,采用减法聚类的方法来获取节点簇头。通过保障簇头地理位置的合理分布... 为降低传感器网络的数据积聚量、提高数据并行聚集精度,提出了一种考虑节点信誉度的传感器网络数据并行聚集方法。将传感器网络数据并行聚集过程分为两个阶段。首先,采用减法聚类的方法来获取节点簇头。通过保障簇头地理位置的合理分布,提升节点分簇效率。然后利用以云理论为基础的节点信誉度度量模型获取信誉云的数值特征值,量化局部窗口内传感器节点的信誉度。在数据传输阶段,以多属性决策过程描述簇头节点确定下一跳数据转发节点的建模过程,结合节点信誉度分析结果,确定由整体评价最佳的簇头节点转发聚集数据。仿真结果表明:本文方法的精度最高可达98.1%,由此可知,利用该方法可实现高精度的传感器网络数据并行聚集。 展开更多
关键词 节点信誉度 传感器网络 数据并行聚集 节点分簇 数据传输 云理论
在线阅读 下载PDF
基于动态冗余机制的数据并行型计算网格模型 被引量:3
12
作者 陈庆奎 那丽春 《通信学报》 EI CSCD 北大核心 2005年第12期110-116,共7页
在由多个普通计算机机群构成的网格环境下,为了解决大规模数据并行型计算加速比问题、容错问题和动态负载均衡问题,提出了一个基于动态冗余机制的数据并行型网格模型。给出了由多个计算机机群组成的数据并行型计算网格等一系列形式化定... 在由多个普通计算机机群构成的网格环境下,为了解决大规模数据并行型计算加速比问题、容错问题和动态负载均衡问题,提出了一个基于动态冗余机制的数据并行型网格模型。给出了由多个计算机机群组成的数据并行型计算网格等一系列形式化定义。利用逻辑计算机机群、机群逻辑环、计算节点逻辑环和m-冗余策略,研究了动态冗余、动态负载均衡技术。根据这些技术,描述了网格环境下的数据并行型计算过程。理论分析和实践表明,该模型有效地解决了大规模数据并行型计算所需的负载均衡、容错和资源优化问题。该模型适合基于网格的数据并行型计算。 展开更多
关键词 网格 数据并行型计算 大规模并行算法 动态冗余 容错
在线阅读 下载PDF
MCC-SIMD数据并行卷积计算方法的研究 被引量:1
13
作者 张发存 赵晓红 +1 位作者 王忠 沈绪榜 《计算机工程》 CAS CSCD 北大核心 2004年第9期34-36,共3页
主要研究卷积计算的数据并行方法在MCC-SIMD计算机的设计和实现问题。在参考国内外现有资料的基础上,从图论的角度用卷积路径的方法对卷积计算的有关概念进行了严格的形式化定义;分析了4-连接卷积路径下数据并行卷积计算时处理元阵列... 主要研究卷积计算的数据并行方法在MCC-SIMD计算机的设计和实现问题。在参考国内外现有资料的基础上,从图论的角度用卷积路径的方法对卷积计算的有关概念进行了严格的形式化定义;分析了4-连接卷积路径下数据并行卷积计算时处理元阵列的移动规律;在此基础上给出了数据并行卷积计算算法;最后对算法的计算复杂性和通信复杂性进行了简要分析。文中还对有关结论进行了证明。 展开更多
关键词 数据并行 卷积计算 卷积路径 MCC-SIMD计算机
在线阅读 下载PDF
大规模数据并行问题的可扩展性分析 被引量:4
14
作者 金之雁 王鼎兴 《应用气象学报》 CSCD 北大核心 2003年第3期369-374,共6页
大规模数据并行处理的性能受到处理机数量、I/O速度、通信速度等多方面因素的制约。增加处理机数量或提高处理机的计算速度 ,可以提高计算机的整体处理速度 ,但是通信和I/O会成为影响并行效率的主要因素。为了综合分析这些因素对计算性... 大规模数据并行处理的性能受到处理机数量、I/O速度、通信速度等多方面因素的制约。增加处理机数量或提高处理机的计算速度 ,可以提高计算机的整体处理速度 ,但是通信和I/O会成为影响并行效率的主要因素。为了综合分析这些因素对计算性能的影响 ,用一种比较典型的大规模数据并行的计算模型 ,具体分析了处理机数量、处理机速度与处理机间的通信延迟、通信速率以及输入输出速度之间的关系。得到了大规模并行机的通信和I/O性能与处理机速度与数量之间存在的关系。指出 ,增加处理机数量、提高单节点处理速度的同时 ,必须按照一定的关系相应增加节点间的通信性能和I/O性能。单纯以增加处理机数量、提高单处理机速度提高计算机峰值速度的方法会降低系统的计算效率 ,不能达到计算速度与计算机处理能力同步增长的目的。 展开更多
关键词 大规模数据并行 数据处理 并行处理 可扩展性分析 计算模型 计算机处理 计算速度 处理机
在线阅读 下载PDF
数据并行程序中的动态负载平衡模型 被引量:1
15
作者 王明文 陆宁 +1 位作者 孙永强 薛景云 《计算机工程》 CAS CSCD 北大核心 2000年第11期6-8,共3页
在研究分析已有的负载平衡策略算法的基础上.应用Dempster-Shafer的信任函数理论,提出了一种基于信度网络的负载平衡策略算法,此算法较适应动态负载平衡,而且优于负载平衡的随机算法,若忽略系统的通信花费则可达到... 在研究分析已有的负载平衡策略算法的基础上.应用Dempster-Shafer的信任函数理论,提出了一种基于信度网络的负载平衡策略算法,此算法较适应动态负载平衡,而且优于负载平衡的随机算法,若忽略系统的通信花费则可达到系统的完全负载平衡,综合各种费用,提出的算法通过状态管理器,在不完全信息的状态下可使系统达到较满意的平衡.此外,基于信度网络的负载平衡策略算法不仅适应于虚拟非规则网络,也适应于虚拟规则网. 展开更多
关键词 动态负载平衡 数据分布 数据并行 单程序多数据 信任函数 信度推理网络
在线阅读 下载PDF
模块化可视化环境中的数据并行与流水线处理技术 被引量:1
16
作者 黄朝晖 李晓梅 《计算机研究与发展》 EI CSCD 北大核心 2000年第8期962-968,共7页
提高数据处理的规模与效率是模块化可视化环境目前需要解决的一个主要问题 .提出了基于数据分解与组合的模块间数据并行与流水线处理技术 ,同时进行了性能分析和数值实验 .结果表明 ,数据并行与流水线处理能够提高应用执行效率、减少存... 提高数据处理的规模与效率是模块化可视化环境目前需要解决的一个主要问题 .提出了基于数据分解与组合的模块间数据并行与流水线处理技术 ,同时进行了性能分析和数值实验 .结果表明 ,数据并行与流水线处理能够提高应用执行效率、减少存储需求 。 展开更多
关键词 模块化可视化环境 数据并行 流水线处理
在线阅读 下载PDF
数据并行计算:概念、模型与系统 被引量:5
17
作者 李晓明 《计算机科学》 CSCD 北大核心 2000年第6期1-5,共5页
一、引言并行计算,或者并行处理,指的是这样一种努力和相关的研究:利用多个具有计算能力的部件来共同完成一个计算工作,以获得比用一个部件来完成要快的效果。这显然是一个很自然的想法。历史地看,几乎是自从有了计算机,就有了并行处理... 一、引言并行计算,或者并行处理,指的是这样一种努力和相关的研究:利用多个具有计算能力的部件来共同完成一个计算工作,以获得比用一个部件来完成要快的效果。这显然是一个很自然的想法。历史地看,几乎是自从有了计算机,就有了并行处理的想法和实践。在80年代后期到90年代初期。 展开更多
关键词 数据并行计算 算法 并行计算机 数学模型
在线阅读 下载PDF
超立方体多计算机上数据并行算法性能研究 被引量:1
18
作者 林亚平 尹锋 《湖南大学学报(自然科学版)》 EI CAS CSCD 1995年第5期109-114,120,共7页
讨论了超立方体多计算机上的数据并行算法,着重分析通信参数对算法性能的影响。提出了一个计算模型,并以并行归并算法为例,对数据元素数目和处理机数目等设计参数进行性能评价。
关键词 数据并行算法 超立方体 多计算机系统 并行算法
在线阅读 下载PDF
流化H.264编码的数据并行方法
19
作者 文梅 任巨 +3 位作者 伍楠 苏华友 荀长庆 张春元 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第3期66-71,共6页
流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编... 流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编码过程中遇到的相关性问题,然后为各主要编码模块分别提出解除相关性限制的数据并行编码方法。采用这些方法能够保证大数据并行粒度,最终达到高效并行流化编码的目的。实验表明采用数据并行流化编码方法,帧间预测、帧内预测、熵编码和去块滤波模块都获得了显著加速。 展开更多
关键词 H.264编码 流模型 并行计算 数据并行
在线阅读 下载PDF
网格中数据并行流水线的任务指派优化
20
作者 王庆江 桂小林 郑守淇 《西安交通大学学报》 EI CAS CSCD 北大核心 2004年第8期771-774,共4页
为了缩短网格中数据并行流水线在吞吐率受限下的延迟,提出了一种优化任务指派的算法.在一个流水线中,每个任务都可以是一个数据并行程序.当多个任务被指派到同一个并行系统时,假设每个任务排他地使用一组处理机.根据优化目的,优化过程... 为了缩短网格中数据并行流水线在吞吐率受限下的延迟,提出了一种优化任务指派的算法.在一个流水线中,每个任务都可以是一个数据并行程序.当多个任务被指派到同一个并行系统时,假设每个任务排他地使用一组处理机.根据优化目的,优化过程可分成连续的两个阶段,即提高吞吐率和缩短吞吐率受限下的延迟.对不同的优化阶段,用不同的启发式算法确定一个并行系统中每个任务的处理机数.改派任一任务都会使流水线的性能发生变化,性能提高的幅度被称为任务优先级.通过重复改派优先级最高的任务,流水线的性能可迅速提高,这在仿真实验中已得到了证实. 展开更多
关键词 网格 流水线 数据并行流水线 吞吐率 延迟 任务指派
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部