期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
深度神经网络模型任务切分及并行优化方法 被引量:1
1
作者 巨涛 刘帅 +1 位作者 王志强 李林娟 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第9期2739-2752,共14页
为解决传统手工切分神经网络模型计算任务并行化方法面临的并行化难度大、训练耗时长、设备利用率低等问题,提出了一种基于深度神经网络(DNN)模型特性感知的任务切分及并行优化方法。结合硬件计算环境,对模型计算特性进行动态分析,获取... 为解决传统手工切分神经网络模型计算任务并行化方法面临的并行化难度大、训练耗时长、设备利用率低等问题,提出了一种基于深度神经网络(DNN)模型特性感知的任务切分及并行优化方法。结合硬件计算环境,对模型计算特性进行动态分析,获取模型内部相关性和各类参数属性,构建原始计算任务有向无环图(DAG);利用增强反链,构建DAG节点间可分区聚类的拓扑关系,将原始DAG转换为易于切分的反链DAG;通过拓扑排序生成反链DAG状态序列,并使用动态规划将状态序列切分为不同执行阶段,分析最佳分割点进行模型切分,实现模型分区与各GPU间动态匹配;对批量进行微处理,通过引入流水线并行实现多迭代密集训练,提高GPU利用率,减少训练耗时。实验结果表明:与已有模型切分方法相比,在CIFAR-10数据集上,所提模型切分及并行优化方法可实现各GPU间训练任务负载均衡,在保证模型训练精度的同时,4 GPU加速比达到3.4,8 GPU加速比为3.76。 展开更多
关键词 深度神经网络模型并行 模型切分 流水线并行 反链 并行优化
在线阅读 下载PDF
MapReduce并行编程模型研究综述 被引量:189
2
作者 李建江 崔健 +2 位作者 王聃 严林 黄义双 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2635-2642,共8页
MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成... MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成果的特点和不足,重点对MapReduce涉及的关键技术(包括:模型改进、模型针对不同平台的实现、任务调度、负载均衡和容错)的研究现状进行了深入的分析.本文最后还对MapReduce未来的发展趋势进行了展望. 展开更多
关键词 MAPREDUCE 并行编程模型 运行时支持库 海量数据处理
在线阅读 下载PDF
基于MapReduce模型的并行科学计算 被引量:39
3
作者 郑启龙 房明 +3 位作者 汪胜 王向前 吴晓伟 王昊 《微电子学与计算机》 CSCD 北大核心 2009年第8期13-17,共5页
随着多核处理器日渐普及,开发高效易用的并行编程模型成为新的挑战.MapReduce是Google开发的一种并行分布式计算模型,在其搜索业务中获得了巨大的成功.将MapReduce模型引入科学计算领域,并结合实例阐述了如何使用面向高性能计算的HPMR/H... 随着多核处理器日渐普及,开发高效易用的并行编程模型成为新的挑战.MapReduce是Google开发的一种并行分布式计算模型,在其搜索业务中获得了巨大的成功.将MapReduce模型引入科学计算领域,并结合实例阐述了如何使用面向高性能计算的HPMR/HPMR-s系统在分布式或共享存储系统中采用统一的方式描述并实现并行科学计算. 展开更多
关键词 并行编程模型 科学计算 MAPREDUCE
在线阅读 下载PDF
基于隐马尔可夫模型与并行模型组合的特征补偿算法 被引量:4
4
作者 吕勇 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第5期889-893,共5页
提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方差,采用并行模型组合方法调整隐马尔可夫模型的均值向量和协... 提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方差,采用并行模型组合方法调整隐马尔可夫模型的均值向量和协方差矩阵,使之与识别环境相匹配.最后,根据基于状态转移矩阵压缩的前向后向算法计算隐马尔可夫模型的后验概率,并通过最小均方误差准则估计纯净语音特征向量.实验结果表明,该算法能够更加准确地估计纯净语音特征向量,其性能明显优于基于高斯混合模型的特征补偿算法;状态转移矩阵压缩算法可以在不影响补偿精度的前提下,显著减少前向后向算法的计算量. 展开更多
关键词 语音识别 特征补偿 隐马尔可夫模型 并行模型组合
在线阅读 下载PDF
一种用于空时自适应处理的并行计算模型 被引量:3
5
作者 邵银波 王永良 +2 位作者 李强 陈辉 肖奚安 《电子学报》 EI CAS CSCD 北大核心 2006年第3期450-453,共4页
在分析各种空时自适应处理(STAP)算法特点的基础上,提出了一种用于STAP的并行计算模型.进而深入分析了STAP系统的实时特性,分析发现,要减少系统延时,一是必须尽量减少计算或者通信时间,二是充分利用前批数据的计算结果和相关先验知识;... 在分析各种空时自适应处理(STAP)算法特点的基础上,提出了一种用于STAP的并行计算模型.进而深入分析了STAP系统的实时特性,分析发现,要减少系统延时,一是必须尽量减少计算或者通信时间,二是充分利用前批数据的计算结果和相关先验知识;而要增大吞吐率,一是增加处理器流水线条数,二是避免出现瓶颈阶段.基于该模型,已成功开发了多种实际系统. 展开更多
关键词 空时自适应处理(STAP) 并行计算模型 并行处理
在线阅读 下载PDF
基于并行计算模型的并行微粒群算法的性能分析 被引量:2
6
作者 王元元 曾建潮 谭瑛 《微电子学与计算机》 CSCD 北大核心 2007年第9期25-28,共4页
将微粒群算法与并行计算模型相结合,基于三种不同的并行计算模型(带中央控制器的并行计算模型、环形结构带缓存区的并行计算模型、BSP并行计算模型),设计出相应的并行微粒群算法,并对并行算法性能进行详细分析。大量实验表明:子种群之... 将微粒群算法与并行计算模型相结合,基于三种不同的并行计算模型(带中央控制器的并行计算模型、环形结构带缓存区的并行计算模型、BSP并行计算模型),设计出相应的并行微粒群算法,并对并行算法性能进行详细分析。大量实验表明:子种群之间的通讯周期是个重要的可变参数,当选取合适时,能提高解的质量以及算法的收敛性和最优性。 展开更多
关键词 并行计算模型 并行算法 微粒群算法
在线阅读 下载PDF
基于OpenMP的文件压缩与解压的并行设计模型 被引量:2
7
作者 胡荣 邹承明 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第8期2684-2690,共7页
在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用... 在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用到文件压缩与解压中。并在文件并行处理过程中,与数据分解法相结合对数据文件进行分割,将分解后的数据由主线程分给多个处理器上的多个子线程来并行处理,以此提高多核处理器的利用率并提高文件压缩效率。最后通过实验模拟验证模型以及算法性能。研究结果表明:在八核处理器下通过对文本文件、图像文件和音频文件等多种不同类型文件进行压缩解压试验,验证了动态Huffman并行算法与串行算法相比其加速比可以达到1.5~8.0倍,性能也得到很大提高。 展开更多
关键词 OPENMP 并行设计模型 多核多线程 Huffman并行算法
在线阅读 下载PDF
网络处理器并行性能模型及多线程停顿特性
8
作者 时向泉 苏金树 +1 位作者 陈一骄 吴纯青 《通信学报》 EI CSCD 北大核心 2007年第9期53-59,共7页
对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了... 对影响多处理器与多线程的网络处理器性能因素进行分析,提出了网络处理器并行性能模型NP3M,给出了影响其性能的主要原因,并对多线程并行数目与处理单元并行以及网络处理器整体系统性能之间的关系进行了研究与实际测试,对NP3M模型进行了验证,并给出了相关的结论。 展开更多
关键词 网络处理器 并行性能模型 多线程 停顿
在线阅读 下载PDF
并行计算中的CDT模型
9
作者 边根庆 邵必林 +1 位作者 冯钢 金湖庭 《西安建筑科技大学学报(自然科学版)》 CSCD 北大核心 2005年第4期552-556,共5页
并行模型机的构造是并行计算研究中极为重要的部分,一个理想的并行模型机应该能够反映并行计算中的重要环节同时又能最大限度的减少并行计算中繁杂的具体细节的分析.在对目前较为流行的一些并行模型机进行简单分析的基础上,对以范畴理... 并行模型机的构造是并行计算研究中极为重要的部分,一个理想的并行模型机应该能够反映并行计算中的重要环节同时又能最大限度的减少并行计算中繁杂的具体细节的分析.在对目前较为流行的一些并行模型机进行简单分析的基础上,对以范畴理论为基础的并行机模型、范畴数据类型(CDT)的研究方法、现状及存在的问题进行了较为深入的研究和探讨. 展开更多
关键词 并行计算模型 范畴数据类型(CDT)模型 范畴理论
在线阅读 下载PDF
一种面向网格的二级并行计算模型研究与实现
10
作者 李利杰 雷咏梅 《微电子学与计算机》 CSCD 北大核心 2006年第z1期63-64,68,共3页
网格的异构性、动态性使得传统的计算模型已经不能适应网格计算环境。文章提出一种面向网格的基于消息通信方式的二级计算模型以求解问题。二级计算模型可简述如下:第一步将任务粗粒度分解成若干子任务并映射到节点;第二步各节点进行全... 网格的异构性、动态性使得传统的计算模型已经不能适应网格计算环境。文章提出一种面向网格的基于消息通信方式的二级计算模型以求解问题。二级计算模型可简述如下:第一步将任务粗粒度分解成若干子任务并映射到节点;第二步各节点进行全局竞争得到全局最优解并以全局最优解为对象进行细粒度方式协同计算。最后在上海高校网格E网格计算应用平台上实例验证。 展开更多
关键词 网格 二级并行计算模型 动态资源调度
在线阅读 下载PDF
一个基于集群的并行计算模型——NHCBL
11
作者 董勇 翁代云 《现代电子技术》 2007年第4期146-149,152,共5页
当前,集群是流行的并行计算平台,既具有所有并行计算都具备的一般特性,又具有自己独有的特性———节点计算资源的异构性、节点计算资源的非独占性、对节点间通信的敏感性。针对基于集群环境的并行计算,对非独占、异构、同步LogGP模型NH... 当前,集群是流行的并行计算平台,既具有所有并行计算都具备的一般特性,又具有自己独有的特性———节点计算资源的异构性、节点计算资源的非独占性、对节点间通信的敏感性。针对基于集群环境的并行计算,对非独占、异构、同步LogGP模型NHBL(Nondedicated Heterogeneous Barrier Log GP model)进行改进,提出了一种更实用的计算模型,即考虑网络拥塞的非独占、异构、同步LogGP模型NHCBL(Nondedicated Heterogeneous Barrier Log GP model considering Conges-tion)。NHCBL模型既比较准确地描述了并行计算的一般特性,又比较准确地描述了基于集群的并行计算独有的节点计算资源的异构性、节点计算资源的非独占性、对节点间通信的敏感性,其描述比NHBL模型更全面也更准确。 展开更多
关键词 集群 并行计算模型 NHCBL 节点
在线阅读 下载PDF
面向大数据处理的并行计算模型及性能优化 被引量:2
12
作者 龚威 《无线互联科技》 2015年第21期108-109,共2页
近年来,信息技术飞速发展,在对人们工作及生活各个领域产生广泛影响的基础上,也促使海量数据的产生,这标志着人类进入了大数据时代。而大数据不断发展的一个关键技术就是并行计算模型,现阶段工业生产过程中所应用的多种大数据编程模型... 近年来,信息技术飞速发展,在对人们工作及生活各个领域产生广泛影响的基础上,也促使海量数据的产生,这标志着人类进入了大数据时代。而大数据不断发展的一个关键技术就是并行计算模型,现阶段工业生产过程中所应用的多种大数据编程模型都是有效分析与处理大数据的关键技术,因此现阶段加强并行计算模型研究对于适应时代发展、促进我国科技进步具有重要意义。文章从P-DOT模型入手,在对其含义等进行简要介绍的基础上,详细探讨了性能优化方式。 展开更多
关键词 大数据处理 并行计算模型 性能优化
在线阅读 下载PDF
P2P-Grid环境下基于聚集的并行资源调度模型研究 被引量:1
13
作者 叶从欢 《电子技术应用》 北大核心 2006年第2期77-80,共4页
在混合式P2P结构的基础上提出了P2P-Grid模型,把同类同属性资源聚集到资源组,并建立资源组目录树。给出了一种可以避免Grid-Peer内部任务扎堆现象的资源调度算法和Grid-Peer调度算法。
关键词 P2P—Grid模型 Grid—Peer算法 资源组 资源调度 并行资源调度模型
在线阅读 下载PDF
基于SIMD-MPP并行模型的图像调度与映射方法研究
14
作者 付光远 《微电子学与计算机》 CSCD 北大核心 2006年第z1期92-94,共3页
文章提出并设计了一种基于SIMD-MPP并行模型的图像划分和图像映射方法,使得在基于SIMD-MPP并行模型的景象匹配全遍历搜索过程中,从存储器读取基准图的每个像素只需一次,使处理元阵列与存储器之间的数据通信量减到最小,有效地解决了基准... 文章提出并设计了一种基于SIMD-MPP并行模型的图像划分和图像映射方法,使得在基于SIMD-MPP并行模型的景象匹配全遍历搜索过程中,从存储器读取基准图的每个像素只需一次,使处理元阵列与存储器之间的数据通信量减到最小,有效地解决了基准图的重复读取“瓶颈”问题。 展开更多
关键词 SIMD-MPP并行模型 虚拟划分 景象匹配
在线阅读 下载PDF
产生式系统的并行点火模型(英文)
15
作者 张学海 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1990年第6期116-118,共3页
A production system (PS) is a program composed entirely of conditional statements called productions These productions operate on expressions stored in a global data base called working memory (WM). The productions ar... A production system (PS) is a program composed entirely of conditional statements called productions These productions operate on expressions stored in a global data base called working memory (WM). The productions are stored in a separate memory called production memory (PM). The production is similar 展开更多
关键词 产生式系统 并行点火模型
在线阅读 下载PDF
基于C/S结构的Ada_DBMS分布并行计算模型
16
作者 凌咏红 吴思 《微电子学与计算机》 CSCD 北大核心 2002年第9期19-21,共3页
文章介绍了一种基于C/S结构的Ada_DBMS分布并行计算模型,它将Ada的任务机制、C/S结构、DBMS的多线索机制相结合熏形成一种灵活的分布并行计算机制,提高了Ada在分布式网络环境下的计算效率。并以Ada_Sybase系统为例提出了一种实现方案。
关键词 分布并行计算模型 C/S结构 ADA语言 DBMS 数据库 多线索技术
在线阅读 下载PDF
PVM系统统一并行调试对象模型的Petri网描述
17
作者 黄宁 《航空计算技术》 2000年第1期25-29,共5页
采用具体定义的PVM活动所描述的统一并行调试对象模型可使用户在调试的各阶段都面对相同的调试对象 ,但并行程序的文本表示或通常由事件为基础的视图并不适合描述这种概念 ,为把活动明确地表达给用户 ,我们给出了该模型的着色Petri网描... 采用具体定义的PVM活动所描述的统一并行调试对象模型可使用户在调试的各阶段都面对相同的调试对象 ,但并行程序的文本表示或通常由事件为基础的视图并不适合描述这种概念 ,为把活动明确地表达给用户 ,我们给出了该模型的着色Petri网描述 ,这将有助于对程序作进一步的静态分析和性能调试研究。 展开更多
关键词 PVM PETRI网 统一并行调试对象模型
在线阅读 下载PDF
基于并行处理模型的地震仪器主机系统软件体系结构
18
作者 穆群英 王堃 +4 位作者 朱贵冬 刘胜航 范斌 魏启 王浩 《勘探地球物理进展》 2008年第6期454-456,共3页
主机系统是新一代地震仪器的工作和调度核心。研究并设计了基于线程级并行处理模型的地震仪器主机软件系统体系结构。首先,建立任务模型,对主机软件系统进行任务划分;其次,利用线程管理、任务管理和实时调度,有效地利用硬件多核体系结构... 主机系统是新一代地震仪器的工作和调度核心。研究并设计了基于线程级并行处理模型的地震仪器主机软件系统体系结构。首先,建立任务模型,对主机软件系统进行任务划分;其次,利用线程管理、任务管理和实时调度,有效地利用硬件多核体系结构,以提高性能。模拟带道能力测试结果表明,在该软件体系结构下实现的主机软件系统带道能力满足1 ms@9 000道要求。 展开更多
关键词 地震数据采集记录系统 主机软件系统 并行处理模型 软件体系结构
在线阅读 下载PDF
面向流体机械仿真的层次化并行计算模型 被引量:1
19
作者 肖兮 刘闯 +3 位作者 何锋 张琼 张兴军 董小社 《西安交通大学学报》 EI CAS CSCD 北大核心 2019年第2期121-127,共7页
随着流体机械基础并行算法的发展,传统的单核处理器已经不能很好地满足先进流体机械研发的技术需求,为此本文深入研究了流体机械的物理模型以及高性能计算机架构特点,设计并实现了能够充分表达物理模型并行性的高效的面向流体机械仿真... 随着流体机械基础并行算法的发展,传统的单核处理器已经不能很好地满足先进流体机械研发的技术需求,为此本文深入研究了流体机械的物理模型以及高性能计算机架构特点,设计并实现了能够充分表达物理模型并行性的高效的面向流体机械仿真的层次化并行计算模型(HP2H)。HP2H模型充分考虑流体机械的多层几何结构以及高性能计算机的多层逻辑架构,深入挖掘计算平台、计算模型以及物理模型的并行性,实现从物理模型到计算资源的高效任务映射。依据具体的轴流压气机转子数值模拟的实际应用背景,结合粗粒度并行和细粒度并行对模型进行实现。对HP2H计算模型进行了功能测试和性能测试,当计算核心从36核提升到432核时,计算性能提升约12倍,并行效率达到了100%。实验结果表明,HP2H计算模型不但在正确地对流体机械进行数值模拟的前提下实现了较好的计算性能,并且由于HP2H计算模型结合了粗粒度并行与细粒度并行,因而可以在不同的计算平台上运行,还可以便捷地实现计算规模的扩展,具有良好的可移植性与可扩展性。 展开更多
关键词 流体机械 粗粒度并行 细粒度并行 并行计算模型
在线阅读 下载PDF
模糊逻辑语言FLL的并行计算模型FPCM 被引量:2
20
作者 陈世鸿 彭蓉 《数学物理学报(A辑)》 CSCD 北大核心 2002年第1期48-54,共7页
该文在研究模糊逻辑语言 FLL 语义的基础上 ,提出了并行计算模型 FPCM(FuzzyParallel Compute Model) .该模型描述了模糊逻辑程序设计语言 FLL的并行计算结构 ,以此实现了“AND并行”和“OR并行”计算 ,并利用所提出的警卫条件、计算负... 该文在研究模糊逻辑语言 FLL 语义的基础上 ,提出了并行计算模型 FPCM(FuzzyParallel Compute Model) .该模型描述了模糊逻辑程序设计语言 FLL的并行计算结构 ,以此实现了“AND并行”和“OR并行”计算 ,并利用所提出的警卫条件、计算负影响等机制进一步提高了 FLL语言的并行执行效率 。 展开更多
关键词 AND并行 OR并行 警卫条件 程序设计语言 FPCM 模糊逻辑语言 并行计算模型
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部