期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于异构系统的多级并行稀疏张量向量乘算法 被引量:1
1
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 cpu-gpu 异构并行计算 多级并行 稀疏张量 张量运算
在线阅读 下载PDF
一种异构多核系统动态调度协处理器设计
2
作者 曾树铭 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第2期185-195,共11页
为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理... 为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理、任务自动映射、通讯任务乱序执行等机制。实验结果表明,该动态调度协处理器不仅能够实现任务级乱序执行等基本设计目标,还具有极低的调度开销,相较于基于动态记分牌算法的调度器,运行多个子孔径距离压缩算法的时间降低达17.13%。研究结果证明文章设计的动态调度协处理器能够有效优化目标场景下的任务调度效果。 展开更多
关键词 动态调度 硬件调度器 异构多核系统 任务级并行 编程模型 片上缓存 片上网络
在线阅读 下载PDF
CPU-GPU异构系统在光学遥感影像处理中的应用 被引量:8
3
作者 党源源 王昕 《红外与激光工程》 EI CSCD 北大核心 2020年第S01期177-185,共9页
近年来,CPU-GPU异构系统在光学遥感影像数据处理领域的应用得到了广泛关注。首先介绍CPU-GPU异构系统的体系架构及发展历程。其次,介绍光学遥感影像数据处理流程。接下来,对CPU-GPU异构系统在光学遥感影像预处理、后续处理领域应用现状... 近年来,CPU-GPU异构系统在光学遥感影像数据处理领域的应用得到了广泛关注。首先介绍CPU-GPU异构系统的体系架构及发展历程。其次,介绍光学遥感影像数据处理流程。接下来,对CPU-GPU异构系统在光学遥感影像预处理、后续处理领域应用现状进行介绍。最后对CPU-GPU异构系统在光学遥感影像数据处理系统中的应用进行分析和总结,分析可知,CPU-GPU异构系统在光学遥感影像数据处理领域应用具有可行性且前景广阔,但仍需解决算法并行化设计、优化及CPU和GPU负载平衡等关键问题,这对推动CPU-GPU异构系统在光学遥感影像数据处理中的应用具有重要意义。 展开更多
关键词 遥感影像数据处理 异构系统 并行处理 GPU
在线阅读 下载PDF
一种面向异构并行系统的最大功耗管理方法 被引量:3
4
作者 王桂彬 杜静 唐滔 《软件学报》 EI CSCD 北大核心 2013年第10期2460-2472,共13页
高功耗已成为制约高性能计算机发展的重要问题之一.近年来,大量研究关注于如何在满足系统功耗约束的条件下优化系统执行性能.然而,已有方法大都针对同构系统,未考虑异构处理器之间的功耗或速度差异,难以高效应用于基于加速器的异构系统... 高功耗已成为制约高性能计算机发展的重要问题之一.近年来,大量研究关注于如何在满足系统功耗约束的条件下优化系统执行性能.然而,已有方法大都针对同构系统,未考虑异构处理器之间的功耗或速度差异,难以高效应用于基于加速器的异构系统.对当前异构并行系统执行模型进行了抽象,并提出了融合两级功耗控制机制的系统功耗管理框架,自顶向下依次为系统级功耗控制器和异构处理引擎功耗控制器.在异构处理引擎功耗控制中,针对类OpenMP并行循环,首先分析了异构多处理器在满足功耗约束条件下达到性能最优的条件.基于该结果,给出了功耗受限的并行循环划分算法,该方法通过协调并行循环调度和动态电压频率调节技术以优化异构并行处理.在系统级功耗控制中,建立了异构处理引擎效能评估方法,以此作为功耗划分的依据,在兼顾并发应用公平性的同时,提高系统整体执行效能.最后,基于典型CPU-GPU异构系统验证了方法的有效性. 展开更多
关键词 异构并行系统 最大功耗管理 任务调度 动态电压 频率调节
在线阅读 下载PDF
异构机群系统上双序列全局比对并行算法 被引量:2
5
作者 崔鑫 钟诚 陆向艳 《计算机工程与应用》 CSCD 北大核心 2009年第8期58-61,共4页
对于处理机节点具有不同的计算速度、通信延迟和存储容量的异构机群系统,考虑通信启动开销,基于可分负载理论,提出一种双序列全局比对问题并行处理的最优分配策略,利用该策略确定出并行迭代次数和分配给各个从处理机的子序列长度。异构P... 对于处理机节点具有不同的计算速度、通信延迟和存储容量的异构机群系统,考虑通信启动开销,基于可分负载理论,提出一种双序列全局比对问题并行处理的最优分配策略,利用该策略确定出并行迭代次数和分配给各个从处理机的子序列长度。异构PC机群系统上的实验结果表明,提出的双序列全局比对并行算法优于基于平均分配策略的并行比对算法,获得良好的加速和可扩展性。 展开更多
关键词 双序列比对 并行算法 异构机群系统 可分负载
在线阅读 下载PDF
异构机群系统上基于多轮分配方式的近似串匹配并行算法 被引量:3
6
作者 钟诚 范大娟 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期105-112,共8页
在给定正文串分配轮数的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情形,根据从处理机是否允许重叠执行计算和通信操作,提出异构机群计算环境下的最优正文串多轮分配策略;同时提出一种周期性的正文串多轮分配策略并给出了... 在给定正文串分配轮数的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情形,根据从处理机是否允许重叠执行计算和通信操作,提出异构机群计算环境下的最优正文串多轮分配策略;同时提出一种周期性的正文串多轮分配策略并给出了相应的正文串多轮分配的闭合解,此策略可以求出最优的分配轮数.实验结果表明,正文串多轮分配策略比正文串单轮分配策略大大缩短了近似串匹配并行处理的时间,并且在正文串多轮分配策略中,当近似串匹配应用的规模较小时,分配轮数比参与近似串匹配并行处理的从处理机数更能影响近似串匹配并行处理的完成时间,反之,从处理机数对近似串匹配并行处理的完成时间影响更大. 展开更多
关键词 近似串匹配 并行算法 异构机群系统 分配策略 多轮分配
在线阅读 下载PDF
异构并行系统中高时效性任务的节能调度方法 被引量:2
7
作者 黄日胜 《计算机应用与软件》 CSCD 2015年第11期329-333,共5页
面向异构并行系统的高时效性任务调度问题开展研究,着重考虑能耗因素对于调度方案的影响。首先在问题分析中,给出任务与资源的形式化描述。随后提出异构并行系统任务调度的决策变量和优化目标,并构建约束模型。基于典型调度过程,将原问... 面向异构并行系统的高时效性任务调度问题开展研究,着重考虑能耗因素对于调度方案的影响。首先在问题分析中,给出任务与资源的形式化描述。随后提出异构并行系统任务调度的决策变量和优化目标,并构建约束模型。基于典型调度过程,将原问题分解为序列生成算法设计问题和指派控制算法设计问题。提出用于任务排序的三种策略,以及用于任务分配的调度算法。在仿真实验中,将所提算法进行组合,在不同场景下进行对比测试。实验结果表明,所提方法能够在保证任务执行率的前提下,通过优化调度方案减少系统的能量开销。 展开更多
关键词 并行系统 节能调度 时效性 异构 算法
在线阅读 下载PDF
并行异构系统中的一种高效任务调度算法 被引量:4
8
作者 蒋韵联 孙广中 许胤龙 《计算机工程》 CAS CSCD 北大核心 2007年第11期39-41,共3页
并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随... 并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随机任务图和高斯迭代任务图进行模拟,与已有算法相比,新算法的效率有很大的提高。 展开更多
关键词 异构并行系统 启发式算法 任务复制
在线阅读 下载PDF
面向国产异构DCU平台的大规模并行矩量法研究
9
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
在线阅读 下载PDF
存储受限异构机群系统的多目标串近似匹配并行算法 被引量:2
10
作者 范曾 钟诚 +1 位作者 崔鑫 许莉莉 《小型微型计算机系统》 CSCD 北大核心 2009年第2期225-229,共5页
针对处理机节点具有不同的计算能力、通信延迟和存储容量的情形,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,分别建立单层和两层树结构模型的存储受限异构机群系统的目标串最优分配线性规划模型,给出相应的目标串最... 针对处理机节点具有不同的计算能力、通信延迟和存储容量的情形,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,分别建立单层和两层树结构模型的存储受限异构机群系统的目标串最优分配线性规划模型,给出相应的目标串最优分配方法,并讨论了处理机最优分配顺序.实验结果表明,本文提出的基于最优分配方法的多目标串近似匹配并行算法优于平均分配算法,获得了较好的加速并具有良好的可扩展性. 展开更多
关键词 多目标串近似匹配 近似词典匹配 并行算法 异构机群系统 存储受限 可分负载
在线阅读 下载PDF
异构机群系统上近似串匹配并行算法 被引量:1
11
作者 范大娟 钟诚 许莉莉 《计算机工程》 CAS CSCD 北大核心 2008年第3期141-144,共4页
基于可分负载理论的最优原则,在假定正文串分配顺序固定的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情况,提出一种异构机群计算环境下的最优正文串分配策略,给出最优正文串分配的闭合解。对于节点具有不同计算速度、... 基于可分负载理论的最优原则,在假定正文串分配顺序固定的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情况,提出一种异构机群计算环境下的最优正文串分配策略,给出最优正文串分配的闭合解。对于节点具有不同计算速度、通信能力、存储容量的异构机群系统,建立正文串最优分配的线性规划模型。针对几种特殊情况讨论正文串的最优分配顺序。实验结果表明,与平均分配正文串策略以及按照从处理机能力分配正文串策略相比,利用该策略进行近似串匹配并行处理所需时间分别缩短了10%~40%和5%~20%。 展开更多
关键词 近似串匹配 并行算法 异构机群系统 可分负载 分配策略
在线阅读 下载PDF
CPU-GPU系统中基于剖分的全局性能优化方法 被引量:10
12
作者 张保 董小社 +3 位作者 白秀秀 曹海军 刘超 梅一多 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优... 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右. 展开更多
关键词 cpu-gpu异构并行系统 全局优化 3级优化 3级剖分
在线阅读 下载PDF
基于国产异构众核处理器的等值线与等值面提取算法优化
13
作者 张元胤 肖敏广 +3 位作者 刘志勇 翁灵玲 陈志广 卢宇彤 《计算机工程与科学》 北大核心 2025年第2期200-209,共10页
MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-300... MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-3000处理器上,由于片上缓存空间有限,从核访存带宽限制等问题,导致计算效率低下;另外,由于编程模型的特殊性,现有软件与方法无法直接在MT-3000上运行。为了充分发挥国产超算系统在可视化领域的计算效能,基于MT-3000的微体系结构对等值线网格序列算法和等值面移动立方体算法分别提出了新的并行化算法。新方法采用向量指令、流水线实现存算重叠等技术,更加适应异构众核架构,从而达到加速算法执行的目的。实验结果表明,2种算法的加速比均达到4以上,并且随着从核的增多,算法的执行时间近呈线性下降,这证明所提算法具有良好的可扩展性。 展开更多
关键词 数据过滤 等值线 等值面 并行计算 异构 众核 国产超算系统
在线阅读 下载PDF
异构机群系统上并行计算双序列的最长公共子序列
14
作者 许莉莉 魏鹰 +1 位作者 罗海鹏 张林才 《计算机应用研究》 CSCD 北大核心 2010年第5期1669-1671,1682,共4页
针对处理机节点具有不同计算速度、不同通信能力的情况,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,提出一种存储受限异构机群系统的序列串最优分配线性规划模型,给出相应的序列串最优分配方法。实验结果表明,基于最... 针对处理机节点具有不同计算速度、不同通信能力的情况,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,提出一种存储受限异构机群系统的序列串最优分配线性规划模型,给出相应的序列串最优分配方法。实验结果表明,基于最优序列串分配方法的双序列最长公共子序列并行算法优于平均分配序列串算法,获得了较好的加速,并具有良好的可扩展性。 展开更多
关键词 双序列的最长公共子序列 并行算法 异构机群系统 可分负载 分配策略
在线阅读 下载PDF
面向天河新一代超算系统的大规模精确对角化方法
15
作者 李彪 刘杰 王庆林 《计算机研究与发展》 北大核心 2025年第6期1347-1362,共16页
精确对角化(exact diagonalization)方法是一种在量子物理、凝聚态物理等领域广泛应用的数值计算方法,是最直接求得量子系统基态的数值方法.仅从哈密顿矩阵的对称性出发,利用无矩阵(matrix-free)方法、分层通信模型以及适配于MT-3000的... 精确对角化(exact diagonalization)方法是一种在量子物理、凝聚态物理等领域广泛应用的数值计算方法,是最直接求得量子系统基态的数值方法.仅从哈密顿矩阵的对称性出发,利用无矩阵(matrix-free)方法、分层通信模型以及适配于MT-3000的数据级并行算法,提出了面向天河新一代超算系统上的超大稀疏哈密顿矩阵向量乘异构并行算法,可以实现基于一维Hubbard模型的大规模精确对角化.提出的并行算法在天河新一代超算系统上进行了测试,其中在1400亿维度矩阵规模上,8192进程相比256进程强扩展效率为55.27%,而弱扩展到7300亿维度矩阵规模上,13740个进程相比64进程的弱扩展效率保持在51.25%以上. 展开更多
关键词 精确对角化 HUBBARD模型 异构并行计算 MT-3000处理器 量子多体系统
在线阅读 下载PDF
异构并行编程模型研究与进展 被引量:13
16
作者 刘颖 吕方 +3 位作者 王蕾 陈莉 崔慧敏 冯晓兵 《软件学报》 EI CSCD 北大核心 2014年第7期1459-1475,共17页
近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑... 近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑战提供了相应的解决方案.最后,结合目前的研究现状以及异构系统的发展,提出了异构并行编程模型的未来方向. 展开更多
关键词 异构并行编程模型 异构系统 GPU 编程接口 编译 运行时系统
在线阅读 下载PDF
异构机群系统上带返回信息的可分负载多轮调度算法 被引量:4
17
作者 钟诚 李显宁 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期99-104,共6页
针对处理机具有不同的计算速度、通信能力的异构机群计算环境,以及实际应用中许多问题的求解在处理完任务后向中心处理机节点返回处理结果信息的情形,通过允许计算和通信操作重叠执行,采取FIFO调度策略和多次并行分配计算任务的方法,提... 针对处理机具有不同的计算速度、通信能力的异构机群计算环境,以及实际应用中许多问题的求解在处理完任务后向中心处理机节点返回处理结果信息的情形,通过允许计算和通信操作重叠执行,采取FIFO调度策略和多次并行分配计算任务的方法,提出一种带返回结果信息的调度轮数可变的可分负载多轮调度算法.实验结果表明,该算法对于处理具有返回结果信息的应用的调度性能优于UMR可分负载多轮调度算法,并且可以获得近似最优的调度轮数. 展开更多
关键词 异构机群系统 任务调度 并行算法 返回信息 可分负载
在线阅读 下载PDF
并行工程中基于XML的分布式约束管理系统研究 被引量:2
18
作者 蹇崇军 王润孝 秦现生 《组合机床与自动化加工技术》 北大核心 2003年第3期21-23,共3页
约束在产品并行开发过程中起着十分重要的作用 ,约束管理系统的建立对于并行工程 (ConcurrentEngineering ,CE)的应用具有非常重要的意义。本文介绍了并行工程中基于XML(eXtensibleMarkupLanguage)的分布式约束管理系统的设计与实现 :... 约束在产品并行开发过程中起着十分重要的作用 ,约束管理系统的建立对于并行工程 (ConcurrentEngineering ,CE)的应用具有非常重要的意义。本文介绍了并行工程中基于XML(eXtensibleMarkupLanguage)的分布式约束管理系统的设计与实现 :该系统采用Browser/Server结构 ,使用XML作为约束信息的传递媒介 。 展开更多
关键词 并行工程 分布式约束管理系统 XML 异构系统 约束信息共享
在线阅读 下载PDF
异构数据库环境下语义集成过程的并行计算方法研究 被引量:1
19
作者 强保华 吴中福 +2 位作者 陈凌 吴开贵 余建桥 《计算机科学》 CSCD 北大核心 2004年第9期96-99,共4页
区分相同属性是异构数据库环境下语义集成中的一个重要环节,主要的方法是用特征描述属性来评估属性之间的相似性。虽然这种方法具有较高自动化和易于实现的特点,但它将花费更多的时间来比较所有的属性且不能在语义集成中实现并行计算。... 区分相同属性是异构数据库环境下语义集成中的一个重要环节,主要的方法是用特征描述属性来评估属性之间的相似性。虽然这种方法具有较高自动化和易于实现的特点,但它将花费更多的时间来比较所有的属性且不能在语义集成中实现并行计算。本文提出了一种基于数据类型的方法来实现异构数据环境下相同属性的确定,这种方法具有在描述比较时间的同时实现语义集成的并行计算的特点。实验结果表明我们的方法能提高系统性能并且不降低查准率和查全率。 展开更多
关键词 语义集成 异构数据库 并行计算 属性 数据类型 系统性能 特征描述 查准率 查全率 方法
在线阅读 下载PDF
基于异构平台的并行最大最小蚁群算法 被引量:4
20
作者 黄震华 赵振岐 +1 位作者 林培裕 梅建华 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第12期1949-1955,共7页
最大最小蚂蚁系统(Max-min Ant System,MMAS)是一种性能优良的启发式算法,常用于解决组合优化问题.当解决的目标问题规模较大、迭代轮次较多时,最大最小蚁群算法存在运行时间长的缺点.试验以开源串行包ACOTSP为基准,利用GPU多线程并发... 最大最小蚂蚁系统(Max-min Ant System,MMAS)是一种性能优良的启发式算法,常用于解决组合优化问题.当解决的目标问题规模较大、迭代轮次较多时,最大最小蚁群算法存在运行时间长的缺点.试验以开源串行包ACOTSP为基准,利用GPU多线程并发的优势,采用并行蚂蚁策略将MMAS在CPU-GPU协同异构计算平台上并发实现.算法在GPU上运行时的影响因素,如数据传输、内存层次、库函数调用等,也得到有效分析,并作出针对性优化.试验最终取得了高达13倍的加速,表明并行MMAS策略具有高效性和实用性. 展开更多
关键词 并行计算 异构平台 最大最小蚁群系统 加速比
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部