期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
众核计算平台的高吞吐率密码算法加速
1
作者 符鹤 李春江 +1 位作者 王昊 谢永芳 《计算机工程与科学》 CSCD 北大核心 2018年第4期580-586,共7页
众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核... 众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核协处理器上执行。使用MIC众核协处理器,采用三级并行结构及任务分配机制,提升了高吞吐率密码算法处理的并行性。针对多种密码算法应用的实验结果表明,该框架可充分利用众核平台实现粗粒度并行的高吞吐率加解密处理。 展开更多
关键词 众核平台 密码算法 高吞吐率 粗粒度并行
在线阅读 下载PDF
基于OpenMP4.0的发动机燃烧模拟软件异构并行优化 被引量:2
2
作者 杨梅芳 车永刚 高翔 《计算机研究与发展》 EI CSCD 北大核心 2018年第2期400-408,共9页
LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core,MIC)构成的新型异构众核平台,使用新的Ope... LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core,MIC)构成的新型异构众核平台,使用新的OpenMP 4.0编程标准,实现了LESAP软件面向异构并行平台的移植,并采用SIMD向量化、数据传输优化、基于网格块划分的负载均衡等技术进行了性能优化.性能测试结果表明异构版本比纯CPU版本性能更佳.在天河二号超级计算机的1个结点(含2个12核的Intel Xeon E5-2692CPU加3块Intel Xeon Phi 31S1P协处理器)上,对一个实际超燃发动机燃烧数值模拟问题,网格规模为532万单元时,每时间步的平均执行时间从原来纯CPU版的64.72s减少到21.06s,性能加速比达到约3.07. 展开更多
关键词 发动机燃烧数值模拟 异构众核平台 Intel集成 OpenMP4.0 性能优化
在线阅读 下载PDF
深度学习节点分配的遗传算法设计 被引量:3
3
作者 蔡恒雨 郑启龙 《小型微型计算机系统》 CSCD 北大核心 2021年第6期1158-1164,共7页
随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储... 随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储资源,提供的并行通信接口MPIRIO适合深度学习模型的部署.本文基于BWDSP众核虚拟平台和并行通信接口MPIRIO,使用遗传算法优化深度学习模型在BWDSP虚拟平台上的部署,加速深度学习模型的训练过程.设计了静态遗传算法和动态遗传算法两种算法,优化了深度学习模型计算节点在BWDSP虚拟平台上的分配,实现了虚拟平台上的深度学习模型加速,并通过实验证明了两种遗传算法的有效性. 展开更多
关键词 深度学习 BWDSP 虚拟平台 MPIRIO 静态遗传算法 动态遗传算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部