期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
众核计算平台的高吞吐率密码算法加速
1
作者
符鹤
李春江
+1 位作者
王昊
谢永芳
《计算机工程与科学》
CSCD
北大核心
2018年第4期580-586,共7页
众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核...
众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核协处理器上执行。使用MIC众核协处理器,采用三级并行结构及任务分配机制,提升了高吞吐率密码算法处理的并行性。针对多种密码算法应用的实验结果表明,该框架可充分利用众核平台实现粗粒度并行的高吞吐率加解密处理。
展开更多
关键词
众核平台
密码算法
高吞吐率
粗粒度并行
在线阅读
下载PDF
职称材料
基于OpenMP4.0的发动机燃烧模拟软件异构并行优化
被引量:
2
2
作者
杨梅芳
车永刚
高翔
《计算机研究与发展》
EI
CSCD
北大核心
2018年第2期400-408,共9页
LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core,MIC)构成的新型异构众核平台,使用新的Ope...
LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core,MIC)构成的新型异构众核平台,使用新的OpenMP 4.0编程标准,实现了LESAP软件面向异构并行平台的移植,并采用SIMD向量化、数据传输优化、基于网格块划分的负载均衡等技术进行了性能优化.性能测试结果表明异构版本比纯CPU版本性能更佳.在天河二号超级计算机的1个结点(含2个12核的Intel Xeon E5-2692CPU加3块Intel Xeon Phi 31S1P协处理器)上,对一个实际超燃发动机燃烧数值模拟问题,网格规模为532万单元时,每时间步的平均执行时间从原来纯CPU版的64.72s减少到21.06s,性能加速比达到约3.07.
展开更多
关键词
发动机燃烧数值模拟
异构
众核平台
Intel集成
众
核
OpenMP4.0
性能优化
在线阅读
下载PDF
职称材料
深度学习节点分配的遗传算法设计
被引量:
3
3
作者
蔡恒雨
郑启龙
《小型微型计算机系统》
CSCD
北大核心
2021年第6期1158-1164,共7页
随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储...
随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储资源,提供的并行通信接口MPIRIO适合深度学习模型的部署.本文基于BWDSP众核虚拟平台和并行通信接口MPIRIO,使用遗传算法优化深度学习模型在BWDSP虚拟平台上的部署,加速深度学习模型的训练过程.设计了静态遗传算法和动态遗传算法两种算法,优化了深度学习模型计算节点在BWDSP虚拟平台上的分配,实现了虚拟平台上的深度学习模型加速,并通过实验证明了两种遗传算法的有效性.
展开更多
关键词
深度学习
BWDSP
众
核
虚拟
平台
MPIRIO
静态遗传算法
动态遗传算法
在线阅读
下载PDF
职称材料
题名
众核计算平台的高吞吐率密码算法加速
1
作者
符鹤
李春江
王昊
谢永芳
机构
中南大学信息科学与工程学院
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2018年第4期580-586,共7页
基金
国家自然科学基金(61321003
61170046)
文摘
众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核协处理器上执行。使用MIC众核协处理器,采用三级并行结构及任务分配机制,提升了高吞吐率密码算法处理的并行性。针对多种密码算法应用的实验结果表明,该框架可充分利用众核平台实现粗粒度并行的高吞吐率加解密处理。
关键词
众核平台
密码算法
高吞吐率
粗粒度并行
Keywords
many-core platform
cryptography algorithm
high throughput
coarse-grained parallel
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于OpenMP4.0的发动机燃烧模拟软件异构并行优化
被引量:
2
2
作者
杨梅芳
车永刚
高翔
机构
国防科技大学计算机学院长沙
国防科技大学并行与分布处理重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第2期400-408,共9页
基金
国家自然科学基金国际合作与交流项目(61561146395)
国家自然科学基金项目(11502296)
国家“八六三”高技术研究发展计划基金项目(2012AA01A301)
文摘
LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core,MIC)构成的新型异构众核平台,使用新的OpenMP 4.0编程标准,实现了LESAP软件面向异构并行平台的移植,并采用SIMD向量化、数据传输优化、基于网格块划分的负载均衡等技术进行了性能优化.性能测试结果表明异构版本比纯CPU版本性能更佳.在天河二号超级计算机的1个结点(含2个12核的Intel Xeon E5-2692CPU加3块Intel Xeon Phi 31S1P协处理器)上,对一个实际超燃发动机燃烧数值模拟问题,网格规模为532万单元时,每时间步的平均执行时间从原来纯CPU版的64.72s减少到21.06s,性能加速比达到约3.07.
关键词
发动机燃烧数值模拟
异构
众核平台
Intel集成
众
核
OpenMP4.0
性能优化
Keywords
combustion simulation
heterogeneous many-core platform
Intel MIC
OpenMP 4.0
performance optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
深度学习节点分配的遗传算法设计
被引量:
3
3
作者
蔡恒雨
郑启龙
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学国家高性能计算中心
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第6期1158-1164,共7页
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助.
文摘
随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储资源,提供的并行通信接口MPIRIO适合深度学习模型的部署.本文基于BWDSP众核虚拟平台和并行通信接口MPIRIO,使用遗传算法优化深度学习模型在BWDSP虚拟平台上的部署,加速深度学习模型的训练过程.设计了静态遗传算法和动态遗传算法两种算法,优化了深度学习模型计算节点在BWDSP虚拟平台上的分配,实现了虚拟平台上的深度学习模型加速,并通过实验证明了两种遗传算法的有效性.
关键词
深度学习
BWDSP
众
核
虚拟
平台
MPIRIO
静态遗传算法
动态遗传算法
Keywords
deep learning
BWDSP
many core virtual platform
MPIRIO
static genetic algorithm
dynamic genetic algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
众核计算平台的高吞吐率密码算法加速
符鹤
李春江
王昊
谢永芳
《计算机工程与科学》
CSCD
北大核心
2018
0
在线阅读
下载PDF
职称材料
2
基于OpenMP4.0的发动机燃烧模拟软件异构并行优化
杨梅芳
车永刚
高翔
《计算机研究与发展》
EI
CSCD
北大核心
2018
2
在线阅读
下载PDF
职称材料
3
深度学习节点分配的遗传算法设计
蔡恒雨
郑启龙
《小型微型计算机系统》
CSCD
北大核心
2021
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部