-
题名基于软硬件协同加速的关系网络推理优化方法
- 1
-
-
作者
张志超
王剑
章隆兵
肖俊华
-
机构
计算机体系结构国家重点实验室(中国科学院计算技术研究所)
中国科学院计算技术研究所
中国科学院大学
中国电子科技集团公司第十五研究所
-
出处
《高技术通讯》
CAS
2022年第4期327-336,共10页
-
基金
国家自然科学基金(61432016)
国家重点研发计划(2018YFC0832306,2018YFC0831203,2018YFC0831206)资助项目。
-
文摘
针对数据中心基于图形处理器(GPU)平台的关系网络推理计算中存在的低效能问题,本文提出了一种基于软硬件协同加速的关系网络优化方法。该方法采用基于GPU提取的支持集特征池与现场可编程门阵列(FPGA)推理异构协同的方式处理关系网络的推理计算,在高效能计算的同时保持关系网络的推理计算与GPU平台一致的准确率。利用基于高级综合(HLS)优化浮点卷积神经网络的计算方式,提高关系网络的处理能效。利用多运算单元异构多核处理的方式,满足FPGA时序收敛的同时,提升FPGA片上吞吐能力。本文在FPGA平台上实现了关系网络推理运算单元,在Omniglot数据集上构建的加速器功耗为15.867W,相对于GPU加速比为1.4~17.2;在miniImageNet数据集上构建的加速器功耗为12.359W,相对于GPU加速比为1.5~3.4。本文方法与同类FPGA加速浮点卷积神经网络相比,达到了最优的计算效能。实验数据表明,该方法有效利用了软硬件协同计算以及FPGA可重构计算的优势,降低了软硬件协同开发的耦合度,在保持关系网络推理计算准确率的同时,提升了关系网络推理的计算效能。
-
关键词
关系网络
软硬件协同加速
卷积神经网络
异构多核
-
Keywords
relation network
software and hardware co-acceleration
convolutional neural network
heterogeneous multi-core
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名复杂三维体高效布尔运算技术的研究与实现
- 2
-
-
作者
张永亮
王家润
吴乾坤
-
机构
华北计算技术研究所基础三部
-
出处
《计算机应用与软件》
北大核心
2025年第1期249-257,327,共10页
-
基金
基础加强重点专项计划项目(2020JCJQZD01412)。
-
文摘
高效、稳健的复杂三维体布尔运算是地理信息中的重点与难点。针对难点提出软硬件协同加速计算框架。在软件层面采用多种算法加速优化技术,包括:降维碰撞检测、三维多边形保留与丢弃的原则、新生成三维多边形的构建方法、三维线段与三维多边形的高效求交、三维点或三维多边形与三维体包含关系的高效判断;基于以上加速优化技术提出一套高效的计算框架;在硬件层面基于GPU的众核算力加速计算,提出软硬件协同加速计算框架。实验证明,该计算框架高效性且稳健性,与现有的方法相比,软件层面计算框架效率提高3倍左右,软硬件协同加速框架将效率进一步提高3倍左右。
-
关键词
加速优化技术
降维碰撞检测
高效
众核算力
软硬件协同加速
-
Keywords
Accelerated optimization technology
Reduced dimension collision detection
High efficiency
Public accounting power
Hardware and software co-acceleration
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-