-
题名可重构CNN处理器的高效能自适应映射策略
- 1
-
-
作者
常立博
武丹妮
杜慧敏
张盛兵
郝鹏
蔡秀霞
-
机构
西安邮电大学电子工程学院
西北工业大学计算机学院
-
出处
《计算机辅助设计与图形学学报》
北大核心
2025年第7期1157-1169,共13页
-
基金
国家重点研发计划(2019YFB1803600)
陕西省自然科学基础研究计划(2025JC-YBMS-736)
+1 种基金
陕西省教育厅重点科学研究计划(22JY059)
中国民航适航中心开放基金(SH2021111903).
-
文摘
针对因CNN模型巨大的参数规模和数据访问量,及不同CNN模型或同一模型中不同层的计算模式存在多样性,导致其仅可支持单一或固定映射方式及片上数据缓存的计算系统整体效能较低的问题,提出软硬件协同设计策略.将基于深度强化学习的自适应访存优化机制与片上弹性缓存动态划分方法结合,根据可重构CNN处理器中存储结构相关参数,针对不同CNN运算层自动搜索最优的循环调度策略;并通过设计可重构片上互联结构、地址映射逻辑以及动态存储调度方法,使片上弹性缓存可根据不同调度策略动态划分地址映射空间.在基于Eyeriss和TPU的CNN处理器构架上,与对比的调度策略相比,采用所提方法可分别将2种可重构CNN处理器的效能提升约3倍和4倍;并且,采用相同的调度策略,与固定容量双缓存结构相比,文中的弹性存储划分方法可分别将功耗减少30.28%和18.43%.与基于FPGA平台的相关研究相比,文中可重构CNN处理器将计算效率和计算效能分别提高了约10倍和2倍.
-
关键词
卷积神经网络模型映射器
卷积神经网络模型数据流
深度强化学习
片上弹性缓存
-
Keywords
mapping of CNN
dataflow of CNN
deep reinforcement learning
elastic on-chip buffer
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-