检索结果-维普期刊中文期刊服务平台

基于粗粒度可重构架构的并行FFT算法实现被引量：3: 1; 作者曹鹏杨锦江梅晨《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第6期1174-1179,共6页; 为了提升并行 FFT 算法的计算性能，基于粗粒度可重构架构 REMUS＿LPP（reconfigurable embedded multimedia system，low performance processor）提出了一种新的复数 FFT 实现方法．在实现 FFT 算法过程中，首先通过局部串行方式完成... 展开更多; 关键词粗粒度可重构架构并行FFT算法 REMUS_LPP; 在线阅读下载PDF 职称材料

面向媒体的粗粒度可重构架构层次化存储设计: 2; 作者曹鹏梅晨刘波《上海交通大学学报》 EI CAS CSCD 北大核心 2014年第10期1389-1393,1399,共6页; 为了优化粗粒度可重构架构REMUS-II(Reconfigurable Multimedia System 2)的数据流通路,使其能够完成高性能媒体解码,针对媒体算法的数据访问特征,对REMUS-II的片上存储与片外存储访问模块进行优化.片上存储通过二维数据传输和转置等访... 展开更多; 关键词粗粒度可重构架构媒体应用层次化存储高清解码; 在线阅读下载PDF 职称材料

面向分组密码算法的高面积效率可重构架构被引量：1: 3; 作者杨锦江曹鹏杨军《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第5期939-944,共6页; 为了提升安全应用中分组密码算法的面积效率,提出了一种基于粗粒度可重构计算的硬件架构.在可重构架构设计过程中采用了2种优化方案,即利用Benes网络优化可重构计算阵列的层间互联和基于配置信息的使用频度优化配置信息的组织方式.实验... 展开更多; 关键词分组密码算法粗粒度可重构架构层次化配置面积效率; 在线阅读下载PDF 职称材料

面向稀疏卷积神经网络的CGRA加速器研究被引量：1: 4; 作者谭龙严明玉 +3 位作者吴欣欣李文明吴海彬范东睿《高技术通讯》 CAS 北大核心 2024年第2期173-186,共14页; 本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。Dy... 展开更多; 关键词稀疏卷积神经网络(CNN) 专用加速结构粗粒度可重构架构(CGRA) 动态指令过滤动态负载调度; 在线阅读下载PDF 职称材料

题名基于粗粒度可重构架构的并行FFT算法实现被引量：3: 1; 作者曹鹏杨锦江梅晨; 机构东南大学国家专用集成电路系统工程技术研究中心; 出处《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第6期1174-1179,共6页; 基金国家自然科学基金资助项目(61204023 61203251 +1 种基金 61272183) 国家高技术研究发展计划(863计划)资助项目(2012AA012703); 文摘为了提升并行 FFT 算法的计算性能，基于粗粒度可重构架构 REMUS＿LPP（reconfigurable embedded multimedia system，low performance processor）提出了一种新的复数 FFT 实现方法．在实现 FFT 算法过程中，首先通过局部串行方式完成低阶部分，然后交换低阶部分结果后并行执行高阶部分．针对 RCA 内和 RCA 间的数据流优化，提出了流水气泡消除技术和数据块重排技术，从而提升了算法实现性能并降低了片上存储需求．芯片实测结果表明，提出的 FFT 算法实现方法的执行速度是其他同类并行计算架构的2．15～13．60倍，片上存储减少为其他方法的7．0％～28．1％．; 关键词粗粒度可重构架构并行FFT算法 REMUS_LPP; Keywords coarse-grained reconfigurable architecture （CGRA） parallel fast Fourier transform（FFF） algorithm REMUS_LPP （ reconfigurable embedded multimedia system, lowperformance processor）; 分类号 TN302 [电子电信—物理电子学]; 在线阅读下载PDF 职称材料

题名面向媒体的粗粒度可重构架构层次化存储设计: 2; 作者曹鹏梅晨刘波; 机构东南大学国家专用集成电路系统工程技术研究中心; 出处《上海交通大学学报》 EI CAS CSCD 北大核心 2014年第10期1389-1393,1399,共6页; 文摘为了优化粗粒度可重构架构REMUS-II(Reconfigurable Multimedia System 2)的数据流通路,使其能够完成高性能媒体解码,针对媒体算法的数据访问特征,对REMUS-II的片上存储与片外存储访问模块进行优化.片上存储通过二维数据传输和转置等访问模式进行优化,片上数据传输效率分别平均提高了69.6%和15.1%.片外存储通过块缓存设计优化参考帧访问,平均减少37%的外存访问时间.经过层次化存储设计,REMUS-II数据流可满足计算需求,在200MHz主频下实现H.264算法和MPEG2算法高级档次的1 920像素×1 080像素高清分辨率实时解码.; 关键词粗粒度可重构架构媒体应用层次化存储高清解码; Keywords coarse grain reconfigurable architecture （CGRA） multimedia application hierarchical memory high-definition decoding; 分类号 TN302 [电子电信—物理电子学]; 在线阅读下载PDF 职称材料

题名面向分组密码算法的高面积效率可重构架构被引量：1: 3; 作者杨锦江曹鹏杨军; 机构东南大学国家专用集成电路系统工程技术研究中心; 出处《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第5期939-944,共6页; 基金国家自然科学基金资助项目(61404028); 文摘为了提升安全应用中分组密码算法的面积效率,提出了一种基于粗粒度可重构计算的硬件架构.在可重构架构设计过程中采用了2种优化方案,即利用Benes网络优化可重构计算阵列的层间互联和基于配置信息的使用频度优化配置信息的组织方式.实验结果表明:采用基于Benes网络的层间互联方案后,可重构阵列中层间互联的面积开销减少了51.61%;采用基于使用频度的配置信息层次化组织方式后,AES分组密码算法和DES分组密码算法的配置时间分别缩短了80%和88%,配置时间占总时间的百分数分别下降了42%和39%.这2种分组密码算法在该可重构架构上实现的面积效率为同类架构的3.95和1.51倍.因此,所提的2种优化方案能够有效降低面积开销,提高可重构架构的性能,有助于分组密码算法高面积效率的实现.; 关键词分组密码算法粗粒度可重构架构层次化配置面积效率; Keywords block cipher algorithm coarse-grained reconfigurable architecture hierarchical configuration organization area efficiency; 分类号 TN302 [电子电信—物理电子学]; 在线阅读下载PDF 职称材料

题名面向稀疏卷积神经网络的CGRA加速器研究被引量：1: 4; 作者谭龙严明玉吴欣欣李文明吴海彬范东睿; 机构中国科学院计算技术研究所处理器国家重点实验室中国科学院大学; 出处《高技术通讯》 CAS 北大核心 2024年第2期173-186,共14页; 基金国家自然科学基金(62202451) 中国科学院青年基础研究(YSBR-029) 中国科学院青年创新促进会项目资助。; 文摘本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。DyCNN使用基于数据感知的指令动态过滤机制来滤除各计算单元中由于稀疏CNN中权值静态稀疏性和激活值动态稀疏性产生的大量无效计算和访存指令,使它们能像执行稠密网络一样高效复用一组指令。此外DyCNN利用基于负载感知的动静结合负载调度策略解决了稀疏导致的负载不均衡问题。实验结果表明,DyCNN运行稀疏CNN与运行密集CNN相比实现了平均1.69倍性能提升和3.04倍能效提升,比先进的GPU(cuSPARSE)和Cambricon-X上的解决方案分别实现了2.78倍、1.48倍性能提升和35.62倍、1.17倍能效提升。; 关键词稀疏卷积神经网络(CNN) 专用加速结构粗粒度可重构架构(CGRA) 动态指令过滤动态负载调度; Keywords sparse convolutional neural network(CNN) dedicated accelerator coarse-grained reconfigu-rable architecture(CGRA) dynamic instruction filtering dynamic workload balance; 分类号 TP332 [自动化与计算机技术—计算机系统结构] TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于粗粒度可重构架构的并行FFT算法实现	曹鹏杨锦江梅晨	《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2013	3	在线阅读下载PDF 职称材料
2	面向媒体的粗粒度可重构架构层次化存储设计	曹鹏梅晨刘波	《上海交通大学学报》 EI CAS CSCD 北大核心	2014	0	在线阅读下载PDF 职称材料
3	面向分组密码算法的高面积效率可重构架构	杨锦江曹鹏杨军	《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2016	1	在线阅读下载PDF 职称材料
4	面向稀疏卷积神经网络的CGRA加速器研究	谭龙严明玉吴欣欣李文明吴海彬范东睿	《高技术通讯》 CAS 北大核心	2024	1	在线阅读下载PDF 职称材料