检索结果-维普期刊中文期刊服务平台

面向稀疏卷积神经网络的CGRA加速器研究被引量：1: 1; 作者谭龙严明玉 +3 位作者吴欣欣李文明吴海彬范东睿《高技术通讯》 CAS 北大核心 2024年第2期173-186,共14页; 本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。Dy... 展开更多; 关键词稀疏卷积神经网络(CNN) 专用加速结构粗粒度可重构架构(CGRA) 动态指令过滤动态负载调度; 在线阅读下载PDF 职称材料

基于粗粒度数据流架构的稀疏卷积神经网络加速被引量：10: 2; 作者吴欣欣欧焱 +3 位作者李文明王达张浩范东睿《计算机研究与发展》 EI CSCD 北大核心 2021年第7期1504-1517,共14页; 卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域... 展开更多; 关键词领域专用加速器粗粒度数据流稀疏卷积神经网络指令映射指令控制; 在线阅读下载PDF 职称材料

基于稀疏卷积神经网络的车载激光雷达点云语义分割方法被引量：14: 3; 作者夏祥腾王大方 +2 位作者曹江赵刚张京明《汽车工程》 EI CSCD 北大核心 2022年第1期26-35,共10页; 对车载激光雷达扫描得到的点云进行语义分割是保证行车安全、加强驾驶员对周边环境理解的重要手段之一。因为内存限制和大规模点云场景更加稀疏的特点,将传统神经网络的方法直接沿用到车载激光雷达扫描得到的点云场景中的效果不佳。本... 展开更多; 关键词无人驾驶点云语义分割稀疏卷积神经网络; 在线阅读下载PDF 职称材料

自学习稀疏密集连接卷积神经网络图像分类方法被引量：3: 4; 作者吴鹏林国强 +1 位作者郭玉荣赵振兵《信号处理》 CSCD 北大核心 2019年第10期1747-1752,共6页; 通道剪枝是深度模型压缩的主要方法之一。针对密集连接卷积神经网络中,每一层都接收其前部所有卷积层的输出特征图作为输入,但并非每个后部层都需要所有先前层的特征,网络中存在很大冗余的缺点。本文提出一种自学习剪枝密集连接网络中... 展开更多; 关键词剪枝冗余通道自学习稀疏化密集连接卷积神经网络图像分类; 在线阅读下载PDF 职称材料

稀疏卷积计算高效数据加载与输出缓存策略被引量：1: 5; 作者刘彪陈长林 +3 位作者张宇飞刘思彤唐励勤于红旗《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第5期212-221,共10页; 针对现有神经网络加速器在处理稀疏神经网络时存在的数据加载效率低、乘加资源利用率低、输出缓存寻址逻辑复杂等问题,提出了稀疏卷积计算高效数据加载与输出缓存策略。将属于同一输入通道的非零输入特征图像数据和非零权重进行全对全... 展开更多; 关键词神经网络加速器稀疏卷积神经网络输入驻留全对全计算; 在线阅读下载PDF 职称材料

基于邻域一致性的极化SAR图像仿射配准被引量：7: 6; 作者朱庆涛殷君君 +1 位作者曾亮杨健《雷达学报（中英文）》 CSCD 北大核心 2021年第1期49-60,共12页; 极化SAR图像的配准是极化SAR图像处理的基础,需要具备较高的精度与速度。基于深度学习的极化SAR图像配准大多数是结合图像块特征的匹配与基于随机抽样一致性的参数迭代估计来实现的。目前尚未实现端到端的基于深度卷积神经网络的一步仿... 展开更多; 关键词邻域一致性仿射变换极化SAR 图像配准稀疏卷积神经网络; 在线阅读下载PDF 职称材料

题名面向稀疏卷积神经网络的CGRA加速器研究被引量：1: 1; 作者谭龙严明玉吴欣欣李文明吴海彬范东睿; 机构中国科学院计算技术研究所处理器国家重点实验室中国科学院大学; 出处《高技术通讯》 CAS 北大核心 2024年第2期173-186,共14页; 基金国家自然科学基金(62202451) 中国科学院青年基础研究(YSBR-029) 中国科学院青年创新促进会项目资助。; 文摘本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。DyCNN使用基于数据感知的指令动态过滤机制来滤除各计算单元中由于稀疏CNN中权值静态稀疏性和激活值动态稀疏性产生的大量无效计算和访存指令,使它们能像执行稠密网络一样高效复用一组指令。此外DyCNN利用基于负载感知的动静结合负载调度策略解决了稀疏导致的负载不均衡问题。实验结果表明,DyCNN运行稀疏CNN与运行密集CNN相比实现了平均1.69倍性能提升和3.04倍能效提升,比先进的GPU(cuSPARSE)和Cambricon-X上的解决方案分别实现了2.78倍、1.48倍性能提升和35.62倍、1.17倍能效提升。; 关键词稀疏卷积神经网络(CNN) 专用加速结构粗粒度可重构架构(CGRA) 动态指令过滤动态负载调度; Keywords sparse convolutional neural network(CNN) dedicated accelerator coarse-grained reconfigu-rable architecture(CGRA) dynamic instruction filtering dynamic workload balance; 分类号 TP332 [自动化与计算机技术—计算机系统结构] TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于粗粒度数据流架构的稀疏卷积神经网络加速被引量：10: 2; 作者吴欣欣欧焱李文明王达张浩范东睿; 机构计算机体系结构国家重点实验室(中国科学院计算技术研究所) 中国科学院计算技术研究所中国科学院大学计算机科学与技术学院; 出处《计算机研究与发展》 EI CSCD 北大核心 2021年第7期1504-1517,共14页; 基金国家自然科学基金项目(61732018,61872335,61802367,61672499) 中国科学院战略性先导科技专项(C类)(XDC05000000) +1 种基金计算机体系结构国家重点实验室创新项目(CARCH4408,CARCH4412)。; 文摘卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).; 关键词领域专用加速器粗粒度数据流稀疏卷积神经网络指令映射指令控制; Keywords domain-specific accelerator coarse-grained dataflow sparse convolutional neural network instruction mapping instruction control; 分类号 TP387 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于稀疏卷积神经网络的车载激光雷达点云语义分割方法被引量：14: 3; 作者夏祥腾王大方曹江赵刚张京明; 机构哈尔滨工业大学(威海)汽车工程学院; 出处《汽车工程》 EI CSCD 北大核心 2022年第1期26-35,共10页; 基金哈尔滨工业大学重大科研项目培育计划(ZDXMPY20180109)资助。; 文摘对车载激光雷达扫描得到的点云进行语义分割是保证行车安全、加强驾驶员对周边环境理解的重要手段之一。因为内存限制和大规模点云场景更加稀疏的特点,将传统神经网络的方法直接沿用到车载激光雷达扫描得到的点云场景中的效果不佳。本文中针对大规模点云的稀疏性,利用稀疏卷积神经网络对体素化点云进行特征提取。考虑到逐点处理分支抑制点云数据的密度不一致性导致的信息损失,另外设计了3D-CA和3D-SA模块,使稀疏卷积神经网络更好地提取特征。实验结果表明,与传统卷积神经网络的方法和将点云投影到平面的方法相比,使用稀疏卷积神经网络对大规模点云进行语义分割,可将平均交并比提升4.1%和3.4%,证明了该方法的有效性。; 关键词无人驾驶点云语义分割稀疏卷积神经网络; Keywords autonomous driving point cloud semantic segmentation sparse convolution neural network; 分类号 U463.67 [机械工程—车辆工程] TN958.98 [电子电信—信号与信息处理] TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名自学习稀疏密集连接卷积神经网络图像分类方法被引量：3: 4; 作者吴鹏林国强郭玉荣赵振兵; 机构全球能源互联网研究院有限公司电力系统人工智能(联研院)国家电网公司联合实验室华北电力大学电子与通信工程系; 出处《信号处理》 CSCD 北大核心 2019年第10期1747-1752,共6页; 基金国家电网有限公司总部科技项目(基于人工智能的视频图像处理及在巡检中的应用研究,5455HJ170002) 国家自然科学基金项目(61871182,61401154,61773160,61302163) +3 种基金模式识别国家重点实验室开放课题基金(201900051)等资助; 文摘通道剪枝是深度模型压缩的主要方法之一。针对密集连接卷积神经网络中,每一层都接收其前部所有卷积层的输出特征图作为输入,但并非每个后部层都需要所有先前层的特征,网络中存在很大冗余的缺点。本文提出一种自学习剪枝密集连接网络中冗余通道的方法,得到稀疏密集连接卷积神经网络。首先,提出了一种衡量每个卷积层中每个输入特征图对输出特征图贡献度大小的方法,贡献度小的输入特征图即为冗余特征图;其次,介绍了通过自学习,网络分阶段剪枝冗余通道的训练过程,得到了稀疏密集连接卷积神经网络,该网络剪枝了密集连接网络中的冗余通道,减少了网络参数,降低了存储和计算量;最后,为了验证本文方法的有效性,在图像分类数据集CIFAR-10/100上进行了实验,在不牺牲准确率的前提下减小了模型冗余。; 关键词剪枝冗余通道自学习稀疏化密集连接卷积神经网络图像分类; Keywords pruning redundant channel self-learning sparse densely concatenated convolutional neural network image classification; 分类号 TN911.73 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名稀疏卷积计算高效数据加载与输出缓存策略被引量：1: 5; 作者刘彪陈长林张宇飞刘思彤唐励勤于红旗; 机构国防科技大学电子科学学院; 出处《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第5期212-221,共10页; 基金国家自然科学基金资助项目(61804181,62074166) 国家重点研发计划资助项目(2019YFB2205102)。; 文摘针对现有神经网络加速器在处理稀疏神经网络时存在的数据加载效率低、乘加资源利用率低、输出缓存寻址逻辑复杂等问题,提出了稀疏卷积计算高效数据加载与输出缓存策略。将属于同一输入通道的非零输入特征图像数据和非零权重进行全对全乘累加运算,降低了非零数据配对难度,提高了乘加资源利用率;通过采用输入驻留计算,以及密集型循环加载特征图像数据,大幅减少了数据片外调取次数;优化了输出缓存设计,解决了现有方案中存在的输出缓存地址访问争用、存储拥塞等问题。实验表明,与采用类似架构的细粒度脉动加速器相比,在处理单元面积上减少了21.45%;在数据加载速度方面平均提高了117.71%在平均乘法器利用率方面提高了11.25%,达到89%。; 关键词神经网络加速器稀疏卷积神经网络输入驻留全对全计算; Keywords neural network accelerator sparse convolution neural network input stationary all-to-all calculation; 分类号 TN492 [电子电信—微电子学与固体电子学]; 在线阅读下载PDF 职称材料

题名基于邻域一致性的极化SAR图像仿射配准被引量：7: 6; 作者朱庆涛殷君君曾亮杨健; 机构清华大学电子工程系北京科技大学计算机与通信工程学院; 出处《雷达学报（中英文）》 CSCD 北大核心 2021年第1期49-60,共12页; 基金国家自然科学基金(61771043) 中央高校基本科研业务费专项资金(FRF-IDRY-19-008,FRF-GF-19-017B)。; 文摘极化SAR图像的配准是极化SAR图像处理的基础,需要具备较高的精度与速度。基于深度学习的极化SAR图像配准大多数是结合图像块特征的匹配与基于随机抽样一致性的参数迭代估计来实现的。目前尚未实现端到端的基于深度卷积神经网络的一步仿射配准。该文提出了一种基于弱监督学习的端到端极化SAR图像配准框架,无需图像切块处理或迭代参数估计。首先,对输入图像对进行特征提取,得到密集的特征图。在此基础上,针对每个特征点保留k对相关度最高的特征点对。之后,将该4D稀疏特征匹配图输入4D稀疏卷积网络,基于邻域一致性进行特征匹配的过滤。最后,结合输出的匹配点对置信度,利用带权最小二乘法进行仿射参数回归,实现图像对的配准。该文采用RADARSAT-2卫星获取的德国Wallerfing地区农田数据以及PAZ卫星获取的中国舟山港口地区数据作为测试图像对。通过对升降轨、不同成像模式、不同极化方式、不同分辨率的极化SAR图像对的配准测试,并与4种现有方法进行对比,验证了该方法具有较高的配准精度与较快的速度。; 关键词邻域一致性仿射变换极化SAR 图像配准稀疏卷积神经网络; Keywords Neighborhood consensus Affine transformation Polarimetric SAR Image registration Sparse convolutional neural network; 分类号 TP75 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	面向稀疏卷积神经网络的CGRA加速器研究	谭龙严明玉吴欣欣李文明吴海彬范东睿	《高技术通讯》 CAS 北大核心	2024	1	在线阅读下载PDF 职称材料
2	基于粗粒度数据流架构的稀疏卷积神经网络加速	吴欣欣欧焱李文明王达张浩范东睿	《计算机研究与发展》 EI CSCD 北大核心	2021	10	在线阅读下载PDF 职称材料
3	基于稀疏卷积神经网络的车载激光雷达点云语义分割方法	夏祥腾王大方曹江赵刚张京明	《汽车工程》 EI CSCD 北大核心	2022	14	在线阅读下载PDF 职称材料
4	自学习稀疏密集连接卷积神经网络图像分类方法	吴鹏林国强郭玉荣赵振兵	《信号处理》 CSCD 北大核心	2019	3	在线阅读下载PDF 职称材料
5	稀疏卷积计算高效数据加载与输出缓存策略	刘彪陈长林张宇飞刘思彤唐励勤于红旗	《国防科技大学学报》 EI CAS CSCD 北大核心	2023	1	在线阅读下载PDF 职称材料
6	基于邻域一致性的极化SAR图像仿射配准	朱庆涛殷君君曾亮杨健	《雷达学报（中英文）》 CSCD 北大核心	2021	7	在线阅读下载PDF 职称材料