期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向稀疏卷积神经网络的CGRA加速器研究
被引量:
1
1
作者
谭龙
严明玉
+3 位作者
吴欣欣
李文明
吴海彬
范东睿
《高技术通讯》
CAS
北大核心
2024年第2期173-186,共14页
本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。Dy...
本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。DyCNN使用基于数据感知的指令动态过滤机制来滤除各计算单元中由于稀疏CNN中权值静态稀疏性和激活值动态稀疏性产生的大量无效计算和访存指令,使它们能像执行稠密网络一样高效复用一组指令。此外DyCNN利用基于负载感知的动静结合负载调度策略解决了稀疏导致的负载不均衡问题。实验结果表明,DyCNN运行稀疏CNN与运行密集CNN相比实现了平均1.69倍性能提升和3.04倍能效提升,比先进的GPU(cuSPARSE)和Cambricon-X上的解决方案分别实现了2.78倍、1.48倍性能提升和35.62倍、1.17倍能效提升。
展开更多
关键词
稀疏卷积神经网络
(CNN)
专用加速结构
粗粒度可重构架构(CGRA)
动态指令过滤
动态负载调度
在线阅读
下载PDF
职称材料
基于粗粒度数据流架构的稀疏卷积神经网络加速
被引量:
10
2
作者
吴欣欣
欧焱
+3 位作者
李文明
王达
张浩
范东睿
《计算机研究与发展》
EI
CSCD
北大核心
2021年第7期1504-1517,共14页
卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域...
卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).
展开更多
关键词
领域专用加速器
粗粒度数据流
稀疏卷积神经网络
指令映射
指令控制
在线阅读
下载PDF
职称材料
基于稀疏卷积神经网络的车载激光雷达点云语义分割方法
被引量:
12
3
作者
夏祥腾
王大方
+2 位作者
曹江
赵刚
张京明
《汽车工程》
EI
CSCD
北大核心
2022年第1期26-35,共10页
对车载激光雷达扫描得到的点云进行语义分割是保证行车安全、加强驾驶员对周边环境理解的重要手段之一。因为内存限制和大规模点云场景更加稀疏的特点,将传统神经网络的方法直接沿用到车载激光雷达扫描得到的点云场景中的效果不佳。本...
对车载激光雷达扫描得到的点云进行语义分割是保证行车安全、加强驾驶员对周边环境理解的重要手段之一。因为内存限制和大规模点云场景更加稀疏的特点,将传统神经网络的方法直接沿用到车载激光雷达扫描得到的点云场景中的效果不佳。本文中针对大规模点云的稀疏性,利用稀疏卷积神经网络对体素化点云进行特征提取。考虑到逐点处理分支抑制点云数据的密度不一致性导致的信息损失,另外设计了3D-CA和3D-SA模块,使稀疏卷积神经网络更好地提取特征。实验结果表明,与传统卷积神经网络的方法和将点云投影到平面的方法相比,使用稀疏卷积神经网络对大规模点云进行语义分割,可将平均交并比提升4.1%和3.4%,证明了该方法的有效性。
展开更多
关键词
无人驾驶
点云
语义分割
稀疏卷积神经网络
在线阅读
下载PDF
职称材料
自学习稀疏密集连接卷积神经网络图像分类方法
被引量:
3
4
作者
吴鹏
林国强
+1 位作者
郭玉荣
赵振兵
《信号处理》
CSCD
北大核心
2019年第10期1747-1752,共6页
通道剪枝是深度模型压缩的主要方法之一。针对密集连接卷积神经网络中,每一层都接收其前部所有卷积层的输出特征图作为输入,但并非每个后部层都需要所有先前层的特征,网络中存在很大冗余的缺点。本文提出一种自学习剪枝密集连接网络中...
通道剪枝是深度模型压缩的主要方法之一。针对密集连接卷积神经网络中,每一层都接收其前部所有卷积层的输出特征图作为输入,但并非每个后部层都需要所有先前层的特征,网络中存在很大冗余的缺点。本文提出一种自学习剪枝密集连接网络中冗余通道的方法,得到稀疏密集连接卷积神经网络。首先,提出了一种衡量每个卷积层中每个输入特征图对输出特征图贡献度大小的方法,贡献度小的输入特征图即为冗余特征图;其次,介绍了通过自学习,网络分阶段剪枝冗余通道的训练过程,得到了稀疏密集连接卷积神经网络,该网络剪枝了密集连接网络中的冗余通道,减少了网络参数,降低了存储和计算量;最后,为了验证本文方法的有效性,在图像分类数据集CIFAR-10/100上进行了实验,在不牺牲准确率的前提下减小了模型冗余。
展开更多
关键词
剪枝冗余通道
自学习
稀疏
化密集连接
卷积
神经网络
图像分类
在线阅读
下载PDF
职称材料
稀疏卷积计算高效数据加载与输出缓存策略
5
作者
刘彪
陈长林
+3 位作者
张宇飞
刘思彤
唐励勤
于红旗
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2023年第5期212-221,共10页
针对现有神经网络加速器在处理稀疏神经网络时存在的数据加载效率低、乘加资源利用率低、输出缓存寻址逻辑复杂等问题,提出了稀疏卷积计算高效数据加载与输出缓存策略。将属于同一输入通道的非零输入特征图像数据和非零权重进行全对全...
针对现有神经网络加速器在处理稀疏神经网络时存在的数据加载效率低、乘加资源利用率低、输出缓存寻址逻辑复杂等问题,提出了稀疏卷积计算高效数据加载与输出缓存策略。将属于同一输入通道的非零输入特征图像数据和非零权重进行全对全乘累加运算,降低了非零数据配对难度,提高了乘加资源利用率;通过采用输入驻留计算,以及密集型循环加载特征图像数据,大幅减少了数据片外调取次数;优化了输出缓存设计,解决了现有方案中存在的输出缓存地址访问争用、存储拥塞等问题。实验表明,与采用类似架构的细粒度脉动加速器相比,在处理单元面积上减少了21.45%;在数据加载速度方面平均提高了117.71%在平均乘法器利用率方面提高了11.25%,达到89%。
展开更多
关键词
神经网络
加速器
稀疏卷积神经网络
输入驻留
全对全计算
在线阅读
下载PDF
职称材料
基于邻域一致性的极化SAR图像仿射配准
被引量:
7
6
作者
朱庆涛
殷君君
+1 位作者
曾亮
杨健
《雷达学报(中英文)》
CSCD
北大核心
2021年第1期49-60,共12页
极化SAR图像的配准是极化SAR图像处理的基础,需要具备较高的精度与速度。基于深度学习的极化SAR图像配准大多数是结合图像块特征的匹配与基于随机抽样一致性的参数迭代估计来实现的。目前尚未实现端到端的基于深度卷积神经网络的一步仿...
极化SAR图像的配准是极化SAR图像处理的基础,需要具备较高的精度与速度。基于深度学习的极化SAR图像配准大多数是结合图像块特征的匹配与基于随机抽样一致性的参数迭代估计来实现的。目前尚未实现端到端的基于深度卷积神经网络的一步仿射配准。该文提出了一种基于弱监督学习的端到端极化SAR图像配准框架,无需图像切块处理或迭代参数估计。首先,对输入图像对进行特征提取,得到密集的特征图。在此基础上,针对每个特征点保留k对相关度最高的特征点对。之后,将该4D稀疏特征匹配图输入4D稀疏卷积网络,基于邻域一致性进行特征匹配的过滤。最后,结合输出的匹配点对置信度,利用带权最小二乘法进行仿射参数回归,实现图像对的配准。该文采用RADARSAT-2卫星获取的德国Wallerfing地区农田数据以及PAZ卫星获取的中国舟山港口地区数据作为测试图像对。通过对升降轨、不同成像模式、不同极化方式、不同分辨率的极化SAR图像对的配准测试,并与4种现有方法进行对比,验证了该方法具有较高的配准精度与较快的速度。
展开更多
关键词
邻域一致性
仿射变换
极化SAR
图像配准
稀疏卷积神经网络
在线阅读
下载PDF
职称材料
题名
面向稀疏卷积神经网络的CGRA加速器研究
被引量:
1
1
作者
谭龙
严明玉
吴欣欣
李文明
吴海彬
范东睿
机构
中国科学院计算技术研究所处理器国家重点实验室
中国科学院大学
出处
《高技术通讯》
CAS
北大核心
2024年第2期173-186,共14页
基金
国家自然科学基金(62202451)
中国科学院青年基础研究(YSBR-029)
中国科学院青年创新促进会项目资助。
文摘
本文针对规模日益增长和演变迅速的稀疏卷积神经网络(CNN)应用,提出一款高能效且灵活的加速结构DyCNN来提升其性能和能效。DyCNN基于兼具灵活性和高能效的粗粒度可重构架构(CGRA)设计,可以利用其指令的高并行性来高效支持CNN的操作。DyCNN使用基于数据感知的指令动态过滤机制来滤除各计算单元中由于稀疏CNN中权值静态稀疏性和激活值动态稀疏性产生的大量无效计算和访存指令,使它们能像执行稠密网络一样高效复用一组指令。此外DyCNN利用基于负载感知的动静结合负载调度策略解决了稀疏导致的负载不均衡问题。实验结果表明,DyCNN运行稀疏CNN与运行密集CNN相比实现了平均1.69倍性能提升和3.04倍能效提升,比先进的GPU(cuSPARSE)和Cambricon-X上的解决方案分别实现了2.78倍、1.48倍性能提升和35.62倍、1.17倍能效提升。
关键词
稀疏卷积神经网络
(CNN)
专用加速结构
粗粒度可重构架构(CGRA)
动态指令过滤
动态负载调度
Keywords
sparse convolutional neural network(CNN)
dedicated accelerator
coarse-grained reconfigu-rable architecture(CGRA)
dynamic instruction filtering
dynamic workload balance
分类号
TP332 [自动化与计算机技术—计算机系统结构]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于粗粒度数据流架构的稀疏卷积神经网络加速
被引量:
10
2
作者
吴欣欣
欧焱
李文明
王达
张浩
范东睿
机构
计算机体系结构国家重点实验室(中国科学院计算技术研究所)
中国科学院计算技术研究所
中国科学院大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第7期1504-1517,共14页
基金
国家自然科学基金项目(61732018,61872335,61802367,61672499)
中国科学院战略性先导科技专项(C类)(XDC05000000)
+1 种基金
中国科学院国际伙伴计划(171111KYSB20170032)
计算机体系结构国家重点实验室创新项目(CARCH4408,CARCH4412)。
文摘
卷积神经网络(convolutional neural network,CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).
关键词
领域专用加速器
粗粒度数据流
稀疏卷积神经网络
指令映射
指令控制
Keywords
domain-specific accelerator
coarse-grained dataflow
sparse convolutional neural network
instruction mapping
instruction control
分类号
TP387 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于稀疏卷积神经网络的车载激光雷达点云语义分割方法
被引量:
12
3
作者
夏祥腾
王大方
曹江
赵刚
张京明
机构
哈尔滨工业大学(威海)汽车工程学院
出处
《汽车工程》
EI
CSCD
北大核心
2022年第1期26-35,共10页
基金
哈尔滨工业大学重大科研项目培育计划(ZDXMPY20180109)资助。
文摘
对车载激光雷达扫描得到的点云进行语义分割是保证行车安全、加强驾驶员对周边环境理解的重要手段之一。因为内存限制和大规模点云场景更加稀疏的特点,将传统神经网络的方法直接沿用到车载激光雷达扫描得到的点云场景中的效果不佳。本文中针对大规模点云的稀疏性,利用稀疏卷积神经网络对体素化点云进行特征提取。考虑到逐点处理分支抑制点云数据的密度不一致性导致的信息损失,另外设计了3D-CA和3D-SA模块,使稀疏卷积神经网络更好地提取特征。实验结果表明,与传统卷积神经网络的方法和将点云投影到平面的方法相比,使用稀疏卷积神经网络对大规模点云进行语义分割,可将平均交并比提升4.1%和3.4%,证明了该方法的有效性。
关键词
无人驾驶
点云
语义分割
稀疏卷积神经网络
Keywords
autonomous driving
point cloud
semantic segmentation
sparse convolution neural network
分类号
U463.67 [机械工程—车辆工程]
TN958.98 [电子电信—信号与信息处理]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
自学习稀疏密集连接卷积神经网络图像分类方法
被引量:
3
4
作者
吴鹏
林国强
郭玉荣
赵振兵
机构
全球能源互联网研究院有限公司
电力系统人工智能(联研院)国家电网公司联合实验室
华北电力大学电子与通信工程系
出处
《信号处理》
CSCD
北大核心
2019年第10期1747-1752,共6页
基金
国家电网有限公司总部科技项目(基于人工智能的视频图像处理及在巡检中的应用研究,5455HJ170002)
国家自然科学基金项目(61871182,61401154,61773160,61302163)
+3 种基金
北京市自然科学基金项目(4192055)
河北省自然科学基金项目(F2016502101,F2017502016,F2015502062)
中央高校基本科研业务费专项资金项目(2018MS095,2018MS094)
模式识别国家重点实验室开放课题基金(201900051)等资助
文摘
通道剪枝是深度模型压缩的主要方法之一。针对密集连接卷积神经网络中,每一层都接收其前部所有卷积层的输出特征图作为输入,但并非每个后部层都需要所有先前层的特征,网络中存在很大冗余的缺点。本文提出一种自学习剪枝密集连接网络中冗余通道的方法,得到稀疏密集连接卷积神经网络。首先,提出了一种衡量每个卷积层中每个输入特征图对输出特征图贡献度大小的方法,贡献度小的输入特征图即为冗余特征图;其次,介绍了通过自学习,网络分阶段剪枝冗余通道的训练过程,得到了稀疏密集连接卷积神经网络,该网络剪枝了密集连接网络中的冗余通道,减少了网络参数,降低了存储和计算量;最后,为了验证本文方法的有效性,在图像分类数据集CIFAR-10/100上进行了实验,在不牺牲准确率的前提下减小了模型冗余。
关键词
剪枝冗余通道
自学习
稀疏
化密集连接
卷积
神经网络
图像分类
Keywords
pruning redundant channel
self-learning
sparse densely concatenated convolutional neural network
image classification
分类号
TN911.73 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
稀疏卷积计算高效数据加载与输出缓存策略
5
作者
刘彪
陈长林
张宇飞
刘思彤
唐励勤
于红旗
机构
国防科技大学电子科学学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2023年第5期212-221,共10页
基金
国家自然科学基金资助项目(61804181,62074166)
国家重点研发计划资助项目(2019YFB2205102)。
文摘
针对现有神经网络加速器在处理稀疏神经网络时存在的数据加载效率低、乘加资源利用率低、输出缓存寻址逻辑复杂等问题,提出了稀疏卷积计算高效数据加载与输出缓存策略。将属于同一输入通道的非零输入特征图像数据和非零权重进行全对全乘累加运算,降低了非零数据配对难度,提高了乘加资源利用率;通过采用输入驻留计算,以及密集型循环加载特征图像数据,大幅减少了数据片外调取次数;优化了输出缓存设计,解决了现有方案中存在的输出缓存地址访问争用、存储拥塞等问题。实验表明,与采用类似架构的细粒度脉动加速器相比,在处理单元面积上减少了21.45%;在数据加载速度方面平均提高了117.71%在平均乘法器利用率方面提高了11.25%,达到89%。
关键词
神经网络
加速器
稀疏卷积神经网络
输入驻留
全对全计算
Keywords
neural network accelerator
sparse convolution neural network
input stationary
all-to-all calculation
分类号
TN492 [电子电信—微电子学与固体电子学]
在线阅读
下载PDF
职称材料
题名
基于邻域一致性的极化SAR图像仿射配准
被引量:
7
6
作者
朱庆涛
殷君君
曾亮
杨健
机构
清华大学电子工程系
北京科技大学计算机与通信工程学院
出处
《雷达学报(中英文)》
CSCD
北大核心
2021年第1期49-60,共12页
基金
国家自然科学基金(61771043)
中央高校基本科研业务费专项资金(FRF-IDRY-19-008,FRF-GF-19-017B)。
文摘
极化SAR图像的配准是极化SAR图像处理的基础,需要具备较高的精度与速度。基于深度学习的极化SAR图像配准大多数是结合图像块特征的匹配与基于随机抽样一致性的参数迭代估计来实现的。目前尚未实现端到端的基于深度卷积神经网络的一步仿射配准。该文提出了一种基于弱监督学习的端到端极化SAR图像配准框架,无需图像切块处理或迭代参数估计。首先,对输入图像对进行特征提取,得到密集的特征图。在此基础上,针对每个特征点保留k对相关度最高的特征点对。之后,将该4D稀疏特征匹配图输入4D稀疏卷积网络,基于邻域一致性进行特征匹配的过滤。最后,结合输出的匹配点对置信度,利用带权最小二乘法进行仿射参数回归,实现图像对的配准。该文采用RADARSAT-2卫星获取的德国Wallerfing地区农田数据以及PAZ卫星获取的中国舟山港口地区数据作为测试图像对。通过对升降轨、不同成像模式、不同极化方式、不同分辨率的极化SAR图像对的配准测试,并与4种现有方法进行对比,验证了该方法具有较高的配准精度与较快的速度。
关键词
邻域一致性
仿射变换
极化SAR
图像配准
稀疏卷积神经网络
Keywords
Neighborhood consensus
Affine transformation
Polarimetric SAR
Image registration
Sparse convolutional neural network
分类号
TP75 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向稀疏卷积神经网络的CGRA加速器研究
谭龙
严明玉
吴欣欣
李文明
吴海彬
范东睿
《高技术通讯》
CAS
北大核心
2024
1
在线阅读
下载PDF
职称材料
2
基于粗粒度数据流架构的稀疏卷积神经网络加速
吴欣欣
欧焱
李文明
王达
张浩
范东睿
《计算机研究与发展》
EI
CSCD
北大核心
2021
10
在线阅读
下载PDF
职称材料
3
基于稀疏卷积神经网络的车载激光雷达点云语义分割方法
夏祥腾
王大方
曹江
赵刚
张京明
《汽车工程》
EI
CSCD
北大核心
2022
12
在线阅读
下载PDF
职称材料
4
自学习稀疏密集连接卷积神经网络图像分类方法
吴鹏
林国强
郭玉荣
赵振兵
《信号处理》
CSCD
北大核心
2019
3
在线阅读
下载PDF
职称材料
5
稀疏卷积计算高效数据加载与输出缓存策略
刘彪
陈长林
张宇飞
刘思彤
唐励勤
于红旗
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2023
0
在线阅读
下载PDF
职称材料
6
基于邻域一致性的极化SAR图像仿射配准
朱庆涛
殷君君
曾亮
杨健
《雷达学报(中英文)》
CSCD
北大核心
2021
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部