期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
快速3D-CNN结合深度可分离卷积对高光谱图像分类 被引量:2
1
作者 王燕 梁琦 《计算机科学与探索》 CSCD 北大核心 2022年第12期2860-2869,共10页
针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成... 针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成分分析(IPCA)对输入的数据进行降维预处理;其次将输入模型的像素分割成小的重叠的三维小卷积块,在分割的小块上基于中心像素形成地面标签,利用三维核函数进行卷积处理,形成连续的三维特征图,保留空谱特征。用3D-CNN同时提取空谱特征,然后在三维卷积中加入深度可分离卷积对空间特征再次提取,丰富空谱特征的同时减少参数量,从而减少计算时间,分类精度也有所提高。所提模型在Indian Pines、Salinas Scene和University of Pavia公开数据集上验证,并且同其他经典的分类方法进行比较。实验结果表明,该方法不仅能大幅度节省可学习的参数,降低模型复杂度,而且表现出较好的分类性能,其中总体精度(OA)、平均分类精度(AA)和Kappa系数均可达99%以上。 展开更多
关键词 高光谱图像分类 空谱特征提取 三维卷积神经网络(3d-cnn) 深度可分离卷积(DSC) 深度学习
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
2
作者 贾克斌 吴岳珩 《北京工业大学学报》 北大核心 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
3维卷积递归神经网络的高光谱图像分类方法 被引量:9
3
作者 关世豪 杨桄 +1 位作者 李豪 付严宇 《激光技术》 CAS CSCD 北大核心 2020年第4期485-491,共7页
为了针对高光谱图像中空间信息与光谱信息的不同特性进行特征提取,提出一种3维卷积递归神经网络(3-D-CRNN)的高光谱图像分类方法。首先采用3维卷积神经网络提取目标像元的局部空间特征信息,然后利用双向循环神经网络对融合了局部空间信... 为了针对高光谱图像中空间信息与光谱信息的不同特性进行特征提取,提出一种3维卷积递归神经网络(3-D-CRNN)的高光谱图像分类方法。首先采用3维卷积神经网络提取目标像元的局部空间特征信息,然后利用双向循环神经网络对融合了局部空间信息的光谱数据进行训练,提取空谱联合特征,最后使用Softmax损失函数训练分类器实现分类。3-D-CRNN模型无需对高光谱图像进行复杂的预处理和后处理,可以实现端到端的训练,并且能够充分提取空间与光谱数据中的语义信息。结果表明,与其它基于深度学习的分类方法相比,本文中的方法在Pavia University与Indian Pines数据集上分别取得了99.94%和98.81%的总体分类精度,有效地提高了高光谱图像的分类精度与分类效果。该方法对高光谱图像的特征提取具有一定的启发意义。 展开更多
关键词 光谱学 高光谱图像分类 3维卷积神经网络 双向循环神经网络 空谱联合特征
在线阅读 下载PDF
利用卷积神经网络对GF-3输电塔的检测与分类 被引量:4
4
作者 孙震笙 柳鹏 +2 位作者 余涛 杨健 米晓飞 《遥感信息》 CSCD 北大核心 2019年第5期88-97,共10页
高压输电塔廊道的快速、大范围监测能力对于国家能源安全战略至关重要。合成孔径雷达遥感技术以其全天时、全天候、穿透能力强等众多优势能够为区域电力基础设施监测提供稳定数据源。但由于复杂的成像机理和大量相干斑噪声的影响,SAR数... 高压输电塔廊道的快速、大范围监测能力对于国家能源安全战略至关重要。合成孔径雷达遥感技术以其全天时、全天候、穿透能力强等众多优势能够为区域电力基础设施监测提供稳定数据源。但由于复杂的成像机理和大量相干斑噪声的影响,SAR数据的快速智能解译存在一定的困难。为此,提出一个基于深度卷积神经网络的输电塔快速识别分类算法框架。利用我国首颗C频段多极化合成孔径雷达高分三号数据,结合目标检测网络自动标注构建RAD-GFEP输电塔数据集,然后采用基于卷积神经网络的分类算法对该样本集进行分类测试。结果表明,基于深度卷积神经网络的分类算法能够对复杂背景场下SAR微小目标精准识别。在输电塔数据集RAD-GFEP上分类的总体精度达到了98.21%,混淆矩阵的Kappa系数值为0.9729,该结果远远优于传统的视觉算法。研究也表明了国产星载SAR较好的成像能力和利用其进行广域输电塔发现、识别和分类的可行性,在电力基础设施规划、建设、维护和灾后评估等方面展现出了巨大的应用前景。 展开更多
关键词 深度卷积神经网络 目标识别 输电塔 合成孔径雷达 高分三号
在线阅读 下载PDF
基于块编码特点的压缩视频质量增强算法 被引量:1
5
作者 于海 杨磊 +4 位作者 高阳 刘枫琪 刘鹏宇 孙萱 张悦 《北京工业大学学报》 CAS CSCD 北大核心 2024年第9期1069-1076,共8页
针对现有压缩视频质量增强算法未能充分利用压缩视频特点的问题,研究了视频编码与压缩视频质量增强任务之间的本质关系,并针对性地设计了一种基于三维卷积神经网络(3D convolutional neural network, 3D-CNN)的非对齐压缩视频质量增强... 针对现有压缩视频质量增强算法未能充分利用压缩视频特点的问题,研究了视频编码与压缩视频质量增强任务之间的本质关系,并针对性地设计了一种基于三维卷积神经网络(3D convolutional neural network, 3D-CNN)的非对齐压缩视频质量增强算法。实验结果表明:相较于高效视频编码(high efficiency video coding, HEVC)标准H.265,所提算法在低延迟(low delay, LD)配置下且量化参数(quantization parameter, QP)为37时,峰值信噪比(peak signal-to-noise ratio, PSNR)提升了0.465 2 dB;相较于数据压缩会议(data compression conference, DCC)中提出的多帧引导的注意力网络(multi-frame guided attention network, MGANet)方法,该算法PSNR的增长量提升了15.1%。 展开更多
关键词 视频编码 高效视频编码(high efficiency video coding HEVC) 压缩视频质量增强 深度学习 卷积神经网络(convolutional neural network CNN) 三维卷积神经网络(3D convolutional neural network 3d-cnn)
在线阅读 下载PDF
基于多尺度时空注意力网络的微表情检测方法 被引量:6
6
作者 于洋 孙芳芳 +2 位作者 吕华 李扬 王晓民 《计算机工程》 CAS CSCD 北大核心 2024年第6期228-235,共8页
微表情可以揭示人们试图隐藏的真实情绪,为刑事侦查、心理辅导等提供潜在的信息。现有微表情检测方法主要在获取空间特征的基础上提取时间特征以构建时空特征,这种处理方式容易导致时间特征失真,同时在空间处理过程中会破坏原有时序关系... 微表情可以揭示人们试图隐藏的真实情绪,为刑事侦查、心理辅导等提供潜在的信息。现有微表情检测方法主要在获取空间特征的基础上提取时间特征以构建时空特征,这种处理方式容易导致时间特征失真,同时在空间处理过程中会破坏原有时序关系,降低微表情时空特征的判别性。针对这一问题,提出基于多尺度时空注意力网络的微表情检测方法。利用包含时间和空间关系的三维卷积神经网络(3DCNN)对微表情序列进行处理,获取兼顾时间域和空间域的鲁棒性特征。构建多尺度时间输入序列,从不同时间长度的图像序列中提取多维时间特征,采用轻量级3DCNN提取多尺度时空特征,利用全局时空注意力模块(GSAM)对时空特征进行全局性时空关联加强,其中时空重组模块用于加强不同时刻图像帧之间的连通性,全局信息关注模块构建单帧图像上的空间关联信息,最后对不同时刻的特征赋予权重以突出关键时间信息,有效完成微表情检测工作。实验结果表明,该方法可以准确检测出微表情序列片段,在CASME、CASME II和SAMM公开数据集上的准确率分别达到92.32%、95.04%和89.56%,相比目前最优的深度学习方法LGAttNet,所提方法在CASME II和SAMM数据集上的准确率分别提高了3.84和4.96个百分点。 展开更多
关键词 微表情检测 三维卷积神经网络 时空特征 多尺度特征 关联性
在线阅读 下载PDF
基于深度卷积神经网络和深度视频的人体行为识别 被引量:7
7
作者 刘智 冯欣 张杰 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第11期99-106,共8页
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,... 传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。 展开更多
关键词 深度学习 人体行为识别 深度卷积神经网络 深度视频 3维卷积
在线阅读 下载PDF
BTDGCNN:面向三维点云拓扑结构的BallTree动态图卷积神经网络 被引量:4
8
作者 张学典 方慧 《小型微型计算机系统》 CSCD 北大核心 2022年第11期2342-2347,共6页
点云卷积网络对点云进行分割分类时,独立提取点云特征却忽略了点之间的几何关联,从而丢失了许多局部特征.而对稀疏、无结构、无序的点云进行输入转换则会导致数据变得更加庞大,卷积效率降低.为此构建了面向三维点云拓扑结构的BallTree... 点云卷积网络对点云进行分割分类时,独立提取点云特征却忽略了点之间的几何关联,从而丢失了许多局部特征.而对稀疏、无结构、无序的点云进行输入转换则会导致数据变得更加庞大,卷积效率降低.为此构建了面向三维点云拓扑结构的BallTree动态图卷积神经网络,利用Bat-Net变换网络(BallTree transfromation network)对初始无序点云进行空间变换,恢复点云的拓扑结构和距离向量,提高点云中各个点间的关联性,结合三层BAT边卷积模块(BallTree edge convolution network),提升其信息表征能力,以便更好地进行分类分割任务.实验结果表明,该方法在ModelNet40数据集上的分类性能均优于其他五种方法,分别提高了4.4%、2.9%、1.3%、2%和1.4%.同时在ShapeNet Parts数据集上的分割的平均交并比分别提高了1.7%、0.3%、0.3%、0.3%、0.3%,有效地提升了三维点云的分类分割性能. 展开更多
关键词 三维点云 图卷积神经网络 分类 分割
在线阅读 下载PDF
基于深度学习的城市臭氧小时浓度预测模型 被引量:8
9
作者 王凯 胡冬梅 +3 位作者 闫雨龙 彭林 尹浩 张可可 《环境化学》 CAS CSCD 北大核心 2023年第8期2609-2618,共10页
近地面高浓度臭氧(O3)对城市环境空气质量、植物生长和人体健康等均有较大影响.因此,精准预报臭氧浓度对城市环境管理部门臭氧污染防治、居民出行决策建议、降低健康影响等具有重要意义.深度学习模型对于非线性关系具有较强捕捉和学习能... 近地面高浓度臭氧(O3)对城市环境空气质量、植物生长和人体健康等均有较大影响.因此,精准预报臭氧浓度对城市环境管理部门臭氧污染防治、居民出行决策建议、降低健康影响等具有重要意义.深度学习模型对于非线性关系具有较强捕捉和学习能力,因此本研究提出一种基于深度学习算法的混合模型,利用图卷积神经网络(GCN)及长短期记忆神经网络(LSTM)分别捕捉臭氧浓度空间和时间变化特征,耦合气象因子,构建基于时空关联的臭氧小时浓度预测模型GCN-LSTM,并以北京市为例开展应用研究.结果显示,GCN-LSTM模型可较好预测北京市未来72 h臭氧浓度,预测值与观测值决定系数为0.86;预测未来24、48、72 h臭氧浓度平均相对偏差分别为18.2%、19.2%和22.9%,RMSE值分别为17.3、23.7、25.4μg·m^(−3),对于48-72 h的长时预测准确度优于已有机器学习模型;当臭氧观测浓度介于0-80μg·m^(−3)、80-160μg·m^(−3)和160-200μg·m^(−3)时(共占总数据量的96.3%),预测平均相对偏差分别为20.1%、6.9%和16.4%;预测不同类型站点浓度时发现,城市清洁对照点、城市环境评价点、区域背景传输点和交通污染监控点的平均相对偏差分别为7.9%、13.2%、24.4%和29.3%,RMSE值分别为10.8、14.9、20.1、31.4μg·m−3,模型对城市清洁对照点和城市环境评价点的预测准确度较高.使用本模型对城市大气臭氧小时浓度预测,将较好助力城市大气臭氧污染防治工作. 展开更多
关键词 O3 小时浓度预测 深度学习 图卷积神经网络 长短期记忆神经网络.
在线阅读 下载PDF
改进AlexNet的高分三号全极化海岛地物分类 被引量:3
10
作者 刘鹏 谢春华 +1 位作者 安文韬 李良伟 《遥感信息》 CSCD 北大核心 2021年第5期142-147,共6页
针对经典卷积神经网络难以有效分类全极化SAR数据中复杂的海岛地物的问题,为满足日益精细化的监测需求、充分发挥SAR在海岛监测中的作用,文章对经典的AlexNet改进,提出了一种应用于全极化SAR数据海岛地物分类的卷积神经网络模型。该模... 针对经典卷积神经网络难以有效分类全极化SAR数据中复杂的海岛地物的问题,为满足日益精细化的监测需求、充分发挥SAR在海岛监测中的作用,文章对经典的AlexNet改进,提出了一种应用于全极化SAR数据海岛地物分类的卷积神经网络模型。该模型是在AlexNet基础上调整卷积核大小及全连接层,减少参数,加入池化层,降低维度,减少计算复杂度。利用高分三号卫星对南日岛进行观测获取的全极化SAR图像进行实验和分析,表明该方法能够对全极化SAR图像中海岛的多类地物进行有效区分,与AlexNet的分类结果相比,精度提升5.56%。 展开更多
关键词 高分三号 地物分类 合成孔径雷达 海岛 卷积神经网络 深度学习
在线阅读 下载PDF
Multimodal Emotion Recognition Based on Facial Expression and ECG Signal
11
作者 NIU Jian-wei AN Yue-qi +1 位作者 NI Jie JIANG Chang-hua 《包装工程》 CAS 北大核心 2022年第4期71-79,共9页
As a key link in human-computer interaction,emotion recognition can enable robots to correctly perceive user emotions and provide dynamic and adjustable services according to the emotional needs of different users,whi... As a key link in human-computer interaction,emotion recognition can enable robots to correctly perceive user emotions and provide dynamic and adjustable services according to the emotional needs of different users,which is the key to improve the cognitive level of robot service.Emotion recognition based on facial expression and electrocardiogram has numerous industrial applications.First,three-dimensional convolutional neural network deep learning architecture is utilized to extract the spatial and temporal features from facial expression video data and electrocardiogram(ECG)data,and emotion classification is carried out.Then two modalities are fused in the data level and the decision level,respectively,and the emotion recognition results are then given.Finally,the emotion recognition results of single-modality and multi-modality are compared and analyzed.Through the comparative analysis of the experimental results of single-modality and multi-modality under the two fusion methods,it is concluded that the accuracy rate of multi-modal emotion recognition is greatly improved compared with that of single-modal emotion recognition,and decision-level fusion is easier to operate and more effective than data-level fusion. 展开更多
关键词 multi-modal emotion recognition facial expression ECG signal three-dimensional convolutional neural network
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部