期刊文献+
共找到119篇文章
< 1 2 6 >
每页显示 20 50 100
深度度量注意力混合模型表情识别方法
1
作者 姚丽莎 《计算机工程与应用》 北大核心 2025年第7期245-254,共10页
深度学习网络在人脸表情识别中已广泛采用,但因表情图像复杂多变,受光照、个体差异等各个因素的影响,现有方法的识别效果有待提高。为了提高深度学习网络的表达能力,在深度学习网络中,结合面部关键区域的位置特征,提出融合位置信息的深... 深度学习网络在人脸表情识别中已广泛采用,但因表情图像复杂多变,受光照、个体差异等各个因素的影响,现有方法的识别效果有待提高。为了提高深度学习网络的表达能力,在深度学习网络中,结合面部关键区域的位置特征,提出融合位置信息的深层注意力反馈机制卷积神经网络模型。同时,由于表情特征的类间差异小,为了提高分类器的分类学习能力,引入度量学习方法增强特征的判别性,使同类之间的距离减小,异类之间的距离加大。通过度量学习将面部表情图像的特征映射到具有表情判别性的新的特征空间中,由此判断各表情样本的表情类别。对原图进行人脸检测,确定人脸裁剪出人脸关键区域,去除头发、背景等因素的干扰;通过深层注意力反馈机制的CNN模型对人脸关键区域进行特征学习,学习获得面部表情深度特征,之后引入判别性度量学习方法,通过度量矩阵将特征向量映射为新的学习后的特征向量;将提取的样本表情特征送入全连接层并通过Softmax分类器识别划分到预先定义好的7种基本表情。在CK+和RAF-DB数据库的实验表明,该方法取得了98.69%和87.68%的平均识别率,提高了分类器的分类学习能力。 展开更多
关键词 深度注意力 表情识别 卷积神经网络 度量学习
在线阅读 下载PDF
基于用户数据特征深度挖掘的快速图书检索算法
2
作者 窦淑庆 刘思豆 《现代电子技术》 北大核心 2025年第14期137-142,共6页
针对传统图书推荐系统所得到的计算结果滞后于实时需求且准确性较低的缺陷,文中基于用户画像数据,提出一种快速图书检索算法。该算法在用户画像构建部分对静态属性抽取和动态标签行为进行建模。在图书特征提取模型中,使用BERT-Word2Vec... 针对传统图书推荐系统所得到的计算结果滞后于实时需求且准确性较低的缺陷,文中基于用户画像数据,提出一种快速图书检索算法。该算法在用户画像构建部分对静态属性抽取和动态标签行为进行建模。在图书特征提取模型中,使用BERT-Word2Vec作为基础框架进行多模态特征提取,并利用双塔深度匹配模型构建了用户MLP塔和图书改进CNN塔,对特征进行充分细致的多维分析。模型通过将实时反馈机制Kafka-Redis流处理算法与会话注意力加权融合,最终实现了场景化的推荐。实验测试结果显示,NDCG@10指标较最优基准提升了约21.0%,行为反馈延迟在峰值500 QPS流量下小于等于3.5 s。表明所提算法能够为知识服务场景提供兼具准确性、时效性与场景适应性的信息推荐解决方案。 展开更多
关键词 用户画像 双向编码器表示技术 双塔深度匹配模型 多层感知器 卷积神经网络 推荐算法
在线阅读 下载PDF
融合多尺度注意力神经网络的港口起重装备故障时序数据预测方法 被引量:2
3
作者 雷鹏 谢敬玲 +4 位作者 许洪祖 焦锋 魏立明 张忠岩 吕成兴 《机电工程》 北大核心 2025年第2期277-286,共10页
近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注... 近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注意力机制港口装备故障时序数据预测方法。首先,采用了融合非线性策略与混沌映射的改进灰狼优化算法(IGWO),自适应地确定了变分模态分解(VMD)的模态数与惩罚因子;然后,将变分模态分解得到的本征模态函数进一步作为融合多尺度注意力神经网络(FMANN)模型的时序输入,进行了多尺度通道特征融合;最后,对各个本征模态函数的预测结果进行了融合,得到了最终预测结果。研究结果表明:FMANN模型在回转机构数据集上的均方根误差(RMSE)为0.001 12,平均绝对百分比误差(MAPE)为6.396 3%,决定系数为0.999 8;相比于其他预测模型,FMANN预测效果更加拟合实际数据。FMANN模型能够准确地预测设备轴承的时序振动,有望为未来实际工业生产提供一条新思路。 展开更多
关键词 滚动轴承 故障诊断 变分模态分解 注意力机制 灰狼优化算法 融合多尺度注意力神经网络 深度可分离卷积
在线阅读 下载PDF
基于卷积神经网络的GFRP/NOMEX蜂窝夹层结构缺陷红外热成像检测 被引量:1
4
作者 唐庆菊 谷卓妍 +3 位作者 卜红茹 徐贵鹏 谭鑫杰 谢锐 《光谱学与光谱分析》 北大核心 2025年第2期542-550,共9页
蜂窝夹层结构是复合材料领域的重要结构形式之一,由于其制备工艺复杂服役环境恶劣,极易产生分层、脱粘等缺陷,严重影响材料使用寿命。为确保相关构件的使用性能以及质量安全,有必要通过合适的无损检测技术对蜂窝夹层结构进行定期的质量... 蜂窝夹层结构是复合材料领域的重要结构形式之一,由于其制备工艺复杂服役环境恶劣,极易产生分层、脱粘等缺陷,严重影响材料使用寿命。为确保相关构件的使用性能以及质量安全,有必要通过合适的无损检测技术对蜂窝夹层结构进行定期的质量监测以及探伤。因此,实现缺陷的量化检测是预防以及解决此类问题发生的根本。基于红外热成像技术以含预制分层及脱粘缺陷的GFRP/NOMEX蜂窝夹层结构试件为研究对象进行脉冲红外热波无损检测试验研究,采集若干帧试件表面温度信号分布热图,取若干缺陷区域及健康区域内像素点的温度信号构建样本数据集,并将其随机划分为训练集及验证集,取第四行缺陷中心水平线区域作为测试集数据。结合卷积神经网络技术实现GFRP/NOMEX蜂窝夹层结构缺陷检测识别以及深度预测。分析一维卷积神经网络结构,引入多尺度空洞卷积、残差模块、注意力机制,搭建一维卷积神经网络预测模型,使用构建的温度信号数据集训练搭建的网络模型。训练结果表明,验证集和训练集的Loss及RMSE趋势一致,验证集最终Loss为1.67×10^(-5),RMSE为0.0058,并未出现过拟合现象。将测试集数据输入至训练完成的网络中。结果表明,所搭建的网络可以有效识别出缺陷,对于缺陷中心处的深度预测误差控制在2%以内。将卷积神经网络与红外热成像检测技术相结合,能够实现GFRP/NOMEX蜂窝夹层结构缺陷的可靠性检测及缺陷埋深的稳定预测,同时为其他复合材料缺陷识别以及量化检测提供参考。 展开更多
关键词 蜂窝夹层结构 深度预测 卷积神经网络 红外热成像
在线阅读 下载PDF
基于可信度的非视距识别与定位算法
5
作者 刘林 宋雨昊 《中国惯性技术学报》 北大核心 2025年第10期972-978,共7页
为提高非视距场景下超宽带(UWB)定位精度,提出了基于可信度的非视距识别与定位算法。首先,利用UWB诊断寄存器提取实时信道冲击响应特征及测距值,通过一维卷积神经网络进行非视距识别,估计测距为视距或非视距的概率。然后,利用该概率构... 为提高非视距场景下超宽带(UWB)定位精度,提出了基于可信度的非视距识别与定位算法。首先,利用UWB诊断寄存器提取实时信道冲击响应特征及测距值,通过一维卷积神经网络进行非视距识别,估计测距为视距或非视距的概率。然后,利用该概率构建可信度,基于可信度进行定位基站筛选及定位算法改进,设计基于可信度的加权最小二乘-泰勒(WLS-Taylor)融合滤波算法。在多种场景下采集静态和动态测试数据进行性能验证,实验结果表明:所提算法能够有效抑制非视距对定位结果的影响,非视距环境下定位误差均值小于10 cm;在非视距相对严重环境下,所提算法的定位误差较基于距离加权的WLS算法降低了76.94 cm。 展开更多
关键词 超宽带 信道响应特征 非视距识别 一维深度卷积神经网络 可信度
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
6
作者 贾克斌 吴岳珩 《北京工业大学学报》 北大核心 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
结合多尺度注意力的轻量自监督单目深度估计
7
作者 葛竟睿 秦国轩 张为 《西安电子科技大学学报》 北大核心 2025年第4期66-76,共11页
针对目前单目深度估计网络模型参数量大、计算复杂度高、难以部署在边缘计算设备上进行实时推理的问题,提出一种结合多尺度注意力的轻量级自监督单目深度估计算法。该算法引入多尺度注意力模块作为编码器主体,以卷积操作与自注意力机制... 针对目前单目深度估计网络模型参数量大、计算复杂度高、难以部署在边缘计算设备上进行实时推理的问题,提出一种结合多尺度注意力的轻量级自监督单目深度估计算法。该算法引入多尺度注意力模块作为编码器主体,以卷积操作与自注意力机制的局部结构和远程全局信息捕获能力作为核心思想,通过将添加了多分支大核空洞卷积的门控多层感知机与前馈神经网络相结合,实现带有注意力机制的局部与全局特征聚合,从而在确保深度估计精度的情况下降低网络参数量和计算复杂度。使用经过编码器-解码器架构得到的深度图与基于ResNet18的位姿估计网络输出的相对姿态矩阵进行图像重建,通过计算重建图像与原始图像间的光度损失与平滑损失,实现自监督的单目深度估计。该算法模型参数量仅4.1 M,浮点运算量仅3.0 G,运行网络结构平均用时5.7 ms,在公开数据集KITTI上的AbsRel指标为0.104,δ_1指标为0.892,综合性能优于目前的主流方法。实验结果表明,该算法深度估计精度高,推理速度快,能够满足实时性单目深度估计任务的需求。 展开更多
关键词 深度学习 深度估计 无监督学习 卷积神经网络 注意力机制
在线阅读 下载PDF
Hand segmentation from a single depth image based on histogram threshold selection and shallow CNN 被引量:1
8
作者 XU Zhengze ZHANG Wenjun 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期675-685,共11页
Real-time hand gesture recognition technology significantly improves the user's experience for virtual reality/augmented reality(VR/AR) applications, which relies on the identification of the orientation of the ha... Real-time hand gesture recognition technology significantly improves the user's experience for virtual reality/augmented reality(VR/AR) applications, which relies on the identification of the orientation of the hand in captured images or videos. A new three-stage pipeline approach for fast and accurate hand segmentation for the hand from a single depth image is proposed. Firstly, a depth frame is segmented into several regions by histogrambased threshold selection algorithm and by tracing the exterior boundaries of objects after thresholding. Secondly, each segmentation proposal is evaluated by a three-layers shallow convolutional neural network(CNN) to determine whether or not the boundary is associated with the hand. Finally, all hand components are merged as the hand segmentation result. Compared with algorithms based on random decision forest(RDF), the experimental results demonstrate that the approach achieves better performance with high-accuracy(88.34% mean intersection over union, mIoU) and a shorter processing time(≤8 ms). 展开更多
关键词 HAND SEGMENTATION HISTOGRAM THRESHOLD selection convolutional neural network(CNN) depth map
在线阅读 下载PDF
Rmcvit:一种融合卷积与自注意力的轻量级图像识别算法
9
作者 孙红 吴一凡 +2 位作者 徐广辉 田鑫驰 朱江明 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1929-1934,共6页
为了解决目前基于Transformer的模型需要较大的参数量而无法有效应用在资源受限的移动端设备中,提出一种融合卷积与Transformer两者优势的轻量级混合模型.模型中Rmcvit Block将输入张量分成多个通道组,利用深度可分离卷积和跨通道维度... 为了解决目前基于Transformer的模型需要较大的参数量而无法有效应用在资源受限的移动端设备中,提出一种融合卷积与Transformer两者优势的轻量级混合模型.模型中Rmcvit Block将输入张量分成多个通道组,利用深度可分离卷积和跨通道维度的互协方差注意力来增加感受野并融合多尺度特征,并融合unflod模块在保证其空间顺序的前提下,降低每个向量序列(token)送入自注意力模块后的计算消耗.基于整理后的Imagenet数据集的对比实验,RmcVit-M以5.81M的参数量大小达到了85.2%的准确率,其模型相关变体性能超过了参数量相似的Transformer模型和卷积神经网络.结果表明,Rmcvit能够有效结合卷积神经网络与Transformer的优势,达到了以较少的模型参数获得更高准确率的目的. 展开更多
关键词 卷积神经网络 互协方差注意力 轻量级混合模型 深度可分离卷积 多尺度
在线阅读 下载PDF
复杂场景下自适应注意力机制融合实时语义分割
10
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
在线阅读 下载PDF
基于深度强化学习的测井曲线自动深度校正方法 被引量:7
11
作者 熊文君 肖立志 +1 位作者 袁江如 岳文正 《石油勘探与开发》 EI CAS CSCD 北大核心 2024年第3期553-564,共12页
针对传统测井曲线深度校正需要手动调整曲线,而对于多口井的深度校正工作量巨大,需要大量人工参与,且工作效率较低的问题,提出一种多智能体深度强化学习方法(MARL)来实现多条测井曲线自动深度匹配。该方法基于卷积神经网络(CNN)定义多... 针对传统测井曲线深度校正需要手动调整曲线,而对于多口井的深度校正工作量巨大,需要大量人工参与,且工作效率较低的问题,提出一种多智能体深度强化学习方法(MARL)来实现多条测井曲线自动深度匹配。该方法基于卷积神经网络(CNN)定义多个自上而下的双滑动窗口捕捉测井曲线上相似的特征序列,并设计一个智能体与环境的互动机制来控制深度匹配过程。通过双深度Q学习网络(DDQN)选取一个动作来平移或缩放测井特征序列,并利用反馈的奖励信号来评估每个动作的好坏,以学习到最优的控制策略达到提升深度校正精度的目的。研究表明,MARL方法可以自动完成多口井、不同测井曲线的深度校正任务,减少人工干预。在油田实例应用中,对比分析了动态时间规整(DTW)、深度Q学习网络(DQN)和DDQN等方法的测试结果,DDQN算法采用双网络评估机制有效改进了算法的性能,能够识别和对齐测井曲线特征序列上更多的细节,具有较高的深度匹配精度。 展开更多
关键词 人工智能 机器学习 深度校正 测井曲线 多智能体深度强化学习 卷积神经网络 双深度Q学习网络
在线阅读 下载PDF
基于多域信息融合与深度分离卷积的轴承故障诊断网络模型 被引量:4
12
作者 王同 许昕 潘宏侠 《机电工程》 北大核心 2024年第1期22-32,共11页
针对传统卷积神经网络(CNN)对滚动轴承振动信号的故障识别准确率不高这一问题,提出了一种基于多域信息融合结合深度分离卷积(MDIDSC)的轴承故障诊断方法。首先,利用自适应噪声的完全集合经验模态分解(CEEMDAN)算法对轴承振动信号进行了... 针对传统卷积神经网络(CNN)对滚动轴承振动信号的故障识别准确率不高这一问题,提出了一种基于多域信息融合结合深度分离卷积(MDIDSC)的轴承故障诊断方法。首先,利用自适应噪声的完全集合经验模态分解(CEEMDAN)算法对轴承振动信号进行了分解;然后,利用分解出的本征模态函数(IMF)的各个分量构建了多空间状态矩阵,并将该多空间状态矩阵输入该深度分离卷积模型中,进行了卷积训练;同时,在该深度分离卷积模型中添加了残差结构,对数据特征进行了复利用,并对卷积核进行了深度分离,解决了深度模型的网络退化问题;最后,提出了一种空间特征提取方法,对模型参数进行了修剪,采用一种自适应学习率退火方法进行了梯度优化,以避免模型陷入局部最优。研究结果表明:通过对多个轴承故障数据集进行对比分析可知,MDIDSC在轴承故障诊断方面的准确率和稳定性明显优于其他方法,MDIDSC的最高测试准确率为100%,平均测试准确率为99.07%;同时,在测试集中的最大损失和平均损失分别为0.1345和0.0841;该结果表明MDIDSC在轴承故障诊断方面具有一定的优越性。 展开更多
关键词 深度分离卷积 信息融合 参数修剪 残差网络 卷积神经网络 自适应噪声的完全集合经验模态分解 本征模态函数 多域信息融合结合深度分离卷积
在线阅读 下载PDF
基于改进ResNet模型的番茄叶片病虫害识别 被引量:6
13
作者 王圆 祝俊辉 +4 位作者 周贤勇 胡敏 侯津津 徐明升 陈琳 《激光杂志》 CAS 北大核心 2024年第5期209-214,共6页
识别早期番茄叶片的病虫害是预防番茄病虫害、提升产量的关键步骤之一。基于改进ResNet50识别番茄叶片病虫害。根据不同病虫害类别创建5种不同番茄病虫害数据集,并采用数据增强方式对数据进行预处理。在原始模型ResNet50的基础上,通过... 识别早期番茄叶片的病虫害是预防番茄病虫害、提升产量的关键步骤之一。基于改进ResNet50识别番茄叶片病虫害。根据不同病虫害类别创建5种不同番茄病虫害数据集,并采用数据增强方式对数据进行预处理。在原始模型ResNet50的基础上,通过在网络模型结构中添加SE注意力机制模块让模型能够更准确地识别待检测目标。此外为了减少模型的参数量,实现更加轻量化的模型,利用深度可分离卷积替换传统卷积。为了说明改进模型的有效性,分析改进后的模型在番茄叶片病虫害数据集上的性能,将其与传统卷积神经网络ResNet50、AlexNet、VGG16、GoogLeNet进行对比。实验结果表明,改进后的模型相较于原模型参数量降低了37.5%,准确率达到了97.4%,与原模型相比,其准确率提升了4.4%。综上所述,本模型实现了性能与参数量之间的良好平衡,为后续在实际环境中番茄叶片病虫害识别系统部署提供可能。 展开更多
关键词 番茄 叶片病虫害 注意力机制 深度可分离卷积 卷积神经网络 识别分类
在线阅读 下载PDF
基于改进OpenPose的行人关节点检测算法 被引量:4
14
作者 田雨 刘红 《传感器与微系统》 CSCD 北大核心 2024年第9期144-148,共5页
针对车载图像存在目标行人较小、携带信息较少、无法准确检测行人关节点的问题,提出一种基于改进OpenPose的行人关节点检测算法。首先,通过增大输入图像分辨率和增加图像缩放比例来捕获车载视角下行人关节点的特征信息;其次改进网络结构... 针对车载图像存在目标行人较小、携带信息较少、无法准确检测行人关节点的问题,提出一种基于改进OpenPose的行人关节点检测算法。首先,通过增大输入图像分辨率和增加图像缩放比例来捕获车载视角下行人关节点的特征信息;其次改进网络结构,卷积核大小以及采用深度可分离卷积代替标准卷积来降低网络模型的参数数量和计算量。实验结果表明:改进网络在检测行人关节点准确率提高了6%,改进网络模型的参数量和计算量比原OpenPose减少69%和39%,提高了检测行人节点的速度。 展开更多
关键词 卷积神经网络 OpenPose 深度可分离卷积 关节点检测
在线阅读 下载PDF
基于LPDMR-NET的鸟鸣声识别 被引量:2
15
作者 王娅茹 唐璐 +2 位作者 陈爱斌 彭伟雄 沈平 《计算机工程》 CAS CSCD 北大核心 2024年第10期174-184,共11页
为了高效且快速地识别自然环境中的鸟鸣声,提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先,通过Mel滤波器生成Mel频谱图。接着,采用basicblock和downblock连接生成两层残差网络DBNet,堆叠DBNet作为鸟鸣声识... 为了高效且快速地识别自然环境中的鸟鸣声,提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先,通过Mel滤波器生成Mel频谱图。接着,采用basicblock和downblock连接生成两层残差网络DBNet,堆叠DBNet作为鸟鸣声识别的主干网络,以提高训练速度。然后,利用逐点深度卷积网络(PDNet)提取频谱图特征信息,替代主干网络下采样模块,将两个残差模块的basicblock中的3×3卷积替换为分离分支块(DBB),引入不同的感受野,在复杂多分支结构下显著提高网络的识别性能。最后,在两个残差模块间嵌入轻量级高效置换注意力(SA)模块用于传递两层残差模块间的有效信息,增强频谱图波纹特征,进一步提高网络识别性能。在自建的30类鸟鸣声数据集Birdselfdata上的实验结果表明,该模型的识别准确率为96.82%、F1值为96.73%,在识别效率和准确性方面超越了对比模型。 展开更多
关键词 卷积神经网络 鸟鸣声分类 深度学习 Mel频谱图 残差网络 深度可分离卷积
在线阅读 下载PDF
基于仿鱼人工侧线的水下静态目标主动感知方法研究 被引量:2
16
作者 谢鸥 孙兆光 +1 位作者 沈灿 陈子昂 《传感技术学报》 CAS CSCD 北大核心 2024年第10期1786-1794,共9页
针对静止水域中静态目标探测问题,提出了一种基于仿鱼人工侧线的水下静态目标主动感知方法。依据流体动力学理论,分析了侧线主动感知水下静态目标的可行性。建立侧线主动感知水下静态目标的仿真模型,采集目标作用下机器鱼的体表压力数据... 针对静止水域中静态目标探测问题,提出了一种基于仿鱼人工侧线的水下静态目标主动感知方法。依据流体动力学理论,分析了侧线主动感知水下静态目标的可行性。建立侧线主动感知水下静态目标的仿真模型,采集目标作用下机器鱼的体表压力数据,揭示了目标尺寸和距离对体表压强的影响关系。建立基于深度卷积神经网络的目标尺寸和距离预测回归模型,对模型结构和训练参数进行了优化。结果表明,所提出的方法可有效感知和预测水下静态目标参数。 展开更多
关键词 人工侧线 主动感知 深度卷积神经网络 水下静态目标
在线阅读 下载PDF
结合密集残差块和注意力的真实图像去噪网络
17
作者 余卓璞 周冬明 +2 位作者 周联敏 赵倩 尹稳 《计算机工程与设计》 北大核心 2024年第6期1812-1821,共10页
为有效去除真实图像噪声并保留图像边缘信息,提出一种结合密集网络思想和并行极化自注意力机制的真实去噪算法。使用3条并行结构处理不同尺度的特征信息,其中每条分支由两个密集注意力块串联而成,形成残差结构。使用选择性核融合机制,... 为有效去除真实图像噪声并保留图像边缘信息,提出一种结合密集网络思想和并行极化自注意力机制的真实去噪算法。使用3条并行结构处理不同尺度的特征信息,其中每条分支由两个密集注意力块串联而成,形成残差结构。使用选择性核融合机制,获取不同深度下的特征信息,将其融合并使用注意力机制去除冗余信息,获取干净图像。实验结果表明,该算法在SIDD、DND、PolyU测试集上的峰值信噪比分别为39.32 dB、39.52 dB和37.36 dB,结构相似性分别为0.908、0.951和0.952,在SIDD和PolyU测试集上的图像通用质量指标值为0.992和0.982,在去噪任务上可以达到较好的性能,提高了图像视觉的质量。 展开更多
关键词 真实图像去噪 深度学习 卷积神经网络 密集残差网络 多尺度 注意力机制 深度卷积
在线阅读 下载PDF
基于稠密自编码器的无监督番茄植株图像深度估计模型 被引量:9
18
作者 周云成 邓寒冰 +2 位作者 许童羽 苗腾 吴琼 《农业工程学报》 EI CAS CSCD 北大核心 2020年第11期182-192,共11页
深度信息获取是温室移动机器人实现自主作业的关键。该研究提出一种基于稠密卷积自编码器的无监督植株图像深度估计模型。针对因视角差异和遮挡而产生的像素消失问题,引入视差置信度预测,抑制图像重构损失产生的问题梯度,设计了基于可... 深度信息获取是温室移动机器人实现自主作业的关键。该研究提出一种基于稠密卷积自编码器的无监督植株图像深度估计模型。针对因视角差异和遮挡而产生的像素消失问题,引入视差置信度预测,抑制图像重构损失产生的问题梯度,设计了基于可分卷积的稠密自编码器作为模型的深度神经网络。以深度估计误差、阈值精度等为判据,在番茄植株双目图像上开展训练和测试试验,结果表明,抑制问题梯度回传可显著提高深度估计精度,与问题梯度抑制前相比,估计深度的平均绝对误差和均方根误差分别降低了55.2%和33.0%,将网络预测的多尺度视差图接入编码器并将其上采样到输入图像尺寸后参与图像重构和损失计算的处理方式对提高预测精度是有效的,2种误差进一步降低了23.7%和27.5%;深度估计误差随空间点深度的减小而显著降低,当深度在9 m以内时,估计深度的平均绝对误差<14.1 cm,在3 m以内时,则<7 cm。与已有研究相比,该研究估计深度的平均相对误差和平均绝对误差分别降低了46.0%和26.0%。该研究可为温室移动机器人视觉系统设计提供参考。 展开更多
关键词 图像处理 卷积神经网络 算法 深度估计 无监督学习 深度学习 自编码器 视差 番茄
在线阅读 下载PDF
一种视角无关的时空关联深度视频行为识别方法 被引量:13
19
作者 吴培良 杨霄 +2 位作者 毛秉毅 孔令富 侯增广 《电子与信息学报》 EI CSCD 北大核心 2019年第4期904-910,共7页
当前行为识别方法在不同视角下的识别准确率较低,该文提出一种视角无关的时空关联深度视频行为识别方法。首先,运用深度卷积神经网络的全连接层将不同视角下的人体姿态映射到与视角无关的高维空间,以构建空间域下深度行为视频的人体姿... 当前行为识别方法在不同视角下的识别准确率较低,该文提出一种视角无关的时空关联深度视频行为识别方法。首先,运用深度卷积神经网络的全连接层将不同视角下的人体姿态映射到与视角无关的高维空间,以构建空间域下深度行为视频的人体姿态模型(HPM);其次,考虑视频序列帧之间的时空相关性,在每个神经元激活的时间序列中分段应用时间等级池化(RP)函数,实现对视频时间子序列的编码;然后,将傅里叶时间金字塔(FTP)算法作用于每一个池化后的时间序列,并加以连接产生最终的时空特征表示;最后,在不同数据集上,基于不同方法进行了行为识别分类测试。实验结果表明,该文方法(HPM+RP+FTP)提高了不同视角下深度视频识别准确率,在UWA3DII数据集中,比现有最好方法高出18%。此外,该文方法具有较好的泛化性能,在MSR Daily Activity3D数据集上得到82.5%的准确率。 展开更多
关键词 视频行为识别 深度视频 视角无关 卷积神经网络 时空关联
在线阅读 下载PDF
基于自监督学习的番茄植株图像深度估计方法 被引量:7
20
作者 周云成 许童羽 +2 位作者 邓寒冰 苗腾 吴琼 《农业工程学报》 EI CAS CSCD 北大核心 2019年第24期173-182,共10页
深度估计是智能农机视觉系统实现三维场景重建和目标定位的关键。该文提出一种基于自监督学习的番茄植株图像深度估计网络模型,该模型直接应用双目图像作为输入来估计每个像素的深度。设计了3种面向通道分组卷积模块,并利用其构建卷积... 深度估计是智能农机视觉系统实现三维场景重建和目标定位的关键。该文提出一种基于自监督学习的番茄植株图像深度估计网络模型,该模型直接应用双目图像作为输入来估计每个像素的深度。设计了3种面向通道分组卷积模块,并利用其构建卷积自编码器作为深度估计网络的主体结构。针对手工特征衡量2幅图像相似度不足的问题,引入卷积特征近似性损失作为损失函数的组成部分。结果表明:基于分组卷积模块的卷积自编码器能够有效提高深度估计网络的视差图精度;卷积特征近似性损失函数对提高番茄植株图像深度估计的精度具有显著作用,精度随着参与损失函数计算的卷积模块层数的增加而升高,但超过4层后,其对精度的进一步提升作用不再明显;当双目图像采样距离在9.0 m以内时,该文方法所估计的棋盘格角点距离均方根误差和平均绝对误差分别小于2.5和1.8 cm,在3.0 m以内时,则分别小于0.7和0.5 cm,模型计算速度为28.0帧/s,与已有研究相比,2种误差分别降低了33.1%和35.6%,计算速度提高了52.2%。该研究可为智能农机视觉系统设计提供参考。 展开更多
关键词 图像处理 卷积神经网络 算法 自监督学习 深度估计 视差 深度学习 番茄
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部