期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
融合注意力机制的深度神经网络的人脸表情皮沟识别方法
1
作者 王长清 《信息技术与信息化》 2025年第4期31-34,共4页
在复杂光照条件下,由于光照的不均匀性和方向性,皮沟图像的小邻域系和皮沟纹理特征基团会发生形变,影响人脸皮肤的细微纹理特征的提取。为此,提出一种融合注意力机制的深度神经网络方法进行人脸表情皮沟识别。利用深度神经网络从预处理... 在复杂光照条件下,由于光照的不均匀性和方向性,皮沟图像的小邻域系和皮沟纹理特征基团会发生形变,影响人脸皮肤的细微纹理特征的提取。为此,提出一种融合注意力机制的深度神经网络方法进行人脸表情皮沟识别。利用深度神经网络从预处理后的图像中精确捕捉到与表情变化紧密相关的局部特征,由此引入注意力机制,分别关注不同通道和不同位置的特征信息,增强对皮沟纹理的捕捉能力,使网络能够更加聚焦于对表情识别具有关键作用的特征信息,即皮沟的细微纹理信息。并将其输入到全连接层中,通过SoftMax函数转化为表情分类的概率分布,实现人脸表情皮沟的准确识别。实验结果表明,该识别方法不仅保持了高分类精度,还显著提升了识别速度,为实际应用场景中的快速、准确人脸表情识别提供了强有力的支持。 展开更多
关键词 融合注意力机制 深度神经网络 人脸表情皮沟 皮沟识别
在线阅读 下载PDF
复杂场景下自适应注意力机制融合实时语义分割
2
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
在线阅读 下载PDF
基于时空融合的多头注意力车辆轨迹预测 被引量:5
3
作者 宋秀兰 董兆航 +1 位作者 单杭冠 陆炜杰 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第8期1636-1643,共8页
针对时空维度特征影响自动驾驶车辆轨迹精度的问题,提出基于时空融合的多头注意力(TSMHA)车辆轨迹预测模型,对于空间与时间2个维度的特征信息,分别使用多头注意力机制提取车辆空间交互感知与时间运动模式.为了获得互补特征,并除去特征... 针对时空维度特征影响自动驾驶车辆轨迹精度的问题,提出基于时空融合的多头注意力(TSMHA)车辆轨迹预测模型,对于空间与时间2个维度的特征信息,分别使用多头注意力机制提取车辆空间交互感知与时间运动模式.为了获得互补特征,并除去特征数据中的冗余,将处理后的时空特征信息传输至门控特征融合模型进行特征融合.使用基于长短期记忆(LSTM)的编解码器结构,考虑编码与解码2个过程中轨迹之间潜在的相互作用,循环生成目标车辆未来预测轨迹.在训练过程中使用L2损失函数,以此降低预测轨迹与真实轨迹的差值.实验表明,与对比算法模型相比,在直线高速公路、城市十字路口、环岛场景下,本研究所提出的模型的精度分别提高了3.95%、15.64%、31.40%. 展开更多
关键词 车辆智能决策 轨迹预测 时空融合注意力机制 多目标车辆 神经网络
在线阅读 下载PDF
基于融合注意力的交通图像描述方法研究 被引量:2
4
作者 郭宙鑫 王海涌 《兰州交通大学学报》 CAS 2023年第1期71-78,共8页
针对交通监测图像易受到光线变化、天气、路况等因素的影响而出现描述不精确的问题,提出一种基于融合注意力的交通图像描述方法,旨在生成准确描述语句的同时,提升模型对交通名词的描述效果.在模型的生成器中使用残差网络和门控循环单元... 针对交通监测图像易受到光线变化、天气、路况等因素的影响而出现描述不精确的问题,提出一种基于融合注意力的交通图像描述方法,旨在生成准确描述语句的同时,提升模型对交通名词的描述效果.在模型的生成器中使用残差网络和门控循环单元生成交通图像端对端的描述语句,同时,在生成器和鉴别器中均采用包含局部信息和全局信息的融合注意力机制,以进一步提高特征表示和推理能力.在公共数据集MSCOCO和交通图像数据集上的实验结果表明:相比于其他主流方法,所提出的算法生成的交通图像描述语句更加准确自然. 展开更多
关键词 生成对抗网络 融合注意力机制 交通图像描述 门控循环单元
在线阅读 下载PDF
基于多特征交叉融合及跨层级联的航拍目标检测算法 被引量:1
5
作者 高武奇 杨婷 李亮亮 《西北工业大学学报》 EI CAS CSCD 北大核心 2023年第6期1179-1189,共11页
复杂条件下特殊目标的精确检测是增强特定场景态势生成和预测能力的关键因素。目前的技术不能克服航拍视频中出现的烟雾和遮挡干扰、目标高度变化、尺度不一等问题。因此,提出一个多特征交叉融合及跨层级联的航拍特殊目标检测算法(YOLOv... 复杂条件下特殊目标的精确检测是增强特定场景态势生成和预测能力的关键因素。目前的技术不能克服航拍视频中出现的烟雾和遮挡干扰、目标高度变化、尺度不一等问题。因此,提出一个多特征交叉融合及跨层级联的航拍特殊目标检测算法(YOLOv5-MFLC)。针对实际特殊目标保密性高、航拍图像资源匮乏的问题,构建了一个基于真实场景的航拍特殊目标数据集,并采用随机拼接和随机提取嵌入的方法进行数据增强以提高目标多样性和泛化性;针对复杂背景干扰问题,构建了多特征交叉融合注意力机制,增强了目标特征的可用信息;针对航拍图像中目标多尺度问题,设计了跨层级联多尺度特征融合金字塔,提高了跨尺度目标的检测准确率。实验结果表明,与现有的先进检测模型相比,所提算法的检测准确率有较大提升,算法平均准确率可达到81.0%,相比于原始网络提升了5.2%,特别是,在更小的目标类别“person”中达到了55.9%,提升了9.4%,进一步表明了所提改进算法对小目标检测的有用性。同时,所提算法的检测速率可以达56 frame/s,能够有效地实现实际复杂场景特殊目标的准确、快速检测,对特殊目标的识别具有一定的指导意义。 展开更多
关键词 航拍图像 目标检测 YOLOv5 融合注意力机制 多尺度特征金字塔
在线阅读 下载PDF
基于细节增强的多能DR图像融合网络 被引量:1
6
作者 刘祎 刘宇航 +1 位作者 颜溶標 桂志国 《电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期379-389,共11页
针对单能X射线无法对复杂工件各部位同时曝光成像的问题,提出一种基于细节增强的多能DR融合网络-双编码巢式连接融合网络。该网络以Inception模块作为基础卷积层,在双编码器的辅支路设计了可训练的LOG卷积模块,用来提取多尺度边缘特征,... 针对单能X射线无法对复杂工件各部位同时曝光成像的问题,提出一种基于细节增强的多能DR融合网络-双编码巢式连接融合网络。该网络以Inception模块作为基础卷积层,在双编码器的辅支路设计了可训练的LOG卷积模块,用来提取多尺度边缘特征,并将其补充到主支路以增强全局特征。在训练阶段,提出一种基于图像块的局部能量一致性损失函数,以减少输入、输出的局部性误差。融合时,采用通道和空间注意力机制作为融合策略,对双编码提取的多尺度增强特征进行融合,并将融合后的多尺度特征输入嵌套连接的解码器进行重构。结果表明,该融合网络具有细节增强效果,能够完整清晰地再现复杂工件的内部结构及缺陷。 展开更多
关键词 注意力机制融合策略 复杂工件 DR图像融合 Inception模块 LOG卷积模块 巢式连接
在线阅读 下载PDF
基于改进YOLOv5s的车载行人定位感知方法 被引量:1
7
作者 戚俊杰 王洋 许可飞 《汽车实用技术》 2024年第20期63-68,共6页
针对目前车载双目视觉系统获取行人定位方法精度不高和难以实现跟踪定位的问题,提出了一种基于改进YOLOv5s的行人定位跟踪方法。研究在基于双目视觉的YOLOv5目标检测网络中设计目标定位跟踪功能;在模型主干网络中设计基于Transformer的... 针对目前车载双目视觉系统获取行人定位方法精度不高和难以实现跟踪定位的问题,提出了一种基于改进YOLOv5s的行人定位跟踪方法。研究在基于双目视觉的YOLOv5目标检测网络中设计目标定位跟踪功能;在模型主干网络中设计基于Transformer的自适应融合注意力机制以提高目标特征表示能力;修改特征融合模块的网络结构以提高融合精度。将改进的YOLOv5s模型命名为YOLOv5sBCT,相较于基准模型YOLOv5s在训练结果的精确率上提升约4.20%,在mAP@0.5:0.95中提升约2.91%,在实际测量的距离误差率降低约6.19%。因此,文章针对车载行人定位感知方法能够为车载智能系统提供一种有效提升行人跟踪定位精度的方法,以提升驾驶员的驾驶安全性,推动智能交通领域的发展。 展开更多
关键词 行人定位 YOLOv5 融合注意力机制 mAP@0.5:0.95
在线阅读 下载PDF
基于改进YOLOv7的无人机图像目标检测算法 被引量:5
8
作者 梁秀满 贾梓涵 +1 位作者 于海峰 刘振东 《无线电工程》 2024年第4期937-946,共10页
针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失... 针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失、提高小目标检测能力;提出多信息流融合注意力机制——Spatial and Channel Attention Mechanism(SCA),动态调整注意力对空间信息流和语义信息流的关注,获得更丰富的特征信息以提高捕获目标的能力;更换损失函数为SIoU,加快模型收敛速度。在公开数据集VisDrone2019上进行对比实验,改进后算法的mAP50值相比YOLOv7提高了4%,达到了52.4%,FPS为37,消融实验验证了每个模块均提升了检测精度。实验表明,改进后的算法能较好地检测无人机图像中的目标。 展开更多
关键词 无人机 小目标检测 多信息流融合注意力机制 YOLOv7 损失函数
在线阅读 下载PDF
复杂运动场景下的多人姿态估计研究
9
作者 柳长源 臧彦丞 兰朝凤 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第6期930-939,共10页
针对运动场景中运动员之间的相互遮挡、自身部位遮挡、运动器械遮挡及复杂背景干扰问题,提出一种高分辨特征生成复原网络,引入融合注意力机制筛选有用特征信息通道,加入反卷积和多尺度特征融合模块分层处理小目标人像与大中型目标人像... 针对运动场景中运动员之间的相互遮挡、自身部位遮挡、运动器械遮挡及复杂背景干扰问题,提出一种高分辨特征生成复原网络,引入融合注意力机制筛选有用特征信息通道,加入反卷积和多尺度特征融合模块分层处理小目标人像与大中型目标人像的姿态估计任务。设计生成对抗模块,对缺失部分进行补全和预测得到关节点热图,经过姿态骨架和最优匹配算法确定出关节点连接方式,并输出可视化姿态估计结果。在MSCOCO和Crowd Pose数据集上的实验结果表明该姿态估计方法在复杂运动场景下效果更优。 展开更多
关键词 人体姿态估计 深度学习 复杂运动场景 融合注意力机制 生成对抗网络
在线阅读 下载PDF
基于高斯密度图的自然场景中文文字检测
10
作者 王昌波 仝明磊 《电子设计工程》 2023年第18期168-173,共6页
自然场景下中文文字检测任务字符面积较小且文字背景复杂,为此,该文提出了一种基于高斯密度图作为分割区域标签的文字检测改进方法。将文本区域标注从矩形框改变为高斯分布区域标签,在特征融合部分引入了交叉通道融合注意力机制,以提高... 自然场景下中文文字检测任务字符面积较小且文字背景复杂,为此,该文提出了一种基于高斯密度图作为分割区域标签的文字检测改进方法。将文本区域标注从矩形框改变为高斯分布区域标签,在特征融合部分引入了交叉通道融合注意力机制,以提高网络的收敛性能,提出像素值一维投影法解决了文字密集区域输出的高斯密度图在不同标签区域出现重叠的问题。经过实验验证,该文方法对中文文字检测有较好的结果,证明了该方法的有效性。 展开更多
关键词 文字检测 高斯密度图标签 交叉通道融合注意力机制 一维投影
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部