期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于卷积神经网络和混合注意力机制的书标检测算法 被引量:2
1
作者 张岩 赵蒙蒙 +1 位作者 孙英伟 常艳康 《山东科技大学学报(自然科学版)》 CAS 北大核心 2023年第3期94-102,共9页
为实现图书馆中机器人智能排架,提出一种基于卷积神经网络和混合注意力机制的书标检测模型。将DenseNet121引入YOLOv4以提高特征和梯度之间的传递效率,利用SPDC模块实现局部和全局特征融合,进而通过通道和空间混合注意力提高模型的特征... 为实现图书馆中机器人智能排架,提出一种基于卷积神经网络和混合注意力机制的书标检测模型。将DenseNet121引入YOLOv4以提高特征和梯度之间的传递效率,利用SPDC模块实现局部和全局特征融合,进而通过通道和空间混合注意力提高模型的特征表征能力。实验结果表明,模型的平均准确率、整体性能、参数量和模型大小均优于对比方法,且易于部署到嵌入式设备中实现在线检测,从而提高图书乱架治理的智能化水平。 展开更多
关键词 卷积神经网络 混合注意力机制 书标 目标检测 智慧图书馆
在线阅读 下载PDF
融合细节特征与混合注意力机制的火灾烟雾检测 被引量:5
2
作者 汪睿卿 王慧琴 王可 《液晶与显示》 CAS CSCD 北大核心 2022年第7期900-912,共13页
针对卷积神经网络高层特征图中细节特征被削弱造成烟雾图像底层特征丢失的问题,提出一种融合细节特征与混合注意力机制的YOLOv4改进算法。设计了细节特征融合模块,将主干网络中的底层细节特征引入高层特征图,得到具有丰富多尺度信息的... 针对卷积神经网络高层特征图中细节特征被削弱造成烟雾图像底层特征丢失的问题,提出一种融合细节特征与混合注意力机制的YOLOv4改进算法。设计了细节特征融合模块,将主干网络中的底层细节特征引入高层特征图,得到具有丰富多尺度信息的融合特征。在通道和空间维度上采用混合注意力机制对融合特征的图权重进行重新赋值,在增强烟雾目标特征的同时抑制无关区域特征,使烟雾特征表达具有更好的鲁棒性。实验结果表明,本文算法的平均精确率、精确率和召回率相比YOLOv4算法分别提高了4.31%,1.21%,9.86%,同时保持了较快的检测速度。本文算法能够有效提取烟雾目标的整体特征,对于复杂背景下的火灾烟雾检测任务更为适用。 展开更多
关键词 烟雾检测 深度学习 YOLOv4算法 特征融合 混合注意力机制
在线阅读 下载PDF
基于混合注意力机制和深度学习的大坝变形预测模型 被引量:13
3
作者 向镇洋 包腾飞 +2 位作者 白妍丽 宋宝钢 王瑞婕 《水利水电科技进展》 CSCD 北大核心 2023年第2期96-101,共6页
为深度挖掘时序数据中前后信息的动态相关性,探究大坝变形的内在影响机理,有效提高模型预测精度,构建了一种基于混合注意力机制与鲸鱼优化算法(WOA)的双向门控循环网络(BiGRU)预测模型。模型利用WOA对BiGRU进行超参数寻优以有效挖掘变... 为深度挖掘时序数据中前后信息的动态相关性,探究大坝变形的内在影响机理,有效提高模型预测精度,构建了一种基于混合注意力机制与鲸鱼优化算法(WOA)的双向门控循环网络(BiGRU)预测模型。模型利用WOA对BiGRU进行超参数寻优以有效挖掘变形数据在时间维度的深层信息,并引入融合特征注意力(FATT)和时间注意力(TATT)的混合注意力机制计算各影响因子的贡献率,使模型可视化并提高模型捕捉环境因素动态变化的能力。以某高拱坝为例,将该模型预测结果与多种常用模型预测结果进行对比分析,结果表明该模型预测精度显著提升,贡献率计算符合大坝变形研究成果,验证了模型在大坝变形预测中的优越性与合理性。 展开更多
关键词 大坝变形预测 深度学习 混合注意力机制 鲸鱼优化算法
在线阅读 下载PDF
基于混合注意力机制的中文文本蕴含识别方法 被引量:1
4
作者 黄生斌 肖诗斌 +1 位作者 都云程 施水才 《北京信息科技大学学报(自然科学版)》 2020年第3期89-93,98,共6页
将注意力机制应用于中文文本蕴含识别研究,提出了一种基于混合注意力机制的中文文本蕴含识别方法。为使模型能捕获文本间更丰富的语义信息,利用混合注意力机制获取文本词语级别和句子级别的语义信息,将不同级别的语义信息进行融合后对... 将注意力机制应用于中文文本蕴含识别研究,提出了一种基于混合注意力机制的中文文本蕴含识别方法。为使模型能捕获文本间更丰富的语义信息,利用混合注意力机制获取文本词语级别和句子级别的语义信息,将不同级别的语义信息进行融合后对文本蕴含关系进行识别,提高了模型识别中文蕴含关系的准确性。模型的输入阶段采用了BERT字向量,提高了模型的泛化能力。该方法在CCL2018(第十七届中国计算语言学大会)中文文本蕴含识别测评任务验证集上准确率达80.38%,实验结果表明了该方法的有效性。 展开更多
关键词 中文文本蕴含 深度学习 混合注意力机制
在线阅读 下载PDF
非受控环境下基于混合注意力机制的面部表情识别
5
作者 张宁 穆静 +2 位作者 钱智哲 张洁 郭岱朋 《西安工业大学学报》 CAS 2023年第5期495-502,共8页
针对非受控环境下的面部表情识别过程中特征提取不充分的问题,构建了一个加强特征提取的网络结构——3_M_S_MobileNetV2模型,该结构以MobileNetV2为基础网络,结合自主设计的混合注意力模块3_M_CBAM,并且将ReLU6激活函数更换为SiLU激活... 针对非受控环境下的面部表情识别过程中特征提取不充分的问题,构建了一个加强特征提取的网络结构——3_M_S_MobileNetV2模型,该结构以MobileNetV2为基础网络,结合自主设计的混合注意力模块3_M_CBAM,并且将ReLU6激活函数更换为SiLU激活函数设计而成。在两个非受控环境下所采集的数据集RAF_DB和Fer2013上对设计的模型进行实验,识别准确率分别达到81.88%和65.65%,并且与现有的基于神经网络的识别方法相比,在RAF_DB数据集和Fer2013数据集上的面部表情识别准确率分别提高了1%~9%、0.5%~4%,证明了文中网络结构的有效性。 展开更多
关键词 人脸表情识别 非受控环境 混合注意力机制 特征提取
在线阅读 下载PDF
基于多尺度卷积和混合注意力机制的情绪脑电识别研究 被引量:2
6
作者 陶勇 龙多 《长春工业大学学报》 CAS 2023年第1期15-24,共10页
建立了基于深度学习框架的情绪识别模型——M-Attention-EmotionNet。采用多尺度卷积提取不同尺度的特征。为避免特征冗余,引入了混合域注意力机制,从通道和空间两个维度对特征进行赋权。在DEAP数据集上,首先提取预处理后脑电信号不同... 建立了基于深度学习框架的情绪识别模型——M-Attention-EmotionNet。采用多尺度卷积提取不同尺度的特征。为避免特征冗余,引入了混合域注意力机制,从通道和空间两个维度对特征进行赋权。在DEAP数据集上,首先提取预处理后脑电信号不同频带的功率谱密度特征作为模型的输入,然后被分类。实验结果表明,该模型在唤醒和效价两个维度上分类准确率分别为95.64%和96.49%,同时,在四分类和八分类的细粒度情感分类上,平均准确率分别为90.89%和89.22%。 展开更多
关键词 功率谱密度 多尺度卷积 混合注意力机制
在线阅读 下载PDF
采用混合域注意力机制的无人机识别方法 被引量:8
7
作者 薛珊 卫立炜 +1 位作者 顾宸瑜 吕琼莹 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第10期141-150,共10页
针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(... 针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。 展开更多
关键词 无人机 声音识别 对数梅尔谱图 神经网络 混合注意力机制
在线阅读 下载PDF
基于混合域注意力机制的服装关键点定位及属性预测算法 被引量:3
8
作者 雷冬冬 王俊英 +2 位作者 董方敏 臧兆祥 聂雄锋 《东华大学学报(自然科学版)》 CAS 北大核心 2022年第4期28-35,共8页
针对服装形变和模特复杂姿态影响服装视觉分析准确率的问题,提出一个基于混合域注意力机制的服装关键点定位与属性预测算法,该算法利用循环十字交叉注意力(recurrent criss-cross attention,RCCA)模块得到服装图像的每个像素的上下文信... 针对服装形变和模特复杂姿态影响服装视觉分析准确率的问题,提出一个基于混合域注意力机制的服装关键点定位与属性预测算法,该算法利用循环十字交叉注意力(recurrent criss-cross attention,RCCA)模块得到服装图像的每个像素的上下文信息,从而捕获服装关键点之间潜在的空间几何关系,再融合服装图像的空间联系和通道交互信息来获得更好的服装关键点定位和属性预测效果。服装的空间特征由空间注意力分支网络在关键点热图的基础上学习得到,而通道交互信息通过局部跨通道交互策略生成通道注意力来捕获。试验结果表明,所提算法降低了服装关键点定位的归一化误差,并在一定程度上提高了服装的分类与属性预测效果。 展开更多
关键词 服装关键点定位 属性预测 混合注意力机制 非局部空间连接 局部跨通道交互
在线阅读 下载PDF
基于混合注意力及自适应多尺度的语义分割算法研究 被引量:1
9
作者 赵松璞 郑翔 +3 位作者 彭志远 赵昕 梁洪军 杨利萍 《无线电工程》 北大核心 2023年第7期1563-1571,共9页
为提升语义分割网络特征提取的有效性以及尺度不变性,提出了一种基于混合注意力机制和多尺度特征自适应融合的轻量级语义分割算法。算法采用颜色空间转化、边缘提取以及灰度化等图像预处理方法增强输入图像信息;利用深度可分离卷积、池... 为提升语义分割网络特征提取的有效性以及尺度不变性,提出了一种基于混合注意力机制和多尺度特征自适应融合的轻量级语义分割算法。算法采用颜色空间转化、边缘提取以及灰度化等图像预处理方法增强输入图像信息;利用深度可分离卷积、池化和H-Swish激活结合残差结构逐步提取目标局部和全局特征,并设计混合注意力机制从最大、均值和标准差等角度分别捕获特征通道及空间位置的全局上下文信息,使网络聚焦目标关联特征,降低背景信息干扰;针对不同大小目标,引入了多尺度特征自适应加权融合结构,以自主选择的方式来避免各尺度目标特征相互影响。通过在标准、仿真以及实际场景数据集上的实验结果表明,所提方法有效提升了特征多样性以及关键特征的贡献,保障了多尺度目标准确识别,并能较好地应用于实际场景中,高效实现语义分割任务。 展开更多
关键词 语义分割 图像预处理 混合注意力机制 自适应多尺度融合
在线阅读 下载PDF
基于混合域注意力YOLOv4的输送带纵向撕裂多维度检测 被引量:7
10
作者 李飞 胡坤 +2 位作者 张勇 王文善 蒋浩 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第11期2156-2167,共12页
针对输送带纵向撕裂目标检测维度单一、模型复杂度高等问题,提出一种高效的MobileNetv3及YOLOv4集成网络输送带纵向撕裂多维度实时检测方法.基于YOLOv4目标识别算法,通过将轻量化网络Mobile-Netv3代替CSPDarknet53作为骨干网络,结合高... 针对输送带纵向撕裂目标检测维度单一、模型复杂度高等问题,提出一种高效的MobileNetv3及YOLOv4集成网络输送带纵向撕裂多维度实时检测方法.基于YOLOv4目标识别算法,通过将轻量化网络Mobile-Netv3代替CSPDarknet53作为骨干网络,结合高效通道域ECA模块和空间域注意力机制(STNet)构建混合域注意力网络(ECSNet),改进了MobileNetv3嵌入ECSNet,并且提升了模型对空间和通道的关注度.引入深度可分离卷积块代替网络中3*3卷积,并将YOLOv4的检测头(Prediction Heads)缩减为2种尺度,轻量化模型降低网络复杂度和训练难度,完成ECSMv3_YOLOv4模型的搭建,使用K-means聚类6个Anchors预测目标框高宽,提高网络对表面撕裂的检测性能.研制带式输送机多维度智能巡检样机,采集制作输送带多维度面的纵向撕裂数据集,开展网络模型的训练、测试、识别和定位实验.结果表明,提出算法在测试集中的平均识别准确率为97.8%,识别速度为37帧/s,模型的计算量和参数量为4.882 G和8.851 M,通过试验不同的网络模型效果和改变光照强度,该方法体现出检测精度高、速度快和轻量化等优点,具备更强的适应性和抗干扰能力. 展开更多
关键词 纵向撕裂 多维度检测 MobileNetv3 混合注意力机制 YOLOv4 轻量化
在线阅读 下载PDF
基于注意力机制的航拍图像实时语义分割方法 被引量:3
11
作者 袁旭亮 王娟 +3 位作者 武明虎 郭力权 刘子杉 陈关海 《激光杂志》 CAS 北大核心 2023年第1期122-129,共8页
目前语义分割网络存在推理速度慢、轮廓信息缺失和语义信息不充足的问题,使其不适用于航拍图像的语义分割。提出一种交叉注意力混合机制和金字塔注意力机制的解码网络用于航拍图像语义分割。首先,采用MobileNetV2为骨干网络提高实时性... 目前语义分割网络存在推理速度慢、轮廓信息缺失和语义信息不充足的问题,使其不适用于航拍图像的语义分割。提出一种交叉注意力混合机制和金字塔注意力机制的解码网络用于航拍图像语义分割。首先,采用MobileNetV2为骨干网络提高实时性推理速度;其次,提出交叉注意力混合机制解决轮廓信息缺失的问题;再次,提出金字塔注意力机制消除卷积神经网络无法捕获长范围语义信息的局限性。最后,实验结果表明,该文网络在单张GTX 3090卡,分辨率为256×256×3的DLRSD(Dense Labeling Remote Sensing Dataset)数据集中,获取73.4%的平均交并比和85.4%的像素精度,实现了196.9帧每秒的推理速度。 展开更多
关键词 航拍图像语义分割 实时语义分割 金字塔注意力机制 交叉注意力混合机制
在线阅读 下载PDF
大数据驱动的非球面光学表面缺陷检测研究
12
作者 彭雪梅 黄建军 《激光杂志》 北大核心 2025年第4期252-256,共5页
光学技术的快速发展使非球面光学元件在成像、通信等领域的应用日益广泛,其表面缺陷检测成为确保产品质量的关键环节。为满足更高精度的检测需求,设计了大数据驱动的非球面光学表面缺陷检测方法。在大数据驱动下,设计非球面光学表面图... 光学技术的快速发展使非球面光学元件在成像、通信等领域的应用日益广泛,其表面缺陷检测成为确保产品质量的关键环节。为满足更高精度的检测需求,设计了大数据驱动的非球面光学表面缺陷检测方法。在大数据驱动下,设计非球面光学表面图像采集装置,由显微光学成像系统、分光棱镜、光纤照明、机械调整台、电动转台构成,实施非球面光学表面图像的大数据采集。在大数据驱动下,采用小波阈值去噪方法对采集的非球面光学表面缺陷图像实施去噪处理。选定YOLOv3作为基础架构,对三个方向实施针对性改进,通过改进后的YOLOv3模型实现非球面光学表面缺陷检测。测试结果表明,所设计的方法对于5种实验元件的表面缺陷平均尺寸测量偏差较低,尤其是对于抛光非球面棱镜的表面缺陷,其平均尺寸测量偏差最低。此外,该方法对于五种实验元件的表面伪缺陷响应系数较低,意味着它不容易受到伪缺陷的影响。 展开更多
关键词 大数据技术 非球面光学元件 表面缺陷检测 改进YOLOv3模型 CBAM混合注意力机制
在线阅读 下载PDF
基于改进YOLOv8n的井下人员多目标检测
13
作者 问永忠 贾澎涛 +2 位作者 夏敏高 张龙刚 王伟峰 《工矿自动化》 北大核心 2025年第1期31-37,77,共8页
针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSE... 针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSEAM),以增强对遮挡目标的检测性能;在C2f模块中引入混合局部通道注意力(MLCA)机制,构建C2f-MLCA模块,以融合局部和全局特征信息,提高特征表达能力;在Head层检测头中嵌入自适应空间特征融合(ASFF)模块,以增强对小尺度目标的检测性能。实验结果表明:(1)与Faster R-CNN,SSD,RT-DETR,YOLOv5s,YOLOv7等主流模型相比,YOLOv8n-MSMLAS综合性能表现最佳,mAP@0.5和mAP@0.5:0.95分别达到93.4%和60.1%,FPS为80.0帧/s,参数量为5.80×106个,较好平衡了模型的检测精度和复杂度。(2)YOLOv8n-MSMLAS在光照不均、目标尺度不一致、遮挡等条件下表现出较好的检测性能,适用于现场检测。 展开更多
关键词 煤矿井下危险区域 井下人员多目标检测 YOLOv8n 多尺度空间增强注意力机制 自适应空间特征融合 轻量化混合局部通道注意力机制
在线阅读 下载PDF
一种改进多尺度特征融合的交通标志识别算法 被引量:1
14
作者 余翔 靳闪闪 杨路 《电讯技术》 北大核心 2024年第12期1955-1962,共8页
为了进一步提高在背景复杂且目标距离远的情况下交通标志识别算法的识别准确率,在YOLOv5s算法的基础上提出了一种改进的交通标志识别算法MAFM-YOLO。首先,在颈部网络设计了基于空洞混合注意力机制的多尺度注意力特征融合模块,使网络在... 为了进一步提高在背景复杂且目标距离远的情况下交通标志识别算法的识别准确率,在YOLOv5s算法的基础上提出了一种改进的交通标志识别算法MAFM-YOLO。首先,在颈部网络设计了基于空洞混合注意力机制的多尺度注意力特征融合模块,使网络在特征融合阶段能够高效保留图像中的细节信息,对小目标更加的敏感。其次,在回归阶段采用归一化Wasserstein距离改进原有的损失函数,提高了边界框的回归性能,从而进一步提高网络的识别性能。在TT100K数据集上的实验结果表明,MAFM-YOLO较基准模型在精确率、召回率和平均精度均值上分别实现了9.4%、3.3%、6.3%的提升。 展开更多
关键词 交通标志识别 YOLOv5s 多尺度特征融合 混合注意力机制 归一化Wasserstein距离
在线阅读 下载PDF
改进型YOLOv8融合关键点的跌倒检测算法
15
作者 王小鹏 石欢 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第5期149-164,共16页
针对传统跌倒检测算法在特征提取不充分、跌倒判决方法单一以及实时性不强的问题,提出一种改进型YOLOv8结合人体骨骼关键点的跌倒检测算法。首先,算法通过ShuffleNetV2网络替换原有YOLOv8的Darknet-53主干网络,在颈部增加混合注意力机制... 针对传统跌倒检测算法在特征提取不充分、跌倒判决方法单一以及实时性不强的问题,提出一种改进型YOLOv8结合人体骨骼关键点的跌倒检测算法。首先,算法通过ShuffleNetV2网络替换原有YOLOv8的Darknet-53主干网络,在颈部增加混合注意力机制(Shuffle Attention,SA),使得网络能够更好地提取人体的行为特征,实现人体静态姿势匹配。其次,分析人体动态行为的骨骼关键点位置变化信息,将人体质心下降速度、人体躯干与地面间的夹角变化速度和人体的高宽比三者共同作为跌倒行为的判决依据,提高跌倒判决的准确率。实验结果表明,该算法在COCO Key Points数据集上的检测精度、F1值和mAP50值分别为78.3%、67.9%和70.0%,在UR Fall Detection、Fall Detection Datasets和自建数据集上的检测准确率分别为95.85%、92.8%和96.52%,在区分日常生活行为和跌倒行为方面优于传统算法。 展开更多
关键词 跌倒检测 骨骼关键点 YOLOv8 混合注意力机制
在线阅读 下载PDF
基于改进Swin-Transformer的农村路面裂缝检测算法 被引量:1
16
作者 李禹萱 宋伟东 +1 位作者 孙尚宇 张晋赫 《北京交通大学学报》 CSCD 北大核心 2024年第5期88-97,共10页
裂缝作为农村道路病害的主要组成部分,在检测过程中易受到路面阴影、杂草、泥土等干扰因素的影响,导致基于路面图像的自动化检测变得更加困难.为解决这一问题,提出一种基于Swin-Transformer主干网络的农村道路裂缝检测(Swin-Transformer... 裂缝作为农村道路病害的主要组成部分,在检测过程中易受到路面阴影、杂草、泥土等干扰因素的影响,导致基于路面图像的自动化检测变得更加困难.为解决这一问题,提出一种基于Swin-Transformer主干网络的农村道路裂缝检测(Swin-Transformer Rural road Crack Detection,S-TRCD)模型.针对模型在裂缝特征提取过程中受到周围干扰物影响导致识别精度降低的问题,设计一种自适应的混合注意力机制模块CAS(Channel and Spatial),该模块能够在空间和通道两个维度上调整裂缝的权重,提高检测模型的抗干扰能力;针对多个裂缝在同一图像上尺寸差异较大导致识别困难的问题,改进了一种带注意力机制的多尺度目标检测头AHead(Attention Head),该检测头可以自适应调整网络感受野,实现多尺度的裂缝检测.为验证S-TRCD检测模型的检测性能,制作农村路病害基准数据集LNTU_RDD_NC,并对S-TRCD检测模型以及路面裂缝检测领域常用的改进YOLOv5、Faster R-CNN、YOLOv8检测模型进行训练.实验结果表明:S-TRCD检测模型在农村路面裂缝检测中较改进YOLOv5、Faster R-CNN、YOLOv8检测模型平均识别精度分别高4.06%、12.12%、2.84%,证明在农村路面裂缝检测领域中,S-TRCD检测模型具有较好的检测性能. 展开更多
关键词 裂缝检测 深度学习 农村道路 多尺度特征 混合注意力机制
在线阅读 下载PDF
基于扩散模型的人脸图像修复技术 被引量:2
17
作者 郭庚辰 姚剑敏 +2 位作者 严群 林智贤 刘德崇 《信息技术与信息化》 2024年第3期200-203,共4页
人脸作为人体信息最为密集的部位,人脸图像在各个研究领域都有不可替代的作用。因此,研究如何将遮挡或模糊的人脸图像恢复成真实图像是非常有意义的。针对人脸图像修复技术的研究,提出基于扩散模型的人脸图像修复技术。在现有的人脸图... 人脸作为人体信息最为密集的部位,人脸图像在各个研究领域都有不可替代的作用。因此,研究如何将遮挡或模糊的人脸图像恢复成真实图像是非常有意义的。针对人脸图像修复技术的研究,提出基于扩散模型的人脸图像修复技术。在现有的人脸图像修复技术基础上,解决在修复大区域破损或遮挡的情况下,修复图像出现纹理模糊及结构扭曲等问题。所提出的方法基于边缘引导的扩散模型图像修复网络,主要包括两个阶段:首先训练基于U-Net结构的边缘修复模型生成较为真实的缺失区域的边缘信息,然后根据已修复好的边缘信息,训练内容生成模型填充缺失部分的内容信息。实验证明对于人脸图像修复具有较好的效果。 展开更多
关键词 扩散模型 人脸补全 注意力机制 图像修复 边缘引导 混合注意力机制
在线阅读 下载PDF
基于改进Mask R-CNN模型的粘连烟丝识别方法
18
作者 张伟伟 姬远鹏 +5 位作者 元春波 王君婷 齐晓任 张卫正 李萌 饶智 《轻工学报》 CAS 北大核心 2024年第5期78-85,共8页
为精准识别并高效分割粘连烟丝,提出一种基于改进掩码区域卷积神经网络模型(Mask R-CNN)的粘连烟丝识别方法。首先,采集粘连烟丝图像,通过图像增强操作将数据集扩充到训练模型所需的样本数量;其次,在Mask R-CNN模型的基础上对训练样本... 为精准识别并高效分割粘连烟丝,提出一种基于改进掩码区域卷积神经网络模型(Mask R-CNN)的粘连烟丝识别方法。首先,采集粘连烟丝图像,通过图像增强操作将数据集扩充到训练模型所需的样本数量;其次,在Mask R-CNN模型的基础上对训练样本中的粘连烟丝图像进行边缘特征提取、分形特征提取,获得更清晰、连续的图像边缘特征信息和纹理特征信息;再次,将原始特征、边缘特征、分形特征进行融合以充分利用不同层次的特征信息,丰富底层特征;最后,通过引入混合注意力机制关注特征图的通道和空间维度,从而提高粘连烟丝识别的效率和准确性。模型性能对比结果表明:基于改进Mask R-CNN模型的识别方法的平均交并比(Avg.MIoU)为85.29%,类别平均像素准确率(Avg.MPA)为84.33%,其能够快速、准确地识别并分割出单根烟丝,识别效果优于Mask R-CNN和DeepLabV3+模型识别方法,可为后续烟丝宽度检测提供技术支持。 展开更多
关键词 粘连烟丝 改进Mask R-CNN模型 边缘特征提取 特征融合 混合注意力机制
在线阅读 下载PDF
改进2D-CNN的永磁同步电机故障诊断分析
19
作者 毛念玲 陈辉 《兰州工业学院学报》 2024年第2期7-12,共6页
针对卷积神经网络在噪声环境中特征提取能力不足,导致永磁同步电机故障诊断出现准确率低、泛化能力差的问题,提出了一种改进二维卷积神经网络与混合注意力机制的故障诊断方法。该方法首先将采集的一维时序信号转换为二维灰度图;其次,改... 针对卷积神经网络在噪声环境中特征提取能力不足,导致永磁同步电机故障诊断出现准确率低、泛化能力差的问题,提出了一种改进二维卷积神经网络与混合注意力机制的故障诊断方法。该方法首先将采集的一维时序信号转换为二维灰度图;其次,改进多尺度特征提取模块,将该模块部分普通卷积替换为空洞卷积,以最大程度地提取到数据信号中的有效信息;然后引入混合注意力机制动态更新权重参数,强化故障特征,抑制噪声的干扰;最后使用分类器进行匝间短路故障诊断。实验结果表明:与其他方法相比,文中模型具有更好的准确性和鲁棒性;在各噪声背景下,本模型的准确率均在96%以上,表明所提方法具有较强的抗噪性能和泛化能力。 展开更多
关键词 电机匝间短路 故障诊断 卷积神经网络 混合注意力机制
在线阅读 下载PDF
融合深度学习与AM的资源数据智能校核技术
20
作者 徐声龙 于聪 +2 位作者 时雨欣 杨柳 胡振 《电子设计工程》 2024年第19期11-15,共5页
在对各类资源数据进行智能校核的过程中,传统算法存在对数据量依赖性强、数据特征敏感度高的缺点。对此,文中提出了一种融合深度学习与注意力机制的改进算法。该算法针对电网人力资源数据集存在的特征维度多、原始数据特征易缺失的特点... 在对各类资源数据进行智能校核的过程中,传统算法存在对数据量依赖性强、数据特征敏感度高的缺点。对此,文中提出了一种融合深度学习与注意力机制的改进算法。该算法针对电网人力资源数据集存在的特征维度多、原始数据特征易缺失的特点,使用KNN对数据缺失的属性进行补偿以提升数据质量,通过引入Wasserstein距离改进了对抗神经网络,以此使得少量数据集也同样能够实现较优的训练效果。采用混合注意力机制对数据特征权重加以训练,有效提升了模型的核验精度及效率。实验测试结果表明,所提算法的数据准确率均在77%以上,在对比算法中最优,具有较强的数据核验能力。 展开更多
关键词 对抗神经网络 混合注意力机制 K近邻算法 数据特征 数据校核
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部