期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
融合邻域注意力和状态空间模型的医学视频分割算法
1
作者 丁建睿 张听 +1 位作者 刘家栋 宁春平 《电子与信息学报》 北大核心 2025年第5期1582-1595,共14页
在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过... 在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过两阶段的精心设计,显著提升了分割性能:第1阶段,通过深度卷积网络捕获低层次的空间语义信息,并借助邻域注意力机制,挖掘相邻帧间的局部时序语义关联。第2阶段,引入状态空间模型来捕捉全面的时序信息,并再次应用邻域注意力模块,进一步增强对局部时序特征的敏感度。该方法不仅有效整合了视频中丰富的时序信息,而且在局部和全局层面上实现了空间与时间特征的协同优化。相较于使用具有2次计算复杂度的自注意力机制,该文采用了具有线性计算复杂度的状态空间模型,显著提升了模型的训练效率和推理速度。所提算法在甲状腺超声视频数据集以及结肠息肉视频数据集CVC-ClinicDB和CVC-ColonDB上的交并比(IOU)指标分别达到了72.7%,82.3%和72.5%,相比该文的基线模型Vivim分别提高了5.7%,1.7%和5.5%。此外,消融实验进一步揭示了邻域注意力模块和状态空间模型在提取时序信息中发挥的关键作用。 展开更多
关键词 医学视频分割 邻域注意力机制 状态空间模型
在线阅读 下载PDF
基于时空图注意力状态空间模型的人体姿态异常检测研究
2
作者 李航 陈志刚 +3 位作者 王易杰 张心宇 雷惊鸿 刘凌枫 《计算机工程与科学》 北大核心 2025年第10期1830-1840,共11页
视频异常检测在公共安防、交通和医疗等领域应用广泛,人体姿态异常检测存在易受环境影响、骨架时序难处理、计算复杂度高和运动区域的局部重要特征易忽略等问题。为解决上述问题,提出了一种新的基于人体骨架的时空图正则化流混合注意力... 视频异常检测在公共安防、交通和医疗等领域应用广泛,人体姿态异常检测存在易受环境影响、骨架时序难处理、计算复杂度高和运动区域的局部重要特征易忽略等问题。为解决上述问题,提出了一种新的基于人体骨架的时空图正则化流混合注意力状态空间模型STG-FAM。该模型通过在时空图卷积网络中引入选择性状态空间模型和正则化流,有效捕获骨架时序中的时间动态特征,利用混合注意力机制学习跨通道域和空间域的注意力权重,增强模型对时序骨架关键节点与时空边的关注,提升模型表征能力和异常检测能力。通过在2个视频异常检测数据集ShanghaiTech Campus和UBnormal上进行验证,表明了所提模型的有效性。 展开更多
关键词 视频异常检测 人体骨架 图神经网络 状态空间模型 注意力机制
在线阅读 下载PDF
融合多尺度与坐标注意力的城市扩张模拟
3
作者 孙令博 刘明皓 +2 位作者 罗庆喜 许汀汀 陈春 《西南大学学报(自然科学版)》 CAS 北大核心 2025年第2期145-159,共15页
针对基于机器学习的元胞自动机在土地覆被变化模拟中存在的尺度效应和非平稳性特征提取不充分等问题,构建了ASPP(空洞空间金字塔池化)-CRA(坐标注意力)Unet-CARS(基于多类随机斑块种子)耦合模型。以成渝地区双城经济圈2012、2016、2020... 针对基于机器学习的元胞自动机在土地覆被变化模拟中存在的尺度效应和非平稳性特征提取不充分等问题,构建了ASPP(空洞空间金字塔池化)-CRA(坐标注意力)Unet-CARS(基于多类随机斑块种子)耦合模型。以成渝地区双城经济圈2012、2016、2020年实际城市土地利用变化数据为例,设计2组实验验证了模型的性能,并将其应用于预测2024年及2028年的城市扩张模式。通过模型对比结果显示,ASPP-CRAUnet-CARS模型的Kappa值为0.9123,FoM值为0.4142,Kappa值分别比RF-CMCNN-CA模型和UMCNN-CA模型的高出0.0208和0.0342,FoM值则分别提升了0.0306和0.0679。消融实验表明:去除ASPP和CRA模块后Kappa值与FoM值均有所下降。研究结果表明:ASPP-CRAUnet-CARS模型融合了传统元胞自动机和深度学习模型的双重优势,能较好地学习到城市发展中的复杂空间特征,改善了空间非平稳性建模效果,有效提高了模拟精度。 展开更多
关键词 ASPP-CRAUnet-CARS模型 多尺度特征 注意力机制 空间非平稳性
在线阅读 下载PDF
基于潜在因子模型在子空间上的缺失值注意力聚类算法
4
作者 王啸飞 鲍胜利 陈炯环 《计算机应用》 CSCD 北大核心 2023年第12期3772-3778,共7页
针对传统聚类算法在对缺失样本进行数据填充过程中存在样本相似度难度量且填充数据质量差的问题,提出一种基于潜在因子模型(LFM)在子空间上的缺失值注意力聚类算法。首先,通过LFM将原始数据空间映射到低维子空间,降低样本的稀疏程度;其... 针对传统聚类算法在对缺失样本进行数据填充过程中存在样本相似度难度量且填充数据质量差的问题,提出一种基于潜在因子模型(LFM)在子空间上的缺失值注意力聚类算法。首先,通过LFM将原始数据空间映射到低维子空间,降低样本的稀疏程度;其次,通过分解原空间得到的特征矩阵构建不同特征间的注意力权重图,优化子空间样本间的相似度计算方式,使样本相似度的计算更准确、泛化性更好;最后,为了降低样本相似度计算过程中过高的时间复杂度,设计一种多指针的注意力权重图进行优化。在4个按比例随机缺失的数据集上进行实验。在Hand-digits数据集上,相较于面向高维特征缺失数据的K近邻插补子空间聚类(KISC)算法,在数据缺失比例为10%的情况下,所提算法的聚类准确度(ACC)提高了2.33个百分点,归一化互信息(NMI)提高了2.77个百分点,在数据缺失比例为20%的情况下,所提算法的ACC提高了0.39个百分点,NMI提高了1.33个百分点,验证了所提算法的有效性。 展开更多
关键词 潜在因子模型 缺失值 注意力机制 聚类算法 空间
在线阅读 下载PDF
注意力引导的多尺度红外行人车辆实时检测 被引量:2
5
作者 张印辉 计凯 +1 位作者 何自芬 陈光晨 《红外与激光工程》 EI CSCD 北大核心 2024年第5期229-239,共11页
红外成像技术通过捕捉目标热辐射特征进行成像,能实现复杂道路场景下的目标监测和道路冗杂信息滤除。针对红外行人和车辆目标检测模型参数量大、依赖高性能GPU资源和检测速度慢等问题,提出了一种注意力引导的多尺度红外行人车辆实时检... 红外成像技术通过捕捉目标热辐射特征进行成像,能实现复杂道路场景下的目标监测和道路冗杂信息滤除。针对红外行人和车辆目标检测模型参数量大、依赖高性能GPU资源和检测速度慢等问题,提出了一种注意力引导的多尺度红外行人车辆实时检测模型。首先,为精确匹配校准红外行人和车辆目标尺度与锚框尺寸,利用K-Means++算法对红外行人和车辆目标尺度进行先验框预置参数重聚类生成,并设计128×128精细尺度检测层;其次,设计注意力引导广域特征提取模块增强模型特征提取能力和空间及通道信息聚焦能力;随后,构建跨空间感知模块引入空间信息感知,强化不同尺度空间下的目标的特征表达能力;最后,针对资源受限设备,通过4倍通道剪枝方法降低模型参数量,增强移动端算法部署适应性。实验结果表明:所提IRDet算法与基准方法相比,模型平均检测精度提升4.3%,达到87.4%,模型权重值压缩60.4%,降至5.7 MB。 展开更多
关键词 红外交通检测 先验框匹配 注意力引导 空间感知 模型剪枝
在线阅读 下载PDF
API模型和新安江模型的参数区域化研究与应用 被引量:15
6
作者 姚成 邱桢毅 +2 位作者 李致家 胡维登 许洁 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期189-194,共6页
为了将API模型与新安江模型更好地应用于无资料地区,将API模型和新安江模型应用于大别山区及皖南山区的29个中小流域,对模型参数在研究区的区域规律进行研究,通过中小河流新建水文测站对参数区域化的成果进行实证研究。结果表明:API模... 为了将API模型与新安江模型更好地应用于无资料地区,将API模型和新安江模型应用于大别山区及皖南山区的29个中小流域,对模型参数在研究区的区域规律进行研究,通过中小河流新建水文测站对参数区域化的成果进行实证研究。结果表明:API模型与新安江模型均能较好地用于研究区中小流域的洪水模拟;逐步回归分析法能有效地推求模型的敏感参数;基于空间邻近与逐步回归分析相结合的参数区域化方法,API模型与新安江模型在新建水文测站次洪模拟中的平均确定性系数分别达到0.92和0.86,该方法能有效地推求研究区无资料流域API模型与新安江模型的参数。 展开更多
关键词 API模型 新安江模型 无资料地区 参数区域化 空间邻近法 逐步回归分析法 新建水文测站
在线阅读 下载PDF
基于自注意力对抗的深度子空间聚类 被引量:6
7
作者 尹明 吴浩杨 +1 位作者 谢胜利 杨其宇 《自动化学报》 EI CAS CSCD 北大核心 2022年第1期271-281,共11页
子空间聚类(Subspace clustering)是一种当前较为流行的基于谱聚类的高维数据聚类框架.近年来,由于深度神经网络能够有效地挖掘出数据深层特征,其研究倍受各国学者的关注.深度子空间聚类旨在通过深度网络学习原始数据的低维特征表示,计... 子空间聚类(Subspace clustering)是一种当前较为流行的基于谱聚类的高维数据聚类框架.近年来,由于深度神经网络能够有效地挖掘出数据深层特征,其研究倍受各国学者的关注.深度子空间聚类旨在通过深度网络学习原始数据的低维特征表示,计算出数据集的相似度矩阵,然后利用谱聚类获得数据的最终聚类结果.然而,现实数据存在维度过高、数据结构复杂等问题,如何获得更鲁棒的数据表示,改善聚类性能,仍是一个挑战.因此,本文提出基于自注意力对抗的深度子空间聚类算法(SAADSC).利用自注意力对抗网络在自动编码器的特征学习中施加一个先验分布约束,引导所学习的特征表示更具有鲁棒性,从而提高聚类精度.通过在多个数据集上的实验,结果表明本文算法在精确率(ACC)、标准互信息(NMI)等指标上都优于目前最好的方法. 展开更多
关键词 空间聚类 生成对抗网络 注意力模型 深度学习
在线阅读 下载PDF
基于用户关注空间与注意力分析的视频精彩摘要与排序 被引量:4
8
作者 黄庆明 郑轶佳 +1 位作者 蒋树强 高文 《计算机学报》 EI CSCD 北大核心 2008年第9期1612-1621,共10页
文中提出一种基于用户关注空间与注意力分析的视频内容理解方法,该方法可以有效地获得多通道的视频关注信息,并可使用户根据个性化需求定制视频关注内容,实现视频的高效浏览与访问.首先采用基于二叉层次型结构与分类器选择的音频分类算... 文中提出一种基于用户关注空间与注意力分析的视频内容理解方法,该方法可以有效地获得多通道的视频关注信息,并可使用户根据个性化需求定制视频关注内容,实现视频的高效浏览与访问.首先采用基于二叉层次型结构与分类器选择的音频分类算法将视频中的主要声音类型分类,然后将视频中影响用户注意力的视觉、听觉、时序因素定义为用户关注空间,分别使用相应的中层特征在这三个方面对用户注意力进行表示并计算其关注度,从而在音视频底层特征与高层认知之间建立有机过渡.作者设计了顺序决策融合算法来融合视觉与听觉关注度,生成关注度时序变化曲线并获得精彩摘要.最后使用支持向量回归模型并引入相关反馈机制来实现用户个性化的精彩片段排序.该项工作的特点是通过建立符合人类认知规律的关注度模型并结合相关反馈技术,对视频内容进行类人理解.实验证明,该方法对提取与生成符合用户个性化要求的视频摘要及排序结果具有良好的效果. 展开更多
关键词 用户关注空间 注意力分析 关注模型 音视频摘要 精彩排序
在线阅读 下载PDF
结合超轻量级双注意力模块的ShuffleNetV2面部表情识别 被引量:2
9
作者 林恩惠 王凡 谭晓玲 《电子测量技术》 北大核心 2024年第10期168-174,共7页
针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征... 针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征捕获与分类能力。此外,本文创新性地引入了一种超轻量级双注意力模块LDAM,该模块结合了DCAM注意力机制与空间注意力机制,并通过捷径连接技术集成到优化后的ShuffleNetV2模型中,以增强模型对细节特征的识别能力及分类效果。在FER2013和CK+两大公认的面部表情识别数据集上的实验结果显示,本方法分别达到了69.12%和94.77%的识别准确率,同时保持了低至1.25的模型参数量。这一成果不仅展示了在保持模型轻量化的同时提升识别性能的可能性,而且通过实验验证了所提出方法的高效性和实用性。 展开更多
关键词 面部表情识别方法的改进 激活函数 空间注意力机制 轻量化模型 超轻量级双注意力模块
在线阅读 下载PDF
采用注意力模型的多星交会序列优化方法 被引量:2
10
作者 严冰 张进 +1 位作者 罗亚中 朱阅訸 《宇航学报》 EI CAS CSCD 北大核心 2023年第11期1683-1692,共10页
针对强化学习方法能够实现组合优化问题从无序输入到有序输出的离散决策特点,提出一种基于注意力模型的单航天器对多目标交会的序列优化方法,以快速估计转移成本较低的交会序列和时间。通过拓展注意力的时间维度使得策略网络能够同时选... 针对强化学习方法能够实现组合优化问题从无序输入到有序输出的离散决策特点,提出一种基于注意力模型的单航天器对多目标交会的序列优化方法,以快速估计转移成本较低的交会序列和时间。通过拓展注意力的时间维度使得策略网络能够同时选择目标和时间,并设计启发因子引导注意力有侧重地分布于不同的交会时刻,然后基于带基线的REINFORCE算法对网络参数进行更新。将所提方法应用于轨道分布较为集中的10目标交会任务,所得序列成本相对于蚁群算法优化结果的平均误差为9.7%,且强化学习方法的计算时间极短,可用于多目标对多航天器的分组指派全局规划的底层评价。 展开更多
关键词 空间交会 多星交会 序列优化 强化学习 注意力模型
在线阅读 下载PDF
基于改进YOLOv8n算法的城市空间混行交通参与者检测模型
11
作者 周军超 陈鑫 +1 位作者 高建杰 章杰 《中国安全科学学报》 CSCD 北大核心 2024年第12期178-186,共9页
为提升智能网联汽车和交通监测系统对交通参与者的识别精度和检测速度,及时应对城市空间混行交通环境中的安全隐患,提出一种基于改进YOLOv8n算法的城市空间混行交通参与者检测模型。首先,在数据输入阶段利用几何变换和像素变换策略来防... 为提升智能网联汽车和交通监测系统对交通参与者的识别精度和检测速度,及时应对城市空间混行交通环境中的安全隐患,提出一种基于改进YOLOv8n算法的城市空间混行交通参与者检测模型。首先,在数据输入阶段利用几何变换和像素变换策略来防止过度拟合,提高鲁棒性和泛化性;其次,使用空间到深度的非跨行卷积(SPD-Conv)模块代替所有原始卷积层,提高对低分辨率小目标的特征提取能力;同时,在颈部网络融合结构中加入轻量级坐标注意力机制(CA)模块,在几乎不添加任何计算开销的同时提高对关键信息的识别精度;然后,用边界框损失函数有效交并比(EIoU)替代原损失函数,使模型获得更卓越的收敛速度与识别稳定性;最后,利用平台公开和自建融合的交通参与者数据集(BNS)进行消融和对比试验,运用自动驾驶试验平台进行实景实时检测。结果表明:相比于基线模型YOLOv8n,改进模型SEC-YOLO的每秒传输帧数(FPS)和平均精度均值(mAP)分别提高了7.3%和3.2%;与主流模型对比,mAP和FPS性能值最佳;在自动驾驶试验平台上的实景检测平均准确率为95%。SEC-YOLO算法模型对城市交通参与者的检测准确率更高,鲁棒性和实时性更强。 展开更多
关键词 YOLOv8n 空间混行 交通参与者 检测模型 空间到深度的非跨行卷积(SPD-Conv) 坐标注意力机制(CA)
在线阅读 下载PDF
低碳治理注意力对协同减排绩效的影响--基于中国城市空间面板数据 被引量:1
12
作者 吉治璇 张卓群 王谋 《企业经济》 北大核心 2023年第8期24-35,共12页
强有力的“双碳”目标离不开政府的高度重视。从空间视角探究低碳治理注意力对减排绩效的影响,对于协同推进区域降碳具有重要现实意义。本文基于2010—2019年中国城市面板数据,实证检验低碳治理注意力对城市碳排放的直接影响及空间溢出... 强有力的“双碳”目标离不开政府的高度重视。从空间视角探究低碳治理注意力对减排绩效的影响,对于协同推进区域降碳具有重要现实意义。本文基于2010—2019年中国城市面板数据,实证检验低碳治理注意力对城市碳排放的直接影响及空间溢出效应。研究结果表明:低碳治理注意力的增强能够显著降低城市人均碳排放,并存在空间溢出效应;技术要素的提升与外溢是协同减排的重要抓手,一方面降低能源碳强度直接促进碳减排,另一方面技术溢出在间接效应中起到强化调节作用。区域异质性表明:东部地区的低碳治理注意力能够发挥更加显著的协同减排效益。研究建议:将系统观贯穿城市碳减排的全过程,积极发挥政府低碳治理注意力的减排导向作用,以先进技术推动低碳发展,同时兼顾地区差异性。 展开更多
关键词 碳排放 低碳治理 政府注意力 空间杜宾模型 协同效益
在线阅读 下载PDF
基于改进轻量级MobileNet V2-DeepLab V3^(+)模型的恐龙谷环状地区土地利用分类
13
作者 任聪 甘淑 +2 位作者 袁希平 罗为东 朱智富 《兰州大学学报(自然科学版)》 北大核心 2025年第4期436-441,共6页
针对传统卷积神经网络模型对全局特征捕捉不足的缺陷,提出一种基于改进的DeepLab V3^(+)全局通道空间注意力模型.通过处理无人机影像数据,以轻量级网络MobileNet V2为主干网络,结合通道注意力、通道洗牌和空间注意力机制,增强了特征的... 针对传统卷积神经网络模型对全局特征捕捉不足的缺陷,提出一种基于改进的DeepLab V3^(+)全局通道空间注意力模型.通过处理无人机影像数据,以轻量级网络MobileNet V2为主干网络,结合通道注意力、通道洗牌和空间注意力机制,增强了特征的全局特征捕捉能力,有效提升了研究区的土地利用分类精度.在以专家经验构建的道路、耕地、草地等样本中进行对比实验,结果表明,该方法的平均准确率、平均召回率、平均F_(1)分数、平均交并比及К系数比原始DeepLab V3^(+)模型分别提高了1.90%、2.22%、2.22%、3.37%、2.74%,其分割效果相比其他模型,更加关注图像的全局特征,提升了对复杂纹理类别的识别精度. 展开更多
关键词 全局通道空间注意力 MobileNet V2网络 DeepLab V3^(+)模型 土地利用 语义分割
在线阅读 下载PDF
基于视觉注意机制的彩色图像显著性区域提取 被引量:8
14
作者 孟琭 《计算机应用研究》 CSCD 北大核心 2013年第10期3159-3161,共3页
图像显著性区域提取是计算机视觉处理的重要步骤。结合人类视觉心理、生理模型,提出一种基于视觉注意机制的彩色图像显著性区域提取模型。通过改进的分水岭算法对彩色图像进行预分割,从而将原图像分成若干子区域,在此基础上运用提出的... 图像显著性区域提取是计算机视觉处理的重要步骤。结合人类视觉心理、生理模型,提出一种基于视觉注意机制的彩色图像显著性区域提取模型。通过改进的分水岭算法对彩色图像进行预分割,从而将原图像分成若干子区域,在此基础上运用提出的区域化空间注意力模型对各个子区域进行显著图计算,得到最终的显著性区域提取结果。实验结果表明,提出的显著性区域提取算法可以很好地从彩色图像中得到与视觉注意机制相一致的结果,且满足实时性要求,与传统方法相比,算法提取的区域更完整、更准确。 展开更多
关键词 显著性区域提取 视觉注意机制 分水岭 区域化空间注意力模型
在线阅读 下载PDF
基于改进条件扩散模型的残简文字修复方法
15
作者 谭俊毅 陈炳权 +1 位作者 陈慧娟 荆博 《现代电子技术》 北大核心 2025年第17期61-67,共7页
由于秦简长期埋于地下,其表面受雨水侵蚀,因此在挖掘过程出现大量残简、断简。针对简牍上文字模糊不清、字体结构信息缺失的问题,文中提出一种基于改进条件扩散模型的残简文字修复方法,通过优化噪声估计网络,捕获秦简文字的全局结构信... 由于秦简长期埋于地下,其表面受雨水侵蚀,因此在挖掘过程出现大量残简、断简。针对简牍上文字模糊不清、字体结构信息缺失的问题,文中提出一种基于改进条件扩散模型的残简文字修复方法,通过优化噪声估计网络,捕获秦简文字的全局结构信息和局部纹理细节,从而得到更好的图像修复效果。在优化网络中,首先,引入一个双信息输入的空间通道重建残差模块,提高修复的纹理清晰度;其次,引入全局上下文网络(GCNet),将局部纹理特征传播到全局,解决相隔较远文字像素间依赖关系较弱的问题,使修复后的文字结构更加完整。在自制秦简文字数据集上与其他图像修复模型进行比较,仿真结果表明:所提方法在主观视觉上达到了较好的效果,峰值信噪比和结构相似性分别达到了34.12 dB和97.8%,相比较于扩散模型Palette分别提高了1.68 dB和0.6%,修复效果满足考古工作者、文字学专家及历史学家的视觉需要。 展开更多
关键词 秦简文字 图像修复 扩散模型 空间通道重建卷积 噪声估计网络 注意力机制
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
16
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
全卷积注意力机制神经网络的图像语义分割 被引量:18
17
作者 欧阳柳 贺禧 瞿绍军 《计算机科学与探索》 CSCD 北大核心 2022年第5期1136-1145,共10页
全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积... 全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法。该方法利用计算高级特征图像素之间的联系来获取全局信息,增强像素之间的相关性,再结合空洞空间金字塔池化进一步提取图像的特征信息。针对图像的高层特征图像素丢失的问题,提出了基于图像不同层级的注意力方法。该方法将高层特征图中的信息作为指导对低层特征图中隐藏的信息进行挖掘,然后和高级特征图进行融合,充分利用高级特征图信息和低级特征图的信息。在实验方面,通过对比所提不同模块对全卷积神经网络分割性能的影响,验证了所提方法的有效性。同时在公认的图像语义分割数据集Cityscapes上与当前先进的网络进行实验对比,结果显示所提方法在客观评价指标和主观效果方面均存在优越性,并在Cityscapes官网测试集中达到了69.3%的准确率,性能比近期几个先进网络高出3~5个百分点。 展开更多
关键词 全卷积神经网络 空洞空间金字塔池化 注意力模型 语义分割
在线阅读 下载PDF
基于时空注意力网络的动态高速路网交通速度预测 被引量:8
18
作者 邹国建 赖子良 李晔 《计算机工程》 CAS CSCD 北大核心 2023年第2期303-313,共11页
交通速度是影响高速路网通行效率和安全的重要指标,精准预测高速路网交通速度可以减少交通事故和通行时间,预先为交通控制提供有价值的参考信息,对高速公路管理具有重要意义。基于时空注意力网络,提出一种由数据和长期预测任务驱动面向... 交通速度是影响高速路网通行效率和安全的重要指标,精准预测高速路网交通速度可以减少交通事故和通行时间,预先为交通控制提供有价值的参考信息,对高速公路管理具有重要意义。基于时空注意力网络,提出一种由数据和长期预测任务驱动面向动态高速路网的交通速度预测模型(ST-ANet)。通过图注意力网络提取高速路网的动态空间关联特征,使用长短期记忆网络提取输入数据的时间关联特征。在此基础上,采用基于多头自注意力机制的时间注意力网络计算历史输入数据和预测值之间的相关性,并利用密集连接和层归一化方法进一步提升模型性能。基于中国宁夏回族自治区银川市高速路网监测数据进行实验,结果表明,与GCN-LSTM模型相比,STANet模型预测未来1 h、2 h和3 h内高速路网交通速度的平均绝对误差分别降低4.0%、3.6%和3.9%。 展开更多
关键词 交通工程 高速路网交通速度预测 ST-ANet预测模型 时间注意力 空间注意力 长短期记忆网络
在线阅读 下载PDF
基于改进DeepLabV3+的轻量化茶叶嫩芽采摘点识别模型 被引量:4
19
作者 胡程喜 谭立新 +1 位作者 王文胤 宋敏 《智慧农业(中英文)》 CSCD 2024年第5期119-127,共9页
[目的/意义]名优茶的采摘是茶产业中至关重要的环节,识别和定位名优茶嫩芽采摘点是现代化采茶过程中的重要组成部分。传统神经网络方法存在着模型体量大、训练时间长,以及应对场景复杂等问题。本研究以湖南省溪清茶园为实际场景,提出一... [目的/意义]名优茶的采摘是茶产业中至关重要的环节,识别和定位名优茶嫩芽采摘点是现代化采茶过程中的重要组成部分。传统神经网络方法存在着模型体量大、训练时间长,以及应对场景复杂等问题。本研究以湖南省溪清茶园为实际场景,提出一种新型深度学习算法解决名优茶采摘点的精确分割难题。[方法]对传统的DeepLabV3+算法进行轻量化改进。首先,针对其模型体量大、训练时间长的问题,使用MobilenetV2网络提取图像的初始特征,并按照网络结构划分深浅层特征;其次,将高效通道注意力网络(Efficient Channel Attention Network,ECANet)与空洞空间卷积池化金字塔(Atrous Spatial Pyramid Pooling,ASPP)模块结合,得到ECA_ASPP模块,并将深层特征输入到ECA_ASPP模块中进行多尺度特征融合以减少无效信息,将经过处理后的深浅层特征相加,随后通过卷积和上采样的方式对特征信息进行还原,得到分割结果;最后,通过对识别结果进行处理以获得茶叶嫩芽采摘点。[结果和讨论]改进后的DeepLabV3+在茶叶嫩芽数据集上的平均交并比达到93.71%,平均像素准确率达到97.25%,模型参数量由原来以Xception为底层网络的54.714 M下降至5.818 M。[结论]本研究在茶叶嫩芽结构分割上相对于原版DeepLabV3+的检测速度更快、参数量更小,同时保证了较高的准确率,为智能采茶机器人的采摘提供了新的定位方法。 展开更多
关键词 轻量化模型 DeepLabV3+ 注意力机制 茶叶嫩芽 ECANet 名优茶 空洞空间卷积池化金字塔
在线阅读 下载PDF
基于改进Tiny-YOLO模型的群养生猪脸部姿态检测 被引量:22
20
作者 燕红文 刘振宇 +2 位作者 崔清亮 胡志伟 李艳文 《农业工程学报》 EI CAS CSCD 北大核心 2019年第18期169-179,共11页
生猪脸部包含丰富的生物特征信息,对其脸部姿态的检测可为生猪的个体识别和行为分析提供依据,而在生猪群养场景下,猪舍光照、猪只黏连等复杂因素给生猪脸部姿态检测带来极大挑战。该文以真实养殖场景下的群养生猪为研究对象,以视频帧数... 生猪脸部包含丰富的生物特征信息,对其脸部姿态的检测可为生猪的个体识别和行为分析提供依据,而在生猪群养场景下,猪舍光照、猪只黏连等复杂因素给生猪脸部姿态检测带来极大挑战。该文以真实养殖场景下的群养生猪为研究对象,以视频帧数据为数据源,提出一种基于注意力机制与Tiny-YOLO相结合的检测模型DAT-YOLO。该模型将通道注意力和空间注意力信息引入特征提取过程中,高阶特征引导低阶特征进行通道注意力信息获取,低阶特征反向指引高阶特征进行空间注意力筛选,可在不显著增加参数量的前提下提升模型特征提取能力、提高检测精度。对5栏日龄20~105d的群养生猪共35头的视频抽取504张图片,共计3712个脸部框,并标注水平正脸、水平侧脸、低头正脸、低头侧脸、抬头正脸和抬头侧脸6类姿态,构建训练集,另取420张图片共计2106个脸部框作为测试集。试验表明,DAT-YOLO模型在测试集上对群养生猪的水平正脸、水平侧脸、低头正脸、低头侧脸、抬头正脸和抬头侧脸6类姿态预测的AP值分别达到85.54%、79.30%、89.61%、76.12%、79.37%和84.35%,其6类总体mAP值比Tiny-YOLO模型、仅引入通道注意力的CAT-YOLO模型以及仅引入空间注意力的SAT-YOLO模型分别提高8.39%、4.66%和2.95%。为进一步验证注意力在其余模型上的迁移性能,在同等试验条件下,以YOLOV3为基础模型分别引入两类注意力信息构建相应注意力子模型,试验表明,基于Tiny-YOLO的子模型与加入相同模块的YOLOV3子模型相比,总体mAP指标提升0.46%~1.92%。Tiny-YOLO和YOLOV3系列模型在加入注意力信息后检测性能均有不同幅度提升,表明注意力机制有利于精确、有效地对群养生猪不同类别脸部姿态进行检测,可为后续生猪个体识别和行为分析提供参考。 展开更多
关键词 图像处理 模型 目标检测 Tiny-YOLO 通道注意力 空间注意力
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部