期刊文献+
共找到140篇文章
< 1 2 7 >
每页显示 20 50 100
基于多尺度注意力的冠脉造影图像血管增强CNN模型
1
作者 周鹏 汪光普 +3 位作者 高慧 秦泽伟 王硕 余辉 《中国生物医学工程学报》 北大核心 2025年第1期43-51,共9页
冠状动脉造影记录着血管随血液流动显影的动态过程。受心脏运动干扰,可能导致显影图像质量差,严重影响医生的诊断,同时不利于冠心病智能辅助诊断。本研究提出了一种基于卷积神经网络(CNN)的多尺度注意力冠脉造影图像血管增强网络。它由... 冠状动脉造影记录着血管随血液流动显影的动态过程。受心脏运动干扰,可能导致显影图像质量差,严重影响医生的诊断,同时不利于冠心病智能辅助诊断。本研究提出了一种基于卷积神经网络(CNN)的多尺度注意力冠脉造影图像血管增强网络。它由多尺度注意力模块(MAB)和尾部大核注意力模块(LKAT)组成。MAB由多尺度大核注意力块(MLKA)和门控空间注意力块(GSAB)两部分组成,模块不仅能够提取更多局部和全局的血管信息,而且也避免了栅格效应。LKAT具有聚合长范围信息的能力,提高了重构血管特征的表征能力,从而提升冠脉造影图像的重建质量。实验中2 666张冠脉数据集由医学专家人工标注,得到的血管分割标签作为掩膜,叠加到经高斯滤波预处理后的图像上作为冠脉增强标签。与现有的先进方法比较,本研究方法能够完整的重建冠脉造影图像,峰值信噪比(PSNR)和结构相似性(SSIM)分别达到了34.880 1和0.973 2。并且增强后的分割结果,Dice和IoU分别达到了0.851 4和0.741 3,Acc和Recall分别达到了98.55%和89.05%。所提出的方法有效实现了冠脉血管造影图像的智能增强,同时也有利于冠心病智能辅助诊断的后续处理。 展开更多
关键词 冠脉血管增强 卷积神经网络 多尺度注意力 冠状动脉造影
在线阅读 下载PDF
融合ViT与多尺度注意力的改进YOLOv8飞鸟识别算法
2
作者 张强 张灿智 +1 位作者 曹恒 员腾蛟 《科学技术与工程》 北大核心 2025年第19期8151-8157,共7页
针对飞鸟识别中存在密集目标识别不准确、小目标检测困难等问题,提出一种基于改进YOLOv8的飞鸟识别算法。首先,针对密集目标识别难度大的问题,采用多尺度线性注意力机制EfficientViT替换骨干网络,实现全局感受野和多尺度学习,提升模型... 针对飞鸟识别中存在密集目标识别不准确、小目标检测困难等问题,提出一种基于改进YOLOv8的飞鸟识别算法。首先,针对密集目标识别难度大的问题,采用多尺度线性注意力机制EfficientViT替换骨干网络,实现全局感受野和多尺度学习,提升模型性能和效率的同时提高密集目标识别效果。然后,针对小目标飞鸟检测困难、容易出现漏检的问题,引入高效多尺度注意力(efficient multi-scale attention,EMA)机制,通过通道重组实现跨维度聚合特征,从而更好地捕捉全局信息,实现多尺度特征融合,减少漏检概率。实验结果表明,改进模型在鸟类识别基准数据集CUB-200-2011和自制数据集birds28上的mAP50分别达到77.1%和88.4%,较原始YOLOv8模型分别提高了4.5和5.4个百分点,验证了改进模型的有效性。 展开更多
关键词 飞鸟识别 多尺度注意力 密集目标识别 YOLOv8 EfficientViT EMA
在线阅读 下载PDF
基于多尺度注意力轻量化网络的信道状态信息反馈方法
3
作者 刘庆利 谢佳骏 《电讯技术》 北大核心 2025年第9期1363-1372,共10页
针对大规模多输入多输出系统中信道状态信息在反馈时重构精度低、复杂度高的问题,提出了一种基于注意力机制的反馈方法。首先,考虑到信道状态信息矩阵数据分布特点,采用一种高效多尺度注意力模块提取信道状态信息矩阵局部和全局的特征,... 针对大规模多输入多输出系统中信道状态信息在反馈时重构精度低、复杂度高的问题,提出了一种基于注意力机制的反馈方法。首先,考虑到信道状态信息矩阵数据分布特点,采用一种高效多尺度注意力模块提取信道状态信息矩阵局部和全局的特征,并关注重要数据点的分布,提升网络模型的特征学习能力。其次,使用增强的可重参数化的卷积替代普通的卷积核,提升卷积对于局部特征的提取能力,使整个神经网络自编码器在保持轻量化的基础上达到更高的压缩重构精度。仿真结果表明,与轻量化网络CRNet和ACRNet-1x相比,所提出的网络模型在复杂度方面分别平均降低了19%和5%,重构精度分别平均提高了3%和8%,同时展现出了更好的鲁棒性。 展开更多
关键词 大规模MIMO 信道状态信息反馈 神经网络自编码器 高效多尺度注意力 轻量化网络
在线阅读 下载PDF
结合多尺度注意力和动态构建的非均匀超图聚类模型 被引量:1
4
作者 朱峰冉 王慧颖 +2 位作者 林晓丽 李全鑫 庞俊 《计算机工程与应用》 北大核心 2025年第2期200-207,共8页
单个较大非均匀超图聚类旨在将非均匀超图包含的节点划分为多个簇,使得同一簇内的节点更相似,而不同簇中的节点更不相似,具有广泛的应用场景。目前,最优的基于超图神经网络的非均匀超图聚类方法CIAH(co-cluster the interactions via at... 单个较大非均匀超图聚类旨在将非均匀超图包含的节点划分为多个簇,使得同一簇内的节点更相似,而不同簇中的节点更不相似,具有广泛的应用场景。目前,最优的基于超图神经网络的非均匀超图聚类方法CIAH(co-cluster the interactions via attentive hypergraph neural network)虽然较好地学习了非均匀超图的关系信息,但仍存在两点不足:(1)对于局部关系信息的挖掘不足;(2)忽略了隐藏的高阶关系。因此,提出一种基于多尺度注意力和动态超图构建的非均匀超图聚类模型MADC(non-uniform hypergraph clustering combining multi-scale attention and dynamic construction)。一方面,使用多尺度注意力充分学习了超边中节点与节点之间的局部关系信息;另一方面,采用动态构建挖掘隐藏的高阶关系,进一步丰富了超图特征嵌入。真实数据集上的大量实验结果验证了MADC模型在非均匀超图聚类上的聚类准确率(accuracy,ACC)、标准互信息(normalized mutual information,NMI)和调整兰德指数(adjusted Rand index,ARI)均优于CIAH等所有Baseline方法。 展开更多
关键词 非均匀超图 超图聚类 超图神经网络 多尺度注意力
在线阅读 下载PDF
TalentDepth:基于多尺度注意力机制的复杂天气场景单目深度估计模型
5
作者 张航 卫守林 殷继彬 《计算机科学》 北大核心 2025年第S1期442-448,共7页
对于复杂天气场景图像模糊、低对比度和颜色失真所导致的深度信息预测不准的问题,以往的研究均以标准场景的深度图作为先验信息来对该类场景进行深度估计。然而,这一方式存在先验信息精度较低等问题。对此,提出一个基于多尺度注意力机... 对于复杂天气场景图像模糊、低对比度和颜色失真所导致的深度信息预测不准的问题,以往的研究均以标准场景的深度图作为先验信息来对该类场景进行深度估计。然而,这一方式存在先验信息精度较低等问题。对此,提出一个基于多尺度注意力机制的单目深度估计模型TalentDepth,以实现对复杂天气场景的预测。首先,在编码器中融合多尺度注意力机制,在减少计算成本的同时,保留每个通道的信息,提高特征提取的效率和能力。其次,针对图像深度不清晰的问题,基于几何一致性,提出深度区域细化(Depth Region Refinement,DSR)模块,过滤不准确的像素点,以提高深度信息的可靠性。最后,输入图像翻译模型所生成的复杂样本,并计算相应原始图像上的标准损失来指导模型的自监督训练。在NuScence,KITTI和KITTI-C这3个数据集上,相比于基线模型,所提模型对误差和精度均有优化。 展开更多
关键词 单目深度估计 自监督学习 多尺度注意力 知识提炼 深度学习
在线阅读 下载PDF
基于多尺度注意力和不确定性损失的两阶段左心房疤痕分割
6
作者 张鑫艳 唐振超 +1 位作者 李一夫 刘振宇 《计算机科学》 北大核心 2025年第6期264-273,共10页
心房颤动(AF)是临床上最常见的心律失常之一。左心房及其心肌梗死后疤痕区域的准确分割和面积评估,对于心肌梗死患者出现AF的早期诊断、治疗规划以及预后评估具有极其重要的临床意义。深度学习方法是进行左心房及其心肌梗死后疤痕区域... 心房颤动(AF)是临床上最常见的心律失常之一。左心房及其心肌梗死后疤痕区域的准确分割和面积评估,对于心肌梗死患者出现AF的早期诊断、治疗规划以及预后评估具有极其重要的临床意义。深度学习方法是进行左心房及其心肌梗死后疤痕区域自动分割的主流方向。但是由于心肌梗死后疤痕体积小且容易受到周围增强组织的影响,分割精度尚有待提高。为此,提出了一种基于多尺度注意力和不确定性损失的两阶段深度学习模型。一方面,在网络上采样之前引入多尺度注意力模块(MSAM),该模块能够编码丰富的多尺度语义信息并让模型更为关注重要的语义信息及空间信息。另一方面,引入不确定性损失(Uncertainty Loss)以增强模型对疤痕不确定性的建模能力。此外,还采用直方图匹配(HM)增强图像质量,提高网络的分割能力。将所提出的方法在验证集以及左心房和疤痕量化与分割挑战赛(LAScarQS++)验证平台上进行验证,实验结果均表明该方法分割的疤痕更加完整,分割精度也得到了提升。与nnU-Net相比,心肌梗死后疤痕分割骰子系数(Dice)提高了8.12%。 展开更多
关键词 心肌梗死后疤痕 深度学习 图像分割 不确定性损失 nnU-Net 多尺度注意力
在线阅读 下载PDF
基于多尺度注意力融合的叶绿素a水质参数反演研究
7
作者 孙帮勇 巩凯杰 +1 位作者 于涛 别倩雯 《光谱学与光谱分析》 北大核心 2025年第4期1190-1200,共11页
水资源是生态环境核心要素之一,目前大量的水域被工业化污染或富营养化破坏,因此实时监测水质参数对于维护水体健康至关重要。传统水质监测多利用实地采样测量法或基于线性回归预测法,由于遥感图像与水质参数之间显著的非线性特征,传统... 水资源是生态环境核心要素之一,目前大量的水域被工业化污染或富营养化破坏,因此实时监测水质参数对于维护水体健康至关重要。传统水质监测多利用实地采样测量法或基于线性回归预测法,由于遥感图像与水质参数之间显著的非线性特征,传统方法费时费力且预测精度不高。深度学习方法在处理复杂非线性问题中表现出良好性能,已被多位学者应用到水质参数反演中。基于深度学习的水质反演模型仍存在解析遥感光谱图像特征不精确、模型泛化能力差等问题。提出一种基于多尺度注意力融合机制的水质反演网络模型,能够采用遥感光谱图像准确预测出叶绿素a等水质参数,为水域健康程度评价提供依据。该网络融合了先进的注意力机制和特征融合策略,通过结合CNN的局部特征学习优势和Transformer的全局特征提取能力,引入了DenseASPP模块来获取遥感图像的多尺度特征,并采用通道注意力解码器模块和池化融合模块来提取细节特征。通过融合不同尺度和层次的特征信息对叶绿素a浓度进行估计,获得了较高的反演精度和泛化性能。为验证所提出反演模型的性能,实验在Python3.7和PyTorch框架下对模型进行实现,并选择2021年1月至2022年12月的海洋遥感光谱图像和叶绿素a浓度数据进行网络训练。实验对所提出的方法与其他7种水质反演方法进行对比,客观指标所提出方法均达到了最好的性能,较对比方法中最好的在R2指标上提高了0.09,在RMSE、MAE、MAD指标上分别降低了11.99、0.089、0.029,在Evar指标上提高了0.098,在NSE指标上提高了0.041;在主观评价上,所提出方法获得的叶绿素a浓度更精确,误差更小,不同水域中表现的泛化能力更强。 展开更多
关键词 水质反演 叶绿素A 遥感光谱图像 多尺度注意力融合
在线阅读 下载PDF
结合多尺度注意力和自训练的超图聚类方法
8
作者 刘志成 王慧颖 +4 位作者 林晓丽 朱峰冉 郭宇恒 闫炳鑫 庞俊 《小型微型计算机系统》 北大核心 2025年第9期2066-2074,共9页
单个较大的非均匀超图聚类旨在将非均匀超图包含的节点划分为多个簇,使得簇内节点越相似越好,簇间节点越不相似越好,具有广泛的应用前景.目前最优的基于超图神经网络的非均匀超图聚类模型MADC(Non-uniform hypergraph clustering combin... 单个较大的非均匀超图聚类旨在将非均匀超图包含的节点划分为多个簇,使得簇内节点越相似越好,簇间节点越不相似越好,具有广泛的应用前景.目前最优的基于超图神经网络的非均匀超图聚类模型MADC(Non-uniform hypergraph clustering combining multi-scale attention and dynamic construction)仍存在不足:超图特征嵌入的学习效率不高.针对这个问题,提出了一种基于多尺度注意力和自训练网络的非均匀超图聚类模型STHC(Self-Training non-uniform Hypergraph Clustering).STHC模型采用并行的多尺度注意力网络学习超图特征嵌入,以提高其学习效率.此外,该模型还构造自训练网络,联合优化超图特征嵌入和超图聚类结果,以进一步得到更好的超图聚类结果.STHC模型在真实数据集上的大量实验结果验证了其在非均匀超图聚类上的聚类准确率(Accuracy,ACC)、标准互信息(Normalized Mutual Information,NMI)和调整兰德指数(Adjusted Rand Index,ARI)均优于所有对比方法. 展开更多
关键词 非均匀超图 聚类 自训练网络 多尺度注意力
在线阅读 下载PDF
基于多尺度注意力机制的无人机小目标检测算法 被引量:1
9
作者 冯迎宾 郭枭尊 晏佳华 《兵工学报》 北大核心 2025年第1期12-21,共10页
针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster ... 针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster Block_C2f,EF_C2f),替换YOLOv8网络中的C2f模块,提高网络对小目标特征的提取能力;在特征融合网络中增加P1检测层,并设计一种跨尺度特征融合结构(Bi-Path Aggregation Network,BPAN),融合小目标特征信息;增加一个微小目标检测头,使用SIoU Loss作为边界框损失函数,提升小目标检测精度和网络收敛速度。在公开数据集VisDrone2019上进行实验验证。验证结果表明:与YOLOv8s算法相比,新算法在检测精度上提升了6.9%、mAP50提升了9.1%,模型参数量减少了44.6%,检测速度为28帧/s,新算法在小目标检测领域具有一定的实用性。 展开更多
关键词 多尺度注意力机制 YOLOv8s算法 特征提取 尺度特征融合 小目标检测
在线阅读 下载PDF
融合多尺度注意力神经网络的港口起重装备故障时序数据预测方法 被引量:1
10
作者 雷鹏 谢敬玲 +4 位作者 许洪祖 焦锋 魏立明 张忠岩 吕成兴 《机电工程》 北大核心 2025年第2期277-286,共10页
近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注... 近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注意力机制港口装备故障时序数据预测方法。首先,采用了融合非线性策略与混沌映射的改进灰狼优化算法(IGWO),自适应地确定了变分模态分解(VMD)的模态数与惩罚因子;然后,将变分模态分解得到的本征模态函数进一步作为融合多尺度注意力神经网络(FMANN)模型的时序输入,进行了多尺度通道特征融合;最后,对各个本征模态函数的预测结果进行了融合,得到了最终预测结果。研究结果表明:FMANN模型在回转机构数据集上的均方根误差(RMSE)为0.001 12,平均绝对百分比误差(MAPE)为6.396 3%,决定系数为0.999 8;相比于其他预测模型,FMANN预测效果更加拟合实际数据。FMANN模型能够准确地预测设备轴承的时序振动,有望为未来实际工业生产提供一条新思路。 展开更多
关键词 滚动轴承 故障诊断 变分模态分解 注意力机制 灰狼优化算法 融合多尺度注意力神经网络 深度可分离卷积
在线阅读 下载PDF
联合可变形特征和多尺度注意力的结核杆菌图像检测
11
作者 周梦丽 钟铭恩 +3 位作者 谭佳威 袁彬淦 邓智颖 杨凯博 《中国生物医学工程学报》 北大核心 2025年第3期301-311,共11页
结核病是一种常见、多发且较为凶险的传染性疾病,目前主要采用痰涂片人工镜检。由于结核杆菌在显微场景下具有尺度小、菌体粘连和形态不规整等特点,易造成漏检和错检。为此,基于深度学习技术提出一种痰液显微图像结核杆菌的自动检测算法... 结核病是一种常见、多发且较为凶险的传染性疾病,目前主要采用痰涂片人工镜检。由于结核杆菌在显微场景下具有尺度小、菌体粘连和形态不规整等特点,易造成漏检和错检。为此,基于深度学习技术提出一种痰液显微图像结核杆菌的自动检测算法MTDet。首先,构建轻量化的基础特征提取网络,以全局注意的方式捕捉菌体堆积粘连时的空间关系和个体局部特征;其次,利用自主设计的可变形特征聚合模块DC2f和高效多尺度注意力EMA来重构特征,自适应结核杆菌的多种形态;最后,在检测头中增加高分辨率分支,提升模型对小目标的感知能力。在结核杆菌显微图像公开数据集Tuberculosis-phonecamera和ZNSM iDB上的实验结果表明:算法平均检测准确率分别为90.2%和87.9%,召回率分别为84.1%和83.2%,均超越了现有主流算法。此外,基于WHO的结核病诊断标准,针对220例临床样本的综合准确率为96.8%,其中假阳率为6.5%,假阴率为0%。本研究结果有望为结核病的辅助诊断带来帮助。 展开更多
关键词 结核杆菌检测 痰涂片图像 小目标 特征聚合 多尺度注意力
在线阅读 下载PDF
联合多尺度注意力与混合池化的手腕创伤X光图像检测
12
作者 林淑娟 钟铭恩 +2 位作者 谭佳威 范康 林志强 《电子测量技术》 北大核心 2025年第16期180-188,共9页
针对X光图像中的骨折、软组织肿胀、骨病变等多类创伤的辅助检测问题,提出一种基于深度卷积神经网络的目标检测算法模型WristXNet。首先设计了多尺度注意力特征聚合模块C2f_MSAF来增强模型对多尺度目标的特征理解能力;其次构建了混合池... 针对X光图像中的骨折、软组织肿胀、骨病变等多类创伤的辅助检测问题,提出一种基于深度卷积神经网络的目标检测算法模型WristXNet。首先设计了多尺度注意力特征聚合模块C2f_MSAF来增强模型对多尺度目标的特征理解能力;其次构建了混合池化空间金字塔模块HPSP来增强对不同类别目标关联特征的提取能力;随后引入动态上采样模块DySample来进一步增强对细粒度特征的捕捉能力;最后设计了具有解耦结构的轻量化检测头LDDHead来提升模型计算效率。在儿童手腕创伤X光图像公开数据集GRAZPEDWRI-DX上的实验结果表明,所提算法针对X光图像中的7类常见目标的平均检测精度mAP取得最高值68.5%,相比现有最优算法提升了1.6%,且模型大小仅为3.3 M,处理效率达到每秒156.9张图像,体现了良好的综合性能。 展开更多
关键词 医学图像处理 腕骨X光图像 多尺度注意力 混合池化 细粒度特征
在线阅读 下载PDF
基于多尺度注意力和空间通道重构卷积的冲击回波频谱图像分类
13
作者 崔博 武冰冰 +3 位作者 陈伟 孟庆洪 王晓 黄祺祥 《南京信息工程大学学报》 北大核心 2025年第5期659-669,共11页
针对传统卷积神经网络对冲击回波信号频谱图像进行分类时,面临卷积神经网络特征提取能力不足和数据集类别不平衡的问题,提出一种基于多尺度注意力和空间通道重构卷积的神经网络模型(Multi-scale Hybrid Attention and Spatial Channel R... 针对传统卷积神经网络对冲击回波信号频谱图像进行分类时,面临卷积神经网络特征提取能力不足和数据集类别不平衡的问题,提出一种基于多尺度注意力和空间通道重构卷积的神经网络模型(Multi-scale Hybrid Attention and Spatial Channel Reconstruction Convolutional Neural Network,MHA-SCConvNet).首先设计了多尺度混合注意力(Multi-scale Hybrid Attention,MHA)模块,用于提取不同尺度的频谱图像特征并增强模型对频谱波形关键信息的关注力度.其次,引入空间通道重构卷积(Spatial and Channel Reconstruction Convolution,SCConv)模块,通过优化图像特征的表示来降低特征冗余.最后,提出了新的混合损失函数GDHM Loss(Gradient and Distribution Harmonized Margin Loss,梯度与分布协调边距损失),该损失函数在动态情况下同时考虑难分类样本和少数类样本.在自建的数据集上进行了训练与测试,并与AlexNet、VGGNet、GoogLeNet等分类模型对比,MHA-SCConvNet准确率达到94.58%.实验结果表明,MHA-SCConvNet模型能够有效提高冲击回波信号频谱图像分类的准确率和效率. 展开更多
关键词 频谱图像分类 多尺度注意力模块 卷积神经网络 混合损失函数 空间通道重构卷积
在线阅读 下载PDF
基于多尺度注意力和图神经网络的多模态医学实体识别研究
14
作者 韩普 刘森嶺 陈文祺 《数据采集与处理》 北大核心 2025年第4期922-933,共12页
随着信息技术的快速发展,医疗健康领域中文文本、图像等多模态数据呈现出了爆发式增长。多模态医学实体识别(Multi-modal medical entity recognition,MMER)是多模态信息抽取的关键环节,近期受到了极大关注。针对多模态医学实体识别任... 随着信息技术的快速发展,医疗健康领域中文文本、图像等多模态数据呈现出了爆发式增长。多模态医学实体识别(Multi-modal medical entity recognition,MMER)是多模态信息抽取的关键环节,近期受到了极大关注。针对多模态医学实体识别任务中存在图像细节信息损失和文本语义理解不足问题,提出一种基于多尺度注意力和图神经网络(Multi-scale attention and dependency parsing graph convolution,MADPG)的MMER模型。该模型一方面基于ResNet引入多尺度注意力机制,协同提取不同空间尺度融合的视觉特征,减少医学图像重要细节信息丢失,进而增强图像特征表示,补充文本语义信息;另一方面利用依存句法结构构建图神经网络,捕捉医学文本中词汇间复杂语法依赖关系,以丰富文本语义表达,促进图像文本特征深层次融合。实验表明,本文提出的模型在多模态中文医学数据集上F_(1)值达到95.12%,相较于主流的单模态和多模态实体识别模型性能得到了明显提升。 展开更多
关键词 多模态医学实体识别 多尺度注意力 图卷积神经网络 多模态融合 语义特征
在线阅读 下载PDF
结合混合卷积和多尺度注意力的视频异常检测算法 被引量:1
15
作者 杨大为 刘志权 王红霞 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1128-1137,共10页
基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素... 基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素级别的差异而无法捕捉图像的结构特征。对此提出了结合混合卷积和多尺度注意力的视频异常检测算法,并加入结构相似性损失函数(SSIM)优化模型。具体来说,在编码器最后一层添加混合卷积模块,混合空间和位置的特征来提取全局上下文信息。在编码器和解码器之间的跳跃连接中添加多尺度注意力模块,使模型能提取更有价值的特征,实现有效的跳跃连接。使用参数约束结构相似性损失函数与L2损失函数的权重,从而更准确地优化模型。实验结果表明,所提算法在UCSD-Ped2和CUHK Avenue公开数据集上的AUC指标达到96.7%和86.1%,与改进前的模型相比提高了1.6%和1.4%,证明了所提模型的有效性。 展开更多
关键词 上下文信息 跳跃连接 混合卷积 多尺度注意力 结构相似性
在线阅读 下载PDF
基于多尺度注意力机制的实时激光雷达点云语义的分割 被引量:1
16
作者 张晨 刘畅 +2 位作者 赵津 王广玮 许庆 《汽车安全与节能学报》 CAS CSCD 北大核心 2024年第4期591-601,共11页
为既能提高分割精度,又能克服车载计算资源局限,提出一种面向移动机器人平台的车载实时点云语义分割方法,并进行了综合实验。该方法采用基于投影的激光雷达语义分割方法,将三维点云投影到球面图像,并结合二维卷积进行分割。引入多头注... 为既能提高分割精度,又能克服车载计算资源局限,提出一种面向移动机器人平台的车载实时点云语义分割方法,并进行了综合实验。该方法采用基于投影的激光雷达语义分割方法,将三维点云投影到球面图像,并结合二维卷积进行分割。引入多头注意力机制(MHSA),实现轻量级语义分割模型,以一种全新的方式,将一种深度学习模型架构Transformer映射到卷积。将Transformer的MHSA迁移至卷积,以形成多尺度自注意力机制(MSSA)。结果表明:与当前主流方法CENet、FIDNet、PolarNet相比,本方法在NVIDIA JETSON AGX Xavier计算平台上保持了较高的分割精度(平均交并比为63.9%)及较高的检测速率(41帧/s),从而证明了其对移动机器人平台的适用性。 展开更多
关键词 移动机器人平台 激光雷达(LiDAR) 点云 多尺度注意力机制(MSSA) 语义分割方法TRANSFORMER 卷积神经网络
在线阅读 下载PDF
基于多尺度注意力特征增强的异常流量检测方法 被引量:4
17
作者 杨宏宇 张豪豪 成翔 《通信学报》 EI CSCD 北大核心 2024年第11期88-105,共18页
针对现有网络异常流量检测方法存在特征冗余以及流量序列的时间依赖性,导致模型训练速度慢和检测性能不佳等不足,提出一种基于多尺度注意力特征增强的异常流量检测方法。首先,通过基于动态分组的特征选择算法从流量数据中选出最优特征... 针对现有网络异常流量检测方法存在特征冗余以及流量序列的时间依赖性,导致模型训练速度慢和检测性能不佳等不足,提出一种基于多尺度注意力特征增强的异常流量检测方法。首先,通过基于动态分组的特征选择算法从流量数据中选出最优特征集合。其次,使用密集卷积神经网络和多尺度注意力特征提取网络分别提取流量数据的局部和全局特征。最后,利用特征增强网络增强局部和全局特征的区分度和整体表达的有效性,并采用加权融合的方法进行特征融合,实现异常流量检测。实验结果表明,所提方法在CIC-IDS2017和CSECIC-IDS2018数据集上的F1分数分别提升0.17%~2.75%、0.43%~8.99%,具有良好的检测效果。 展开更多
关键词 异常流量检测 特征选择 多尺度注意力 特征增强网络
在线阅读 下载PDF
基于自适应多尺度注意力机制的CNN-GRU矿用电动机健康状态评估 被引量:2
18
作者 谭东贵 袁逸萍 樊盼盼 《工矿自动化》 CSCD 北大核心 2024年第2期138-146,共9页
利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题... 利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题。针对上述问题,提出了一种基于自适应多尺度注意力机制的CNN-GRU(CNN-GRU-AMSA)模型,用于评估矿用电动机健康状态。首先,对传感器采集的电动机运行数据进行填补、剔除和标准化处理,并以环境温度变化作为依据对矿用电动机运行数据进行工况划分。然后,根据马氏距离计算出电动机电流、电动机三相绕组温度、电动机前端轴承温度和电动机后端轴承温度等健康评估指标的健康指数(HI),采用Savitzky–Golay滤波器对指标HI进行降噪、平滑、归一化处理,并结合主成分分析法计算的不同指标对矿用电动机的贡献度,对指标HI进行加权融合得到矿用电动机HI。最后,将矿用电动机HI输入CNN-GRU-AMSA模型中,该模型通过动态调整注意力权重,实现对不同尺度特征的信息融合,从而准确输出电动机健康状态评估结果。实验结果表明,与其他常见的深度学习模型CNN,CNN-GRU,CNN-LSTM,CNN-LSTM-Attention相比,CNN-GRU-AMSA模型在均方根误差、平均绝对误差、准确率、Macro F1及Micro F1等评价指标上更优,且预测残差的波动范围更小,稳定性更优。 展开更多
关键词 电动机健康状态评估 自适应多尺度注意力机制 CNN-GRU 多传感器信息融合 主成分分析
在线阅读 下载PDF
特征细化和多尺度注意力的Transformer图像去噪网络 被引量:4
19
作者 袁姮 耿仪坤 《计算机科学与探索》 CSCD 北大核心 2024年第7期1838-1851,共14页
为增强全局上下文信息的关联性,加强对多尺度特征的关注,在提升图像去噪效果的同时最大程度保留细节特征,提出一种基于Transformer的特征细化和多尺度注意力的图像去噪网络(TFRADNet)。该网络不仅在编解码器部分利用Transformer解决大... 为增强全局上下文信息的关联性,加强对多尺度特征的关注,在提升图像去噪效果的同时最大程度保留细节特征,提出一种基于Transformer的特征细化和多尺度注意力的图像去噪网络(TFRADNet)。该网络不仅在编解码器部分利用Transformer解决大规模图像的长程依赖问题,提高模型的去噪效率,还在上采样操作后加入位置感知层来增强网络对特征图中像素位置的感知能力。为了应对Transformer可能对像素间空间关系的忽略,导致局部细节失真,在特征重建阶段设计了特征细化模块(FRB),采用串行结构逐层引入非线性变换,加强对噪声水平复杂的图像局部特征的识别。同时,设计了多尺度注意力模块(MAB),采用并行双分支结构,对空间注意力和通道注意力联合建模,有效捕捉不同尺度的图像特征并进行加权,提高模型对多尺度特征的感知能力。在真实噪声数据集SIDD、DND和RNI15上的实验结果显示,TFRADNet能够兼顾全局信息和局部细节,相比其他先进方法展现出了更强的抑噪能力和稳健性。 展开更多
关键词 图像去噪 特征细化 多尺度注意力 TRANSFORMER 真实噪声
在线阅读 下载PDF
融合动态损失与渐进多尺度注意力的视网膜血管分割网络
20
作者 李宗民 初天志 +1 位作者 杨超智 刘玉杰 《计算机工程与应用》 CSCD 北大核心 2024年第23期209-218,共10页
视网膜血管分割任务仍然存在许多挑战,例如眼底图像中生物学背景复杂、毛细血管细小且模糊以及特征难以得到充分利用。针对这些问题,提出了一种融合动态损失与渐进多尺度注意力的网络。其中渐进式特征提取策略可以在网络中逐步捕获对分... 视网膜血管分割任务仍然存在许多挑战,例如眼底图像中生物学背景复杂、毛细血管细小且模糊以及特征难以得到充分利用。针对这些问题,提出了一种融合动态损失与渐进多尺度注意力的网络。其中渐进式特征提取策略可以在网络中逐步捕获对分割有益的特征,并且保留更多细节。设计的多尺度通道注意力模块能够获得复杂的通道依赖关系并且抑制跳跃连接过程中的背景噪音,达到突出重要特征的目的。最后提出动态损失用来自适应调整深监督中各损失函数的权重,优化训练策略。所提出的方法在两个公开的数据集DRIVE和CHASE_DB1中进行了充分的验证,其中灵敏度分别达到0.838 9和0.846 8,准确率分别达到0.971 5和0.974 5,展现出了较好的分割性能。 展开更多
关键词 视网膜血管分割 渐进式特征提取 多尺度通道注意力 动态损失
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部