期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
1
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 TRANSFORMER 注意力模块 梯度融合
在线阅读 下载PDF
基于Ghost卷积与自适应注意力的点云分类 被引量:1
2
作者 舒密 王占刚 《现代电子技术》 北大核心 2025年第6期106-112,共7页
点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,... 点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,提出一种基于点云Transformer的轻量级特征增强融合分类网络EFF-LPCT。EFF-LPCT使用一维化Ghost卷积对原始网络进行重构,以降低计算复杂度和内存要求;引入自适应支路权重,以实现注意力层级间的多尺度特征融合;利用多个通道注意力模块增强特征的通道交互信息,以提高模型分类效果。在ModelNet40数据集进行的实验结果表明,EFF-LPCT在达到93.3%高精度的同时,相较于点云Transformer减少了1.11 GFLOPs的浮点计算量和0.86×10^(6)的参数量。 展开更多
关键词 点云分类 Transformer网络 Ghost卷积 特征增强融合模块 ECA通道注意力 特征学习
在线阅读 下载PDF
融合监督注意力模块和跨阶段特征融合的图像修复改进网络 被引量:2
3
作者 黄巧玲 郑伯川 +1 位作者 丁梓成 吴泽东 《计算机应用》 CSCD 北大核心 2024年第2期572-579,共8页
非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两... 非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两阶段网络模型上,引入了SAM与CSFF模块。SAM通过提供真实图像监督信号,监督上阶段输出特征,确保传入下阶段特征信息的有效性。CSFF将上阶段编码器-解码器的特征融合后送入下阶段的编码器,以弥补上阶段修复中特征信息的损失。实验结果表明,在缺失区域占比为1%~10%时,相较于基线模型Gconv,Gconv_CS在CelebA-HQ数据集上峰值信噪比(PSNR)和结构相似性指数(SSIM)分别提高了1.5%和0.5%,Fréchet起始距离(FID)和L1损失分别降低了21.8%、14.8%;在Place2数据集上,前2个指标分别提高了26.7%和0.8%,后2个指标分别降低了7.9%、37.9%。将Gconv_CS用于去除大熊猫面部遮挡物时,取得了较好的修复视觉效果。 展开更多
关键词 图像修复 两阶段网络 跨阶段特征融合 监督注意力模块 门控卷积
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
4
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络 被引量:2
5
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
在线阅读 下载PDF
基于多级特征融合与注意力模块的场景识别方法 被引量:2
6
作者 许华杰 秦远卓 杨洋 《计算机科学》 CSCD 北大核心 2022年第4期209-214,共6页
场景图像通常由背景信息和前景目标对象构成,用于场景识别任务的卷积神经网络(CNN)通常需要根据场景中关键目标的特征,甚至结合目标之间的位置关系来识别出场景所属类别。针对场景图像中较小尺寸的关键目标特征随着网络层次的加深而逐... 场景图像通常由背景信息和前景目标对象构成,用于场景识别任务的卷积神经网络(CNN)通常需要根据场景中关键目标的特征,甚至结合目标之间的位置关系来识别出场景所属类别。针对场景图像中较小尺寸的关键目标特征随着网络层次的加深而逐渐消失,从而导致场景识别错误的问题,提出了一种基于多级特征融合与注意力模块的场景识别方法。首先,将深度神经网络ResNet-18的特征提取部分划分出5个分支;然后,将5个分支输出的多级特征进行融合,利用融合后的特征进行场景识别和分类,以弥补丢失的目标信息;最后,在网络中加入改进的注意力模块,以达到着重学习场景图像中关键目标的目的,进一步提升识别效果。在多个场景数据集上进行实验对比,结果表明,所提方法在MIT-67,SUN-397和UIUC-Sports这3个场景数据集上的识别准确率分别达到了88.2%,79.9%和97.7%,相比目前主流的场景识别方法其具有更高的识别准确率。 展开更多
关键词 场景识别 卷积神经网络 特征融合 注意力模块
在线阅读 下载PDF
基于多注意力机制与跨特征融合的语义分割算法 被引量:1
7
作者 闵莉 董冰洁 安冬 《计算机工程》 CAS CSCD 北大核心 2024年第8期282-289,共8页
图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的... 图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的图像语义分割算法。该算法选取轻量级网络MobileNetv2作为主干,以缩短训练时间;通过优化空洞空间金字塔池化模块中空洞卷积的膨胀率,改善多尺度语义特征的提取效果,提高模型对小目标的分割能力,并将兼具通道与空间的卷积块注意力机制引入其中,更加关注对分割起决定作用的区域,从而加强对目标边界的提取;在编码器中设计跨特征融合模块,以聚合不同层次特征图的空间信息和语义信息,提高网络学习特征的能力;在编码和解码部分均引入坐标注意力机制,以分解全局平均池化的方式将位置信息嵌入到通道中,从而得到分割目标的准确位置。实验结果表明,所提算法F3crc-DeepLabv3+在PASCAL VOC 2012增强数据集和Cityspaces数据集上的平均交并比分别达到了75.06%和73.06%,平均精度分别达到了84.16%和82.05%,精确率分别达到了86.18%和85.43%,训练时间分别为10 h和13.8 h,具有较优的网络性能。 展开更多
关键词 语义分割 DeepLabv3+网络 MobileNetv2网络 坐标注意力 卷积注意力模块 跨特征融合
在线阅读 下载PDF
可变形分支注意力融合网络的胰腺分割方法 被引量:1
8
作者 付艳贞 樊建聪 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2717-2724,共8页
胰腺具有尺寸小、形状不规则且多变的特点,因此在腹部CT图像中自动分割胰腺具有极大的挑战性.为了适应胰腺特征并解决其分割困难的问题,本文提出了一种轻量级的可变形分支注意力融合网络(Deformable Branch Attention Fusion Network,DB... 胰腺具有尺寸小、形状不规则且多变的特点,因此在腹部CT图像中自动分割胰腺具有极大的挑战性.为了适应胰腺特征并解决其分割困难的问题,本文提出了一种轻量级的可变形分支注意力融合网络(Deformable Branch Attention Fusion Network,DBA-Net)作为胰腺自动分割方法.该方法首先将候选区域裁剪出来作为网络的输入,以便减少背景干扰并突出胰腺区域;然后引入可变形卷积使网络自适应地学习胰腺的空间结构;最后提出分支注意力融合模块实现低级别特征和高级别特征的融合,帮助解码器更好地还原特征图.本文的方法在NIH数据集上测试的Dice相似系数为85.3%,在MSD数据集上的Dice相似系数为78.9%,相比基线U-Net分别提高了3.9%和5.6%.实验结果表明本文的方法能够对胰腺进行更好的分割. 展开更多
关键词 胰腺分割 轻量级 可变形卷积 分支注意力融合模块
在线阅读 下载PDF
融合卷积与自注意力机制的基因型填补算法
9
作者 陈炯环 鲍胜利 +1 位作者 王啸飞 李若凡 《计算机应用》 CSCD 北大核心 2023年第11期3534-3539,共6页
基因型填补可以通过填补估算出在基因测序数据中未覆盖的样本区域弥补因技术限制导致的缺失,但现有的基于深度学习的填补方法不能有效捕捉到全序列位点间的连锁关系,造成整体填补准确率低、批量序列填补准确率分散等问题。针对这些问题... 基因型填补可以通过填补估算出在基因测序数据中未覆盖的样本区域弥补因技术限制导致的缺失,但现有的基于深度学习的填补方法不能有效捕捉到全序列位点间的连锁关系,造成整体填补准确率低、批量序列填补准确率分散等问题。针对这些问题提出一种融合卷积与自注意力机制的填补方法——FCSA,使用两种融合模块构成编解码器组建网络模型。编码器融合模块使用自注意力层得到全序列位点间的关联度,将该关联度融合到全局位点后再通过卷积层提取局部特征;解码器融合模块使用卷积对编码后的低维向量进行局部特征重建,应用自注意力层对全序列建模并融合。使用多物种的动物基因数据进行模型训练,并在Dog、Pig和Chicken数据集上进行比较验证,结果表明,与SCDA(Sparse Convolutional Denoising Autoencoders)、AGIC(Autoencoder Genome Imputation and Compression)和U-net相比,FCSA在10%、20%和30%缺失率下的平均填补准确率均取得了最高值,且批量序列填补准确率的分散程度较小;消融实验的结果也表明,这两种融合模块的设计能够有效提升基因型填补的准确率。 展开更多
关键词 基因型填补 卷积 注意力 融合模块 全序列建模
在线阅读 下载PDF
红外弱光下多特征融合与注意力增强铁路异物检测 被引量:2
10
作者 陈永 王镇 +1 位作者 卢晨涛 张娇娇 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第8期1884-1895,共12页
针对红外弱光环境下铁路异物检测时存在目标特征提取不充分、检测精度及实时性低的问题,在CenterNet目标检测模型的基础上,提出了一种红外弱光下多特征融合与注意力增强的无锚框异物检测深度学习模型。在红外目标多尺度特征提取的基础上... 针对红外弱光环境下铁路异物检测时存在目标特征提取不充分、检测精度及实时性低的问题,在CenterNet目标检测模型的基础上,提出了一种红外弱光下多特征融合与注意力增强的无锚框异物检测深度学习模型。在红外目标多尺度特征提取的基础上,引入自适应特征融合(ASFF)模块,充分利用目标高层语义与底层细粒度特征信息,提升红外目标特征提取能力。通过提出的空洞卷积增强注意力模块(Dilated-CBAM)进行关键特征提取,扩大注意力模块感受野范围,克服了原始CenterNet卷积块感受野映射区域变窄、无法检测弱小目标的问题,提升了无锚框网络的检测精度。使用Smooth L1损失函数进行训练,克服了L1损失函数在网络训练过程收敛速度慢及训练不稳定解的问题。通过铁路红外数据集及现场实验测试,结果表明:所提方法较原始CenterNet模型平均检测精度提高了8.03%,检测框置信度提升了31.23%,平均检测速率是Faster R-CNN模型的9.6倍,所提方法在红外弱光环境下能够更加快速准确地检测出铁路异物,主客观评价均优于对比方法。 展开更多
关键词 机器视觉 红外弱光 异物检测 自适应特征融合 空洞卷积增强注意力模块 无锚框网络
在线阅读 下载PDF
基于多尺度融合注意力改进UNet的遥感图像水体分割 被引量:9
11
作者 石甜甜 郭中华 +1 位作者 闫翔 魏士钦 《液晶与显示》 CAS CSCD 北大核心 2023年第3期397-408,共12页
针对遥感图像水体分割任务,提出了一种多尺度融合注意力模块改进的UNet网络——A-MSFAM-UNet,该方法在GF-2遥感图像水体分割任务中实现了端到端高分辨率遥感图像水体分割。首先,针对以往注意力模块全局池化操作带来的局部信息不敏感问题... 针对遥感图像水体分割任务,提出了一种多尺度融合注意力模块改进的UNet网络——A-MSFAM-UNet,该方法在GF-2遥感图像水体分割任务中实现了端到端高分辨率遥感图像水体分割。首先,针对以往注意力模块全局池化操作带来的局部信息不敏感问题,设计了一种多尺度融合注意力模块(MSFAM),该模块使用点卷积融合通道全局信息、深度可分离卷积弥补全局池化造成的信息丢失。MSFAM用于UNet跳跃连接后的特征融合部分重新分配特征点权重以提高特征融合效率,增强网络获取不同尺度信息的能力。其次,空洞卷积用于VGG16主干网络扩展感受野,在不损失分辨率的情况下聚合全局信息。结果表明,A-MSFAM-UNet优于其他通道注意力(SENet、ECANet)改进的UNet,在GF-2水体分割数据集上平均交并比(MIoU)、平均像素精度(MPA)和准确率(Acc)分别达到了96.02%、97.98%和99.26%。 展开更多
关键词 遥感图像 注意力模块 深度可分离卷积 特征融合 空洞卷积
在线阅读 下载PDF
多源信息融合的电机小样本故障诊断 被引量:1
12
作者 贾晗 尚前明 金华标 《机械科学与技术》 北大核心 2025年第5期847-856,共10页
在实际的工程应用中,电机故障发生的频率极低,电机的故障数据通常较少,正常数据与故障数据存在严重的比例失衡,这对基于数据驱动的电机故障诊断方法提出了挑战。针对这一问题,该文提出一种多源信息融合的电机故障诊断方法。首先,采用快... 在实际的工程应用中,电机故障发生的频率极低,电机的故障数据通常较少,正常数据与故障数据存在严重的比例失衡,这对基于数据驱动的电机故障诊断方法提出了挑战。针对这一问题,该文提出一种多源信息融合的电机故障诊断方法。首先,采用快速谱峭度的特征提取方法将电机定子电流信号和振动加速度信号转化为谱峭度特征图像;其次,搭建一种双通道残差网络模型融合振动信号和电流信号的故障特征并完成故障分类;最后,利用实验台架所采集的5种故障电机数据对多源信息融合的故障诊断方法进行了验证。研究结果表明:在故障数据严重缺失的情况下,故障诊断准确度可以达到95%以上,远高于传统的基于数据驱动的故障诊断方法,同时该方法还可以同样应用于旋转机械设备的故障诊断,具备良好的泛化性。 展开更多
关键词 故障诊断 信息融合 快速谱峭度法 残差神经网络 卷积注意力模块
在线阅读 下载PDF
基于通道注意力和边缘融合的伪装目标分割方法 被引量:3
13
作者 詹春兰 王安志 王明辉 《计算机应用》 CSCD 北大核心 2023年第7期2166-2172,共7页
伪装目标分割(COS)的目标是从背景中分离出隐藏的目标对象。近年来,基于卷积神经网络(CNN)的伪装目标检测(COD)发展迅速,然而仍存在无法从前/背景高度相似的场景中准确地检测出完整目标对象的问题。针对上述问题,提出一种基于通道注意力... 伪装目标分割(COS)的目标是从背景中分离出隐藏的目标对象。近年来,基于卷积神经网络(CNN)的伪装目标检测(COD)发展迅速,然而仍存在无法从前/背景高度相似的场景中准确地检测出完整目标对象的问题。针对上述问题,提出一种基于通道注意力(CA)和边缘融合的COS方法CANet(Network based on Channel Attention and edge fusion),以得到伪装目标的边缘细节更清晰的完整分割结果。首先,引入压缩和激励(SE)注意力模块,以提取更丰富的高级语义特征;其次,提出一个边缘融合模块,抑制低级特征中的干扰,并充分利用图像的边缘细节信息;最后,设计了基于深度可分离卷积的通道注意力模块,以自上而下的方式逐步融合跨级的多尺度特征,进一步地提升检测精度和效率。在多个公开的COD数据集上的实验结果表明,相较于SINet(Search Identification Net)、TINet(Textureaware Interactive guidance Network)和C2FNet(Context-aware Cross-level Fusion Network)等8种主流的方法,CANet表现更佳,且能够获取到丰富的伪装目标内部及边缘细节信息,而且在具有挑战性的COD10K数据集上结构度量指标相较于SINet提升了2.6个百分点。CANet性能优越,适用于医学上检测与人体组织相似的病灶区域、军事领域检测隐蔽目标等相关领域。 展开更多
关键词 伪装目标分割 边缘融合 压缩和激励注意力模块 深度可分离卷积 多尺度特征
在线阅读 下载PDF
基于CBAM-GLU-ISF的多模态融合恶意软件检测方法
14
作者 彭飞鸿 刘万平 黄东 《计算机工程与应用》 北大核心 2025年第20期306-314,共9页
恶意软件普遍结合代码混淆技术,基于单特征的检测方法特征信息受限,相对多特征检测方法存在检测准确率偏低的问题。不同模态之间潜在的关联性信息可以提高检测效果上限,目前的多特征检测方法在特征融合时缺乏对特征之间关联性的建模,导... 恶意软件普遍结合代码混淆技术,基于单特征的检测方法特征信息受限,相对多特征检测方法存在检测准确率偏低的问题。不同模态之间潜在的关联性信息可以提高检测效果上限,目前的多特征检测方法在特征融合时缺乏对特征之间关联性的建模,导致其检测准确率欠佳。为了更全面地表征恶意软件并提高检测精度,提出一种基于卷积神经网络CNN和门控线性单元GLU的多模态融合恶意软件检测方法CBAM-GLU-ISF。以恶意软件两种模态:灰度图和字节序列为分析对象,在卷积神经网络中添加卷积块注意力模块(CBAM),结合通道注意力和空间注意力实现对灰度图的关键特征提取。字节序列是软件在计算机上最直接的表示,门控线性单元结合加性注意力机制(additive attention)在高效地捕获长序列依赖关系的基础上,实现对字节序列关键特征的提取。多模态特征融合模块(ISF)对并行特征提取网络的两种模态特征进行融合,挖掘利用两种模态特征之间存在的关联性信息,将恶意软件表征为一个更全面的多模态特征。最后,通过检测层完成恶意软件识别。实验结果表明,所提方法检测准确率达到99.1%,AUC达到了99.8%,对比现有工作中的单特征和多特征检测算法有明显提升,验证了该方法的有效性。 展开更多
关键词 恶意软件检测 多模态融合 卷积神经网络(CNN) 卷积注意力模块 门控线性单元(GLU)
在线阅读 下载PDF
基于CNN-BiLSTM-CBAM的多特征融合恶意PDF文档检测方法
15
作者 王友贺 孙奕 《信息网络安全》 北大核心 2025年第10期1579-1588,共10页
为应对现有恶意PDF文档检测方法忽视特征之间语义关系以及局限于单一类型的特征分析等问题,文章提出一种检测方案,将CNN-BiLSTM-CBAM的模型和多特征融合应用于恶意PDF文档检测中。该方法不仅融合了静态分析中提取的常规信息和结构信息,... 为应对现有恶意PDF文档检测方法忽视特征之间语义关系以及局限于单一类型的特征分析等问题,文章提出一种检测方案,将CNN-BiLSTM-CBAM的模型和多特征融合应用于恶意PDF文档检测中。该方法不仅融合了静态分析中提取的常规信息和结构信息,还结合了动态分析捕获的API序列信息,构建了一个全面多维的特征集。首先,该模型利用卷积神经网络提取特征集中的局部特征;然后,利用双向长短时记忆(BiLSTM)网络捕获特征间的依赖性和上下文语义关系特征,通过卷积块注意力模块(CBAM)为不同特征分配不同的权重,筛选出较具区分性的关键特征;最后,利用Softmax分类器计算检测结果。实验结果表明,与现有方法相比,该模型在准确率、召回率和F1分数等关键性能指标上均展现出显著优势,有效提升了恶意PDF文档的检测性能。 展开更多
关键词 恶意PDF文档检测 多特征融合 卷积注意力模块 双向长短时记忆网络
在线阅读 下载PDF
基于多层注意力机制的图文双模态情感分析 被引量:6
16
作者 周婷 杨长春 《计算机工程与设计》 北大核心 2023年第6期1853-1859,共7页
针对在图文双模态情感分析任务中,容易忽略通道信息,造成关键信息遗漏以及特征融合不充分、不考虑各模态权重的问题,提出一种基于多层注意力机制的图文双模态情感分析模型(multi-level attention mechanism fusion,MAMF)。使用BERT模型... 针对在图文双模态情感分析任务中,容易忽略通道信息,造成关键信息遗漏以及特征融合不充分、不考虑各模态权重的问题,提出一种基于多层注意力机制的图文双模态情感分析模型(multi-level attention mechanism fusion,MAMF)。使用BERT模型和双向长短时记忆网络结合的方式获得文本特征;在图片特征抽取中,引入卷积注意力模块(convolutional block attention module,CBAM)生成视觉注意特征;利用视觉引导的文本注意力和文本引导的视觉注意力重构特征向量,在特征融合中使用注意力机制对不同模态加权以区别其影响,最后输出进行分类。在多模态情感数据集MVSA上的实验验证了模型的有效性。 展开更多
关键词 图文情感分析 深度学习 卷积神经网络 卷积注意力模块 注意力机制 模态融合 多模态识别
在线阅读 下载PDF
结合轻量化与多尺度融合的交通标志检测算法 被引量:3
17
作者 兰红 王惠钊 《计算机工程》 CAS CSCD 北大核心 2024年第10期381-392,共12页
交通标志检测在自动驾驶领域具有重要的应用价值,及时准确地检测交通目标对提高驾驶安全性和预防交通事故具有重要意义。针对交通标志尺寸小,易受遮挡,在复杂环境下容易出现漏检、错检等问题,在YOLOv8的结构基础上提出一种结合轻量化与... 交通标志检测在自动驾驶领域具有重要的应用价值,及时准确地检测交通目标对提高驾驶安全性和预防交通事故具有重要意义。针对交通标志尺寸小,易受遮挡,在复杂环境下容易出现漏检、错检等问题,在YOLOv8的结构基础上提出一种结合轻量化与多尺度融合的交通标志检测网络架构M-YOLO,构建M-YOLOs模型来应对高精度需求的检测任务,并调整网络深度得到更轻量化的M-YOLOn模型来解决不同环境下的检测需求。首先针对交通标志目标尺寸小、图像特征流失的问题,通过增加小目标检测层,保留更多的特征信息,提高网络对于小目标的特征学习能力。提出高效多尺度特征金字塔融合网络MPANet,将浅层特征图进行降维与跳跃连接,从而融合更多的图像特征信息。然后提出融合稀疏注意力和空间注意力的BRSA注意力模块,有效提取全局和局部的位置信息,减少复杂背景下对于关键信息的干扰。最后设计两种轻量高效的BBot模块和C2fGhost模块,以提高模型运算速度并减少参数量。实验结果表明,M-YOLO相较于YOLOv8,参数量降低约1/3。在TT100K数据集和GTSDB数据集上,M-YOLOs检测精度分别提升了9.7和2.1个百分点,M-YOLOn检测精度分别提升了14.5和2.6个百分点,在轻量化的同时具备更高的检测效果。M-YOLO架构解决了浅层特征图在特征提取过程中信息丢失的问题,并显著降低模型特征提取过程中冗余的计算开销,在实景采集的数据集上证实效果有效,表明在交通标志检测任务中具有应用价值。 展开更多
关键词 卷积神经网络 轻量化模型 目标检测 注意力模块 多尺度融合
在线阅读 下载PDF
基于双流自适应时空增强图卷积网络的手语识别 被引量:2
18
作者 金彦亮 吴筱溦 《应用科学学报》 CAS CSCD 北大核心 2024年第2期189-199,共11页
针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使... 针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使用人体身体、手部和面部节点作为输入,构造基于人体关节和骨骼的双流结构。通过自适应时空图卷积模块生成不同部位之间的连接,并充分利用其中的位置和方向信息。同时采用残差连接方式设计自适应多尺度时空注意力模块,进一步增强该网络在空域和时域的卷积能力。将双流网络提取到的有效特征进行加权融合,可以分类输出手语词汇。最后在公开的中文手语孤立词数据集上进行实验,在100类词汇和500类词汇分类任务中准确率达到了95.57%和89.62%。 展开更多
关键词 骨架数据 双流结构 自适应时空图卷积模块 自适应多尺度时空注意力模块 特征融合
在线阅读 下载PDF
融合局部和全局特征的息肉分割模型 被引量:1
19
作者 张攀峰 杨贺 +2 位作者 神显豪 程小辉 杜慧 《电子测量技术》 北大核心 2024年第16期100-109,共10页
针对现有模型在息肉分割中存在复杂区域分割困难、边缘细节信息丢失、泛化能力不足等问题,提出一种融合局部和全局特征的息肉分割模型。以卷积神经网络和Transformer作为并行编码器,使模型可以兼顾多种尺度的局部细节特征和全局语义特征... 针对现有模型在息肉分割中存在复杂区域分割困难、边缘细节信息丢失、泛化能力不足等问题,提出一种融合局部和全局特征的息肉分割模型。以卷积神经网络和Transformer作为并行编码器,使模型可以兼顾多种尺度的局部细节特征和全局语义特征;在跳跃连接处构建注意力增强模块和多尺度残差模块,前者强化模型对重要信息的关注度,后者高效探索目标区域并准确预测其边界,同时促进不同层次特征之间的交互;在解码阶段采用基于残差的逐步上采样特征融合方式汇聚各阶段特征,进一步增强模型的感知能力,丰富息肉特征;最后使用高效预测头促进浅层特征的融合,输出分割结果。该模型在多个对比实验中表现最优,同次优模型相比,在Kvasir、CVC-ClinicDB数据集上,mDice平均提升了1.21%;mIoU平均提升了1.82%;在CVC-ColonDB、ETIS数据集上,mDice平均提升了2.67%,mIoU平均提升了2.83%。实验结果表明,相比于现有主流模型,该模型具有较优的分割精度和泛化性能。 展开更多
关键词 息肉分割 TRANSFORMER 卷积神经网络 注意力增强模块 多尺度残差模块 特征融合
在线阅读 下载PDF
平衡多尺度注意力网络的视网膜血管分割算法 被引量:2
20
作者 梁礼明 余洁 +2 位作者 陈鑫 周珑颂 冯新刚 《计算机工程与设计》 北大核心 2023年第2期480-487,共8页
针对现有算法对微血管分割精度低、难以区分病灶区域等问题,提出一种平衡多尺度注意力网络用于分割视网膜血管。在编码阶段引入多尺度特征提取模块,提升感受野减少血管细节特征损失;在编码和解码器间增加细节增强模块,突出目标区域提高... 针对现有算法对微血管分割精度低、难以区分病灶区域等问题,提出一种平衡多尺度注意力网络用于分割视网膜血管。在编码阶段引入多尺度特征提取模块,提升感受野减少血管细节特征损失;在编码和解码器间增加细节增强模块,突出目标区域提高信息敏感度;设计平衡尺度注意力模块调节细节和语义特征进行最终预测,减少伪影现象。实验结果表明,在DRIVE数据集上分割准确率为96.42%、灵敏度为83.17%、特异性为98.27%,优于现有其它算法。 展开更多
关键词 图像处理 血管分割 空洞卷积 多尺度特征融合 校准残差模块 细节增强模块 注意力机制
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部