期刊文献+
共找到3,787篇文章
< 1 2 190 >
每页显示 20 50 100
基于轻量级注意力残差网络的面部表情识别方法
1
作者 郜高飞 邵党国 +1 位作者 马磊 易三莉 《吉林大学学报(理学版)》 北大核心 2025年第2期437-444,共8页
针对卷积神经网络参数量大、训练时间长的问题,提出一种基于轻量级注意力残差网络的面部表情识别方法.首先,以残差网络为骨架重新搭建模型,通过减少层数并改进残差模块提高模型性能;其次,引入深度可分离卷积减少模型的参数量和计算工作... 针对卷积神经网络参数量大、训练时间长的问题,提出一种基于轻量级注意力残差网络的面部表情识别方法.首先,以残差网络为骨架重新搭建模型,通过减少层数并改进残差模块提高模型性能;其次,引入深度可分离卷积减少模型的参数量和计算工作量;最后,采用Mish函数替代ReLU函数的挤压激励模块自适应地调整通道权重.该模型在两个公共数据集CK+和JAFFE上采用经典的十折交叉验证方式进行验证,分别获得了98.16%和96.67%的准确率.实验结果表明,该方法在模型识别精度和复杂度之间进行了较好权衡. 展开更多
关键词 面部表情识别 轻量级 残差网络 深度可分离卷积 注意力机制
在线阅读 下载PDF
基于图注意力网络和门控网络的轻量级单通道语音分离方法
2
作者 余传旗 郭海燕 +2 位作者 王婷婷 王景润 杨震 《信号处理》 北大核心 2025年第4期706-717,共12页
语音分离旨在从包含多个说话人的混合语音中分离出各个源语音,是多说话人场景下语音处理类任务的重要前端。目前,基于深度学习的语音分离取得了显著进展,但随着模型性能的不断提升的同时,模型的参数量和推理时间也显著增加。针对此问题... 语音分离旨在从包含多个说话人的混合语音中分离出各个源语音,是多说话人场景下语音处理类任务的重要前端。目前,基于深度学习的语音分离取得了显著进展,但随着模型性能的不断提升的同时,模型的参数量和推理时间也显著增加。针对此问题,本文综合考虑模型效率与分离性能,提出一种基于图注意力网络(Graph Attention Network,GAT)和门控网络(Gated Network,GN)的轻量级语音分离模型(称为GGN-Papez)。该方法基于轻量级、高效的基线模型Papez,引入GAT处理听觉记忆块内存储的全局信息,并使用GN生成掩码,来提升基线模型Papez的性能。具体地,假定所有记忆令牌之间均存在连接,利用GAT计算令牌间的注意力得分,并采用阈值过滤策略裁剪掉得分较低的边,生成新的邻接矩阵。再利用此邻接矩阵聚合记忆令牌所存储的全局信息,以提取出更有效的上下文信息,提高模型对全局特征的理解能力。在此基础上,考虑到Papez使用的掩码生成模块为表达能力有限的双层全连接前馈神经网络,本文提出使用具备更强特征选择能力的GN替代原有模块,以生成更符合源语音特征的掩码。所提模型GGN-Papez在基准数据集WSJ0-2Mix和Libri2Mix上进行了实验,实验结果表明所提方法在增加很少参数量的情况下,显著提升了分离语音的尺度不变信噪比(Scale Invariant Signal-to-Noise Ratio,SI-SNR)。此外,本文还设计了消融实验验证GAT和GN对整体模型性能的影响,并从推理时间和语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ)得分等方面综合地对所提模型的性能进行了分析。 展开更多
关键词 语音分离 轻量级模型 图神经网络 注意力网络 门控机制
在线阅读 下载PDF
一种融合注意力机制的轻量级重楼饮片分类方法
3
作者 罗晋 张俊华 +2 位作者 罗旭东 李学芳 张鑫 《计算机应用与软件》 北大核心 2025年第6期186-192,201,共8页
针对重楼属植物中毛重楼、滇重楼、白花重楼的自动化识别问题,提出一种融合注意力机制的轻量级重楼饮片分类模型。首先,提出两种多尺度特征提取模块,综合提取多种尺度特征。然后,在ECA-Net(Efficient Channel Attention Network)和空间... 针对重楼属植物中毛重楼、滇重楼、白花重楼的自动化识别问题,提出一种融合注意力机制的轻量级重楼饮片分类模型。首先,提出两种多尺度特征提取模块,综合提取多种尺度特征。然后,在ECA-Net(Efficient Channel Attention Network)和空间注意力机制的基础上提出ECSA-Module(Efficient Channel and Spatial Attention Module),使特征图通道和空间信息得到充分利用。最后对主干网络进行密集连接,并使用随机擦除方法进行数据增强。实验表明,该模型的分类准确率高达96.74%,相较于MobileNet-V2、VGG16、Xception等模型分别提高了3.26百分点、2.82百分点、2.22百分点。基于该模型开发出的重楼识别系统精度高、速度快,具有重要的实践应用价值。 展开更多
关键词 重楼分类 深度学习 卷积神经网络 注意力机制 多尺度特征提取
在线阅读 下载PDF
基于多头自注意力机制的轻量级包裹破损检测算法 被引量:1
4
作者 周耀威 孔令军 +6 位作者 戴琪 郭乐婷 张楠 蒋阮昕明 叶全意 赵宁 金秀峰 《无线电通信技术》 北大核心 2025年第1期161-170,共10页
为了解决深度学习包裹破损检测中遇到的数据多样和复杂性问题,提出了一种基于多头自注意力(Multi-Head Self-Attention,MHSA)机制与卷积神经网络(Convolutional Neural Network,CNN)模块的轻量级包裹破损检测算法。在YOLOv7框架的基础上... 为了解决深度学习包裹破损检测中遇到的数据多样和复杂性问题,提出了一种基于多头自注意力(Multi-Head Self-Attention,MHSA)机制与卷积神经网络(Convolutional Neural Network,CNN)模块的轻量级包裹破损检测算法。在YOLOv7框架的基础上,采用了BoT3模型替换主干网络部分,使其能够更好地捕捉输入序列中的长距离依赖关系,从而提高特征表达能力;使用卷积块注意力模块(Convolutional Block Attention Module,CBAM)注意力机制对特征融合部分中的MP-2模块进行融合,使其能够更有效地挖掘特征图中的通道和位置相关性,从而提升网络的感知能力和性能。通过在多个不同的数据集上进行测试,在各类包裹图像的平均精度均值(Mean Average Precision,mAP)方面达到了88.4%,与YOLOv7相比检测精度提升了10.9%,利于实际场景下的包裹破损检测。 展开更多
关键词 深度学习 目标检测 包裹检测 轻量级 注意力机制
在线阅读 下载PDF
融合注意力机制和轻量级卷积神经网络的胸部CT影像分类方法研究 被引量:1
5
作者 王威 许玉燕 +2 位作者 王新 黄文迪 袁平 《中国生物医学工程学报》 CAS CSCD 北大核心 2024年第4期429-437,共9页
同一疾病类型的CT影像也会由于患者患病严重程度不同而呈现差异,现主要临床诊断方法依赖医生专业能力及过往经验,客观性有待增强,效率有待提高。针对以上问题,提出一个融合注意力机制的CT分类网络—并联轻量级CT分类卷积神经网络(PC-CTN... 同一疾病类型的CT影像也会由于患者患病严重程度不同而呈现差异,现主要临床诊断方法依赖医生专业能力及过往经验,客观性有待增强,效率有待提高。针对以上问题,提出一个融合注意力机制的CT分类网络—并联轻量级CT分类卷积神经网络(PC-CTNet)。该网络主要由并联支路通道混洗(PCS)模块和深度高效跳跃连接(DES)模块组成。PCS模块采用双分支并联,融合了多尺度感受野的特征;DES模块则利用卷积和高效通道注意力提取有效的深层类间区分信息,并通过跳跃连接避免梯度消失。结果表明,PC-CTNet模型在包含5988张大小不一的CT数据集上分类准确率能达到98.46%,在包含194922张的开源数据集上分类准确率能达到98.75%。PC-CTNet的各项性能指标均接近现有的胸部CT分类网络,且其参数量和计算量约为0.32、75.58 M,分别为实验比较中胸部CT分类网络的10.17%和3.21%,拥有更高的参数效率和计算效率,能有效辅助医生诊断,提高诊断效率和客观性。 展开更多
关键词 注意力机制 胸部CT影像 卷积神经网络 PC-CTNet
在线阅读 下载PDF
轻量级注意力机制与跨尺度融合的船舶目标检测
6
作者 李冬琴 彭琪 吴洋 《电光与控制》 北大核心 2025年第4期52-57,共6页
针对船舶上算力资源有限导致的检测算法速度慢和检测率低问题,基于YOLOv5s算法,提出了轻量级注意力机制与跨尺度融合的船舶目标检测算法。在主干网络中引入轻量级注意力机制SimAM,并与颈部网络跨尺度进行融合,提升算法的检测精度;引入... 针对船舶上算力资源有限导致的检测算法速度慢和检测率低问题,基于YOLOv5s算法,提出了轻量级注意力机制与跨尺度融合的船舶目标检测算法。在主干网络中引入轻量级注意力机制SimAM,并与颈部网络跨尺度进行融合,提升算法的检测精度;引入轻量化卷积C3Ghost和GhostConv降低检测算法的参数量,实现船舶的实时检测;对于边界框回归损失,采用自适应参数提高锚框的适应性以及鲁棒性。最后,与其他流行算法在SeaShips数据集上进行对比和消融实验,结果验证了所提算法的有效性。 展开更多
关键词 船舶检测 YOLOv5s 轻量级注意力机制 轻量化卷积
在线阅读 下载PDF
基于残差分组卷积神经网络和多级注意力机制的源荷极端场景辨识方法 被引量:1
7
作者 郭红霞 李渊 +2 位作者 陈凌轩 王建学 马骞 《电网技术》 北大核心 2025年第2期459-469,I0019-I0024,共17页
为应对极端天气事件给新型电力系统安全稳定运行带来的影响,在电网的生产模拟中需要考虑极端场景。然而极端场景历史样本数量少,传统场景生成方法无法直接生成极端场景,需要对场景进行辨识。为此,提出一种计及源荷双侧的极端场景辨识方... 为应对极端天气事件给新型电力系统安全稳定运行带来的影响,在电网的生产模拟中需要考虑极端场景。然而极端场景历史样本数量少,传统场景生成方法无法直接生成极端场景,需要对场景进行辨识。为此,提出一种计及源荷双侧的极端场景辨识方法。首先,将风电、光伏和负荷序列进行重塑,并在通道维度上拼接;然后,基于分组卷积和深度残差网络,提取场景的时序特征和源荷场景之间的耦合特征;其次,模型内部嵌入通道注意力机制和多头注意力机制,以赋予重要特征更大的权重,并对场景进行分类;此外,采用改进损失函数解决训练样本中数据集不均衡的问题;最后,基于历史数据集进行验证。验证结果表明,所提方法能够对场景进行有效的分类,可以从历史场景中识别出具有高保供或高消纳风险的源荷极端场景。 展开更多
关键词 极端场景辨识 残差神经网络 分组卷积 注意力机制 源荷不确定性
在线阅读 下载PDF
基于孪生网络和交叉注意力机制的空域和JPEG图像隐写分析
8
作者 张倩倩 李浩 +2 位作者 张祎 马媛媛 罗向阳 《计算机学报》 北大核心 2025年第6期1305-1326,共22页
近年来,深度学习在图像隐写分析任务中表现出了优越的性能。然而,此类方法在捕获图像中微弱的隐写噪声时,往往会因下采样过程中大量关键细节信息的丢失,导致在检测空域和JPEG隐写图像时难以同时实现高检测准确率。为此,本文基于孪生神... 近年来,深度学习在图像隐写分析任务中表现出了优越的性能。然而,此类方法在捕获图像中微弱的隐写噪声时,往往会因下采样过程中大量关键细节信息的丢失,导致在检测空域和JPEG隐写图像时难以同时实现高检测准确率。为此,本文基于孪生神经网络对图像进行分区域细粒度学习,同时利用交叉注意力机制进一步增强模型全局信息感知能力,提出一种跨通道交叉注意力增强的隐写分析方法(CES-Net)。首先,采用孪生神经网络作为主干网对图像进行分区域学习,以细致地感知空域和JPEG图像的像素信息和微弱的隐写噪声,同时,设计了多样化的高通滤波器和多层卷积作为网络预处理层来获取丰富且高质量的隐写噪声残差;接着,改进了特征提取部分,提出了跨通道交叉注意力网络,使模型提取到更多因隐写嵌入对图像像素相关性造成扰动的隐写特征,用于基于秘密噪声残差等弱信息的隐写图像分类任务;最后,融合子网络学习到的不同区域图像的分类特征,并输入全连接层组成的分类模块对载体和载密图像进行分类,提升检测效果。在隐写和隐写分析领域常用的图像数据集BOSSBase-1.01和BOWs2上进行了大量实验,结果表明,CES-Net方法与现有方法相比,对于空域和JPEG图像的多种主流隐写算法均能达到目前最优的检测准确率,其中,对多种空域隐写算法(WOW、S-UNIWARD和HILL)在不同嵌入比率下生成的载密图像,检测准确率最高分别提升1.27%~25.61%、2.1%~21.73%和1.69%~23.46%;对JPEG图像自适应隐写算法J-UNIWARD在不同嵌入比率下生成的载密图像,CES-Net方法对两种质量因子(QF=75和QF=85)的JPEG图像隐写检测准确率最高分别提升2.34%和2.06%。 展开更多
关键词 隐写分析 隐写 孪生网络 交叉注意力机制 信息隐藏
在线阅读 下载PDF
融合深度残差网络与注意力机制的驾驶人行为检测方法研究
9
作者 陈运星 崔军华 +2 位作者 吴钊 吴华伟 袁星宇 《重庆理工大学学报(自然科学)》 北大核心 2025年第3期34-42,共9页
为提高驾驶人行为检测的准确性及模型的可解释性,提出了一种融合深度残差网络与注意力机制的驾驶人行为检测模型。利用深度残差网络提取特征模块的优势,对比不同层数的网络模型结果,选取合适的网络模型作为基础网络;为剔除无用信息对驾... 为提高驾驶人行为检测的准确性及模型的可解释性,提出了一种融合深度残差网络与注意力机制的驾驶人行为检测模型。利用深度残差网络提取特征模块的优势,对比不同层数的网络模型结果,选取合适的网络模型作为基础网络;为剔除无用信息对驾驶行为的干扰,引入SE Block注意力机制并对图像进行特征提取和分类预测;通过与其他模型的对比试验、消融试验和特征可视化试验验证所提出模型的性能。结果表明:与其他检测模型相比,所提出模型的平均分类准确率为99.89%,其展现出更优的性能;采用Grad-CAM可视化方法解释模型的关注区域,所提出模型更精准地关注对驾驶行为判定的关键特征,进一步增强了本模型的可解释性,提高了人们对驾驶行为检测模型的信任性。 展开更多
关键词 深度学习 驾驶人行为检测 深度残差网络 注意力机制 神经网络可视化
在线阅读 下载PDF
基于双向长短时记忆网络和自注意力机制的心音分类
10
作者 卢官明 李齐健 +4 位作者 卢峻禾 戚继荣 赵宇航 王洋 魏金生 《数据采集与处理》 北大核心 2025年第2期456-468,共13页
心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进... 心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进行分帧处理,提取每帧心音信号的梅尔频率倒谱系数(Mel⁃frequency cepstral coefficients,MFCC)特征;将MFCC特征序列输入Bi⁃LSTM网络,利用Bi⁃LSTM网络提取心音信号的时域上下文特征;通过自注意力机制动态调整Bi⁃LSTM网络各时间步输出特征的权重,得到有利于分类的更具鉴别性的心音特征;通过Softmax分类器实现正常/异常心音的分类。在PhysioNet/CinC Challenge 2016心音数据集上对所提出的算法使用10折交叉验证法进行了评估,得到0.9425的灵敏度、0.9437的特异度、0.8367的精度、0.8865的F1得分和0.9434的准确率,优于对比的典型算法。实验结果表明,该算法在无需进行心音分段的基础上就能有效实现异常心音检测,具有潜在的临床应用前景。 展开更多
关键词 心音分类 梅尔频率倒谱系数 双向长短时记忆网络 注意力机制
在线阅读 下载PDF
基于双向长短记忆网络和注意力机制的鸡白痢病音频检测
11
作者 漆海霞 张嘉琪 +2 位作者 江锦卓 冯榆森 陈日耀 《中国农机化学报》 北大核心 2025年第8期66-74,96,共10页
鸡白痢病是由鸡白痢沙门氏菌引起的一种传染性疾病,对养鸡业构成严重威胁。鉴于早期监测对预防疾病传播的重要性,提出一种基于深度学习的音频识别模型FlockVigil—Net,旨在实现对鸡白痢病的高效检测。首先,采用Smooth—HF降噪方法,结合... 鸡白痢病是由鸡白痢沙门氏菌引起的一种传染性疾病,对养鸡业构成严重威胁。鉴于早期监测对预防疾病传播的重要性,提出一种基于深度学习的音频识别模型FlockVigil—Net,旨在实现对鸡白痢病的高效检测。首先,采用Smooth—HF降噪方法,结合平滑机制谱减法和高通滤波器,从包含鸡叫声、行为噪声和环境噪声的复杂声音数据中提取清晰鸡叫声。随后,通过基于时间限制条件的端点检测算法分割鸡声音段,并计算鸡叫声的语谱图、FBANK和Mel频率倒谱系数(MFCC)3个特征,进一步形成特征合并图,为疾病识别提供丰富的声学信息。FlockVigil—Net模型融合卷积神经网络、双向长短记忆网络(BILSTM)和多头注意力机制,实现对鸡白痢病感染鸡只的高准确率识别。试验结果表明,在鸡白痢病确认后的第2~8天,模型识别率从86.53%提升至90.26%。与其他语音识别模型相比,FlockVigil—Net展现出更优的性能,为鸡白痢病的早期诊断提供一种高效、准确的音频检测方法。 展开更多
关键词 鸡病检测 双向长短记忆网络 注意力机制 谱减法
在线阅读 下载PDF
基于注意力机制的双卷积图像去噪网络
12
作者 周先春 吕梦楠 +3 位作者 芮旸 唐彬鑫 杜志亭 陈玉泽 《电子测量与仪器学报》 北大核心 2025年第2期60-71,共12页
近年来,深度卷积神经网络在图像去噪领域表现出了优越的性能。然而,深度网络结构往往伴随着大量的模型参数,导致训练成本高,推理时间长,限制了其在实际去噪任务中的应用。提出了一种新的基于注意力机制的双卷积图像去噪网络(MA-DFRNet)... 近年来,深度卷积神经网络在图像去噪领域表现出了优越的性能。然而,深度网络结构往往伴随着大量的模型参数,导致训练成本高,推理时间长,限制了其在实际去噪任务中的应用。提出了一种新的基于注意力机制的双卷积图像去噪网络(MA-DFRNet),它由多尺度特征特征提取网络、双卷积神经网络及动态特征精炼注意力机制组成。多尺度特征提取网络通过不同尺度的卷积获取图像特征,提高灵活性。双卷积神经网络上下分支均采用跳跃连接及扩张卷积来增大感受野。动态特征精炼注意力机制增强特征表示的精度和区分能力。这种结构设计不仅扩大了感受野,还更有效地提取和融合图像特征,显著提升去噪效果。研究结果表明,与最先进的模型相比,提出的MA-DFRNet在所有对比的噪声水平下具有更高的峰值信噪比(PSNR)和结构相似性(SSIM)值,PSNR提高了0.2 dB左右,SSIM提高了1%左右,对于噪声水平较高的图像更具鲁棒性,并且在视觉上更好地保留了图像细节,实现去噪和细节保留之间的平衡。 展开更多
关键词 图像去噪 卷积神经网络 注意力机制 跳跃连接 多尺度特征提取网络
在线阅读 下载PDF
基于注意力机制和多尺度融合的人群计数网络
13
作者 栾方军 龚琪 袁帅 《计算机工程》 北大核心 2025年第3期352-361,共10页
为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),... 为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),将主干网络中不同层次的特征进行跨尺度融合,融合后的特征包含了不同尺度的语义信息,可以更好地适应人群计数任务中的尺度变化问题。接着为了更好地解决人群计数中存在的挑战,设计一个多尺度注意力模块(MSAM),根据不同感受野的分支提取不同尺度的特征,利用选择性Kernel通道注意力(SKCA)缓解多列结构存在的特征相似问题,并将模块生成的注意力图反馈到对应的尺度特征中,以抑制背景的干扰。网络模型在ShanghaiTechA数据集中的平均绝对误差(MAE)和均方根误差(RMSE)分别达到了56.1和93.9;在ShanghaiTechB数据集中的MAE和RMSE分别达到了6.1和10.3;在UCF_CC_50数据集中的MAE和RMSE分别达到了174.9和252.7;在Mall数据集中的MAE和RMSE分别达到了1.42和1.85。在公开数据集上的实验结果表明,提出的网络模型与现有代表性的人群计数方法相比,在提升人群计数任务的准确性和鲁棒性方面均取得了明显进展。 展开更多
关键词 人群计数 多尺度特征融合 注意力机制 神经网络 密度图
在线阅读 下载PDF
基于改进时域卷积网络与多头自注意力机制的间歇过程质量预测模型
14
作者 赵小强 柳勇勇 +1 位作者 惠永永 刘凯 《计算机应用》 北大核心 2025年第7期2245-2252,共8页
为提高时域卷积网络(TCN)在批量大小变化时的训练稳定性,并解决间歇过程质量预测在捕捉长期依赖性和全局关联性上存在不足而导致的预测准确度不高的问题,提出一种基于批量组规范化(BGN)和Mish激活函数改进残差结构的TCN(BMTCN)与多头自... 为提高时域卷积网络(TCN)在批量大小变化时的训练稳定性,并解决间歇过程质量预测在捕捉长期依赖性和全局关联性上存在不足而导致的预测准确度不高的问题,提出一种基于批量组规范化(BGN)和Mish激活函数改进残差结构的TCN(BMTCN)与多头自注意力机制(MHSA)的间歇过程质量预测模型(BMTCN-MHSA)。首先,将间歇过程的三维数据展开为二维矩阵形式,并对数据进行归一化处理,再引入奇异谱分析法(SSA)分解重构数据;其次,在时域卷积的残差部分融入BGN以降低网络模型在批量大小变化时的敏感度,引入Mish激活函数以提高模型的泛化能力,并利用多头自注意力机制对序列中不同位置的特征信息进行关联和权重分配,从而进一步提取序列中的关键特征信息和相互依赖关系,进而更好地捕捉间歇过程的动态特征;最后,使用青霉素仿真实验数据进行实验验证。实验结果表明,相较于TCN模型,BMTCN-MHSA模型的平均绝对误差(MAE)降低了56.86%,均方误差(MSE)降低了48.80%,而决定系数(R2)达到了99.48%,这表明BMTCN-MHSA模型提高了间歇过程质量预测的准确性。 展开更多
关键词 间歇过程 质量预测 奇异谱分析法 时域卷积网络 多头自注意力机制
在线阅读 下载PDF
LFTA:轻量级特征提取与加性注意力的特征匹配方法
15
作者 郭志强 汪子涵 +1 位作者 王永圣 陈鹏羽 《电子与信息学报》 北大核心 2025年第8期2872-2882,共11页
近年来,特征匹配技术在计算机视觉任务中得到了广泛应用,如3维重建、视觉定位和即时定位与地图构建(SLAM)等。然而,现有匹配算法面临精度与效率的权衡困境:高精度方法常因复杂模型设计导致计算复杂度攀升,难以满足实时需求;而快速匹配... 近年来,特征匹配技术在计算机视觉任务中得到了广泛应用,如3维重建、视觉定位和即时定位与地图构建(SLAM)等。然而,现有匹配算法面临精度与效率的权衡困境:高精度方法常因复杂模型设计导致计算复杂度攀升,难以满足实时需求;而快速匹配策略通过特征简化或近似计算虽实现亚线性时间复杂度,却因表征能力受限与误差累积,无法达到实际应用中的精度要求。为此,该文提出一种基于加性注意力的轻量化特征匹配方法—LFTA。该方法通过轻量化多尺度特征提取网络生成高效特征表示,并引入三重交换融合注意力机制,提升了在复杂场景下的特征鲁棒性;同时提出了自适应高斯核生成关键点热力图和动态非极大值抑制算法,以提高关键点的提取精度;此外,该文设计了结合加性Transformer注意力机制和深度可分离卷积位置编码的轻量化模块,对粗粒度匹配结果进行微调,从而生成高精度的像素级匹配点对。为了验证所提方法的有效性,在MegaDepth和ScanNet两个公开数据集上进行了实验评估,并通过消融实验和对比实验验证了各模块的贡献和模型的综合性能。实验结果表明,所提算法在姿态估计上的性能相比于轻量化的算法有显著提升,且与性能较高的算法相比推理时间有显著下降,实现了高效性与高精度的平衡。 展开更多
关键词 特征匹配 加性注意力机制 轻量化网络 自适应关键点提取 像素级匹配
在线阅读 下载PDF
嵌入注意力机制的时空网络设计及孔隙度可靠性预测
16
作者 李艳辉 陶悦 《石油地球物理勘探》 北大核心 2025年第3期555-563,共9页
孔隙度是评价储层和计算储量的一个重要指标。然而,传统取芯方法获取孔隙度成本较高,基于回归分析和统计学模型预测的孔隙度误差较大。为此,构建一种结合卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)和注意力机制的储层孔隙度预测模... 孔隙度是评价储层和计算储量的一个重要指标。然而,传统取芯方法获取孔隙度成本较高,基于回归分析和统计学模型预测的孔隙度误差较大。为此,构建一种结合卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)和注意力机制的储层孔隙度预测模型,并利用实际的测井数据验证其性能。首先通过CNN和BiLSTM捕获测井数据的复杂非线性时空关系;然后嵌入卷积自注意力机制,通过因果卷积产生查询和键,使局部信息更好地融入注意力机制中,相比传统自注意力机制,避免了异常数据对预测结果的影响;最后采用蒙特卡洛dropout的方法量化模型的不确定性,提供储层孔隙度预测的置信区间,进一步评估预测的可信度。多个模型对比实验表明,所提方法预测储层孔隙度的准确度较高;通过两口不同特性井的实验揭示,该方法泛化能力较强。 展开更多
关键词 储层孔隙度预测 卷积神经网络 双向长短期记忆网络 注意力机制 不确定性量化
在线阅读 下载PDF
融合结构化卷积和双重注意力机制的轻量级眼底图像分割网络 被引量:3
17
作者 汪华登 刘金 +4 位作者 黎兵兵 潘细朋 刘振丙 蓝如师 罗笑南 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第5期760-774,共15页
眼底血管图像的自动分割对于多种眼科疾病的计算机辅助诊断具有重要作用.针对血管的尺度差异和图像噪声导致眼底血管图像分割困难、使用单一尺度卷积运算的深度学习方法获取的特征感受野有限,以及现有的方法复杂度过高的问题,提出一个... 眼底血管图像的自动分割对于多种眼科疾病的计算机辅助诊断具有重要作用.针对血管的尺度差异和图像噪声导致眼底血管图像分割困难、使用单一尺度卷积运算的深度学习方法获取的特征感受野有限,以及现有的方法复杂度过高的问题,提出一个融合结构化卷积和双重注意力机制的轻量级眼底图像分割网络.通过编码器增强、减少下采样次数和特征深度的编码-解码网络设计,实现参数量只有0.63M的轻量化网络.在编码阶段,提出一种结构化卷积方法,有效地避免了网络训练过拟合,提高了网络捕获差异化血管特征的能力;在解码阶段,采用基于空间和通道的双重注意力机制,使网络更加关注血管特征的上下文和几何空间信息,抑制病变等噪声的干扰.在DRIVE,CHASE_DB1和STARE数据集上进行实验的结果表明,所提网络图像分割的准确率分别为96.92%,97.57%和97.51%,灵敏度分别为83.68%,84.99%和84.87%,受试者曲线下的面积(AUC)分别为98.67%,99.05%和99.02%;并通过在DRIVE和STARE数据集上的交叉训练,验证了该网络的泛化能力. 展开更多
关键词 眼底图像分割 编码-解码网络 轻量级网络 结构化卷积 双重注意力机制
在线阅读 下载PDF
基于改进注意力机制网络的电力设备图像识别 被引量:1
18
作者 伍颖欣 刘磊 +1 位作者 肖轶婷 关远鹏 《中国电机工程学报》 北大核心 2025年第3期870-883,I0006,共15页
在复杂工作环境下,电力设备的有效图像识别和状态分析可提升其运行维护能力,降低潜在停电风险。然而,传统的电力设备图像识别方法存在目标与背景特征信息难以分辨和特征信息提取能力不足等问题。该文提出一种改进注意力机制网络的电力... 在复杂工作环境下,电力设备的有效图像识别和状态分析可提升其运行维护能力,降低潜在停电风险。然而,传统的电力设备图像识别方法存在目标与背景特征信息难以分辨和特征信息提取能力不足等问题。该文提出一种改进注意力机制网络的电力设备图像检测识别方法。该方法提出面向电力设备目标特征信息的预测策略:引入深度值的变化过程学习机制,提取图像深层语义信息;通过叠加卷积核和剔除前置网络池化层,以改进全局结构信息学习网络模块,获得富含细节特征且关联图像特征的电力设备图像先验信息,进一步采用基于长短期记忆网络(long short-term memory,LSTM)门控机制在不同层级图像特征信息上预测其电力设备目标特征信息,构建LSTM门控机制的注意力机制网络。此外,该方法提出深浅层特征信息交互策略:采用矩阵外积方式整合浅层特征信息与深层特征信息,使模型充分学习电力设备的多层次特征信息。相比于传统的电力设备图像识别方法,所提的改进方案可加强目标的细节特征识别和提取,精确区分背景与目标模糊界限信息,提升深浅层特征信息的交互能力,有效提高在复杂背景环境下目标识别的准确率。实验结果表明,针对绝缘子、变压器、断路器、输电线电杆以及输电线铁塔5种电力设备图像数据集,该文所提出的模型识别准确率达92%,比CvT模型高1.6%。 展开更多
关键词 电力设备 注意力机制 智能检测 智能识别 神经网络
在线阅读 下载PDF
融合卷积神经网络和注意力机制的负荷识别方法 被引量:1
19
作者 赵毅涛 李钊 +3 位作者 刘兴龙 骆钊 王钢 沈鑫 《电力工程技术》 北大核心 2025年第1期227-235,共9页
对居民住宅进行非侵入式负荷监测(non-intrusive load monitoring,NILM)是智能电网用户需求侧的重要研究内容,居民负荷的能耗分析和用电管理是实现节能减排、可持续发展的关键环节。针对传统算法识别性能差、难以适应当下复杂用电环境... 对居民住宅进行非侵入式负荷监测(non-intrusive load monitoring,NILM)是智能电网用户需求侧的重要研究内容,居民负荷的能耗分析和用电管理是实现节能减排、可持续发展的关键环节。针对传统算法识别性能差、难以适应当下复杂用电环境的问题,文中从增强分类算法特征提取性能的优化思路出发,提出融合卷积神经网络(convolutional neural network,CNN)和自注意力机制的NILM负荷识别方法。首先,采集8种不同家用电器的电力数据,建立U-I轨迹曲线数据库;其次,采用挤压-激励网络(squeeze-and-excitation network,SENet)注意力机制提升CNN的特征聚合能力,完成对不同电器U-I轨迹曲线的特征提取和负荷识别;最后,对私有数据集和PLAID数据集进行测试,算例结果表明,所提方法在不同运行场景下均具有较高的识别准确率和较好的泛化性能。 展开更多
关键词 非侵入式负荷监测(NILM) 负荷识别 卷积神经网络(CNN) 挤压-激励网络(SENet) 注意力机制 特征提取 U-I轨迹
在线阅读 下载PDF
一种结合轻量级注意力机制的人体姿态估计算法
20
作者 李文星 喻明毫 +2 位作者 王子牛 高建瓴 林宁 《计算机应用与软件》 北大核心 2024年第5期131-137,共7页
针对现有的人体姿态估计模型存在的模型参数量和计算量大、冗余度高、耗时长等问题,提出一种基于轻量级注意力机制的网络框架。使用轻量级网络MobilenetV3替代了原OpenPose的主干网络VGG-19;对OpenPose的二分支多阶段的卷积神经网络框... 针对现有的人体姿态估计模型存在的模型参数量和计算量大、冗余度高、耗时长等问题,提出一种基于轻量级注意力机制的网络框架。使用轻量级网络MobilenetV3替代了原OpenPose的主干网络VGG-19;对OpenPose的二分支多阶段的卷积神经网络框架进行压缩;引入空间和通道相结合的注意力机制模块CBAM对模型的速度和精度进行权衡。实验结果表明,该方法下的网络模型大小和浮点计算量分别为10.51 MB和22.65 GFlops,相对于原OpenPose减少了79.91%和83.35%;在COCO2017测试集下,能够在保持较高的检测精度和召回率的基础上显著提升检测速度。 展开更多
关键词 人体姿态估计 计算机视觉 OpenPose 轻量级网络注意力机制
在线阅读 下载PDF
上一页 1 2 190 下一页 到第
使用帮助 返回顶部