期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
融合全局上下文注意力的遥感图像检测方法
1
作者 廖欢 朱文球 +1 位作者 雷源毅 徐轲 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第2期278-283,共6页
针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题,提出了一种融合全局上下文注意力的目标检测算法。该算法提出一种全局上下文注意力机制和YOLOv5中C3结构融合的模块,以提升网络捕捉图像全局... 针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题,提出了一种融合全局上下文注意力的目标检测算法。该算法提出一种全局上下文注意力机制和YOLOv5中C3结构融合的模块,以提升网络捕捉图像全局特征的能力;通过Varifocal Loss损失函数来提升对密集、尺寸小的目标的检测性能;采用基于归一化的注意力模块,降低图像中不太显著的特征和权重,使网络能够达到更高的检测准确率;利用动态卷积学习各个维度的信息,让训练得到的模型在降低GFLOPs情况下,同时保持检测精度提升。在NWPU VHR-10数据集上实验结果mAP为96.0%、准确率为98.2%、召回率为94.9%,较原YOLOv5模型分别提升了1.8%、4.7%和2.2%,证明了所改进YOLOv5方法的有效性。 展开更多
关键词 YOLOv5 遥感图像 Varifocal Loss 全局上下文注意力机制 动态卷积
在线阅读 下载PDF
双注意力随机选择全局上下文细粒度识别网络
2
作者 徐胜军 荆扬 +3 位作者 段中兴 李明海 李海涛 刘福友 《液晶与显示》 CAS CSCD 北大核心 2024年第4期506-521,共16页
针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空... 针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空间随机选择,使网络能够关注到其他潜在微小判别性特征;其次,利用全局上下文注意力模块将深层特征的语义信息融合到中间层,增强中间层定位微小特征的能力;最后,提出一种多分支损失,对中间层、深层和拼接层特征引入分类损失,结合不同分支提取到的特征,诱导网络获得多样性的判别特征。所提网络在Stanford-cars、CUB-200-2011、FGVC-Aircraft 3个公开细粒度数据集和真实场景下车型数据集VMRURS上分别达到了95.2%、92.1%、94.0%和97.0%的识别准确率,其性能相比其他对比方法有较大幅度提升。 展开更多
关键词 细粒度识别 ConvNeXt 注意力随机选择 全局上下文注意力 多分支损失
在线阅读 下载PDF
基于全局上下文机制的实体关系联合抽取方法
3
作者 张云涛 黄莺 《信息技术与信息化》 2025年第1期140-146,共7页
目前,中文电子病历进行实体关系抽取存在着因医疗文本表达模糊不准确、文本结构复杂而造成医疗关系识别不准确的问题。针对这一问题,文章提出了一种基于全局上下文机制的中文电子病历实体关系联合抽取模型——GCPRel。首先,该模型通过B... 目前,中文电子病历进行实体关系抽取存在着因医疗文本表达模糊不准确、文本结构复杂而造成医疗关系识别不准确的问题。针对这一问题,文章提出了一种基于全局上下文机制的中文电子病历实体关系联合抽取模型——GCPRel。首先,该模型通过BERT获取词表示。其次,借助全局上下文机制,将过去完成时和将来进行时的句子表征整合至每个单元格的句子表征内,以此更有效地捕捉文本里的上下文信息。再次,借助所获取的文本表征和词性信息,提取所有潜在的主语-宾语组合对。最后,通过biaffine模型为每个实体对分配可能的关系,得到医疗文本的三元组。采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示,在CHIP2020关系抽取数据集上的Precision为62.413%,Recall为60.737%,F1值为61.563%;在糖尿病数据集上的Precision、Recall和F1值分别为83.487%、80.583%和82.009%,证明了该模型的三元组抽取性能优于其它基线模型。 展开更多
关键词 关系抽取 联合抽取 全局上下文机制 词性信息
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法
4
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
融合上下文信息和注意力机制的行人检测算法
5
作者 荣幸 张志华 +1 位作者 冯东东 袁昊 《无线电工程》 2024年第9期2152-2161,共10页
针对复杂交通场景下行人特征信息提取不完整、检测精度不高的问题,提出一种基于YOLOv5网络改进的融合上下文信息和注意力机制的行人检测算法——YOLOv5-STRDC。将Swin Transformer置于骨干网络中,在高效获取全局信息的同时丰富上下文信... 针对复杂交通场景下行人特征信息提取不完整、检测精度不高的问题,提出一种基于YOLOv5网络改进的融合上下文信息和注意力机制的行人检测算法——YOLOv5-STRDC。将Swin Transformer置于骨干网络中,在高效获取全局信息的同时丰富上下文信息。提出融合5个并行空洞卷积和改进卷积块注意模块(Convolutional Block Attention Module,CBAM)注意力机制的空间金字塔池化(Spatial Pyramid Pooling,SPP)模块,输出较大图像范围信息的同时分别从通道和空间维度上增强了特征的融合能力。集成坐标注意力(Coordinate Attention,CA)机制,突出局部重点区域,以得到更准确的特征信息。YOLOv5-STRDC算法在公开的WiderPerson数据集和INRIA数据集上的平均精度均值(mean Average Precision,mAP)分别达到了71.60%和92.01%,相比YOLOv5模型,分别提升了1.80%和1.34%,实现了较好的行人检测效果。所提算法的检测速度分别达到了137.34、114.71帧/秒,满足了实时检测的要求。 展开更多
关键词 行人检测 上下文信息 空洞卷积 特征金字塔 注意力机制
在线阅读 下载PDF
基于上下文提取与注意力融合的遮挡服装图像分割
6
作者 顾梅花 花玮 +1 位作者 董晓晓 张晓丹 《纺织学报》 EI CAS CSCD 北大核心 2024年第5期155-164,共10页
针对遮挡服装图像分割准确率低的问题,提出一种融合上下文提取与注意力机制的遮挡服装图像实例分割方法。以Mask R-CNN为基础网络,首先采用上下文提取模块优化ResNet的输出特征,通过融合不同速率的多路径特征从多个感受野中捕获图像的... 针对遮挡服装图像分割准确率低的问题,提出一种融合上下文提取与注意力机制的遮挡服装图像实例分割方法。以Mask R-CNN为基础网络,首先采用上下文提取模块优化ResNet的输出特征,通过融合不同速率的多路径特征从多个感受野中捕获图像的上下文信息,强化遮挡服装特征表示的识别及提取能力;然后引入通道注意力机制与空间注意力机制的残差连接,自适应地专注于捕捉遮挡服装图像的空间和通道维度上的语义相互依赖关系,降低上下文提取模块在处理特征图时因冗余的上下文关系扩大造成误定位与误识别的概率;最后,采用目标检测损失函数CIoU计算原理作为非极大值抑制的评判标准,关注预测框和真实框的重叠与非重叠区域,最大程度地选择遮挡服装的最优目标框,使预测框更加贴近真实框。结果表明,与其它方法相比,改进方法显著改善了不同遮挡程度服装图像的误分割现象,能提取出更精确的服装实例,其对遮挡服装图像的平均分割精度比原模型提升了4.4%。 展开更多
关键词 图像分割 遮挡服装 上下文提取 注意力机制 CIoU计算原理
在线阅读 下载PDF
基于全局上下文和注意力机制深度卷积神经网络的地震数据去噪 被引量:14
7
作者 杨翠倩 周亚同 +2 位作者 何昊 崔焘 王杨 《石油物探》 CSCD 北大核心 2021年第5期751-762,855,共13页
在地震数据处理中,随机噪声压制是提高地震数据信噪比的关键。针对目前卷积神经网络大多关注局部特征以及在特征提取方面的局限性,提出了一种结合全局上下文和注意力机制的深度卷积神经网络(global context and attention-based deep co... 在地震数据处理中,随机噪声压制是提高地震数据信噪比的关键。针对目前卷积神经网络大多关注局部特征以及在特征提取方面的局限性,提出了一种结合全局上下文和注意力机制的深度卷积神经网络(global context and attention-based deep convolutional neural network,GC-ADNet),并用残差学习压制地震数据随机噪声的方法。其中,全局上下文模块(global context block,GCBlock)既关注局部信息,又能提取全局上下文信息;注意力模块(Attention Block)不仅强调关键特征,还能高效提取隐藏在复杂背景中的噪声信息。加入残差学习和批量规范化方法加快了网络的训练和收敛速度,使用扩张卷积扩大上下文信息并降低计算成本。将GC-ADNet应用于合成和实际地震数据处理,并与现有的去噪方法进行了比较。实验结果表明,GC-ADNet能够更有效压制随机噪声,并保留更多局部细节信息。 展开更多
关键词 地震数据 全局上下文 注意力机制 噪声压制 深度卷积神经网络
在线阅读 下载PDF
嵌入注意力机制并结合层级上下文的语音情感识别 被引量:9
8
作者 程艳芬 陈垚鑫 +1 位作者 陈逸灵 杨益 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2019年第11期100-107,共8页
由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入... 由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入注意力机制并结合层级上下文学习的双向长短时记忆(BLSTM)网络模型.模型分3个阶段完成语音情感识别任务,第1阶段提取情感语音特征全集后采用SVM-RFE特征排序算法降维得到最优特征子集,并对其进行注意力加权;第2阶段将加权后的特征子集输入BLSTM网络学习特征层上下文获得最初情感预测结果;第3阶段利用情感标签值对另一独立BLSTM网络训练学习标签层上下文信息并据此在第2阶段输出结果基础上完成最终预测.模型嵌入注意力机制使其自动学习调整对输入特征子集的关注度,引入标签层上下文使其联合特征层上下文实现层级上下文信息融合提高鲁棒性,提升了模型对情感语音的建模能力,在SEMAINE和RECOLA数据集上实验结果表明:与基线模型相比RMSE和CCC均得到较好改善. 展开更多
关键词 语音情感识别 注意力机制 上下文 双向长短时记忆网络
在线阅读 下载PDF
基于全局补偿注意力机制的战场图像去雾方法 被引量:1
9
作者 林森 王金刚 高宏伟 《兵工学报》 EI CAS CSCD 北大核心 2024年第4期1344-1353,共10页
在现代化战争中,广泛利用图像等载体获取信息,但雾天环境下得到的图像不仅影响场景呈现,而且会掩盖重要特征。为提高雾天图像在现代化战争的利用价值,提出一种基于全局补偿注意力机制的战场图像去雾方法。构建全局补偿模块保证输出图像... 在现代化战争中,广泛利用图像等载体获取信息,但雾天环境下得到的图像不仅影响场景呈现,而且会掩盖重要特征。为提高雾天图像在现代化战争的利用价值,提出一种基于全局补偿注意力机制的战场图像去雾方法。构建全局补偿模块保证输出图像的完整性,并加入通道下采样恢复清晰图像;使用密集残差模块学习退化图像和清晰图像的非线性映射,同时加入注意力机制提高网络的灵活处理能力;通过提升输入图像的通道数量确保网络充分学习特征信息。实验结果表明,与经典和新颖图像去雾方法比较,所提方法在主观和客观评价上均取得出色成绩,说明该方法将注意力机制和全局补偿模块充分结合,有效缓解了战场图像退化问题,同时注重特征增强,使信息得以完整呈现,具有更优越的性能。 展开更多
关键词 战场图像去雾 全局补偿 注意力机制 密集残差模块
在线阅读 下载PDF
基于全局注意力机制的Robust-PointPillars三维目标检测
10
作者 王盈丰 吴俭 +2 位作者 宋佳 柯涛 付伟 《舰船电子对抗》 2024年第2期86-92,共7页
提出了一种基于全局注意力机制的Robust-PointPillars三维目标检测方法,在智能驾驶的应用中,提高了目标检测的精度和鲁棒性。PointPillars等神经网络通过使用点云柱表示点云,具有实现三维目标检测的潜力。首先介绍了空间和通道双重注意... 提出了一种基于全局注意力机制的Robust-PointPillars三维目标检测方法,在智能驾驶的应用中,提高了目标检测的精度和鲁棒性。PointPillars等神经网络通过使用点云柱表示点云,具有实现三维目标检测的潜力。首先介绍了空间和通道双重注意力模块,以增强有学习价值的点云特征,解决了PointPillars缺乏点云柱内部学习机制和特征提取不足的问题;挤压与激励网络(SENet)模块的引入,使PointPillars对特征信息的学习理解能力得到进一步提高;最终,对受到干扰或缺失的传感器信号进行抑制,并利用全局注意力算法来提高鲁棒性。基于KITTI数据集上的目标检测结果,本文算法具有良好的目标检测精度和鲁棒性。 展开更多
关键词 三维目标检测 PointPillars 全局注意力机制 挤压与激励网络模块
在线阅读 下载PDF
结合上下文和注意力机制的特定目标情感分析 被引量:5
11
作者 于佳楠 李万龙 +2 位作者 郑山红 杨妥 苏珂 《长春工业大学学报》 CAS 2020年第2期142-148,共7页
在模型中引入评价目标的上下文信息,通过LSTM对其进行独立语义编码,同时引入基于评价目标的注意力机制,改善得到的情感特征信息。最后在SemEval2014 Task4的Restaurant和Twitter两个不同领域的数据集上进行了实验。
关键词 情感分析 神经网络 上下文信息 注意力机制
在线阅读 下载PDF
局部注意力引导下的全局池化残差分类网络 被引量:1
12
作者 姜文涛 董睿 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第7期107-124,共18页
大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其... 大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其次提出多分割局部增强注意力机制(MSLE)模块,MSLE模块将图像整体分割成多个小图像,增强每个小图像的局部特征,通过特征组交互的方式将局部重要特征引导到全局特征中;最后提出池化残差(PR)模块来处理ResNet残差结构丢失信息的问题,提高各层之间的信息利用率。实验结果表明,MSLENet通过增强局部特征的关联性,在多个数据集上均有良好的效果,有效地提高了网络的表达能力。 展开更多
关键词 图像分类 注意力机制 残差结构 局部特征 全局特征 关联性
在线阅读 下载PDF
基于全局上下文注意力的点云语义分割 被引量:1
13
作者 侯伟鹏 王蕾 《现代电子技术》 2023年第9期120-125,共6页
点云语义分割是三维环境感知的基础,直接基于点的语义分割方法避免了因点云结构化处理所造成的信息损失,但大多数深度学习模型的研究主要集中在提取局部几何特征,没有考虑点云不同局部结构之间的上下文关系,并且忽略了低级与高级特征之... 点云语义分割是三维环境感知的基础,直接基于点的语义分割方法避免了因点云结构化处理所造成的信息损失,但大多数深度学习模型的研究主要集中在提取局部几何特征,没有考虑点云不同局部结构之间的上下文关系,并且忽略了低级与高级特征之间的语义差距,限制了特征表示的能力,影响了点云语义分割的精度。因此,文中提出一种基于全局上下文注意力的点云语义分割方法,该方法主要由基于外部注意力的全局上下文特征聚合和基于后向竞争性注意力的邻近尺度特征融合两部分组成。通过外部注意力学习不同局部结构之间的长距离依赖关系,从而获得丰富的全局上下文信息。为了进一步增强模型的上下文感知能力,设计基于后向竞争性注意力的邻近尺度特征融合模块,学习低级与高级语义特征之间的相似度,重新为中间特征通道分配权重。在S3DIS大规模室内点云数据集上对所提方法进行评估,结果表明,所提方法的平均交并比在Area5上达到了65.2%,相比于RandLA-Net提高了2.5%,在6折交叉验证上的平均交并比达到了71.4%,相比于RandLA-Net提高了1.4%。证明了所提方法能够有效提取全局上下文特征,提高了语义分割的精度。 展开更多
关键词 点云语义分割 全局上下文特征 邻近尺度 外部注意力 后向竞争性注意力 平均交并比
在线阅读 下载PDF
一种基于注意力机制和上下文感知的三维目标检测网络
14
作者 张吴冉 李菲菲 《电子科技》 2023年第10期15-23,共9页
随着自动驾驶的发展,行车安全成为关键性问题。由于点云场景杂乱、背景环境干扰大以及场景采集范围扩增,点云愈加稀疏,使得检测算法鲁棒性变弱。为缓解以上问题,文中提出了一种基于注意力机制和上下文感知的三维目标检测算法。在点云处... 随着自动驾驶的发展,行车安全成为关键性问题。由于点云场景杂乱、背景环境干扰大以及场景采集范围扩增,点云愈加稀疏,使得检测算法鲁棒性变弱。为缓解以上问题,文中提出了一种基于注意力机制和上下文感知的三维目标检测算法。在点云处理阶段,增加点云双向注意力机制生成点权重矩阵,显示标注重要点数据,抑制背景噪声干扰。在伪图特征提取模块中,添加FPN(Feature Pyramid Network)模块重复利用多尺度特征,引入上下文感知模块(Context Awareness Module,CAM)捕捉多比例的上下文语义,并基于源特征设计注意力导向模块(Attention Guide Module,AGM)生成空间位置清晰的导向权图,缓解冗余特征导致的空间模糊问题。文中网络基于KITTI数据集进行测试,结果表明在困难指标下,和基线网络相比,所提方法中行人、汽车和骑行者平均精度(Average Precision,AP)分别提升了0.59%、0.87%和1.42%;和新基线网络相比,在3种难度级别下,所提方法中行人的平均精度分别提升了3.04%、3.53%和3.23%,结果证明改进网络可有效提升三维目标检测性能。 展开更多
关键词 点云 目标检测 注意力机制 特征金字塔 多尺度特征 上下文感知 注意力导向 深度学习
在线阅读 下载PDF
基于全局注意力机制的单像素成像图像增强方法 被引量:2
15
作者 刘辉 杨照华 +2 位作者 吴云 赵梓栋 余远金 《空间控制技术与应用》 CSCD 北大核心 2023年第6期68-76,共9页
单像素成像是一种仅需要使用无分辨能力的桶探测器结合空间光调制信息就能重构出一副完整图像的成像方式,具有非局域成像和高灵敏的特点,适合在外太空非合作目标下进行超远距离成像探测,但需要多次空间光调制后进行探测,重构图像信噪比... 单像素成像是一种仅需要使用无分辨能力的桶探测器结合空间光调制信息就能重构出一副完整图像的成像方式,具有非局域成像和高灵敏的特点,适合在外太空非合作目标下进行超远距离成像探测,但需要多次空间光调制后进行探测,重构图像信噪比低.本文提出一种基于全局注意力机制的低采样率下图像增强方法,利用Transformer结构搭建新型的SUNet(swin transformer unet)网络,解决传统卷积神经网络平移不变性和无法获得全局感受野的问题.根据切蛋糕(cake-cutting, CC)序改进的差分鬼成像算法在低采样条件下重构出低质量的图像,使用SUNet对图像进行增强.实验结果表明,该方法与2022年提出的GIDC(ghost imaging using deep neural network constraint)方法相比,在0.1的采样率下,峰值信噪比提升了3.29 dB,结构相似度提升了8%,为单像素成像的空间探测提供了新的技术途径. 展开更多
关键词 单像素成像 全局注意力机制 图像增强 空间探测
在线阅读 下载PDF
融合半波注意力机制的低光照图像增强算法研究 被引量:2
16
作者 胡聪 陈绪君 吴雨锴 《激光杂志》 CAS 北大核心 2024年第1期109-114,共6页
针对当前基于卷积神经网络的低光照图像增强算法(CycleGAN,Retinex-Net等)存在模型参数过大、内存消耗高、图像复原质量不佳等问题,在轻量级算法IAT基础上,提出了融合半波注意力模块的低光照图像增强算法HBTNet。为了改善网络频繁卷积... 针对当前基于卷积神经网络的低光照图像增强算法(CycleGAN,Retinex-Net等)存在模型参数过大、内存消耗高、图像复原质量不佳等问题,在轻量级算法IAT基础上,提出了融合半波注意力模块的低光照图像增强算法HBTNet。为了改善网络频繁卷积造成的空间信息损失,在网络中引入半波注意力模块,可有效获得小波域的特性,丰富上下文信息,提高特征提取能力。通过引入MS-SSIM损失函数用来保存图像的边缘和细节信息,提升图像恢复的质量。实验结果表明,在LOL数据集上HBTNet相较于IAT算法PSNR提升了2.69%,SSIM提升了5.56%。HBTNet算法的模型参数量仅为0.11 M,可以满足终端用户实时性要求。 展开更多
关键词 图像增强 半波注意力机制 上下文信息 MS-SSIM损失函数
在线阅读 下载PDF
基于上下文空间感知的遥感图像旋转目标检测
17
作者 雷帮军 朱涵 《电光与控制》 北大核心 2025年第3期69-75,共7页
遥感图像处理旋转目标检测任务存在尺度变化大、背景复杂、目标方向任意的特点,给自动目标检测带来了挑战。针对上述问题,结合YOLOv5s检测器,提出了基于上下文空间感知的旋转目标检测框架。首先,设计了上下文空间感知模块(CSPM)构造主... 遥感图像处理旋转目标检测任务存在尺度变化大、背景复杂、目标方向任意的特点,给自动目标检测带来了挑战。针对上述问题,结合YOLOv5s检测器,提出了基于上下文空间感知的旋转目标检测框架。首先,设计了上下文空间感知模块(CSPM)构造主干网络,获取更全面的局部上下文信息与全局空间感知信息,解决网络模型对多尺度目标的特征提取能力不足的问题;其次,在特征融合部分引入无参数注意力机制SimAM,基于神经元抑制原理自适应融合重要信息,解决模型在复杂背景下的误检和漏检问题;最后,增加角度参数回归旋转目标方向,解决任意方向目标回归的问题,同时采用GWDL(Gaussian Wasserstein Distance Loss)计算旋转框损失,参数联合优化,提升检测精度。提出的目标检测算法在HRSC2016数据集上的Recall、Precision和mAP_(50)分别达到了0.955、0.916、0.904,具有最优的检测效果,同时检测速度达到了140.8帧/s,具有实时性。 展开更多
关键词 遥感图像 上下文模块 注意力机制 旋转目标检测
在线阅读 下载PDF
基于多尺度上下文提取的小样本野生动物检测
18
作者 刘珂 林珊玲 +4 位作者 师欣雨 林坚普 吕珊红 林志贤 郭太良 《液晶与显示》 北大核心 2025年第3期516-526,共11页
针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,... 针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,提高检测性能;其次,引入Res2Net作为原型校准模块的强分类网络对分类器输出的分类分数进行校正;然后,在RPN中加入置换注意力机制,增强目标区域的特征图,弱化背景信息;最后,将平衡L1损失作为定位损失函数,提升目标定位性能。实验结果表明,相比DeFRCN算法,MS-FSWD在小样本野生动物数据集FSWA上,1-shot和3-shot检测任务中新类AP50分别提升了9.9%和6.6%;在公共数据集PASCAL VOC上,MS-FSWD最高提升了12.6%。与VFA算法相比,在PASCAL VOC数据集Novel Set 3的10-shot任务中,新类AP50提升了3.3%。 展开更多
关键词 小样本目标检测 野生动物检测 迁移学习 多尺度上下文提取 注意力机制
在线阅读 下载PDF
基于全局-局部特征和自适应注意力机制的图像语义描述算法 被引量:6
19
作者 赵小虎 尹良飞 赵成龙 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第1期126-134,共9页
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对... 为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能.实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高. 展开更多
关键词 图像语义描述 图像关注点 高层语义信息 描述句子细节 全局-局部特征提取 自适应注意力机制
在线阅读 下载PDF
全局通道注意力增强的毫米波图像目标检测
20
作者 蒋甜甜 叶学义 +2 位作者 李刚 杨梦豪 陈华华 《电子技术应用》 2024年第3期19-25,共7页
针对主动毫米波图像中目标与背景纹理区分度较低导致隐匿目标漏检问题,并根据安检实时性要求,提出一种基于全局通道注意力增强的主动毫米波图像目标检测方法。该方法以YOLOv5s为载体,在坐标注意力位置方向上引入全局通道注意模块,增强... 针对主动毫米波图像中目标与背景纹理区分度较低导致隐匿目标漏检问题,并根据安检实时性要求,提出一种基于全局通道注意力增强的主动毫米波图像目标检测方法。该方法以YOLOv5s为载体,在坐标注意力位置方向上引入全局通道注意模块,增强对隐匿目标全局通道信息的关注,从而提升在隐匿目标与背景纹理区分度较低时的检测能力;再利用K-means++聚类算法重新生成适合毫米波图像目标检测的锚框。实验结果表明,无论是阵列图像数据集还是线扫图像数据集,该方法增强了对隐匿目标的特征注意,提高了召回率,在满足安检实时性的前提下,提升了检测性能。通过增加少量参数,在阵列图像数据集上,精度、召回率和mAP@.5达到了92.0%、90.93%和95.32%;在线扫图像数据集上,精度、召回率和mAP@.5达到了94.65%、92.67%和97.73%。平均单张图像推理时间在两个数据集上均达到1 ms,满足实时性要求。 展开更多
关键词 主动毫米波图像目标检测 全局通道注意力增强 K-means++ 注意力机制
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部