期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于多尺度上下文注意力U-SegNet的遥感目标检测
1
作者 陈瑞霞 张善文 吴青娥 《电讯技术》 北大核心 2025年第8期1187-1195,共9页
针对遥感目标图像多样、目标较小且与周围环境对比度差,导致现有目标检测方法复杂度高、检测效果差、泛化能力弱,以及经典U-Net和U-SegNet忽略了不同目标尺度特征感受野差异等问题,提出了一种基于多尺度上下文注意力U-SegNet(Multi-scal... 针对遥感目标图像多样、目标较小且与周围环境对比度差,导致现有目标检测方法复杂度高、检测效果差、泛化能力弱,以及经典U-Net和U-SegNet忽略了不同目标尺度特征感受野差异等问题,提出了一种基于多尺度上下文注意力U-SegNet(Multi-scale Context Attention U-SegNet,MSCAUSNet)的遥感目标检测新模型。该模型由U-SegNet、多尺度特征融合(Multi-scale Feature Fusion,MSFF)和多尺度上下文注意力(Multi-scale Context Attention,MSCA)模块组成,采用MSCA代替U-SegNet中的跳跃连接以融合目标低层特征与高层特征,并通过MSFF和MSCA模块充分捕获多尺度上下文特征,从而显著提升遥感多尺度目标检测性能。在遥感目标图像数据集上的实验结果表明,该模型能够有效检测不同尺度遥感目标,较经典U-Net和U-SegNet的检测精度分别提高了7.94%和5.09%。该模型为遥感目标检测和识别系统提供了技术支持。 展开更多
关键词 遥感多尺度目标检测 多尺度上下文注意力u-segnet 多尺度上下文注意力 多尺度特征融合
在线阅读 下载PDF
基于多尺度上下文注意力的遥感图像语义分割 被引量:1
2
作者 张剑飞 倪俊文 《科学技术与工程》 北大核心 2025年第8期3333-3339,共7页
遥感图像的语义分割对农业生产、城市规划等领域有十分重要的作用,但受成像距离、光照、地物、环境等因素影响,遥感图像中存在目标语义信息模糊问题,导致在分割时存在不确定性。针对此问题,提出一种多尺度上下文注意力方法(multi-scale ... 遥感图像的语义分割对农业生产、城市规划等领域有十分重要的作用,但受成像距离、光照、地物、环境等因素影响,遥感图像中存在目标语义信息模糊问题,导致在分割时存在不确定性。针对此问题,提出一种多尺度上下文注意力方法(multi-scale context attention,MSCA),其将金字塔池化方法与注意力方法相结合,可以更充分地利用上下文信息。同时该方法显著降低了注意力方法的计算量和内存占用。在ISPRS Potsdam数据集上进行了实验,实验结果表明:MSCA方法在不显著增加内存开销,以及维持推理速度一致的情况下,对遥感图像中语义信息不明确的目标分类,具有更好的分割效果。 展开更多
关键词 遥感图像 语义分割 注意力机制 多尺度上下文
在线阅读 下载PDF
基于多尺度上下文提取的小样本野生动物检测
3
作者 刘珂 林珊玲 +4 位作者 师欣雨 林坚普 吕珊红 林志贤 郭太良 《液晶与显示》 北大核心 2025年第3期516-526,共11页
针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,... 针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,提高检测性能;其次,引入Res2Net作为原型校准模块的强分类网络对分类器输出的分类分数进行校正;然后,在RPN中加入置换注意力机制,增强目标区域的特征图,弱化背景信息;最后,将平衡L1损失作为定位损失函数,提升目标定位性能。实验结果表明,相比DeFRCN算法,MS-FSWD在小样本野生动物数据集FSWA上,1-shot和3-shot检测任务中新类AP50分别提升了9.9%和6.6%;在公共数据集PASCAL VOC上,MS-FSWD最高提升了12.6%。与VFA算法相比,在PASCAL VOC数据集Novel Set 3的10-shot任务中,新类AP50提升了3.3%。 展开更多
关键词 小样本目标检测 野生动物检测 迁移学习 多尺度上下文提取 注意力机制
在线阅读 下载PDF
融合注意力与上下文信息的皮肤癌图像分割模型 被引量:1
4
作者 支慧芳 韩建新 吴永飞 《计算机工程与设计》 北大核心 2024年第9期2859-2865,共7页
为提高黑色素瘤分割性能,提出一种结合注意力机制和上下文信息的U-Net网络。以Resnet-34网络作为编码器,在跳跃连接中加入坐标注意力,通过捕捉精准的位置信息定位更准确的目标区域;设计上下文信息模块强化对前景特征的学习能力;加入高... 为提高黑色素瘤分割性能,提出一种结合注意力机制和上下文信息的U-Net网络。以Resnet-34网络作为编码器,在跳跃连接中加入坐标注意力,通过捕捉精准的位置信息定位更准确的目标区域;设计上下文信息模块强化对前景特征的学习能力;加入高效通道注意力模块,重新校准权重并获得更高质量的分割图。在公共数据集ISIC 2017上验证改进模型,其结果表明,该模型召回率、F1分数达到85.29%、87.03%,与现有方法对比,在准确率、交并比、召回率、F1分数产生竞争性结果。 展开更多
关键词 病变分割 多尺度融合 注意力机制 上下文信息 卷积神经网络 U-Net型网络 坐标注意力 高效通道注意力
在线阅读 下载PDF
结合混合卷积和多尺度注意力的视频异常检测算法 被引量:1
5
作者 杨大为 刘志权 王红霞 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1128-1137,共10页
基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素... 基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素级别的差异而无法捕捉图像的结构特征。对此提出了结合混合卷积和多尺度注意力的视频异常检测算法,并加入结构相似性损失函数(SSIM)优化模型。具体来说,在编码器最后一层添加混合卷积模块,混合空间和位置的特征来提取全局上下文信息。在编码器和解码器之间的跳跃连接中添加多尺度注意力模块,使模型能提取更有价值的特征,实现有效的跳跃连接。使用参数约束结构相似性损失函数与L2损失函数的权重,从而更准确地优化模型。实验结果表明,所提算法在UCSD-Ped2和CUHK Avenue公开数据集上的AUC指标达到96.7%和86.1%,与改进前的模型相比提高了1.6%和1.4%,证明了所提模型的有效性。 展开更多
关键词 上下文信息 跳跃连接 混合卷积 多尺度注意力 结构相似性
在线阅读 下载PDF
基于多尺度上下文的英文作文自动评分研究 被引量:4
6
作者 于明诚 党亚固 +2 位作者 吴奇林 吉旭 毕可鑫 《计算机工程》 CAS CSCD 北大核心 2024年第3期259-266,共8页
目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理... 目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理长序列文本时无法准确捕捉到符合上下文语境的向量嵌入,提升动态向量语义表征质量,解决一词多义问题,并通过一维卷积模块提取不同尺度的短语级别嵌入。多尺度上下文网络通过结合内置自注意力简单循环单元和全局注意力机制,分别捕捉单词、短语和句子级别的作文高维潜在上下文语义关联关系,利用句向量与作文主题计算语义相似度提取篇章主题层次特征,将所有特征输入融合层通过线性层得到自动评分结果。在公开的标准英文作文评分数据集ASAP上的实验结果表明,MSC模型平均二次加权的Kappa值达到了80.5%,且在多个子集上取得了最佳效果,优于实验对比的深度学习自动评分模型,证明了MSC在英文作文自动评分任务上的有效性。 展开更多
关键词 英文作文自动评分 预训练模型 多尺度上下文 全局注意力 主题层次特征
在线阅读 下载PDF
顾及多尺度特征及全局上下文的建筑提取方法 被引量:1
7
作者 廖子阳 冯德俊 +1 位作者 陈虹宇 刘子琛 《遥感信息》 CSCD 北大核心 2024年第2期118-126,共9页
针对语义分割提取建筑物时,在特征提取过程中丢失局部细节信息,对全局上下文信息的感知能力及多尺度特征的提取不足,导致小建筑物漏提、建筑物提取不完整及内部孔洞的问题,提出了顾及多尺度特征及全局上文信息的建筑物提取方法。该方法... 针对语义分割提取建筑物时,在特征提取过程中丢失局部细节信息,对全局上下文信息的感知能力及多尺度特征的提取不足,导致小建筑物漏提、建筑物提取不完整及内部孔洞的问题,提出了顾及多尺度特征及全局上文信息的建筑物提取方法。该方法采用编码-解码结构,利用并行的连续空洞卷积提取多尺度特征,并行使用压缩激励模块(SE)和条带池化模块(SPM)从通道和空间维度捕获全局上下文信息,提高网络对小建筑物的识别能力及提取结果的完整性,并减少内部孔洞。通过在WHU建筑数据集和Inria航空数据集上与常见的语义分割网络进行的对比实验表明,该方法在提高建筑物提取准确率的同时,较好地解决了小建筑物漏提、建筑物提取不完整及内部孔洞等问题。 展开更多
关键词 语义分割 多尺度特征 全局上下文 空洞卷积 注意力机制 建筑物
在线阅读 下载PDF
基于多尺度混合注意力的行人重识别模型
8
作者 刘家林 宣士斌 罗俊 《计算机工程与设计》 北大核心 2024年第11期3397-3404,共8页
针对目前行人重识别中复杂背景下人物容易被遮挡物掩盖和人物特征不明显导致模型难以提取重点特征的问题,提出一种基于多尺度混合注意力的行人重识别模型。在特征提取部分,设计一种特征提取模块,即多尺度混合注意力残差块,通过该模块可... 针对目前行人重识别中复杂背景下人物容易被遮挡物掩盖和人物特征不明显导致模型难以提取重点特征的问题,提出一种基于多尺度混合注意力的行人重识别模型。在特征提取部分,设计一种特征提取模块,即多尺度混合注意力残差块,通过该模块可得到丰富上下文关系,在频域范围内获得更丰富的通道特征信息。通过在大型数据集Market1501、DukeMTMC-reID、CUHK03-L、CUHK03-D上的验证,行人重识别的精度得到了有效提升,与目前先进的模型结果对比,mAP精度提升了0.3%、2.1%、0.7%、2.9%,Rank1在DukeMTMC-reID、CUHK03-L数据集提升了0.2%、0.8%。 展开更多
关键词 行人重识别 上下文注意力机制 多谱通道注意力 深度学习 混合注意力机制 多分支网络结构 尺度特征
在线阅读 下载PDF
基于上下文注意力的室外点云语义分割方法 被引量:4
9
作者 苏鸣方 胡立坤 黄润辉 《计算机工程》 CAS CSCD 北大核心 2023年第3期248-256,共9页
基于直接点的语义分割方法能够避免因点云结构化处理所造成的信息损失,但未充分利用多尺度上下文特征,导致行人、自行车等小目标的分割精度降低。提出一种基于上下文注意力的点云语义分割方法,其由双向上下文注意力融合和上下文编码-通... 基于直接点的语义分割方法能够避免因点云结构化处理所造成的信息损失,但未充分利用多尺度上下文特征,导致行人、自行车等小目标的分割精度降低。提出一种基于上下文注意力的点云语义分割方法,其由双向上下文注意力融合和上下文编码-通道自注意力模块组成。通过前向注意力通道进行邻近尺度特征融合,从而获得更多的浅层细粒度信息,而反向注意力通道进一步融合高层语义信息,以增强模型的上下文感知能力。为捕获全局上下文信息,设计上下文编码-通道自注意力模块,通过对多尺度特征进行编码,并为特征通道分配不同的权重,使网络更关注特定的通道特征,以减少特征的冗余。在SemanticKITTI和Semantic3D大规模室外点云数据集上的实验结果表明,该方法的平均交并比分别为55.0%和76.4%,其中在SemanticKITTI数据集上,相比基准方法RandLA-Net的行人和自行车交并比分别提高3.0和6.9个百分点,能有效捕获多尺度上下文信息,提高小目标的分割精度。 展开更多
关键词 语义分割 上下文注意力 室外点云 多尺度特征 通道自注意力 点云小目标
在线阅读 下载PDF
基于全局上下文注意力的点云语义分割 被引量:1
10
作者 侯伟鹏 王蕾 《现代电子技术》 2023年第9期120-125,共6页
点云语义分割是三维环境感知的基础,直接基于点的语义分割方法避免了因点云结构化处理所造成的信息损失,但大多数深度学习模型的研究主要集中在提取局部几何特征,没有考虑点云不同局部结构之间的上下文关系,并且忽略了低级与高级特征之... 点云语义分割是三维环境感知的基础,直接基于点的语义分割方法避免了因点云结构化处理所造成的信息损失,但大多数深度学习模型的研究主要集中在提取局部几何特征,没有考虑点云不同局部结构之间的上下文关系,并且忽略了低级与高级特征之间的语义差距,限制了特征表示的能力,影响了点云语义分割的精度。因此,文中提出一种基于全局上下文注意力的点云语义分割方法,该方法主要由基于外部注意力的全局上下文特征聚合和基于后向竞争性注意力的邻近尺度特征融合两部分组成。通过外部注意力学习不同局部结构之间的长距离依赖关系,从而获得丰富的全局上下文信息。为了进一步增强模型的上下文感知能力,设计基于后向竞争性注意力的邻近尺度特征融合模块,学习低级与高级语义特征之间的相似度,重新为中间特征通道分配权重。在S3DIS大规模室内点云数据集上对所提方法进行评估,结果表明,所提方法的平均交并比在Area5上达到了65.2%,相比于RandLA-Net提高了2.5%,在6折交叉验证上的平均交并比达到了71.4%,相比于RandLA-Net提高了1.4%。证明了所提方法能够有效提取全局上下文特征,提高了语义分割的精度。 展开更多
关键词 点云语义分割 全局上下文特征 邻近尺度 外部注意力 后向竞争性注意力 平均交并比
在线阅读 下载PDF
基于多尺度卷积自注意力的多维时间序列预测 被引量:4
11
作者 霍纬纲 侯振环 《计算机工程与设计》 北大核心 2023年第4期1250-1258,共9页
现有的多维时间序列(mutivariate time series, MTS)预测模型大多关注序列变量间的时空依赖关系,没有考虑MTS各变量上取值的典型变化趋势,即局部上下文模式(local context pattern, LCP)。为此设计一种基于因果卷积自注意力和图卷积网络... 现有的多维时间序列(mutivariate time series, MTS)预测模型大多关注序列变量间的时空依赖关系,没有考虑MTS各变量上取值的典型变化趋势,即局部上下文模式(local context pattern, LCP)。为此设计一种基于因果卷积自注意力和图卷积网络的MTS预测模型,通过多通道多尺度因果卷积提取MTS各变量的多尺度LCP特征,采用多头自注意力机制捕获多尺度LCP间的时序依赖关系,由图卷积网络提取多尺度LCP时序特征之间的空间依赖关系。在4个公开MTS数据集上的结果表明了该预测方法预测性能的优越性。 展开更多
关键词 多维时间序列 预测 局部上下文 多通道因果卷积 图卷积网络 多头自注意力 多尺度卷积
在线阅读 下载PDF
结合多尺度上下文信息的唐卡小样本目标检测
12
作者 胡文瑾 唐慧媛 +1 位作者 乐超洋 宋华飞 《光学精密工程》 EI CAS CSCD 北大核心 2023年第12期1859-1869,共11页
通过对图像中感兴趣的对象进行分类与定位,能够帮助人们理解唐卡图像丰富的语义信息,促进文化传承。针对唐卡图像样本较少,背景复杂,检测目标存在遮挡,检测精度不高等问题,本文提出了一种结合多尺度上下文信息和双注意力引导的唐卡小样... 通过对图像中感兴趣的对象进行分类与定位,能够帮助人们理解唐卡图像丰富的语义信息,促进文化传承。针对唐卡图像样本较少,背景复杂,检测目标存在遮挡,检测精度不高等问题,本文提出了一种结合多尺度上下文信息和双注意力引导的唐卡小样本目标检测算法。首先,构建了一个新的多尺度特征金字塔,学习唐卡图像的多层级特征和上下文信息,提高模型对多尺度目标的判别能力。其次,在特征金字塔末端加入双注意力引导模块,提升模型对关键特征的表征能力,同时降低噪声的影响。最后利用Rank&Sort Loss替换交叉熵分类损失,简化模型训练的复杂度并提升检测精度。实验结果表明,所提出的方法在唐卡数据集和COCO数据集上的10-shot实验中,平均检测精度分别达到了19.7%和11.2%。 展开更多
关键词 唐卡 小样本目标检测 上下文信息 多尺度特征 注意力机制
在线阅读 下载PDF
基于多尺度特征融合和残差注意力机制的目标检测 被引量:5
13
作者 李本高 吴从中 +1 位作者 许良凤 詹曙 《计算机工程与科学》 CSCD 北大核心 2021年第2期347-353,共7页
作为一个多任务的学习过程,目标检测相较于分类网络需要更好的特征。基于多尺度特征对不同尺度的目标进行预测的检测器性能已经大大超过了基于单一尺度特征的检测器。同时,特征金字塔结构被用于构建所有尺度的高级语义特征图,从而进一... 作为一个多任务的学习过程,目标检测相较于分类网络需要更好的特征。基于多尺度特征对不同尺度的目标进行预测的检测器性能已经大大超过了基于单一尺度特征的检测器。同时,特征金字塔结构被用于构建所有尺度的高级语义特征图,从而进一步提高了检测器的性能。但是,这样的特征图没有充分考虑到上下文信息对语义的补充作用。在SSD基准网络的基础上,采用残差注意力的特征融合方法充分利用上下文信息,提高特征图的表征能力,然后利用残差注意力机制强化关键特征。在基准数据集PASCAL VOC上的实验表明,所提方法在输入图像尺寸为300×300和512×512情况下的mAP分别为78.8%和80.7%。 展开更多
关键词 目标检测 特征融合 注意力机制 多尺度特征 上下文信息
在线阅读 下载PDF
基于多尺度上下文信息的遮挡行人检测 被引量:2
14
作者 赵世阳 王晓峰 《计算机工程与应用》 CSCD 北大核心 2022年第11期141-149,共9页
在遮挡场景下的行人检测一直是计算机视觉中的一个棘手问题,由于被遮挡的行人尺度差异大,可见率低,通常会给检测带来极大的挑战。针对这一问题,提出了一种针对行人遮挡检测的模型结构,对基于anchor-free的行人检测方法进行改进。设计了... 在遮挡场景下的行人检测一直是计算机视觉中的一个棘手问题,由于被遮挡的行人尺度差异大,可见率低,通常会给检测带来极大的挑战。针对这一问题,提出了一种针对行人遮挡检测的模型结构,对基于anchor-free的行人检测方法进行改进。设计了一种提取多尺度上下文信息的结构,通过级联多个不同扩张率的卷积层,使用密集连接实现多尺度特征共享,提取各个区域的上下文信息来解决遮挡问题。此外,为了提高特征的可分辨性,使用通道注意力机制对多尺度特征融合进行自适应的调整。实验结果表明,该方法在Caltech行人数据集的遮挡子集上实现了41.73%的MR^(−2),性能优于其他检测算法。 展开更多
关键词 行人检测 多尺度上下文 通道注意力 anchor-free
在线阅读 下载PDF
基于上下文信息和多尺度融合重要性感知的特征金字塔网络算法 被引量:2
15
作者 杨昊 张轶 《计算机应用》 CSCD 北大核心 2023年第9期2727-2734,共8页
针对目标检测中分类和定位子任务分别需要大感受野和高分辨率,难以在这两个相互矛盾的需求间取得平衡的问题,提出一种用于目标检测的基于注意力机制的特征金字塔网络算法。该算法能整合多个不同感受野来获取更丰富的语义信息,以一种更... 针对目标检测中分类和定位子任务分别需要大感受野和高分辨率,难以在这两个相互矛盾的需求间取得平衡的问题,提出一种用于目标检测的基于注意力机制的特征金字塔网络算法。该算法能整合多个不同感受野来获取更丰富的语义信息,以一种更关注不同特征图重要性的方式融合多尺度特征图,并在注意力机制引导下进一步精练复杂融合后的特征图。首先,通过多尺度的空洞卷积获取多尺度感受野,在保留分辨率的同时增强语义信息;其次,通过多级特征融合(MLF)方式将多个不同尺度的特征图通过上采样或池化操作变为相同分辨率后融合;最后,利用注意力引导的特征精练模块(AFRM)对融合后的特征图作精练处理,丰富语义信息并消除融合带来的混叠效应。将所提特征金字塔替换Faster R-CNN中的特征金字塔网络(FPN)后在MS COCO 2017数据集上进行实验,结果表明当骨干网络为深度50和101的残差网络(ResNet)时,平均精度(AP)分别达到了39.2%和41.0%,与使用原FPN的Faster R-CNN相比,分别提高了1.4和1.0个百分点。可见,所提特征金字塔网络算法能替代原FPN,更好地应用在目标检测场景中。 展开更多
关键词 特征金字塔 目标检测 上下文信息 多尺度特征融合 注意力机制
在线阅读 下载PDF
基于多尺度混合注意力机制的视频摘要算法 被引量:3
16
作者 张喻恩 李泽平 《计算机工程与设计》 北大核心 2023年第11期3305-3311,共7页
针对现有的视频摘要任务中视频帧的多层次上下文依赖信息提取不足的问题,提出一种基于多尺度混合注意力机制的视频摘要(MHAVS)算法。MHAVS采用编码器-解码器架构,编码器部分采用金字塔空洞卷积模块提取视频帧的不同尺度特征信息,解码器... 针对现有的视频摘要任务中视频帧的多层次上下文依赖信息提取不足的问题,提出一种基于多尺度混合注意力机制的视频摘要(MHAVS)算法。MHAVS采用编码器-解码器架构,编码器部分采用金字塔空洞卷积模块提取视频帧的不同尺度特征信息,解码器部分嵌入混合注意力机制建模视频帧的通道维度和空间维度的深度相互依赖性,增强特征的表达,利用指针网络帮助模型生成优势的视频摘要。提出算法在两个公共数据集SumMe和TvSum上进行多次实验,综合结果表明,MHAVS算法取得了不错的结果。 展开更多
关键词 视频摘要 上下文特征 多尺度特征 混合注意力机制 指针网络 编码器 解码器
在线阅读 下载PDF
自适应上下文特征的多尺度目标检测算法 被引量:5
17
作者 王凤随 陈金刚 +1 位作者 王启胜 刘芙蓉 《智能系统学报》 CSCD 北大核心 2022年第2期276-285,共10页
识别多尺度目标是检测任务中的一项挑战,针对检测中的多尺度问题,提出自适应上下文特征的多尺度目标检测算法。针对不同尺度的目标需要不同大小感受野特征进行识别的问题,构建了一种多感受野特征提取网络,通过多分支并行空洞卷积,从高... 识别多尺度目标是检测任务中的一项挑战,针对检测中的多尺度问题,提出自适应上下文特征的多尺度目标检测算法。针对不同尺度的目标需要不同大小感受野特征进行识别的问题,构建了一种多感受野特征提取网络,通过多分支并行空洞卷积,从高层语义特征中挖掘标签中的上下文信息;针对不同尺度目标的语义特征出现在不同分辨率特征图中的问题,基于改进的通道注意力机制,提出自适应的特征融合网络,通过学习不同分辨率特征图之间的相关性,在全局语义特征中融合局部位置特征;利用不同尺度的特征图识别不同尺度的物体。在PASCAL VOC数据集上对本文算法进行验证,本文方法的检测精度达到了85.74%,相较于Faster RCNN检测精度提升约8.7%,相较于基线检测算法YOLOv3+提升约2.06%。 展开更多
关键词 机器视觉 目标检测 卷积神经网络 通道注意力 并行空洞卷积 多尺度特征融合 上下文特征 深度学习
在线阅读 下载PDF
基于多尺度与改进注意力机制的序列到序列模型
18
作者 陈立 朱丙丽 《计算机应用与软件》 北大核心 2020年第12期140-144,共5页
序列到序列模型是一种基于神经网络的模型,在机器学习的多个领域取得了良好的效果。针对序列到序列模型的注意力机制模块,提出两种改进方法:维护前面几个时间步骤中的定位和预期上下文历史信息;将前几步的注意力向量与当前解码状态作多... 序列到序列模型是一种基于神经网络的模型,在机器学习的多个领域取得了良好的效果。针对序列到序列模型的注意力机制模块,提出两种改进方法:维护前面几个时间步骤中的定位和预期上下文历史信息;将前几步的注意力向量与当前解码状态作多尺度卷积。新模型被部署于语音识别和文本到语音系统,实验结果表明,该模型与传统序列到序列模型相比性能显著提高,是处理语音识别和文本分析等问题的有效方法。 展开更多
关键词 序列到序列 注意力机制 多尺度 上下文信息 语音处理
在线阅读 下载PDF
多尺度特征融合和上下文混合注意力机制的单图像去模糊
19
作者 张杨 江松林 朱松豪 《小型微型计算机系统》 2025年第11期2633-2642,共10页
随着深度学习技术的快速发展,陆续提出了多种端到端的单图像去模糊网络.然而,现有的端到端网络在提高去模糊性能的同时,也带来了较高的计算复杂度.例如,传统的UNet网络虽然在图像去模糊任务中表现出色,但仍存在一些缺陷.首先,UNet网络... 随着深度学习技术的快速发展,陆续提出了多种端到端的单图像去模糊网络.然而,现有的端到端网络在提高去模糊性能的同时,也带来了较高的计算复杂度.例如,传统的UNet网络虽然在图像去模糊任务中表现出色,但仍存在一些缺陷.首先,UNet网络的计算复杂度较高.其次,由于UNet网络的特征融合策略相对简单,导致其无法提取显著性的特征表征.为解决UNet网络的这些不足,本文提出多尺度特征融合和上下文混合注意力机制的单图像去模糊方法.首先,利用提出的多尺度特征表示机制快速提取不同分辨率的特征表示,从而降低计算复杂度.其次,利用提出的上下文混合注意力模块提取重要的空间信息和信道信息,利用提出的选择性特征融合模块提取自适应加权优化的空间信息和信道信息,利用提出的双层特征融合增强模块提取显著性的融合不同尺度的特征表征.3个公开数据集的实验结果表明,本文所提方法在去模糊性能、泛化能力和鲁棒性方面均优于现有方法. 展开更多
关键词 图像去模糊 多尺度特征表示 上下文混合注意力 选择性特征融合 双层特征融合增强
在线阅读 下载PDF
面向城市复杂场景的多尺度监督融合变化检测
20
作者 潘建平 谢鹏 +2 位作者 郭志豪 林娜 张慧娟 《遥感信息》 CSCD 北大核心 2024年第4期23-32,共10页
城市复杂场景中,地物形状多样,光照和成像角度变化大会导致变化检测结果受到干扰。为解决这些问题,文章提出了一种双上下文多尺度监督融合的网络模型(dual context multi-scale supervised fusion network model,DCMSFNet)。首先,在编... 城市复杂场景中,地物形状多样,光照和成像角度变化大会导致变化检测结果受到干扰。为解决这些问题,文章提出了一种双上下文多尺度监督融合的网络模型(dual context multi-scale supervised fusion network model,DCMSFNet)。首先,在编码部分使用双上下文增强模块获得地物丰富的全局上下文信息。在解码部分,采用级联的方法组合特征,然后通过自适应注意力模块捕捉不同尺度的变化关系,设计多尺度监督融合模块,增强深度网络融合,获得具有更高辨别能力的变化区域特征,将不同层级的输出结果与主网络的重构变化图融合形成最终的变化检测结果。该模型在LEVIR-CD和SYSU-CD变化检测数据集取得了较好的结果,F1-score分别提高了1.58%和2.17%,可更加精确识别复杂场景的变化区域,进一步减少无关因素引起的误检和漏检,且对目标地物边缘的检测更加平滑。 展开更多
关键词 深度学习 变化检测 上下文增强 自适应注意力模块 多尺度监督融合
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部