期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合多特征与全局-局部Transformer的图像修复算法
1
作者 滕诗宇 何丽君 《电子测量技术》 北大核心 2025年第6期121-129,共9页
针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局-局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上... 针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局-局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上的有效融合,在扩大感受野的同时减少关键信息丢失情况。其次提出用于全局推理的全局-局部协同Transformer模块,它通过集成矩形窗口注意力机制和局部前馈神经网络,在降低计算复杂度的同时,提高模型对全局上下文信息的宏观理解和对局部细节特征的微观捕捉能力,增强图像的整体一致性。实验在CelebA-HQ和Places2数据集上进行了验证,在处理40%~50%掩码时,所提方法与常用的修复方法对比,PSNR平均提高了0.26~6.25 dB,SSIM平均提升了1.4%~19%,L1平均下降了0.2%~5.66%。实验证明,所提方法修复后的图像在视觉上具有更加真实和自然的效果,进一步验证了该方法的有效性。 展开更多
关键词 深度学习 图像修复 多尺度分层特征融合 全局-局部协同transformer 矩形窗口注意力机制 局部前馈神经网络
在线阅读 下载PDF
基于局部-全局交互与结构Transformer的点云分类算法
2
作者 陈凯 叶海良 曹飞龙 《计算机应用》 北大核心 2025年第5期1671-1676,共6页
针对点云分类特征提取过程中局部与全局特征提取不充分的问题,提出一种局部-全局交互与结构Transformer的点云分类算法。首先,提出双支并行的局部-全局交互框架并分别提取局部特征和全局特征,其中一支用最大池化与卷积提取局部特征,另... 针对点云分类特征提取过程中局部与全局特征提取不充分的问题,提出一种局部-全局交互与结构Transformer的点云分类算法。首先,提出双支并行的局部-全局交互框架并分别提取局部特征和全局特征,其中一支用最大池化与卷积提取局部特征,另一支用平均池化与Transformer提取全局特征。同时,考虑Transformer中位置信息的重要性,提出结构Transformer,以多次应用位置信息与当前特征的交互,进一步增强全局结构特征。最后,利用局部-全局特征进行分类,以完成点云的分类任务。实验结果表明,所提算法在ModelNet40和ScanObjectNN数据集上分别获得了93.6%和87.5%的总体准确率(OA)。可见,所提出的局部-全局交互与结构Transformer网络在点云分类任务中取得了良好的性能。 展开更多
关键词 深度学习 点云分类 局部-全局交互 结构transformer
在线阅读 下载PDF
基于Transformer全局-局部特征融合的RGB-D显著性检测
3
作者 宋梦柯 王芸 郑元超 《计算机应用与软件》 北大核心 2025年第3期176-182,共7页
现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融... 现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融合后特征送入Transformer编码器通过在所有位置同时整合多尺度和多模态的特征来进行充分的特征融合,获得全局特征依赖关系之后再送入主干网络提取全局—局部融合特征。同时提出双重注意力模块,用来增强两个分支特征的融合效果。在五个公开数据集上进行的实验表明,该网络在三个评价指标上均取得了较好的表现。 展开更多
关键词 RGB-D显著性检测 全局-局部特征 跨模态融合 多尺度 transformer
在线阅读 下载PDF
GLCrowd:基于全局-局部注意力的弱监督密集场景人群计数模型 被引量:1
4
作者 张红民 田钱前 +1 位作者 颜鼎鼎 卜令宇 《光电工程》 CAS CSCD 北大核心 2024年第10期75-86,共12页
针对人群计数在密集场景下存在背景复杂、尺度变化大等问题,提出了一种结合全局-局部注意力的弱监督密集场景人群计数模型——GLCrowd。首先,设计了一种结合深度卷积的局部注意力模块,通过上下文权重增强局部特征,同时结合特征权重共享... 针对人群计数在密集场景下存在背景复杂、尺度变化大等问题,提出了一种结合全局-局部注意力的弱监督密集场景人群计数模型——GLCrowd。首先,设计了一种结合深度卷积的局部注意力模块,通过上下文权重增强局部特征,同时结合特征权重共享获得高频局部信息。其次,利用Vision Transformer(ViT)的自注意力机制捕获低频全局信息。最后,将全局与局部注意力有效融合,并通过回归令牌来完成计数。在Shanghai Tech PartA、Shanghai Tech PartB、UCF-QNRF以及UCF_CC_50数据集上进行了模型测试,MAE分别达到了64.884、8.958、95.523、209.660,MSE分别达到了104.411、16.202、173.453、282.217。结果表明,提出的GLCrowd网络模型在密集场景下的人群计数中具有较好的性能。 展开更多
关键词 人群计数 Vision transformer 全局-局部注意力 弱监督学习
在线阅读 下载PDF
基于持续学习的中医舌色苔色协同分类方法 被引量:1
5
作者 卓力 李艳萍 +5 位作者 孙亮亮 张辉 李晓光 张菁 杨洋 魏玮 《北京工业大学学报》 CAS CSCD 北大核心 2024年第9期1077-1088,共12页
中医(traditional Chinese medicine, TCM)舌诊客观化研究中需要分析的舌象特征很多,不同的舌象特征往往采用单独的方法进行分析,导致分析系统的整体实现复杂度大幅增加。为此,基于持续学习的思想,提出一种中医舌色苔色协同分类方法,该... 中医(traditional Chinese medicine, TCM)舌诊客观化研究中需要分析的舌象特征很多,不同的舌象特征往往采用单独的方法进行分析,导致分析系统的整体实现复杂度大幅增加。为此,基于持续学习的思想,提出一种中医舌色苔色协同分类方法,该方法将舌色分类作为旧任务,将苔色分类作为新任务,充分利用2个任务的相似性和相关性,仅通过一个网络结构就同时实现舌色和苔色的准确分类。首先,设计一种基于全局-局部混合注意力机制(global local hybrid attention, GLHA)的双分支网络结构,将网络高层语义特征与低层特征相融合,提升特征的表达能力;然后,提出基于正则化和回放相结合的持续学习策略,使得该网络在学习新任务知识的同时有效防止对旧任务知识的遗忘。在2个自建的中医舌象特征分析数据集上的实验结果表明,提出的协同分类方法可以获得与单个任务相当的分类性能,同时可以将2个分类任务的整体复杂度降低一半左右。其中,舌色分类准确率分别达到93.92%和92.97%,精确率分别达到93.69%和92.87%,召回率分别达到93.96%和93.16%;苔色分类准确率分别达到90.17%和90.26%,精确率分别达到90.05%和90.17%,召回率分别达到90.24%和90.29%。 展开更多
关键词 中医舌色苔色分类 协同分类 深度学习 持续学习 全局-局部混合注意力机制 机器视觉
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部