期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
融合多尺度交叉注意力和边缘感知的伪装目标检测
1
作者 郝子强 张庆宝 +2 位作者 赵世豪 王焯豪 詹伟达 《计算机工程与应用》 北大核心 2025年第10期228-237,共10页
针对当前伪装目标检测算法无法准确、完整地检测出目标对象和其边缘的问题,提出了一种融合多尺度交叉注意力和边缘感知的伪装目标检测网络(multi-scale cross attention and edge perception network,MAEP-Net)。利用Res2Net-50提取图... 针对当前伪装目标检测算法无法准确、完整地检测出目标对象和其边缘的问题,提出了一种融合多尺度交叉注意力和边缘感知的伪装目标检测网络(multi-scale cross attention and edge perception network,MAEP-Net)。利用Res2Net-50提取图像的原始特征,并采用融合了多尺度交叉注意力的特征金字塔结构从通道、空间两个维度挖掘目标位置信息和凸显伪装目标区域特征;使用定位模块对目标的大致位置进行准确定位;边缘感知模块抑制低级特征中背景的噪声,融合边缘特征以获取更多的边缘细节信息;细化模块通过注意力机制分别从前景和背景两个方向关注目标线索,利用边缘先验、语义先验、领域先验、区域先验知识进一步细化目标结构和边缘轮廓。在3个公开数据集上的实验表明,所提算法相较于12种主流算法在4个客观评价指标上均取得了最优表现,尤其是在COD10K数据集上所提算法的加权平均值F-measure和平均绝对误差(mean absolute error,MAE)分别达到0.797和0.031。由此可见,所提算法在COD任务上具有较好的检测效果。 展开更多
关键词 多尺度交叉注意力 边缘感知 伪装目标检测 特征金字塔结构
在线阅读 下载PDF
基于MSC-LSAM的多尺度交叉超声医学图像分割方法
2
作者 王朝欣 杨汶汶 +3 位作者 戎泽 李铮昱 王行 马磊 《数据采集与处理》 北大核心 2025年第2期469-484,共16页
脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割... 脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割难度。本文提出MSC⁃LSAM算法,一种多尺度交叉的双编码器超声图像分割网络,旨在实现颈动脉腔体和心脏腔体的快速、准确分割,辅助医生完成疾病诊断。MSC⁃LSAM在编码器部分并行了分割一切模型(Segment anything model,SAM)的视觉编码器和UNet编码器,在解码器部分采用UNet解码器。本研究首先冻结了预训练的SAM视觉编码器,并在Transformer层中引入高效的适配器(Adapter)块,被称可学习的分割一切模型(Learnable SAM,LSAM)。LSAM在拥有较低参数量的同时,保留学习能力和高度泛化性。然后,在UNet全局网络引入多尺度交叉注意力(Multi⁃scale cross⁃axial attention,MCA),实现多尺度特征的交叉融合,有效提升边缘分割能力,抑制模型过拟合。最后,通过高效通道注意力(Efficient channel attention,ECA)实现双编码器多尺度特征的高效融合,减少模型误分割。结果表明,本研究提出的MSC⁃LSAM在心脏超声公开数据集CAMUS和颈动脉超声自建数据集CAUS上均取得了良好的效果。CAMUS的两心腔(2CH)和四心腔(4CH)数据集分割的平均Dice相似系数(Dice similarity coefficient,DSC)分别达到0.927和0.934;CAUS数据集的平均DSC达到0.917。MSC⁃LSAM在颈动脉腔体和心脏腔体超声图像分割任务上获得了良好的分割准确度,高于主流分割算法,具有良好的应用前景。 展开更多
关键词 缺血性脑卒中 超声图像分割 分割一切模型 多尺度交叉注意力 高效通道注意力
在线阅读 下载PDF
基于交叉注意力Transformer的人体姿态估计方法 被引量:1
3
作者 王款 宣士斌 +2 位作者 何雪东 李紫薇 李嘉祥 《计算机工程》 CAS CSCD 北大核心 2023年第7期223-231,共9页
现有用于人体姿态估计的深度卷积网络方法大多采用堆叠Transformer编码器技术,未充分考虑低分辨率全局语义信息,存在模型学习困难、推理成本高等问题。提出基于交叉注意力的Transformer多尺度表征学习方法。利用深度卷积网络获取不同分... 现有用于人体姿态估计的深度卷积网络方法大多采用堆叠Transformer编码器技术,未充分考虑低分辨率全局语义信息,存在模型学习困难、推理成本高等问题。提出基于交叉注意力的Transformer多尺度表征学习方法。利用深度卷积网络获取不同分辨率特征图,将特征图转变为多尺度视觉标记,并且预估关键点在标记空间中的分布提高模型的收敛速度。为增强低分辨率全局语义的可识别性,提出多尺度交叉注意力模块,该模块通过对不同分辨率特征标记之间的多次交互,以及对关键点标记采取移动关键点策略,实现减少关键点标记冗余和交叉融合操作次数,交叉注意力融合模块从特征标记中抽取的不同尺度特征信息形成关键点标记,有助于降低上采样融合的不准确性。在多项基准数据集上的实验结果表明,与当前最先进的TokenPose方法相比,该方法能有效促进Transformer编码器对关键点之间关联关系的学习,在不降低性能的前提下计算代价下降11.8%。 展开更多
关键词 全局语义 多尺度交叉注意力 人体姿态估计 表征学习 交叉注意力融合 Transformer编码器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部