期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于图像相对位置和负向感知的图文匹配
1
作者 余超 王铭硕 +1 位作者 赵子樵 于清 《现代电子技术》 北大核心 2024年第17期88-93,共6页
图文匹配任务在计算机视觉以及多模态信息处理领域引起了广泛关注。这一跨模态任务主要难点在于如何高效地提取视觉和文本的信息以及如何解决不一致图文冲突问题。文中提出了一种新颖的图像文本匹配方法,利用图像对象相对位置的注意力... 图文匹配任务在计算机视觉以及多模态信息处理领域引起了广泛关注。这一跨模态任务主要难点在于如何高效地提取视觉和文本的信息以及如何解决不一致图文冲突问题。文中提出了一种新颖的图像文本匹配方法,利用图像对象相对位置的注意力机制解决忽视图像中物体相对位置信息的问题,从而更好地关注视觉信息的提取,同时为了解决忽视图像-文本间不对齐内容相似度贡献的问题,运用了负向感知模块关注物体相对位置和文本中的单词非对齐的信息对相似度的负贡献,从而提高图像-文本匹配相似度的准确性。最后,在公开图文匹配数据集Flickr30K上达到了最好的r_(Sum),比当前最好的负向感知模型提高了7.3,取得了最先进的性能。 展开更多
关键词 多模态 图文匹配 视觉信息提取 相对位置编码 注意力机制 负向感知
在线阅读 下载PDF
基于卷积辅助自注意力的胸部疾病分类网络
2
作者 张自然 李锵 关欣 《浙江大学学报(工学版)》 北大核心 2025年第5期890-901,共12页
针对胸部X光影像中的病变大小不一,纹理复杂,且存在相互影响等问题,提出基于卷积辅助窗口自注意力的胸部X光影像疾病分类网络CAWSNet.使用Swin Transformer作为骨干网络,以窗口自注意力建模长距离视觉依赖关系,通过引入卷积辅助,在弥补... 针对胸部X光影像中的病变大小不一,纹理复杂,且存在相互影响等问题,提出基于卷积辅助窗口自注意力的胸部X光影像疾病分类网络CAWSNet.使用Swin Transformer作为骨干网络,以窗口自注意力建模长距离视觉依赖关系,通过引入卷积辅助,在弥补其缺陷的同时,强化局部特征提取能力.引入图像相对位置编码,通过有向相对位置的动态计算,帮助网络更好地建模像素间的位置关系.使用类别残差注意力,根据疾病类别来调整分类器关注的区域,突出有效信息,提高多标签分类能力.提出动态难度损失函数,解决不同疾病分类的难度差异大,数据集中正负样本不平衡的问题.在公开数据集ChestX-Ray14、CheXpert和MIMIC-CXR-JPG上的实验结果表明,提出CAWSNet的AUC分数分别达到0.853、0.898和0.819,表明该网络在胸部X光影像疾病诊断中的有效性和鲁棒性. 展开更多
关键词 胸部X光图像分类 窗口自注意力 卷积 图像相对位置编码 动态难度损失函数
在线阅读 下载PDF
基于卷积Transformer的支路参数辨识
3
作者 王琳鹏 宋公飞 汪梦龙 《信息技术》 2024年第9期98-103,共6页
为了解决在电力系统支路参数辨识任务中传统的单支路特征参数辨识只能对单一目标进行识别,无法充分利用电力系统的历史信息的问题。在Transformer模型基础之上采用一种卷积自注意力,帮助模型更好地捕获输入特征之间的关系,将局部上下文... 为了解决在电力系统支路参数辨识任务中传统的单支路特征参数辨识只能对单一目标进行识别,无法充分利用电力系统的历史信息的问题。在Transformer模型基础之上采用一种卷积自注意力,帮助模型更好地捕获输入特征之间的关系,将局部上下文更好地纳入注意力机制;同时采用卷积门控循环单元进行位置编码,保证内容和位置的一致性,从而降低训练损失,进一步改善预测的精确度。仿真结果表明,该算法预测精度较高,明显优于其它的机器学习算法和深度学习算法。 展开更多
关键词 深度学习 卷积自注意力 相对位置编码 参数辨识 输电线路
在线阅读 下载PDF
基于改进Transformer模型的运动想象脑电分类方法研究
4
作者 刘月峰 刘好峰 +2 位作者 王越 刘博 暴祥 《计量学报》 CSCD 北大核心 2023年第7期1147-1153,共7页
运动想象(MI)脑电信号本身是由一组较长且连续的特征值组成的信号序列,传统Transformer模型无法捕捉较长序列之间的依赖,设置固定长度的序列又会产生碎片化问题,因此有待进一步调整和优化。针对上述问题,在传统Transformer模型中加入了... 运动想象(MI)脑电信号本身是由一组较长且连续的特征值组成的信号序列,传统Transformer模型无法捕捉较长序列之间的依赖,设置固定长度的序列又会产生碎片化问题,因此有待进一步调整和优化。针对上述问题,在传统Transformer模型中加入了片段重用的循环机制和重用之前片段信息的相对位置编码机制,使Transformer模型能够学习更长特征序列的特征信息,同时解决重用片段之间的位置编码信息错乱和重用等问题。然后,通过并行多分支CNN进一步捕捉脑电局部特征。最后,利用竞赛数据集2008 BCI-Competition 2A对改进的Transformer模型性能进行评估。结果表明,在不做任何人工特征提取的前提下,对于四分类数据集,改进Transformer模型的平均准确率和kappa值分别为94.27%和87.34%。 展开更多
关键词 计量学 脑电信号 运动想象 脑机接口 卷积神经网络 Transformer模型 片段循环机制 相对位置编码
在线阅读 下载PDF
基于改进自注意力神经网络的X光安检识别 被引量:5
5
作者 张弘 刘保洋 高月 《激光杂志》 CAS 北大核心 2023年第12期47-55,共9页
针对X光安检图像中存在背景信息复杂以及物体相互遮挡的情况,以YOLOv5m模型为基础,改进自注意力机制,提出新的视觉自注意力机制与卷积模型结合的叠加混合模型YOLOv5m-CRCS。该网络在视觉自注意力机制中,加入相对位置编码,引入高效变体卷... 针对X光安检图像中存在背景信息复杂以及物体相互遮挡的情况,以YOLOv5m模型为基础,改进自注意力机制,提出新的视觉自注意力机制与卷积模型结合的叠加混合模型YOLOv5m-CRCS。该网络在视觉自注意力机制中,加入相对位置编码,引入高效变体卷积(TVConv)和动态归一化(DTN),增强图像特征中的全局语义信息和位置信息。在网络特征融合阶段将坐标注意力(CA)与改进后的自注意力机制结合,进一步加强输出特征中的位置关系信息,同时引入改进的双自注意力模块,将残差卷积模块(CSPLayer)与双自注意力叠加混合,使得每个输出在原有特征的基础上增加了全局特征的相关性。在X光安检数据集上的实验结果表明,与原始目标检测网络相比,所提出模型的识别精度提高了4.72%,明显降低了由于X光安检图像中的背景信息复杂、相互遮挡而出现的漏检情况。 展开更多
关键词 目标检测 自注意力 相对位置编码 视觉注意力 X光 神经网络
在线阅读 下载PDF
Transformer神经网络和轴心轨迹在燃机转子故障诊断中的应用 被引量:1
6
作者 章明明 蒋欢春 +1 位作者 茅大钧 董渊博 《噪声与振动控制》 CSCD 北大核心 2023年第1期110-115,153,共7页
针对目前国内燃机电厂转子故障诊断主要依靠振动分析,无自动识别轴心轨迹设备的现状,将在自然语言处理领域大放异彩的Transformer神经网络引入转子轴心轨迹监测与识别领域,通过独立成分分析(Independent Component Analysis,ICA)与Trans... 针对目前国内燃机电厂转子故障诊断主要依靠振动分析,无自动识别轴心轨迹设备的现状,将在自然语言处理领域大放异彩的Transformer神经网络引入转子轴心轨迹监测与识别领域,通过独立成分分析(Independent Component Analysis,ICA)与Transformer结合提升燃机转子故障诊断准确性。使用ICA代替Transformer自身的线性变换提取图片特征信息构建输入样本,为了解决自注意力机制无法捕捉位置信息的问题,提出相对位置编码方法,区别于使用较多的绝对位置编码,通过嵌入相对位置编码子层,将相对位置信息注入自注意力机制,使得Attention模块能够学习到序列的相对位置信息,可进一步提高图像识别模型的准确性,该模型对于轴心轨迹故障类型平均识别率达到93.8%。实验结果表明ICA-Transformer模型对转子轴心轨迹的识别准确率较高,对电厂运维具有一定的指导意义。 展开更多
关键词 故障诊断 轴心轨迹 Transformer神经网络 独立成分分析 相对位置编码 图像识别
在线阅读 下载PDF
改进DAB⁃DETR算法的非规则交通对象检测
7
作者 林峰 宁琪琳 朱智勤 《现代电子技术》 2023年第21期141-148,共8页
非规则交通对象主要指任何在车辆行驶过程中可能对车辆行驶起到阻碍作用的物体,例如坑洼、落石、树枝等影响车辆正常驾驶的目标。针对道路中的非规则交通对象检测问题,提出一种基于改进DAB⁃DETR算法的非规则交通对象目标检测算法,经过... 非规则交通对象主要指任何在车辆行驶过程中可能对车辆行驶起到阻碍作用的物体,例如坑洼、落石、树枝等影响车辆正常驾驶的目标。针对道路中的非规则交通对象检测问题,提出一种基于改进DAB⁃DETR算法的非规则交通对象目标检测算法,经过对原始模型结构的分析,发现在图像特征输入编码器前加入绝对位置编码来弥补图像位置信息的缺失,只能隐式地表达特征间的相对位置信息,因此改进DAB⁃DETR在Transformer的编码结构中的多头自注意力机制中添加了针对图像的相对位置编码;其次发现在原始训练策略中,对得到的检测定位结果与类别信息进行二分匹配并计算损失值时,只是简单地将定位损失和分类损失加权求和,这样会导致性能下降,所以在训练策略中增加了将分类、定位损失集成在一个统一参数化公式中的AP损失函数。实验结果表明:改进DAB⁃DETR算法的检测精度达到了82.00%,比原始模型提高了3.3%,比传统模型Faster R⁃CNN、YOLOv5分别提高了6.20%、7.71%。 展开更多
关键词 非规则交通对象 目标检测 DAB⁃DETR算法 相对位置编码 AP损失函数 消融实验
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部