期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于注意力增强Uniformer的锂电池剩余使用寿命预测
1
作者 廖列法 刘映宝 占玉敏 《汽车技术》 北大核心 2025年第6期36-44,共9页
针对锂离子电池的剩余使用寿命(RUL)预测时常面临数据的动态变化和老化数据有限的问题,提出注意力增强Uniformer(AEUniformer)的RUL预测模型,通过Uniformer整合卷积神经网络(CNN)和自注意力机制的优势实现全面的信息感知;设计注意力引... 针对锂离子电池的剩余使用寿命(RUL)预测时常面临数据的动态变化和老化数据有限的问题,提出注意力增强Uniformer(AEUniformer)的RUL预测模型,通过Uniformer整合卷积神经网络(CNN)和自注意力机制的优势实现全面的信息感知;设计注意力引导机制(AGM)和CoordAttention实现强大的特征提取。试验结果表明,AEUniformer可以实现仅需单个老化周期的准确快速的RUL预测,数据集的平均绝对百分比误差分别为2.7%和6.16%,证明了该方法的准确性。 展开更多
关键词 锂电池 剩余使用寿命预测 数据驱动 统一变形器 注意力引导机制 坐标注意力
在线阅读 下载PDF
基于格点网格与段尺度注意力机制的知识图谱构建
2
作者 王体春 李昊 王贤伟 《计算机集成制造系统》 北大核心 2025年第4期1368-1382,共15页
为解决当前知识图谱构建模型过程中训练样本特征单一、关系抽取准确率低下的问题,建立一种基于格点网格与段尺度注意力机制的知识图谱自动构建模型(KG-GSAM)。针对实体识别任务,引入格点网格结构对双向门控循环神经网络进行改进;针对关... 为解决当前知识图谱构建模型过程中训练样本特征单一、关系抽取准确率低下的问题,建立一种基于格点网格与段尺度注意力机制的知识图谱自动构建模型(KG-GSAM)。针对实体识别任务,引入格点网格结构对双向门控循环神经网络进行改进;针对关系抽取任务,引入段尺度注意力机制,搭建关系抽取神经网络。在公开数据集和近三年自动导引车领域的专利文本构建的数据集上分别进行实验,结果表明所建立模型在Precision、Recall和F1-score三个指标上与其他知识图谱构建模型相比有一定的优越性。 展开更多
关键词 知识图谱 格点网格 段尺度注意力机制 BERT模型 关系抽取神经网络 自动导引车
在线阅读 下载PDF
集成边缘门控与多尺度空间注意的排水管道缺陷分割模型
3
作者 陈登峰 赵航辉 +2 位作者 刘世鹏 孟屯良 王泽鹏 《测绘通报》 北大核心 2025年第6期97-102,共6页
城镇地下排水管道老化问题导致管道破损、堵塞等现象频发。人工检测方法难以满足不断增长的检测需求,现有智能化检测技术在应对形状不规则、细节丰富的缺陷边界时,其交并比仍存在提升空间。本文提出了一种提升缺陷边界识别性能的排水管... 城镇地下排水管道老化问题导致管道破损、堵塞等现象频发。人工检测方法难以满足不断增长的检测需求,现有智能化检测技术在应对形状不规则、细节丰富的缺陷边界时,其交并比仍存在提升空间。本文提出了一种提升缺陷边界识别性能的排水管道语义分割模型PGGNet,模型中的GEA通过拉普拉斯边缘检测算法整合边缘特征,提高了对缺陷边界的捕捉能力;MGSA-SSM则结合状态空间模型和MGSA的多尺度机制,引导模型从不同尺度捕捉缺陷的全局轮廓与局部细节,从而提升复杂边界的识别能力。试验结果表明,PGGNet在与主流算法对比中表现出色,mPA达94.32%,mIoU达93.08%,可满足排水管道自动化缺陷检测需求。 展开更多
关键词 城镇地下排水管道 缺陷检测 PGGNet 门控机制 多尺度引导空间注意模块
在线阅读 下载PDF
伪异常引导的融合注意力和记忆增强的鱼群异常行为检测
4
作者 袁红春 肖智豪 《湖南农业大学学报(自然科学版)》 北大核心 2025年第1期123-130,共8页
现有的鱼群异常行为检测方法无法有效提取高级语义信息、特征学习不足,且缺乏对异常样本的学习和提取关键特征的能力,无法满足现有的大规模水产养殖需求。笔者结合深度学习技术,提出了一种伪异常引导的融合注意力和记忆增强的鱼群异常... 现有的鱼群异常行为检测方法无法有效提取高级语义信息、特征学习不足,且缺乏对异常样本的学习和提取关键特征的能力,无法满足现有的大规模水产养殖需求。笔者结合深度学习技术,提出了一种伪异常引导的融合注意力和记忆增强的鱼群异常行为检测方法:通过在视频序列中随机选择跳跃的帧构建伪异常合成器生成伪异常样本,增强对异常样本的感知能力;提出选择性内核频率通道注意力(SKFca)机制,在选择性内核(SK)注意力的基础上引入频域信息,以捕捉更丰富的输入信息;通过瓶颈注意力(BAM)机制在通道和空间维度上抑制不相关的背景特征,突出前景目标特征;在2种注意力模块后面添加记忆增强模块,将异常样本的编码特征替换为正常样本的编码特征,扩大异常样本输出与输入的重构误差;将记忆增强后的通道和空间维度上的关键特征和频域特征融合,以全面提取高级语义信息。结果表明,本研究所提方法在2种自制的鱼类数据集上检测效果都很好,曲线下面积(AUC)分别达0.953和0.957,且能实现对异常的精确定位。 展开更多
关键词 鱼群异常行为检测 高级语义信息 深度学习 伪异常引导 注意力机制 记忆增强
在线阅读 下载PDF
基于项目级和类别级双混合超图的会话推荐
5
作者 李建伏 张丹 《计算机工程与设计》 北大核心 2025年第6期1758-1765,共8页
为捕获项目间和类别间复杂的顺序、高阶依赖关系,提出一种基于项目级和类别级双混合超图融合的会话推荐方法DF-MHCN。分别从项目和类别转换角度构建一个项目级混合超图和一个类别级混合超图;提出混合超图卷积网络更新两个混合超图中节... 为捕获项目间和类别间复杂的顺序、高阶依赖关系,提出一种基于项目级和类别级双混合超图融合的会话推荐方法DF-MHCN。分别从项目和类别转换角度构建一个项目级混合超图和一个类别级混合超图;提出混合超图卷积网络更新两个混合超图中节点的表示;引入引导注意力机制融合两种节点表示;用更新后的节点嵌入学习会话表示,计算每个节点的点击概率并推荐概率最大的k个项目。实验结果表明,DF-MHCN方法相对于现有的会话推荐方法具有较高的精度。 展开更多
关键词 基于会话的推荐 混合超图 项目级混合超图 类别级混合超图 超图卷积网络 混合超图卷积网络 引导注意力机制
在线阅读 下载PDF
基于注意力机制的高分辨率自动实时绿幕抠像方法 被引量:1
6
作者 靳悦 李兆歆 +3 位作者 朱登明 王振强 陈溟 王兆其 《计算机辅助设计与图形学学报》 北大核心 2025年第3期465-473,共9页
随着相机等硬件设备的更新换代以及观众审美水平的提升,高分辨率下的绿幕抠像技术变得十分重要.为实现高分辨率图像下精确且高效的绿幕抠像,提出一种基于注意力机制的高分辨率自动实时绿幕抠像方法.所提方法分为2个阶段,第1阶段仅以RGB... 随着相机等硬件设备的更新换代以及观众审美水平的提升,高分辨率下的绿幕抠像技术变得十分重要.为实现高分辨率图像下精确且高效的绿幕抠像,提出一种基于注意力机制的高分辨率自动实时绿幕抠像方法.所提方法分为2个阶段,第1阶段仅以RGB绿幕图像作为输入,采用注意力机制来准确提取前景目标对象,无须人工参与或生成近似背景图等预处理操作,实现了绿幕抠像的自动化;第2阶段增加深度引导滤波模块进行高分辨率处理,实现了高分辨率下实时处理.在绿幕数据集上的实验结果表明,所提方法在保证较好绿幕抠像精度的前提下,达到2K分辨率视频下约80.20帧/s的处理速度. 展开更多
关键词 绿幕抠像 自动实时 高分辨率 注意力机制 深度引导滤波
在线阅读 下载PDF
基于改进扩散模型的高质量图像生成方法 被引量:2
7
作者 侯哲晓 李弼程 +1 位作者 蔡炳炎 许逸飞 《计算机科学》 北大核心 2025年第S1期449-457,共9页
图像生成是AI2.0时代下AIGC的研究重点,而生成模型的更新迭代促进了图像生成技术的发展。目前主流生成模型的样本质量较低,无法满足AIGC对于图像高保真度的要求,而新兴的扩散模型在无条件生成中不能实现高质量生成。因此,提出了一种基... 图像生成是AI2.0时代下AIGC的研究重点,而生成模型的更新迭代促进了图像生成技术的发展。目前主流生成模型的样本质量较低,无法满足AIGC对于图像高保真度的要求,而新兴的扩散模型在无条件生成中不能实现高质量生成。因此,提出了一种基于改进扩散模型的高质量图像生成方法。首先,采用训练稳定、具有优秀采样质量的扩散模型作为基准模型;其次,使用扩散模型中的自注意力机制来进一步引导噪声生成,进而还原图像中的低频内容,增强去噪过程的稳定性;最后,将递归特征金字塔融合到噪声预测器结构中,使图像特征信息反复提纯,从而捕获图像中的高频细节。在3个标准数据集和4个小型数据集上进行的对比实验和消融实验结果表明,该方法展现了比其他方法更为优秀的性能。 展开更多
关键词 图像生成 扩散模型 自注意力机制引导 递归特征金字塔
在线阅读 下载PDF
融合注意力机制的轻量级猪体质量实时估计方法 被引量:1
8
作者 罗森 葛志辉 《广西大学学报(自然科学版)》 北大核心 2025年第1期161-172,共12页
为了在资源有限的移动设备上对猪体质量进行准确和实时估计,提出了融合注意力机制的轻量级猪体质量实时估计方法,该方法分为分割阶段和体质量估计阶段。在分割阶段,为了能更准确地获得猪躯干分割图像,提出了边缘引导的轻量级分割网络EG-... 为了在资源有限的移动设备上对猪体质量进行准确和实时估计,提出了融合注意力机制的轻量级猪体质量实时估计方法,该方法分为分割阶段和体质量估计阶段。在分割阶段,为了能更准确地获得猪躯干分割图像,提出了边缘引导的轻量级分割网络EG-YOLO。在体质量估计阶段,为了更好地融合双视角特征用于体质量估计,基于改进的轻量级MobileNeXt子网络,构建了双视角特征融合的轻量级体质量估计网络,并在自建的猪体质量估计数据集上进行实验。结果表明,体质量估计的误差仅为3.99%。 展开更多
关键词 体质量估计 边缘引导 注意力机制 特征融合
在线阅读 下载PDF
基于深度学习方法的钢轨多裂缝导波检测
9
作者 刘平心 孛爱 +2 位作者 陈家安 赵春宇 黄震宇 《铁道学报》 北大核心 2025年第2期145-151,共7页
沿钢轨长距离传播的导波遇到钢轨裂缝和内部缺陷可产生反射波,适用于在线检测钢轨裂缝。钢轨可能存在多个裂缝,且端面也会产生反射,从而造成导波的多重反射现象,严重影响导波检测钢轨裂缝的准确性。提出一种能够精确检测钢轨多个裂缝的... 沿钢轨长距离传播的导波遇到钢轨裂缝和内部缺陷可产生反射波,适用于在线检测钢轨裂缝。钢轨可能存在多个裂缝,且端面也会产生反射,从而造成导波的多重反射现象,严重影响导波检测钢轨裂缝的准确性。提出一种能够精确检测钢轨多个裂缝的位置和损伤程度的深度学习算法,其特点是引入注意力机制,增强反射波内的多重反射时序特征,加快深度学习模型的收敛速度。基于实验验证的钢轨有限元模型,在钢轨不同位置生成不同损伤程度的裂缝,模拟导波检测数据用于训练深度学习模型。在真实钢轨上制造不同深度的人工裂缝,测试导波数据用于验证深度学习模型有效性。验证结果表明,在轨头、轨腰和轨底的多裂缝条件下,增加注意力机制可提高裂缝位置和损伤程度预测精度至99%。 展开更多
关键词 钢轨裂缝 导波检测 深度学习 注意力机制
在线阅读 下载PDF
基于角度引导注意力的气动目标宽带PD识别方法
10
作者 李家宽 冯博 +2 位作者 刘红亮 叶春茂 余继周 《系统工程与电子技术》 北大核心 2025年第3期807-816,共10页
逆合成孔径雷达(inverse synthetic aperture radar,ISAR)图像是雷达自动目标识别的重要手段,获得高分辨率的ISAR图像需要雷达长时间照射,在实际工程应用中存在较大的限制。相比之下,宽带脉冲多普勒(pulse Doppler,PD)图像通过短脉冲积... 逆合成孔径雷达(inverse synthetic aperture radar,ISAR)图像是雷达自动目标识别的重要手段,获得高分辨率的ISAR图像需要雷达长时间照射,在实际工程应用中存在较大的限制。相比之下,宽带脉冲多普勒(pulse Doppler,PD)图像通过短脉冲积累成像,能够有效节约雷达资源。本文以不同入射视线角下图像中调制现象差异为出发点,设计一种角度引导注意力的卷积神经网络,旨在实现有限资源下更高的识别性能。首先,通过混合注意力残差模块,使网络聚焦于图像空域的差异,从而有效提升目标精细化特征的表征能力。然后,设计角度引导注意力模块,通过角度编码将入射视线角信息嵌入网络,实现目标特征表示与姿态的关联耦合,进一步提升识别准确率。最后,通过3类飞机的实测宽带PD图像进行分类识别,验证所设计网络的有效性。 展开更多
关键词 宽带脉冲多普勒图像 目标识别 注意力机制 角度引导
在线阅读 下载PDF
融合引导滤波的无监督图像超像素快速生成
11
作者 张永霞 孙银隆 +2 位作者 郭强 范琳伟 张彩明 《计算机辅助设计与图形学学报》 北大核心 2025年第3期533-544,共12页
超像素生成的速度与准确性是评估方法性能的关键指标.针对有监督图像超像素分割方法性能通常依赖大量监督数据的问题,提出一种无监督、保持准确性的图像超像素快速生成方法.首先利用引导滤波设计下采样-联合上采样的超像素快速生成框架... 超像素生成的速度与准确性是评估方法性能的关键指标.针对有监督图像超像素分割方法性能通常依赖大量监督数据的问题,提出一种无监督、保持准确性的图像超像素快速生成方法.首先利用引导滤波设计下采样-联合上采样的超像素快速生成框架,以提高模型的推理速度;然后采用空洞空间卷积池化金字塔和多尺度注意力机制,充分挖掘图像信息,并设计鲁棒的损失函数,提高超像素生成的准确性,实现无监督的图像超像素生成方法;最后采用顺序训练策略减少模型对大量训练数据的依赖.在公开数据集BSDS500与DRIVE上的实验结果表明,所提方法的边界召回率和可达分割准确性指标较文中对比的无监督方法分别提高约1%和2%,且速度提高约50%,并拥有与有监督方法可比的表现. 展开更多
关键词 超像素分割 引导滤波 注意力机制 无监督 深度学习
在线阅读 下载PDF
基于改进YOLOv11n的马铃薯外部缺陷识别研究
12
作者 陈科 李琦颖 +2 位作者 汪迁 刘晶 邓伟刚 《农业装备与车辆工程》 2025年第10期19-26,共8页
随着我国马铃薯种植面积的不断增加,在收获和储运过程中,马铃薯表面常出现绿皮、开裂、霉斑等典型外部缺陷,这些缺陷不仅影响其外观品质,还可能导致营养价值下降甚至产生毒素,造成经济损失。针对上述外部缺陷检测需求,以YOLOv11n为基础... 随着我国马铃薯种植面积的不断增加,在收获和储运过程中,马铃薯表面常出现绿皮、开裂、霉斑等典型外部缺陷,这些缺陷不仅影响其外观品质,还可能导致营养价值下降甚至产生毒素,造成经济损失。针对上述外部缺陷检测需求,以YOLOv11n为基础进行研究与改进:在主干网络C3k2模块中嵌入CGLU以增强上下文特征提取能力,并在Neck特征融合阶段引入轻量化SimAM注意力机制以突出缺陷区域特征表达。该方法能够更精准地定位和识别绿皮、开裂、霉斑等外部缺陷,显著提升了模型对细微缺陷的检测能力。试验结果表明,与基准YOLOv11n相比,改进模型在m AP@0.5、精确率和召回率上分别提升了2.5%、3.0%和3.2%,验证了所提方法在马铃薯外部缺陷检测中的有效性与优越性。 展开更多
关键词 马铃薯缺陷 品质检测 通道引导的轻量级卷积单元 SimAM注意力机制
在线阅读 下载PDF
基于边界引导特征库EGAFB的斑马鱼心室图像自动分割方法
13
作者 黄明慧 徐淑坦 《渔业现代化》 北大核心 2025年第4期99-110,共12页
斑马鱼是心脏疾病研究的常用模式生物,其幼体心脏呈透明状态,能够在显微镜下直接观察,目前尚未有成熟有效的算法自动识别斑马鱼心脏。为提高斑马鱼心室图像自动分割的准确率和实时效率,解决心室区域弱边界、特征提取能力不足及帧间相关... 斑马鱼是心脏疾病研究的常用模式生物,其幼体心脏呈透明状态,能够在显微镜下直接观察,目前尚未有成熟有效的算法自动识别斑马鱼心脏。为提高斑马鱼心室图像自动分割的准确率和实时效率,解决心室区域弱边界、特征提取能力不足及帧间相关性细节利用不充分等问题,本研究提出了一种基于边界引导特征库的斑马鱼心室图像自动分割方法EGAFB。通过嵌入矩形自校准模块改进编码器,提取全局上下文信息,增强心室特征提取;同时,引入边界引导注意力机制,引导模型关注更多的边界细节信息,强化算法的心室边界识别能力;引入均方误差损失和分类置信度损失函数,优化模型的局部细化分割机制,提高斑马鱼心室识别准确率。结果显示:EGAFB方法的平均交并比mIoU达94.7%。与现有方法Unet相比,mIoU提升4.6%,推理时间减少22.9%;与原模型相比,mIoU提升1.3%,推理时间减少6.4%。研究表明,本方法在准确率和实时分割效率方面具有显著优势,为斑马鱼心室图像自动分割提供有效的解决方案,同时为斑马鱼心脏疾病模型研究提供更高效的技术支持。 展开更多
关键词 斑马鱼心室识别 图像语义分割 特征提取 EGAFB 边界注意力机制
在线阅读 下载PDF
基于Convnextv2与纹理边缘引导的伪装目标检测
14
作者 付家瑞 李兆飞 +1 位作者 周豪 黄惟 《浙江大学学报(工学版)》 北大核心 2025年第8期1718-1726,共9页
为了解决伪装目标检测中目标的边缘特征及对应场景下独特纹理特征信息表达处理不足的问题,提出基于Convnextv2与纹理边缘引导的伪装目标检测算法.通过纹理编码模块在输入图片上提取纹理特征,与主干网络提取的边缘特征进行融合,生成图片... 为了解决伪装目标检测中目标的边缘特征及对应场景下独特纹理特征信息表达处理不足的问题,提出基于Convnextv2与纹理边缘引导的伪装目标检测算法.通过纹理编码模块在输入图片上提取纹理特征,与主干网络提取的边缘特征进行融合,生成图片的纹理-边缘特征.通过设计的纹理边缘引导的注意力模块,将纹理-边缘特征融入主干特征以定位目标的真实位置.利用特征融合模块进行多层次特征融合,采用多级监督的方式,设计总的损失函数.在3个公开数据集CAMO、COD10K、NC4K和迷彩伪装混合数据集MICAI_TE上的实验表明,该算法的综合性能最优. 展开更多
关键词 伪装目标检测 纹理边缘引导特征融合 Convnextv2 特征提取 纹理边缘注意力机制
在线阅读 下载PDF
基于注意力机制的曲轴瓦盖上料机器人视觉定位和检测方法 被引量:15
15
作者 朱江 杜瑞 +2 位作者 李建奇 蔡慕尧 许海霞 《仪器仪表学报》 EI CAS CSCD 北大核心 2021年第5期140-150,共11页
为了解决曲轴瓦盖人工上料效率低下、易出错的难题,研究了基于注意力机制的曲轴瓦盖上料机器人视觉定位和检测方法,实现自动上料。针对图像特征不明显,在Faster R-CNN的特征提取网络引入注意力机制,将曲轴瓦盖图像不同位置的权重映射到... 为了解决曲轴瓦盖人工上料效率低下、易出错的难题,研究了基于注意力机制的曲轴瓦盖上料机器人视觉定位和检测方法,实现自动上料。针对图像特征不明显,在Faster R-CNN的特征提取网络引入注意力机制,将曲轴瓦盖图像不同位置的权重映射到特征通道,使深度学习模型能够更多地关注曲轴瓦盖的边缘和中心语义信息。为进一步提高定位精度,本文还改进了候选框生成方法和损失函数。实验结果表明,与传统机器学习方法及经典深度学习目标检测模型相比,检测速度达0.419 s,定位精度最优(IOU和GIOU分别为0.9413和0.9409)。该方法还具有良好的鲁棒性。现场测试表明,该方法引导上料机器人抓取和放置曲轴瓦盖组的成功率达95.14%,提升了发动机装配生产线的效率。 展开更多
关键词 视觉引导机器人 注意力机制 目标检测 深度学习
在线阅读 下载PDF
基于多元注意力框架与引导式监督学习的闭环风电功率超短期预测策略 被引量:15
16
作者 崔杨 王议坚 +2 位作者 黄彦浩 王铮 王茂春 《中国电机工程学报》 EI CSCD 北大核心 2023年第4期1334-1346,共13页
以风电为代表的新能源发电装机容量占比逐年增长,精确的风电功率超短期预测对提高风能利用率、助力双碳实现有重要意义。该文提出一种基于多元注意力框架与引导式监督学习的闭环风电功率超短期预测策略,从特征筛选、模型优化、策略改良... 以风电为代表的新能源发电装机容量占比逐年增长,精确的风电功率超短期预测对提高风能利用率、助力双碳实现有重要意义。该文提出一种基于多元注意力框架与引导式监督学习的闭环风电功率超短期预测策略,从特征筛选、模型优化、策略改良3个角度全面提高预测准确性与模型智能性。首先,采用动态权重特征选择算法、孤立森林算法以及最邻近节点算法筛选并处理数据,便于预测模型更好把握其中特征;其次,对长短期记忆(long short term memory,LSTM)基模型多角度优化,并根据基模型中不同信息的特点,构建关于LSTM的多元注意力框架(Multielement-attention-LSTM),将此框架用于对LightGBM集成学习模型的引导,并通过多种可视化方法提高了模型可解释性;最后,将Bland-Altman应用于模型输出与实际风电出力一致性检验,在预测数据与实际数据交互的基础上实现训练–预测闭环机制。仿真结果表明,所构建的Multielement-attention-LSTM框架具有提高模型预测精度的作用,且闭环更新机制具备合理性。 展开更多
关键词 多元注意力 引导式监督学习 超短期功率预测 闭环机制
在线阅读 下载PDF
联合线性引导与网格优化的混凝土裂缝分割
17
作者 刘光辉 陈健 +1 位作者 孟月波 徐胜军 《光学精密工程》 EI CAS CSCD 北大核心 2024年第2期286-300,共15页
针对混凝土表面裂缝分割过程中分割精度低、细微裂缝漏分和背景干扰等问题,提出一种联合线性引导和网格优化的裂缝分割模型。首先,在主干网络中引入多分支线性引导模块,通过自适应单维度池化增强网络对裂缝线性结构的表达能力,让不同区... 针对混凝土表面裂缝分割过程中分割精度低、细微裂缝漏分和背景干扰等问题,提出一种联合线性引导和网格优化的裂缝分割模型。首先,在主干网络中引入多分支线性引导模块,通过自适应单维度池化增强网络对裂缝线性结构的表达能力,让不同区域的裂缝建立联系,增强全局上下文信息感知能力,提高网络分割精度;然后,提出网格细节优化模块,通过分区-优化-合并三步骤,将整个空间域划分为若干个空间网格,提取空间网格中的细微裂缝信息,防止细微裂缝漏分;最后,在主干网络的跳跃连接处嵌入混合注意力模块,在空间和通道双维度突出裂缝特征,减少背景干扰。在Deepcrack537,Crack500和CFD裂缝数据集上,所提模型的IoU值分别达到77.07%,58.96%和56.55%,F1-score值分别达到87.05%,74.19%和72.24%,明显优于大多数现有方法,具有更高的分割精度。 展开更多
关键词 裂缝图像 线性引导 语义分割 网格优化 注意力机制
在线阅读 下载PDF
基于多注意力图的孪生网络视觉目标跟踪 被引量:5
18
作者 齐天卉 张辉 +1 位作者 李嘉锋 卓力 《信号处理》 CSCD 北大核心 2020年第9期1557-1566,共10页
在视觉跟踪应用中,目标外观通常由包含目标的矩形区域来建模,这种矩形化边框的描述方式不可避免地引入了背景干扰,并随着场景变化导致跟踪关注点的模糊及歧义,进而产生跟踪漂移。针对以上问题,提出了一种基于多注意力图的孪生网络视觉... 在视觉跟踪应用中,目标外观通常由包含目标的矩形区域来建模,这种矩形化边框的描述方式不可避免地引入了背景干扰,并随着场景变化导致跟踪关注点的模糊及歧义,进而产生跟踪漂移。针对以上问题,提出了一种基于多注意力图的孪生网络视觉目标跟踪算法。首先,建立了一种关注于前景目标区域特征表达的孪生网络。该网络通过构建梯度注意力图损失函数项来引导网络训练,提升网络区分目标和干扰背景的能力。此外,嵌入通道注意力和空间注意力进一步强化目标的特征表达,自动发掘有区分的特征表示。在多个公共数据集上的实验验证了提出算法的有效性,以及算法可完成实时的视觉目标跟踪。 展开更多
关键词 视觉目标跟踪 孪生网络 梯度引导反向传播 注意力机制
在线阅读 下载PDF
结合引导解码和视觉注意力的图像语义描述模型 被引量:2
19
作者 马坤阳 林金朝 庞宇 《计算机应用研究》 CSCD 北大核心 2020年第11期3504-3506,3515,共4页
针对输入的图像视觉信息不能在每一步解码过程中动态调整,同时为了提高图像语义描述模型的精度和泛化能力,提出了一种结合引导解码和视觉注意力机制的双层长短时记忆(long short term memory,LSTM)网络的图像语义描述模型。将提取到的... 针对输入的图像视觉信息不能在每一步解码过程中动态调整,同时为了提高图像语义描述模型的精度和泛化能力,提出了一种结合引导解码和视觉注意力机制的双层长短时记忆(long short term memory,LSTM)网络的图像语义描述模型。将提取到的图像的视觉和目标特征通过一个引导网络建模后送入LSTM网络的每一时刻,实现端到端的训练过程;同时设计了基于图像通道特征的视觉注意力机制,提高了模型对图像细节部分的描述。利用MSCOCO和Flickr30k数据集对模型进行了训练和测试,结果显示模型性能在不同的评价指标上都得到了提升。 展开更多
关键词 图像描述 多示例学习 引导解码 视觉注意力机制
在线阅读 下载PDF
基于多阶段多尺度彩色图像引导的道路场景深度图像补全 被引量:3
20
作者 杨宇翔 曹旗 +1 位作者 高明煜 董哲康 《电子与信息学报》 EI CSCD 北大核心 2022年第11期3951-3959,共9页
道路场景深度图像对于道路目标检测、智能驾驶汽车、场景3维重建等研究和应用都是至关重要的,但是由于硬件条件的限制,激光雷达获取的场景深度图像非常稀疏,道路场景深度补全旨在利用稠密的场景彩色图像指导稀疏雷达深度图像的补全重建... 道路场景深度图像对于道路目标检测、智能驾驶汽车、场景3维重建等研究和应用都是至关重要的,但是由于硬件条件的限制,激光雷达获取的场景深度图像非常稀疏,道路场景深度补全旨在利用稠密的场景彩色图像指导稀疏雷达深度图像的补全重建,是目前的研究热点。该文设计了一种新型的多阶段多尺度引导的轻量化编解码网络来实现道路深度图像的高质量补全。该文网络由“彩色引导”和“精细化补全”两个阶段构成。在两个阶段的编码端,提出带有通道随机混合的轻量化多尺度卷积模块,更好地提取图像特征的同时控制网络的参数量。在两个阶段的解码端,采用通道感知机制来实现对重要特征的聚焦。同时将“彩色引导”阶段解码端的多尺度特征融合到“精细化补全”阶段的编码端中,实现多阶段多尺度的特征引导。在训练过程中,该文设计了多损失函数策略来完成由粗到细的深度图像补全。实验表明所提算法能实现高质量的深度图像补全并且具有轻量化的网络结构。 展开更多
关键词 道路场景 深度图像补全 彩色图像引导 感知机制
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部