期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
基于注意力引导和多样本决策的舰船检测方法 被引量:1
1
作者 吕奕龙 苟瑶 +2 位作者 李敏 何玉杰 邢宇航 《北京航空航天大学学报》 北大核心 2025年第1期202-213,共12页
单阶段目标检测方法具有训练速度快、检测时间短的特点,然而其特征金字塔网络(FPN)难以抑制合成孔径雷达(SAR)舰船图像的背景和噪声信息,且检测头存在预测误差。针对该问题,提出一种基于注意力引导和多样本决策的检测方法,用于SAR舰船... 单阶段目标检测方法具有训练速度快、检测时间短的特点,然而其特征金字塔网络(FPN)难以抑制合成孔径雷达(SAR)舰船图像的背景和噪声信息,且检测头存在预测误差。针对该问题,提出一种基于注意力引导和多样本决策的检测方法,用于SAR舰船检测。提出一种注意力引导网络,将其添加至特征金字塔的最高层,使其抑制背景和噪声干扰,从而提升特征的表示能力。提出多样本决策网络,使其参与目标位置的预测。该网络通过增加回归分支中输出的样本数量,缓解预测误差对检测结果的影响。设计了一种新颖的最大似然损失函数。该损失函数利用多样本决策网络中输出的样本构造出最大似然函数,用于规范决策网络的训练,进一步提升目标定位的精度。以RetinaNet网络模型为基线方法,相较于基线方法及目前先进的目标检测方法,所提方法在舰船检测数据集SSDD上表现出最高的检测精度,AP达到52.8%。相比基线方法,所提方法在AP评价指标上提升了3.4%~5.7%,且训练参数量仅增加2.03×10^(6),帧率仅降低0.5帧/s。 展开更多
关键词 舰船检测 注意力引导 多样本决策 最大似然损失函数 单阶段检测 合成孔径雷达
在线阅读 下载PDF
基于多尺度空间注意力引导的图像超分辨率重建网络
2
作者 程德强 王培杰 +2 位作者 董彦强 寇旗旗 江鹤 《北京航空航天大学学报》 北大核心 2025年第7期2185-2195,共11页
针对基于注意力机制的图像超分辨率重建网络忽视了注意力特征的差异性,仅将注意力机制直接引入到网络模型中,对不同层次特征进行相同处理的问题,设计了一种多尺度空间注意力引导的图像超分辨率重建网络SAGN。提出了增强特征提取残差块(E... 针对基于注意力机制的图像超分辨率重建网络忽视了注意力特征的差异性,仅将注意力机制直接引入到网络模型中,对不同层次特征进行相同处理的问题,设计了一种多尺度空间注意力引导的图像超分辨率重建网络SAGN。提出了增强特征提取残差块(ERB),完善了局部信息的表征能力;集成了多尺度空间注意力(MSA)模块,获取了MSA特征信息;引入了注意力引导模块(AGM),对不同的特征分配个性化的权重,以实现有效的上下文全局特征融合和冗余信息抑制。实验结果表明:量化测试和主观效果上,相比于传统的注意力结构,SAGN在4个基准数据集上都展现出了优越性,其4倍重建结果的峰值信噪比(PSNR)较次优模型平均提高了0.05 dB,进一步证实了SAGN在恢复图像的几何结构和细节方面的优势。 展开更多
关键词 超分辨率重建 卷积神经网络 注意力机制 多尺度空间注意力 注意力引导
在线阅读 下载PDF
注意力引导的多尺度红外行人车辆实时检测 被引量:2
3
作者 张印辉 计凯 +1 位作者 何自芬 陈光晨 《红外与激光工程》 EI CSCD 北大核心 2024年第5期229-239,共11页
红外成像技术通过捕捉目标热辐射特征进行成像,能实现复杂道路场景下的目标监测和道路冗杂信息滤除。针对红外行人和车辆目标检测模型参数量大、依赖高性能GPU资源和检测速度慢等问题,提出了一种注意力引导的多尺度红外行人车辆实时检... 红外成像技术通过捕捉目标热辐射特征进行成像,能实现复杂道路场景下的目标监测和道路冗杂信息滤除。针对红外行人和车辆目标检测模型参数量大、依赖高性能GPU资源和检测速度慢等问题,提出了一种注意力引导的多尺度红外行人车辆实时检测模型。首先,为精确匹配校准红外行人和车辆目标尺度与锚框尺寸,利用K-Means++算法对红外行人和车辆目标尺度进行先验框预置参数重聚类生成,并设计128×128精细尺度检测层;其次,设计注意力引导广域特征提取模块增强模型特征提取能力和空间及通道信息聚焦能力;随后,构建跨空间感知模块引入空间信息感知,强化不同尺度空间下的目标的特征表达能力;最后,针对资源受限设备,通过4倍通道剪枝方法降低模型参数量,增强移动端算法部署适应性。实验结果表明:所提IRDet算法与基准方法相比,模型平均检测精度提升4.3%,达到87.4%,模型权重值压缩60.4%,降至5.7 MB。 展开更多
关键词 红外交通检测 先验框匹配 注意力引导 跨空间感知 模型剪枝
在线阅读 下载PDF
一种用于多域对话状态追踪的知识增强与自注意力引导的图神经网络
4
作者 刘漳辉 林宇航 陈羽中 《小型微型计算机系统》 CSCD 北大核心 2024年第1期108-114,共7页
对话状态追踪是对话系统的重要组成部分,旨在从用户与系统的对话中跟踪用户意图,其通常表示为槽位-槽值对序列.近年来,深度神经网络模型在对话状态追踪问题上取得了较大进展.然而,现有模型在槽位相关性建模方面还存在可拓展性差与易引... 对话状态追踪是对话系统的重要组成部分,旨在从用户与系统的对话中跟踪用户意图,其通常表示为槽位-槽值对序列.近年来,深度神经网络模型在对话状态追踪问题上取得了较大进展.然而,现有模型在槽位相关性建模方面还存在可拓展性差与易引入噪声等问题.针对上述问题,本文提出了一种知识增强与自注意力引导的图神经网络KESA-GNN(Knowledge-Enhanced&Self-Attention Guided Graph Neural Network).首先,KESA-GNN通过外部知识嵌入增强槽的语义表征提升多头自注意力机制对槽位间相关性的辨别能力.其次,为了精确建模槽位间的诸如共指、共现等相关性,提出了一种自注意力引导的图神经网络建模槽位相关性.该网络采用多头注意力机制获得槽位间的注意力矩阵以及槽位表征,通过Max-N Relation算法获得注意力矩阵中强相关关系集,将稠密的注意力矩阵稀疏化,从而引导图神经网络中强相关槽位间的信息传播,降低无关槽位的噪声影响.最后,KESA-GNN采用门控融合机制过滤槽位多头注意力和图神经网络输出的槽位表征,从而获取更准确的槽位表征向量,进一步提升了KESA-GNN的鲁棒性.在多域对话数据集上的实验结果表明,KESA-GNN模型的性能优于最新的基线模型. 展开更多
关键词 对话状态追踪 知识图谱 注意力引导 图神经网络 门控融合
在线阅读 下载PDF
用于腹部CT肝脏肿瘤分割的注意力引导模型
5
作者 于凌涛 熊涛 +2 位作者 王鹏程 马英博 夏勇强 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第7期1400-1405,共6页
针对肝脏肿瘤在腹部CT影像中占比低,人为分割与传统分割效果、性能差的问题,本文提出一种高效的两阶段注意力引导的肝脏肿瘤分割模型,该模型由肝脏器官分割模块和肝脏肿瘤分割模块构成。肝脏器官分割模块中凭借卷积神经网络得到肝脏器... 针对肝脏肿瘤在腹部CT影像中占比低,人为分割与传统分割效果、性能差的问题,本文提出一种高效的两阶段注意力引导的肝脏肿瘤分割模型,该模型由肝脏器官分割模块和肝脏肿瘤分割模块构成。肝脏器官分割模块中凭借卷积神经网络得到肝脏器官分割图像作为输出,和原始CT影像叠加得到新的输入影像,最后将新输入图像导入肝脏肿瘤分割模块得到精确的肝脏肿瘤分割影像,给出了每个模块的损失函数以监督训练。利用肝脏肿瘤分割挑战提供的数据集进行了实验研究和定性比较分析。结果在Dice系数等指标上优于其他模型,提高了肝脏肿瘤分割准确率和肝脏肿瘤区域定位准确率,从而使分割出的肝脏肿瘤更接近真实边界。 展开更多
关键词 腹部器官分割 医学图像处理 腹部CT 肝脏分割 肝脏肿瘤分割 深度学习 注意力引导 损失函数
在线阅读 下载PDF
多重注意力引导的超声乳腺癌肿瘤图像分割 被引量:2
6
作者 郭洪洋 程前 +4 位作者 康晓东 杨靖怡 杨舒琪 李芳 张蕊 《计算机科学》 CSCD 北大核心 2024年第S01期409-414,共6页
传统基于U-Net超声乳腺图像分割任务中存在预测尺度单一和信息丢失等问题。针对存在的问题,提出一种由多重注意力引导机制的U-Net超声乳腺肿瘤图像分割。首先,在U-Net的编码结构中,引入多个SE通道注意力,对输入的乳腺肿瘤图像进行多层... 传统基于U-Net超声乳腺图像分割任务中存在预测尺度单一和信息丢失等问题。针对存在的问题,提出一种由多重注意力引导机制的U-Net超声乳腺肿瘤图像分割。首先,在U-Net的编码结构中,引入多个SE通道注意力,对输入的乳腺肿瘤图像进行多层级的语义信息提取,引导编码器聚焦乳腺肿瘤特征,减少冗余背景信息带来的干扰;其次,通过设计特征融合处理模块,对编码器传来的特征图进行复杂语义特征的融合处理;最后,在解码器部分,加入金字塔结构捕获全局空间信息,提高模型对肿瘤图像的多尺度特征提取能力,以提高整体网络的表达能力和分割性能。在乳腺肿瘤图像数据集上对该方法进行了仿真实验,结果表明,与其他U-Net改进策略相比,该方法具有更强的准确率和鲁棒性。 展开更多
关键词 多重注意力引导 乳腺 U-Net 超声 图像分割
在线阅读 下载PDF
注意力引导的标志检测与识别 被引量:1
7
作者 张冬明 靳国庆 +2 位作者 鲁鼎煜 张菁 张勇东 《软件学报》 EI CSCD 北大核心 2024年第11期5116-5132,共17页
自然场景中的实体标志,如商标、交通标志等,易受拍摄角度、所依附物体形变、尺度变化等影响,导致检测精度降低.为此,提出一种注意力引导的标志检测与识别网络(attention guided logo detection and recognition network,AGLDN),联合优... 自然场景中的实体标志,如商标、交通标志等,易受拍摄角度、所依附物体形变、尺度变化等影响,导致检测精度降低.为此,提出一种注意力引导的标志检测与识别网络(attention guided logo detection and recognition network,AGLDN),联合优化模型对多尺度变化和复杂形变的鲁棒性.首先通过标志模板图像搜集及掩码生成、标志背景图像选取和标志图像生成创建标志合成数据集;然后基于RetinaNet和FPN提取多尺度特征并形成高级语义特征映射;最后利用注意力机制引导网络关注标志区域,克服目标变形对特征鲁棒性的影响,实现标志检测与识别.实验结果表明,所提方法可以有效降低尺度变化、非刚性形变的影响,提高标志检测准确率. 展开更多
关键词 标志检测和识别 数据合成 多尺度特征融合 注意力引导
在线阅读 下载PDF
沉浸式VR电力训练中的注意力引导 被引量:5
8
作者 张婷婷 侯晓菲 +1 位作者 田丰 王轶华 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第4期553-563,共11页
由于电力运检过程中存在人身危险,工作者要求具有极高的专业技能.传统的视频培训缺乏沉浸感,培训效率低,而实操培训成本高,对初学者风险较大.研制沉浸式虚拟变电站运检训练系统,实现序列训练、信息提示和评价打分等功能,并应用于电力运... 由于电力运检过程中存在人身危险,工作者要求具有极高的专业技能.传统的视频培训缺乏沉浸感,培训效率低,而实操培训成本高,对初学者风险较大.研制沉浸式虚拟变电站运检训练系统,实现序列训练、信息提示和评价打分等功能,并应用于电力运检安全培训.提出并设计了6种视觉引导和1种声音引导方式,并进行了对比分析.实验结果表明:相较于无引导方式,7种引导方式都明显提高了训练的效率;聚光灯、边缘高亮、边缘闪烁引导在平衡训练效率和沉浸感方面表现优异. 展开更多
关键词 沉浸式VR 变电站运检 注意力引导 用户评价
在线阅读 下载PDF
基于注意力增强Uniformer的锂电池剩余使用寿命预测
9
作者 廖列法 刘映宝 占玉敏 《汽车技术》 北大核心 2025年第6期36-44,共9页
针对锂离子电池的剩余使用寿命(RUL)预测时常面临数据的动态变化和老化数据有限的问题,提出注意力增强Uniformer(AEUniformer)的RUL预测模型,通过Uniformer整合卷积神经网络(CNN)和自注意力机制的优势实现全面的信息感知;设计注意力引... 针对锂离子电池的剩余使用寿命(RUL)预测时常面临数据的动态变化和老化数据有限的问题,提出注意力增强Uniformer(AEUniformer)的RUL预测模型,通过Uniformer整合卷积神经网络(CNN)和自注意力机制的优势实现全面的信息感知;设计注意力引导机制(AGM)和CoordAttention实现强大的特征提取。试验结果表明,AEUniformer可以实现仅需单个老化周期的准确快速的RUL预测,数据集的平均绝对百分比误差分别为2.7%和6.16%,证明了该方法的准确性。 展开更多
关键词 锂电池 剩余使用寿命预测 数据驱动 统一变形器 注意力引导机制 坐标注意力
在线阅读 下载PDF
融合引导注意力的中文长文本摘要生成
10
作者 郭哲 张智博 +2 位作者 周炜杰 樊养余 张艳宁 《电子学报》 CSCD 北大核心 2024年第12期3914-3930,共17页
当前基于深度学习的中文长文本摘要生成的研究存在以下问题:(1)生成模型缺少信息引导,缺乏对关键词汇和语句的关注,存在长文本跨度下关键信息丢失的问题;(2)现有中文长文本摘要模型的词表常以字为基础,并不包含中文常用词语与标点,不利... 当前基于深度学习的中文长文本摘要生成的研究存在以下问题:(1)生成模型缺少信息引导,缺乏对关键词汇和语句的关注,存在长文本跨度下关键信息丢失的问题;(2)现有中文长文本摘要模型的词表常以字为基础,并不包含中文常用词语与标点,不利于提取多粒度的语义信息.针对上述问题,本文提出了融合引导注意力的中文长文本摘要生成(Chinese Long text Summarization with Guided Attention,CLSGA)方法.首先,针对中文长文本摘要生成任务,利用抽取模型灵活抽取长文本中的核心词汇和语句,构建引导文本,用以指导生成模型在编码过程中将注意力集中于更重要的信息.其次,设计中文长文本词表,将文本结构长度由字统计改变至词组统计,有利于提取更加丰富的多粒度特征,进一步引入层次位置分解编码,高效扩展长文本的位置编码,加速网络收敛.最后,以局部注意力机制为骨干,同时结合引导注意力机制,以此有效捕捉长文本跨度下的重要信息,提高摘要生成的精度.在四个不同长度的公共中文摘要数据集LCSTS(大规模中文短文本摘要数据集)、CNewSum(大规模中国新闻摘要数据集)、NLPCC2017和SFZY2020上的实验结果表明:本文方法对于长文本摘要生成具有显著优势,能够有效提高ROUGE-1、ROUGE-2、ROUGE-L值. 展开更多
关键词 自然语言处理 中文长文本摘要生成 引导注意力 层次位置分解编码 局部注意力
在线阅读 下载PDF
基于注意力的双分支图像去雾算法
11
作者 潘月 许光宇 《电光与控制》 北大核心 2025年第10期84-89,共6页
针对现有图像去雾算法未考虑到雾所在的位置信息以及多采用单路径进行去雾等问题,提出一种基于注意力的双分支图像去雾算法。去雾网络使用特征提取模块获取图像的多尺度特征传递给双分支网络;设计的双分支网络是分别含有通道注意力和位... 针对现有图像去雾算法未考虑到雾所在的位置信息以及多采用单路径进行去雾等问题,提出一种基于注意力的双分支图像去雾算法。去雾网络使用特征提取模块获取图像的多尺度特征传递给双分支网络;设计的双分支网络是分别含有通道注意力和位置注意力模块的U-Net架构,关注通道和位置相关特征;使用内容递归引导注意力模块混合精细双分支网络复原的特定特征,以确保信息的交互有助于保留和增强图像中的细节从而生成高分辨率的图像特征;最后,利用一个特征融合模块将复原特征、有雾图像以及初始去雾图像的信息有效聚合生成最终的无雾图像。实验结果表明,在RESIDE数据集上PSNR、SSIM和CIEDE2000评价指标均优于对比算法。 展开更多
关键词 图像去雾 深度学习 内容递归引导注意力 双分支网络
在线阅读 下载PDF
基于特征融合与语义引导的药用胶囊表面缺陷检测
12
作者 董豪 李少波 +1 位作者 杨静 王军 《计算机集成制造系统》 北大核心 2025年第1期158-170,共13页
作为制药产业中常见的药剂容器,胶囊质量与病症的治疗效果以及患者身体的健康状况密切相关。因此,在胶囊生产质量管理流程中,产品质检技术对其批量生产与实际效用有着重要意义。为实现药用胶囊表面缺陷的像素级分割,提出一种基于特征融... 作为制药产业中常见的药剂容器,胶囊质量与病症的治疗效果以及患者身体的健康状况密切相关。因此,在胶囊生产质量管理流程中,产品质检技术对其批量生产与实际效用有着重要意义。为实现药用胶囊表面缺陷的像素级分割,提出一种基于特征融合与语义引导的药用胶囊表面缺陷检测方法。首先,利用特征融合模块聚集多尺度语义信息,使各级特征得到有效利用,以增强对多类目标以及细小缺陷的分割能力;其次,为缓解编解码过程中特征丢失问题,通过语义引导模块对语义信息进行正确疏导,提升缺陷分割的局部效果;最后,在细化分割模块的作用下,进一步优化表面缺陷的分割细节。在胶囊缺陷数据集上的评估结果表明,相比于众多现有方法,所提方法在多维度的评价指标下(包括精度、速度、模型大小以及训练时长)具有更为平衡的整体性能。 展开更多
关键词 深度学习 语义分割 缺陷检测 注意力引导 多尺度融合
在线阅读 下载PDF
结合单词-字符引导注意力网络的中文旅游文本命名实体识别 被引量:6
13
作者 西尔艾力·色提 艾山·吾买尔 +3 位作者 王路路 吐尔根·依布拉音 马喆康 买合木提·买买提 《计算机工程》 CAS CSCD 北大核心 2021年第2期39-45,共7页
传统基于词向量表示的命名实体识别方法通常忽略了字符语义信息、字符间的位置信息,以及字符和单词间的关联关系。提出一种基于单词-字符引导注意力网络(WCGAN)的中文旅游命名实体识别方法,利用单词引导注意力网络获取单词间的序列信息... 传统基于词向量表示的命名实体识别方法通常忽略了字符语义信息、字符间的位置信息,以及字符和单词间的关联关系。提出一种基于单词-字符引导注意力网络(WCGAN)的中文旅游命名实体识别方法,利用单词引导注意力网络获取单词间的序列信息和关键单词信息,采用字符引导注意力网络捕获字符语义信息和字符间的位置信息,增强单词和字符间的关联性与互补性,从而实现中文旅游文本中命名实体的识别。实验结果表明,WCGAN方法在ResumeNER和TourismNER基准数据集上的F值分别为93.491%和92.860%,相比Bi-LSTM+CRF、Char-Dense等方法识别效果更好。 展开更多
关键词 命名实体识别 字符引导注意力网络 单词引导注意力网络 字符语义 信息互补 位置信息
在线阅读 下载PDF
功率谱密度引导下的时间序列预测模型
14
作者 梁立河 崔锦莹 +3 位作者 张雪松 高妮玲 赵涓涓 强彦 《计算机工程与设计》 北大核心 2025年第4期1087-1095,共9页
为增强时间序列预测模型的高解释性、高稳定性、高准确性,从能量的角度分析,提出一种基于功率谱密度的时间序列预测编解码器模型(PSDformer)。通过引入多粒度能量选择模块、注意力知识引导模块和序列去噪分解模块,能够有效提取并融合序... 为增强时间序列预测模型的高解释性、高稳定性、高准确性,从能量的角度分析,提出一种基于功率谱密度的时间序列预测编解码器模型(PSDformer)。通过引入多粒度能量选择模块、注意力知识引导模块和序列去噪分解模块,能够有效提取并融合序列的长短期特征、实现未来“先验”信息的有效传递和降低异常数据对序列预测的负面影响,提高模型的预测准确性。在3个数据集上进行的实验验证了PSDformer模型的可行性和有效性。 展开更多
关键词 时间序列预测 功率谱密度 编解码器模型 多粒度能量选择 注意力知识引导 序列去噪分解 长短期特征 “先验”信息
在线阅读 下载PDF
手机团购应用界面的注意力设计 被引量:4
15
作者 杨冷泠 黄心渊 蒋希娜 《包装工程》 CAS CSCD 北大核心 2015年第18期135-139,共5页
目的在界面设计理论与注意力管理经济学理论的指导下,分析出现有团购应用界面设计中存在的影响注意力的因素,给出设计改进策略。方法通过对现有的4个团购应用界面元素进行案例分析,比较归纳设计优化方案,最后通过对20位用户的访谈来验... 目的在界面设计理论与注意力管理经济学理论的指导下,分析出现有团购应用界面设计中存在的影响注意力的因素,给出设计改进策略。方法通过对现有的4个团购应用界面元素进行案例分析,比较归纳设计优化方案,最后通过对20位用户的访谈来验证结论。结论发现色彩标签、文字信息、内容与图片关联性3个主要问题为影响团购用户视觉注意力的主要因素,三者分别会对用户产生注意力引导、注意力消耗和注意力维持的作用。因此,在设计时应当顺应元素的引导"流"方向,减少注意力消耗,增强元素关联度来维持注意力。 展开更多
关键词 团购应用 界面设计 注意力引导 注意力维持
在线阅读 下载PDF
基于多通道表面肌电传感器的手势识别
16
作者 张劲勇 韩倩 +1 位作者 陈俞强 郭剑岚 《传感器与微系统》 北大核心 2025年第10期44-47,51,共5页
针对多通道表面肌电(sEMG)传感器手势识别精度提升需求,提出新型手势识别框架,采用连续小波变换(CWT)将信号转为时频图,设计DIFT-Net分类网络,集成Swin Transformer双分支结构,通过注意力引导模块(AGM)增强局部特征提取,注意力交互模块(... 针对多通道表面肌电(sEMG)传感器手势识别精度提升需求,提出新型手势识别框架,采用连续小波变换(CWT)将信号转为时频图,设计DIFT-Net分类网络,集成Swin Transformer双分支结构,通过注意力引导模块(AGM)增强局部特征提取,注意力交互模块(AIM)实现多尺度全局特征融合。实验基于自建和Nanapro DB1数据集验证,DIFT-Net分别取得98.36%和82.64%的精度,显著优于传统方法。结果表明,该框架能有效融合局部与全局特征,显著提升多通道sEMG传感器手势识别性能,为人机交互应用提供新方案。 展开更多
关键词 表面肌电传感器 手势识别 TRANSFORMER 注意力引导模块 注意力交互模块
在线阅读 下载PDF
基于图文关联与上下文引导的军事新闻图集描述生成方法
17
作者 梅运红 刘茂福 《计算机工程与科学》 CSCD 北大核心 2024年第9期1625-1634,共10页
传统的图像描述生成方法由于缺少现实世界的先验知识,生成的描述文本不具有解释性,同时在某些专业领域生成的描述文本准确性不高。针对上述问题,提出了军事新闻图集描述生成任务,还构建了军事新闻图集数据集。该任务存在2个关键挑战:描... 传统的图像描述生成方法由于缺少现实世界的先验知识,生成的描述文本不具有解释性,同时在某些专业领域生成的描述文本准确性不高。针对上述问题,提出了军事新闻图集描述生成任务,还构建了军事新闻图集数据集。该任务存在2个关键挑战:描述信息来源于整个图集和对应的新闻文本中,模型学习到的语义不够充分。进一步提出了一种基于图文关联与上下文引导的军事新闻图集描述生成方法ITRCG。基于ITRCG实现跨模态信息交互,引导模型学习更完整的语义,并通过标签清理辅助命名实体生成。在构建的军事新闻图集数据集上进行了验证实验,结果表明ITRCG能够有效提高描述文本的质量,在各项评价指标上均取得了提升。 展开更多
关键词 图像描述 图文关联注意力 上下文引导注意力 图集 新闻文本
在线阅读 下载PDF
面向低算力设备的改进轻量化语音识别模型
18
作者 李政霖 介婧 +2 位作者 柴佳辉 郑慧 武晓莉 《计算机工程与设计》 北大核心 2025年第10期2969-2977,共9页
针对语音识别模型在低算力设备上部署难且识别精度低的问题,提出一种改进的轻量化语音识别模型。该模型采用双通道多核卷积结构,以深度残差收缩网络为主要识别单元;引入卷积块注意力模块提高其对通道和空间位置的特征敏感度;结合门控线... 针对语音识别模型在低算力设备上部署难且识别精度低的问题,提出一种改进的轻量化语音识别模型。该模型采用双通道多核卷积结构,以深度残差收缩网络为主要识别单元;引入卷积块注意力模块提高其对通道和空间位置的特征敏感度;结合门控线性单元,提高对长序列语音信息的识别能力;采用非对称卷积策略减少参数量;通过像素注意力引导模块进行特征融合,增强对关键语音信息的捕捉能力。在中文数据集Aishell-1上的实验结果表明,该模型字错误率为12.13%,相较于结果最好的ResNet降低了5.76%,同时其参数量因引入非对称卷积策略降低了40.26%,有效降低了模型的复杂度。 展开更多
关键词 轻量化语音识别模型 双通道多核卷积结构 深度残差收缩网络 卷积块注意力模块 门控线性单元 非对称卷积策略 像素注意力引导模块
在线阅读 下载PDF
基于项目级和类别级双混合超图的会话推荐
19
作者 李建伏 张丹 《计算机工程与设计》 北大核心 2025年第6期1758-1765,共8页
为捕获项目间和类别间复杂的顺序、高阶依赖关系,提出一种基于项目级和类别级双混合超图融合的会话推荐方法DF-MHCN。分别从项目和类别转换角度构建一个项目级混合超图和一个类别级混合超图;提出混合超图卷积网络更新两个混合超图中节... 为捕获项目间和类别间复杂的顺序、高阶依赖关系,提出一种基于项目级和类别级双混合超图融合的会话推荐方法DF-MHCN。分别从项目和类别转换角度构建一个项目级混合超图和一个类别级混合超图;提出混合超图卷积网络更新两个混合超图中节点的表示;引入引导注意力机制融合两种节点表示;用更新后的节点嵌入学习会话表示,计算每个节点的点击概率并推荐概率最大的k个项目。实验结果表明,DF-MHCN方法相对于现有的会话推荐方法具有较高的精度。 展开更多
关键词 基于会话的推荐 混合超图 项目级混合超图 类别级混合超图 超图卷积网络 混合超图卷积网络 引导注意力机制
在线阅读 下载PDF
基于改进YOLOv10的喷码微小字符精确定位算法 被引量:2
20
作者 操振 余朝刚 +2 位作者 靳胜洁 王帅鹏 朱文良 《计算机工程与应用》 北大核心 2025年第7期153-164,共12页
为解决自动化生产领域物品包装表面喷码字符因微小尺寸及特征模糊而导致的检测定位精度差问题,将YOLOv10n作为基线网络提出一种针对特征模糊小目标检测的精确定位算法(YOLO-DLW)。使用细节信息提取卷积(detail information extraction c... 为解决自动化生产领域物品包装表面喷码字符因微小尺寸及特征模糊而导致的检测定位精度差问题,将YOLOv10n作为基线网络提出一种针对特征模糊小目标检测的精确定位算法(YOLO-DLW)。使用细节信息提取卷积(detail information extraction convolution,DIEConv)模块替换基线网络中所有的跨步卷积模块,避免其导致的细节特征丢失问题,提高网络对小目标特征的提取能力。引入低级特征融合检测层,减少基线网络在下采样过程中造成的小目标特征损失。在颈部网络采用加权混合融合金字塔网络(weighted hybrid fusion pyramid network,WHFPN)结构,并结合内容引导注意力(content-guided attention,CGA)机制,有效提升特征层间的信息融合效率和网络对关键信息的提取能力。与基线模型相比,YOLO-DLW算法应用在编织袋小目标字符定位数据集上,准确率、召回率、mAP@0.5和mAP@0.5:0.95分别提高了7.3、8.2、3.9和3.3个百分点,有效解决基线模型对字符区域的误检和漏检问题。 展开更多
关键词 小目标检测 精确定位 YOLOv10n 细节信息提取卷积 加权混合融合金字塔 内容引导注意力
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部