期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
融合动态注意力的零样本与少样本遥感目标匹配
1
作者 赖平 朱洪椿 +2 位作者 王盈辉 赵雨凡 王媛湲 《指挥与控制学报》 北大核心 2025年第3期292-302,共11页
针对遥感图像中高价值军事目标在开放环境下的识别与匹配挑战,提出一种结合动态注意力机制与零/少样本学习的通用识别框架。引入基于动态注意力机制的改进方法,通过调整注意力窗口大小,更高效捕捉多尺度目标特征。面向军事监测中对高价... 针对遥感图像中高价值军事目标在开放环境下的识别与匹配挑战,提出一种结合动态注意力机制与零/少样本学习的通用识别框架。引入基于动态注意力机制的改进方法,通过调整注意力窗口大小,更高效捕捉多尺度目标特征。面向军事监测中对高价值目标的识别需求,分别构建基于特征检索的零样本学习框架与原型学习驱动的少样本学习框架,显著提升开放域条件下的高价值遥感目标的匹配能力。实验结果表明,所提方法在遥感目标识别任务中的检测正确率和平均F1分数达到90.54%和47.97%。开放域目标匹配算法在零样本场景下,Rank-1准确率可达55.18%;在少样本场景下,算法正确率可达66.22%。 展开更多
关键词 遥感图像 高价值目标 动态注意力机制 目标识别 开放域目标匹配 零样本学习 少样本学习
在线阅读 下载PDF
基于平行全维动态注意力机制的视觉地点识别方法
2
作者 刘沛津 刘淑婕 +2 位作者 何林 彭莉峻 付雪峰 《液晶与显示》 CAS CSCD 北大核心 2024年第9期1233-1242,共10页
针对天气、季节、光线等环境变化导致的视觉地点识别鲁棒性低的问题,提出了一种提升视觉地点识别特征描述子环境稳健性的多维度注意力机制——平行全维动态注意力机制(POD-Attention)。为实现卷积核在全维度上的动态精细探索,增强特征... 针对天气、季节、光线等环境变化导致的视觉地点识别鲁棒性低的问题,提出了一种提升视觉地点识别特征描述子环境稳健性的多维度注意力机制——平行全维动态注意力机制(POD-Attention)。为实现卷积核在全维度上的动态精细探索,增强特征提取网络对建筑物等不变性特征的提取与学习能力,采用全维动态卷积块在卷积核全维度(输入输出通道、卷积空间和卷积核数量)上添加互补性注意力。将1×1卷积、Skip Squeeze-and-Excitation(SSE)模块与全维动态卷积块平行融合,不仅有效提高了特征提取速率,还扩大了视觉地点识别网络的感受野,进一步提升了视觉地点的识别准确率。在公开数据集上进行的实验表明,基于VGG16及Patch-NetVLAD特征聚合的视觉地点识别方法经POD注意力机制改进后,在Nordland与Mapillary Street-Level Sequences数据集上的Recall@1指标提升了9.7%与1.8%,充分证明了本文POD注意力机制对于网络性能的提升效果,也证明了基于本文POD注意力机制的视觉地点识别方法的有效性。 展开更多
关键词 视觉地点识别 环境鲁棒性 深度学习 平行全维动态注意力机制 平行策略
在线阅读 下载PDF
视频传感器网络中基于动态注意力的图像融合 被引量:2
3
作者 谭励 杨明华 +1 位作者 曹元大 成保栋 《计算机工程》 CAS CSCD 北大核心 2010年第2期214-216,219,共4页
为了降低视频传感器网络中的网络负载,减少能量消耗并降低时延,提出一种基于动态注意力的图像分层融合方法。通过对网络的结构化部署和节点间的区域映射,对视频监测区域进行逻辑划分。利用动态注意力模型对局部重点区域进行精度优化,实... 为了降低视频传感器网络中的网络负载,减少能量消耗并降低时延,提出一种基于动态注意力的图像分层融合方法。通过对网络的结构化部署和节点间的区域映射,对视频监测区域进行逻辑划分。利用动态注意力模型对局部重点区域进行精度优化,实现多质量图像融合。实验结果证明了该方法的有效性。 展开更多
关键词 视频传感器网络 图像融合 动态注意力 区域分割 区域映射
在线阅读 下载PDF
基于动态注意力深度迁移网络的高炉铁水硅含量在线预测方法 被引量:8
4
作者 蒋珂 蒋朝辉 +2 位作者 谢永芳 潘冬 桂卫华 《自动化学报》 EI CAS CSCD 北大核心 2023年第5期949-963,共15页
铁水硅含量是反映高炉冶炼过程中热状态变化的灵敏指示剂,但无法实时在线检测,造成铁水质量调控盲目.为此,提出一种基于动态注意力深度迁移网络(Attention deep transfer network, ADTNet)的高炉铁水硅含量在线预测方法.首先,针对传统... 铁水硅含量是反映高炉冶炼过程中热状态变化的灵敏指示剂,但无法实时在线检测,造成铁水质量调控盲目.为此,提出一种基于动态注意力深度迁移网络(Attention deep transfer network, ADTNet)的高炉铁水硅含量在线预测方法.首先,针对传统深度网络静态建模思路无法准确描述过程变量与铁水硅含量之间的关系,提出一种基于注意力机制模块的输入过程变量与输出硅含量之间的动态关系描述方法;其次,为降低硅含量预测模型训练时对标签数据的依赖,考虑到铁水温度与硅含量数据之间的正相关性,利用小时级硅含量标签数据微调基于分钟级铁水温度数据预训练好的深度模型的结构,进而提高基于动态注意力深度迁移网络的硅含量预测精度;同时,为增强预测网络的可解释性,实时给出了基于动态注意力机制模块计算的每个样本各过程变量对铁水硅含量的贡献度;最后,基于某钢铁厂2号高炉的工业实验,验证了该方法的准确性、有效性和先进性. 展开更多
关键词 高炉炼铁 铁水硅含量 深度网络 迁移学习 动态注意力机制 预测
在线阅读 下载PDF
基于图动态注意力网络的多站点风速预测 被引量:1
5
作者 李博录 吴利 +2 位作者 王晓英 黄建强 曹腾飞 《计算机应用》 CSCD 北大核心 2023年第11期3616-3624,共9页
时空序列预测任务在交通、气象、智慧城市等领域有着广泛应用。站点风速预测作为气象预测中的主要任务之一,需要结合降水、气温等外部因素,学习不同数据的时空特征。气象站点的不规则分布和风本身的固有间歇性成为实现高精度风速预测的... 时空序列预测任务在交通、气象、智慧城市等领域有着广泛应用。站点风速预测作为气象预测中的主要任务之一,需要结合降水、气温等外部因素,学习不同数据的时空特征。气象站点的不规则分布和风本身的固有间歇性成为实现高精度风速预测的挑战。为考虑多站点空间分布对风速的影响以获得准确可靠的预测结果,提出一种基于图的动态转换注意力网络(Graph-DSAN)风速预测模型。首先,利用不同站点之间的距离重新构建它们的连接;其次,使用局部采样的过程建模不同采样大小的邻接矩阵,实现图卷积过程中邻居节点信息的聚合与传递;接着,将时空位置编码(STPE)处理后的图卷积结果加入动态注意力编码器(DAE)和转换注意力解码器(SAD)以实现动态注意力计算,从而提取时空相关性;最后,利用自回归的方式形成多步预测。在纽约州15个站点的风速预测实验中,将所设计模型与ConvLSTM、图多注意力网络(GMAN)、时空图卷积网络(STGCN)、动态转换注意力网络(DSAN)和时空动态网络(STDN)进行比较,Graph-DSAN的12 h预测均方根误差(RMSE)分别降低了28.2%、6.9%、27.7%、14.4%和8.9%,验证了Graph-DSAN风速预测的准确性。 展开更多
关键词 风速预测 动态注意力网络 图卷积 注意力机制
在线阅读 下载PDF
基于动态注意力机制和多模态循环融合的帕金森氏症识别 被引量:2
6
作者 朱家英 徐志京 《计算机应用研究》 CSCD 北大核心 2023年第2期481-487,共7页
PD(Parkinson’s disease)的运动障碍会累及口、咽、腭肌以及面部肌肉,引起声带震颤和面部运动迟缓,为利用声纹和面部特征识别PD患者提供了可能。为了有效利用以上两种特征以提高PD识别率,提出了基于多尺度特征与动态注意力机制的多模... PD(Parkinson’s disease)的运动障碍会累及口、咽、腭肌以及面部肌肉,引起声带震颤和面部运动迟缓,为利用声纹和面部特征识别PD患者提供了可能。为了有效利用以上两种特征以提高PD识别率,提出了基于多尺度特征与动态注意力机制的多模态循环融合模型对患者进行识别检测。首先,设计了多尺度特征提取网络,将高、低层级特征的语义信息融合以得到完整的特征信息;其次,在多尺度特征融合过程中为了充分考虑模态间的相关性和互补性,提出了以不同模态信息互为辅助条件生成注意力特征图的动态注意力机制算法,降低特征融合时信息的冗余;最后设计了多模态循环融合模型,通过计算循环矩阵的每个行向量与特征向量间的哈达玛积得到更有效的融合特征,提高了模型性能。在自建数据集上进行的多组实验结果表明,提出的方法识别准确率高达96.24%,优于当前流行的单模态和多模态识别算法,可以有效区分PD患者和HP(healthy people),为高效识别PD患者奠定了基础。 展开更多
关键词 帕金森氏症 多模态循环融合 多尺度特征 动态注意力机制
在线阅读 下载PDF
基于动态注意力和多角度匹配的答案选择模型 被引量:3
7
作者 李志超 吐尔地•托合提 艾斯卡尔•艾木都拉 《计算机应用》 CSCD 北大核心 2021年第11期3156-3163,共8页
针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了基于动态注意力和多角度匹配(DAMPM)的答案选择模型。首先,调用预训练语言模型的嵌入(ELMo)获得包含简单语义信息的词向量;接... 针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了基于动态注意力和多角度匹配(DAMPM)的答案选择模型。首先,调用预训练语言模型的嵌入(ELMo)获得包含简单语义信息的词向量;接着,在注意力层采用过滤机制有效地去除句子中的噪声,从而更好地得到问句和答案句的句子表征;其次,在匹配层同时引入多种匹配策略来完成句子向量之间的信息交互;然后,利用双向长短期记忆(BiLSTM)网络对匹配层输出的句子向量进行拼接;最后,通过分类器来计算拼接向量的相似度大小,从而得到问句和答案句之间的语义关联。在文本检索会议问答(TRECQA)数据集上的实验结果表明,与基于比较聚合框架的基线模型中的动态滑动注意力网络(DCAN)方法相比,DAMPM在平均准确率均值(MAP)和平均倒数排名(MRR)两个性能指标上均提高了1.6个百分点。在维基百科问答(WikiQA)数据集上的实验结果表明,DAMPM相较DCAN在两个性能指标上分别提高了0.7个百分点和0.8个百分点。所提DAMPM相较于基线模型中的方法整体上有更好的性能表现。 展开更多
关键词 神经网络 答案选择 动态注意力机制 多角度匹配 预训练语言模型
在线阅读 下载PDF
基于动态自适应通道注意力特征融合的小目标检测
8
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
图推理嵌入动态自注意力网络的文档级关系抽取
9
作者 李云洁 王丹阳 +2 位作者 刘海涛 汪华东 汪培庄 《智能系统学报》 北大核心 2025年第1期52-63,共12页
文档级关系抽取是指从文档中抽取所有具有语义关系的实体对并判断其关系类别,与句子级关系抽取不同,这里实体关系的确定需要根据文档中多个句子推理得到。现有方法主要采用自注意力进行文档级关系抽取,但是运用自注意力进行文档级关系... 文档级关系抽取是指从文档中抽取所有具有语义关系的实体对并判断其关系类别,与句子级关系抽取不同,这里实体关系的确定需要根据文档中多个句子推理得到。现有方法主要采用自注意力进行文档级关系抽取,但是运用自注意力进行文档级关系抽取需要面临两个技术挑战:即长文本语义编码存在的高计算复杂度和关系预测需要的复杂推理建模,故提出一种图推理嵌入动态自注意力网络(graph reasoning embedded dynamic self-attention network,GSAN)模型。该模型借助门限词选择机制动态选择重要词计算自注意力实现对长文本语义依赖的高效建模,同时考虑以选择词为全局语义背景与实体候选、文档节点一起构建文档图,将文档图的图推理聚合信息嵌入到动态自注意力模块中,实现模型对复杂推理建模的能力。在公开的文档级关系数据集CDR和DocRED上的实验结果表明,文中提出的模型较其他基线模型有显著提升。 展开更多
关键词 文档级关系抽取 图推理 动态注意力网络 注意力机制 门限词选择机制 文档图 注意力网络 关键词
在线阅读 下载PDF
基于可解释动态图注意力网络的短期电力负荷预测
10
作者 原野 王海燕 +2 位作者 袁新平 李梦宇 何杰 《计算机应用》 北大核心 2025年第S1期329-333,共5页
短期电力负荷预测对于电力系统中的负荷调度至关重要,然而现有方法在捕捉负荷中心的动态时空关系方面存在不足。因此,提出一种基于动态图注意力网络(Dyn-GAT)和时间卷积网络(TCN)的Dyn-GAT-TCN(Dynamic Graph ATtention Temporal Convol... 短期电力负荷预测对于电力系统中的负荷调度至关重要,然而现有方法在捕捉负荷中心的动态时空关系方面存在不足。因此,提出一种基于动态图注意力网络(Dyn-GAT)和时间卷积网络(TCN)的Dyn-GAT-TCN(Dynamic Graph ATtention Temporal Convolutional Network)模型。首先,结合负荷空间依赖关系构建负荷时空网络图,并利用时间滑动窗口生成负荷动态图序列;然后,基于Dyn-GAT自适应地调整注意力权重,从而动态建模负荷中心间的空间依赖性;最后,基于TCN提取时间序列中的长短期依赖信息,以实现更精准的负荷预测。在纽约独立系统运营商(NYISO)的一个公开数据集上的实验结果表明,所提模型在一天时间尺度内的均方根误差(RMSE)为2.40,平均绝对百分比误差(MAPE)为1.46%。在云南电网公司的一个数据集上的验证结果表明,所提模型优于已有的相关方法。此外,所提模型的注意力机制增强了可解释性,并能识别对负荷预测影响最大的关键节点。可见,Dyn-GAT-TCN模型在建模和分析电力负荷的动态时空关系方面具有显著优势,为电力系统的调度优化提供了准确且可解释的预测支持。 展开更多
关键词 短期电力负荷预测 动态注意力网络 时间卷积网络 时空关系建模 可解释性分析
在线阅读 下载PDF
自适应生成卷积核的动态图注意力三维点云识别及分割
11
作者 杨军 郭佳晨 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第12期139-152,共14页
针对现有算法在对点云数据进行平移、缩放以及旋转等几何变换时网络不能充分提取局部特征,导致网络精度显著下降的问题,提出基于自适应生成卷积核的动态图注意力三维点云识别及分割算法.首先,利用感受野中心点位置信息增强邻点感知上下... 针对现有算法在对点云数据进行平移、缩放以及旋转等几何变换时网络不能充分提取局部特征,导致网络精度显著下降的问题,提出基于自适应生成卷积核的动态图注意力三维点云识别及分割算法.首先,利用感受野中心点位置信息增强邻点感知上下文信息能力,通过改进的自注意力机制重构感受野,使感受野内特征信息充分交互,增强感受野的上下文信息.其次,构造自适应生成卷积核,通过捕获变化的点云拓扑信息,自适应生成卷积核权重,进而提升网络性能.最后,构建动态图注意力卷积算子,并设计点云识别的动态网络与分割的U形网络.实验结果表明,本文算法在ModelNet40点云识别数据集的识别精度达到了94.0%,在ShapeNet Part点云部件语义分割数据集的平均交并比达到了86.2%.本文算法能够提取三维点云的关键特征信息,具有较好的三维点云识别与分割能力. 展开更多
关键词 三维点云 动态注意力卷积 自适应算法 模型识别 语义分割
在线阅读 下载PDF
融合动态掩码注意力与多教师多特征知识蒸馏的文本分类 被引量:3
12
作者 王润周 张新生 王明虎 《中文信息学报》 CSCD 北大核心 2024年第3期113-129,共17页
知识蒸馏技术可以将大规模模型中的知识压缩到轻量化的模型中,在文本分类任务中实现更高效的推断。现有的知识蒸馏方法较少同时考虑多种教师与多个特征层之间的信息融合。此外,蒸馏过程采用全局填充,未能动态关注数据中的有效信息。为此... 知识蒸馏技术可以将大规模模型中的知识压缩到轻量化的模型中,在文本分类任务中实现更高效的推断。现有的知识蒸馏方法较少同时考虑多种教师与多个特征层之间的信息融合。此外,蒸馏过程采用全局填充,未能动态关注数据中的有效信息。为此,该文提出一种融合动态掩码注意力机制与多教师多特征知识蒸馏的文本分类模型,不仅引入多种教师模型(RoBERTa、Electra)的知识源,还兼顾不同教师模型在多个特征层的语义信息,并通过设置动态掩码模型注意力机制使得蒸馏过程动态关注不等长数据,减少无用填充信息的干扰。在4种公开数据集上的实验结果表明,经过蒸馏后的学生模型(TinyBRET)在预测性能上均优于其他基准蒸馏策略,并在采用教师模型1/10的参数量、约1/2的平均运行时间的条件下,取得与两种教师模型相当的分类结果,平均准确率仅下降4.18%和3.33%,平均F 1值仅下降2.30%和2.38%。其注意力热度图也表明动态掩码注意力机制切实加强关注了数据尾部与上下文信息。 展开更多
关键词 动态掩码注意力 多教师多特征 知识蒸馏 文本分类
在线阅读 下载PDF
基于动态多头注意力机制的藏文语言模型 被引量:6
13
作者 张英 拥措 于韬 《计算机工程与设计》 北大核心 2023年第12期3707-3713,共7页
针对预训练过程中大规模训练语料句子长度跨度较大、特征数量不定的情况,提出一种基于动态多头注意力机制的藏文ALBERT语言模型。在训练过程中根据句子的词数动态获得注意力机制的头数,使语言模型可以捕获重要的特征信息,在藏文公开数据... 针对预训练过程中大规模训练语料句子长度跨度较大、特征数量不定的情况,提出一种基于动态多头注意力机制的藏文ALBERT语言模型。在训练过程中根据句子的词数动态获得注意力机制的头数,使语言模型可以捕获重要的特征信息,在藏文公开数据集TNCC上进行验证。实验结果表明,改进后的预训练模型能够动态学习句子中的重要特征,在目前的TNCC文本分类任务上F1值均取得最优,其长文本分类及短文本分类任务的Macro F1值分别为73.23%、64.47%。 展开更多
关键词 注意力机制 动态注意力头数 藏文 预训练语言模型 文本分类 卷积神经网络 自然语言处理
在线阅读 下载PDF
基于动态图注意力机制的秦俑点云鲁棒配准 被引量:1
14
作者 海琳琦 耿国华 +2 位作者 杨兴 李康 张海波 《光学精密工程》 EI CAS CSCD 北大核心 2022年第24期3210-3224,共15页
针对目前的点云配准方法在处理秦俑等文物模型时不能很好地解决分辨率不匹配、点云部分重叠、噪声点较多等问题,提出一种基于动态图注意力机制的ResUNet配准模型。该模型将残差模块融入U-Net网络中,使用三维稀疏体素卷积计算点云特征,... 针对目前的点云配准方法在处理秦俑等文物模型时不能很好地解决分辨率不匹配、点云部分重叠、噪声点较多等问题,提出一种基于动态图注意力机制的ResUNet配准模型。该模型将残差模块融入U-Net网络中,使用三维稀疏体素卷积计算点云特征,并引入一种新的归一化技术:批邻域归一化(Batch-Neighborhood Normalization,BNHN),来提高特征对于点密度变化的鲁棒性;为了进一步提高配准性能,该模型通过自注意力机制和交叉注意力机制聚合局部特征和上下文特征,最后结合随机抽样一致性算法来估计源点云与目标点云之间的变化矩阵,完成秦俑文物模型的鲁棒配准。为了验证本文方法的有效与鲁棒,使用四组数据集(3DMatch、3DLoMatch、分辨率不匹配的3DMatch数据集以及两组秦俑数据)对配准模型进行测试,实验结果表明,该算法在3DMatch数据集和3DLoMatch数据集上的配准召回率分别达到90.1%和61.0%;在分辨率不匹配的3DMatch数据集,相比与基于特征学习的配准算法,该算法在配准召回率上提升了5%~20%;在秦俑数据集上,相对旋转误差均小于0.071,相对平移误差均小于0.016,相较于同类算法减少了一个量级或几倍。因此,本文的模型能够提取三维点云的关键特征信息,并且对点密度和重叠度变化具有更高的鲁棒性。 展开更多
关键词 点云配准 动态注意力机制 低重叠点云 点密度变化 残差网络
在线阅读 下载PDF
基于动态稀疏注意力的地铁客流预测模型 被引量:5
15
作者 马茜 梁奕 +1 位作者 段毅 曾尚琦 《城市轨道交通研究》 北大核心 2022年第4期22-26,共5页
地铁客流预测是随时间演变的多维时间序列数据,不同序列之间存在复杂的动态相互依赖关系。为挖掘多种监测指标之间存在的内在复杂关系,提出动态稀疏注意力模型:利用全局变量注意力自动选择相关驱动序列,增强模型预测的判别性;根据局部... 地铁客流预测是随时间演变的多维时间序列数据,不同序列之间存在复杂的动态相互依赖关系。为挖掘多种监测指标之间存在的内在复杂关系,提出动态稀疏注意力模型:利用全局变量注意力自动选择相关驱动序列,增强模型预测的判别性;根据局部紧密相关和全局稀疏相关的先验知识,对历史时间步和相关变量分别卷积和稀疏卷积,提取局部时间和局部变量特征;设计了稀疏注意力对相关时间步加权和变量加权,提高预测表现。结果表明,与其他常用客流预测模型相比,动态稀疏注意力模型能高度准确地预测客流。 展开更多
关键词 地铁 客流预测 动态稀疏注意力模型
在线阅读 下载PDF
TDGCN:触发器增强的两阶段动态图卷积网络的对话关系抽取研究 被引量:1
16
作者 自彦丞 李卫疆 《小型微型计算机系统》 北大核心 2025年第1期90-96,共7页
随着互联网中对话数据的不断增加,从中提取关系三元组对于自然语言处理的各个下游任务至关重要.为了改进对话关系抽取的性能,D.Yu等人在数据集中引入了“触发器”的概念,该概念为关系抽取提供了重要的线索.然而,目前对于触发器的应用还... 随着互联网中对话数据的不断增加,从中提取关系三元组对于自然语言处理的各个下游任务至关重要.为了改进对话关系抽取的性能,D.Yu等人在数据集中引入了“触发器”的概念,该概念为关系抽取提供了重要的线索.然而,目前对于触发器的应用还仅仅限于将其作为一个模型训练的附加任务,并未在关系三元组推理中充分利用.本文提出了一个两阶段的动态图模型,通过引入动态机制,有效地改进了现有静态构造的图注意力模型在处理关系重叠时的歧义问题.并且在动态图模型中引入了触发器节点,以便更充分地利用触发器来进行关系推理.整个模型在DialogRE数据集上进行了实验,相对于基线模型,该模型在验证集上的F1值提升了2.2%,在测试集上提升了2%.并且本文对所提出的机制进行了进一步分析,通过实验验证了其有效性. 展开更多
关键词 动态注意力网络 对话关系抽取 触发器
在线阅读 下载PDF
基于动态掩蔽注意力机制的事件抽取 被引量:7
17
作者 黄细凤 《计算机应用研究》 CSCD 北大核心 2020年第7期1964-1968,共5页
事件抽取(event extraction)是自然语言处理(natural language processing,NLP)中的一个重要且有挑战性的任务,以完成从文本中识别出事件触发词(trigger)以及触发词对应的要素(argument)。对于一个句子中有多个事件的多事件抽取任务,提... 事件抽取(event extraction)是自然语言处理(natural language processing,NLP)中的一个重要且有挑战性的任务,以完成从文本中识别出事件触发词(trigger)以及触发词对应的要素(argument)。对于一个句子中有多个事件的多事件抽取任务,提出了一种注意力机制的变种——动态掩蔽注意力机制(dynamic masked attention network,Dy MAN),与常规注意力机制相比,动态掩蔽注意力机制能够捕捉更丰富的上下文表示并保留更有价值的信息。在ACE 2005数据集上进行的实验中,对于多事件抽取任务,与之前最好的模型JRNN相比,Dy MAN模型在触发词分类任务上取得了9.8%的提升,在要素分类任务上取得了4.5%的提升,表明基于Dy MAN的事件抽取模型在多事件抽取上能够实现领先的效果。 展开更多
关键词 事件抽取 注意力机制 多事件抽取 动态掩蔽注意力
在线阅读 下载PDF
动态空间Transformer与多级融合的视网膜病变分级算法
18
作者 梁礼明 钟奕 +1 位作者 康婷 金家新 《计算机工程与科学》 北大核心 2025年第8期1459-1469,共11页
针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,... 针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,凸显病灶边缘特征,提高算法对病灶像素的定位感知能力;再次在网络底层设计动态空间注意力模块,有效联系全局和局部空间信息,以提升算法挖掘深层语义信息的能力;最后构建多级门控融合模块,实现非诊断信息的滤除,同时对可诊断信息进行多级融合,进一步提高视网膜病变分级准确率。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为91.71%和89.89%,IDRID数据集上准确率和APTOS 2019数据集ROC曲线下方面积的占比分别为79.61%和93.06%。实验结果表明,所提出算法在视网膜病变分级领域具有一定应用价值。 展开更多
关键词 视网膜病变分级 动态空间注意力 轮廓增强模块 多级门控融合模块
在线阅读 下载PDF
结合多粒度视图动态融合的多模态方面级情感分析 被引量:1
19
作者 杨颖 钱馨雨 王合宁 《计算机工程与应用》 CSCD 北大核心 2024年第22期172-183,共12页
为了解决以往多模态方面级情感分析研究中存在的特征提取不充分、数据噪声未被有效处理以及多模态数据中的复杂交互被忽视等问题,提出了一种多粒度视图动态融合模型(multi-granularity view dynamic fusion model,MVDFM)。从粗粒度和细... 为了解决以往多模态方面级情感分析研究中存在的特征提取不充分、数据噪声未被有效处理以及多模态数据中的复杂交互被忽视等问题,提出了一种多粒度视图动态融合模型(multi-granularity view dynamic fusion model,MVDFM)。从粗粒度和细粒度两个视角,对文本和图像数据进行向量化编码,以便充分捕捉数据特征,增强模型信息表达能力;提取文本、图像的多粒度视图特征,并设计动态门控自注意力机制,对细粒度级的文本、图像视图进行降噪,进一步保证特征提取质量;为了挖掘不同粒度上多视图之间的互补性和一致性,提出一种三视图分解高阶池化机制,对多粒度视图特征进行两阶段动态融合,得到最终的目标方面词情感极性。实验结果表明,该模型在公共数据集Twitter-2015和Twitter-2017上的准确率和F1值分别达到了78.69%、74.48%以及72.77%、71.61%,相较于最优基线模型分别提升了0.55、0.88个百分点,以及1.67、2.45个百分点。说明该方法能够充分利用多模态数据中包含的深层语义信息,并有效挖掘与目标方面词相关的重要信息,从而提高方面级情感预测效果。 展开更多
关键词 多模态方面级情感分析 动态门控注意力 多粒度视图 动态融合
在线阅读 下载PDF
基于改进YOLOv4算法的煤矿火灾视频智能识别方法研究 被引量:1
20
作者 王伟峰 李煜 +4 位作者 田丰 张宝宝 何地 李高爽 李卓洋 《中国煤炭》 北大核心 2025年第2期88-95,共8页
随着矿井智能化建设,煤矿火灾风险隐患逐渐增加。针对现有火灾检测算法存在准确率低以及对小火焰识别差的问题,提出一种煤矿火灾视频智能识别方法。该方法以YOLOv4为识别模型,采用群组归一化算法对模型归一化算法进行改进,并利用改进算... 随着矿井智能化建设,煤矿火灾风险隐患逐渐增加。针对现有火灾检测算法存在准确率低以及对小火焰识别差的问题,提出一种煤矿火灾视频智能识别方法。该方法以YOLOv4为识别模型,采用群组归一化算法对模型归一化算法进行改进,并利用改进算法降低模型训练时批量值大小引起的误差;为降低矿井环境对火焰识别造成的火焰边缘信息损失,采用随机池化算法与SPP金字塔算法融合、深度可分离卷积与CSP算法融合,实现对动态演化的火焰进行跨尺度特征提取并融合、避免训练过程中的过拟合现象;为降低光源分布不均对视频火焰识别的影响,在模型中引入动态注意力机制,根据火灾视频识别信息的刺激强弱自动调整感受野大小。将标注后的火灾视频图像数据集输入到F YOLOv4算法模型进行训练及测试。结果表明,改进后的F YOLOv4火灾识别模型的平均检测精度达到97.3%左右,较原始模型提升了7.85%,表明该方法可提高检测速度和精度,可有效提高煤矿火灾识别的准确率。 展开更多
关键词 YOLOv4 CSP改进 SPP改进 群组归一化 动态注意力机制
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部