期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于编码器-解码器架构的藏医药文本实体关系联合抽取
1
作者
高兴
拥措
《高原科学研究》
CSCD
2024年第4期115-128,共14页
在藏医药领域,准确提取医学文本中的医学实体及其关系并结构化为三元组,对于构建藏医药知识图谱具有重要意义。然而,现有方法主要依赖通用预训练模型处理藏医药文本,这些模型未能充分覆盖藏医药领域的专业术语,且在泛化性和鲁棒性方面...
在藏医药领域,准确提取医学文本中的医学实体及其关系并结构化为三元组,对于构建藏医药知识图谱具有重要意义。然而,现有方法主要依赖通用预训练模型处理藏医药文本,这些模型未能充分覆盖藏医药领域的专业术语,且在泛化性和鲁棒性方面存在不足。为此,文章提出了一种新型模型,该模型基于编码器-解码器架构,并融合了指针机制。在编码阶段,BERT和GloVe被用于生成丰富的嵌入表示,这些表示经过融合,增强了模型对医学领域文本的理解力;在解码阶段,通过将Transformer解码器和指针机制结合,模型直接生成与实体和关系相关的结构化信息。此外,文章通过引入“相似跨度”的概念和相应的惩罚性训练策略,进一步增强了模型识别实体的能力。通过在CMeIE-V2和藏医药数据集TibetanAI_TMDisRE_v1.0上进行广泛实验,并与基线模型进行对比,验证了文章模型的卓越性能和鲁棒性。
展开更多
关键词
编码器-解码器架构
指针机制
藏医药文本
实体关系联合抽取
在线阅读
下载PDF
职称材料
基于分段注意力机制的时间序列预测模型
2
作者
王慧斌
胡展傲
+2 位作者
胡节
徐袁伟
文博
《计算机应用》
北大核心
2025年第7期2262-2268,共7页
针对时间序列分段后存在因采样间隔增大而导致的长期预测过程中局部依赖关系丢失的情况,提出一种基于分段注意力机制的时间序列预测模型(SAMformer)。首先,显式地将时间静态协变量与原始数据按比例融合,以增强数据的时域信息表征能力;其...
针对时间序列分段后存在因采样间隔增大而导致的长期预测过程中局部依赖关系丢失的情况,提出一种基于分段注意力机制的时间序列预测模型(SAMformer)。首先,显式地将时间静态协变量与原始数据按比例融合,以增强数据的时域信息表征能力;其次,同时引入两个连续的带偏置的线性层和一个激活函数来微调融合数据,从而提高模型对非线性数据的拟合能力;然后,在分段序列的每个段内引入点积注意力机制,以便捕获局部特征依赖关系;最后,利用跨尺度依赖的编码器-解码器架构预测时序数据。所提模型在公开的5个时间序列数据集上的实验结果表明,相较于Crossformer、 Pyraformer和Informer等其他监督学习时序预测模型,SAMformer的均方误差(MSE)和平均绝对误差(MAE)分别降低了2.0%~62.0%和0.9%~49.8%。此外,通过消融实验验证了所提不同组件的完备性和有效性,进一步说明了融合时域信息和段内注意力机制有助于提高时间序列预测的精度。
展开更多
关键词
深度神经网络
时间序列预测
时域信息融合
编码器-解码器架构
注意力机制
在线阅读
下载PDF
职称材料
融合渐进式去雨网络的军用车辆检测算法
3
作者
苏胜君
仝秋红
+3 位作者
柴国庆
苏海东
王凯
胡待方
《现代电子技术》
北大核心
2025年第5期127-134,共8页
针对雨天场景下检测军用车辆目标时出现的精度退化问题,提出一种将渐进式去雨算法与高精确率检测器相融合的军用车辆检测方法。首先设计了一个图像去雨算法HISPNet,其包括轻量级高效雨纹特征提取模块和跨子网雨纹特征融合模块,捕获雨纹...
针对雨天场景下检测军用车辆目标时出现的精度退化问题,提出一种将渐进式去雨算法与高精确率检测器相融合的军用车辆检测方法。首先设计了一个图像去雨算法HISPNet,其包括轻量级高效雨纹特征提取模块和跨子网雨纹特征融合模块,捕获雨纹信息的同时缓解卷积过程中的细节特征丢失问题;其次引入SPPFCSPC模块改进了单阶段检测器,保证检测器感受野的同时提高了效率,增强了检测模型的表达能力。自建数据集中的实验结果表明,雨天场景下,相较于经典检测算法YOLOv7,所提算法的mAP@0.5、mAP@0.5:0.95分别提升了4.4%、2.8%,算法检测速度达到21.05 f/s,基本满足检测实时性要求,证明了所提算法的有效性与实用性。
展开更多
关键词
图像去雨
编码器-解码器架构
轻量级高效雨纹特征提取模块
跨子网雨纹特征融合模块
SPPFCSPC模块
军用车辆检测
在线阅读
下载PDF
职称材料
神经机器翻译前沿进展
被引量:
116
4
作者
刘洋
《计算机研究与发展》
EI
CSCD
北大核心
2017年第6期1144-1149,共6页
机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一.近年来,基于深度学习的神经机器翻译方法获得迅速发展,目前已取代传统的统计机器翻译成为学术界和工业界新的主流方法.首先介...
机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一.近年来,基于深度学习的神经机器翻译方法获得迅速发展,目前已取代传统的统计机器翻译成为学术界和工业界新的主流方法.首先介绍神经机器翻译的基本思想和主要方法,然后对最新的前沿进展进行综述,最后对神经机器翻译的未来发展方向进行展望.
展开更多
关键词
人工智能
深度学习
神经机器翻译
编码器-解码器架构
注意力机制
在线阅读
下载PDF
职称材料
图像描述生成研究进展
被引量:
8
5
作者
李志欣
魏海洋
+2 位作者
张灿龙
马慧芳
史忠植
《计算机研究与发展》
EI
CSCD
北大核心
2021年第9期1951-1974,共24页
图像描述生成结合了计算机视觉和自然语言处理2个研究领域,不仅要求完备的图像语义理解,还要求复杂的自然语言表达,是进一步研究符合人类感知的视觉智能的关键任务.对图像描述生成的研究进展做了回顾.首先,归纳分析了当前基于深度学习...
图像描述生成结合了计算机视觉和自然语言处理2个研究领域,不仅要求完备的图像语义理解,还要求复杂的自然语言表达,是进一步研究符合人类感知的视觉智能的关键任务.对图像描述生成的研究进展做了回顾.首先,归纳分析了当前基于深度学习的图像描述生成方法涉及的5个关键技术,包括整体架构、学习策略、特征映射、语言模型和注意机制.然后,按照发展进程将现有的图像描述生成方法分为四大类,即基于模板的方法、基于检索的方法、基于编码器-解码器架构的方法和基于复合架构的方法,并阐述了各类方法的基本概念、代表性方法和研究现状,重点讨论了基于编码器-解码器架构的各种方法及其创新思路,如多模态空间、视觉空间、语义空间、注意机制、模型优化等.接着,从实验的角度给出图像描述生成的常用数据集和评估措施,并在2个基准数据集上比较了一些典型方法的性能.最后,以提升图像描述的准确性、完整性、新颖性、多样性为依据,展示了图像描述生成的未来发展趋势.
展开更多
关键词
图像描述生成
编码器-解码器架构
复合
架构
注意机制
卷积神经网络
循环神经网络
长短期记忆网络
在线阅读
下载PDF
职称材料
基于双注意模型的图像描述生成方法研究
被引量:
9
6
作者
卓亚琦
魏家辉
李志欣
《电子学报》
EI
CAS
CSCD
北大核心
2022年第5期1123-1130,共8页
现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信...
现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信息,来表示生成语句所需的图像全局信息.在此基础上,结合语句级注意和单词级注意进一步提出了双注意模型,以此来生成更准确的图像描述.通过在模型的中间阶段实施监督和优化,以解决信息间的干扰问题.此外,将强化学习应用于两阶段的训练来优化模型的评估度量.通过在MSCOCO和Flickr30K两个基准数据集上的实验评估,结果表明本文提出的方法能够生成更加准确和丰富的描述语句,并且在各项评价指标上优于现有的多种基于注意机制的方法.
展开更多
关键词
图像描述生成
编码器-解码器架构
单词级注意
语句级注意
双注意模型
强化学习
在线阅读
下载PDF
职称材料
语言结构引导的可解释视频语义描述
被引量:
1
7
作者
李冠彬
张锐斐
+2 位作者
刘梦梦
刘劲
林倞
《软件学报》
EI
CSCD
北大核心
2023年第12期5905-5920,共16页
视频描述技术旨在为视频自动生成包含丰富内容的文字描述,近年来吸引了广泛的研究兴趣.一个准确而精细的视频描述生成方法,不仅需要对视频有全局上的理解,更离不开具体显著目标的局部空间和时序特征.如何建模一个更优的视频特征表达,一...
视频描述技术旨在为视频自动生成包含丰富内容的文字描述,近年来吸引了广泛的研究兴趣.一个准确而精细的视频描述生成方法,不仅需要对视频有全局上的理解,更离不开具体显著目标的局部空间和时序特征.如何建模一个更优的视频特征表达,一直是视频描述工作的研究重点和难点.另一方面,大多数现有工作都将句子视为一个链状结构,并将视频描述任务视为一个生成单词序列的过程,而忽略了句子的语义结构,这使得算法难以应对和优化复杂的句子描述及长句子中易引起的逻辑错误.为了解决上述问题,提出一种新颖的语言结构引导的可解释视频语义描述生成方法,通过设计一个基于注意力的结构化小管定位机制,充分考虑局部对象信息和句子语义结构.结合句子的语法分析树,所提方法能够自适应地加入具有文本内容的相应时空特征,进一步提升视频描述的生成效果.在主流的视频描述任务基准数据集MSVD和MSR-VTT上的实验结果表明,所提出方法在大多数评价指标上都达到了最先进的水平.
展开更多
关键词
视频描述
编码器-解码器架构
小管
注意力机制
依存分析
在线阅读
下载PDF
职称材料
深度神经网络图像描述综述
被引量:
14
8
作者
许昊
张凯
+2 位作者
田英杰
种法广
王子超
《计算机工程与应用》
CSCD
北大核心
2021年第9期9-22,共14页
深度学习的迅速发展使得图像描述效果得到显著提升,针对基于深度神经网络的图像描述方法及其研究现状进行详细综述。图像描述算法结合计算机视觉和自然语言处理的知识,根据图像中检测到的内容自动生成自然语言描述,是场景理解的重要部...
深度学习的迅速发展使得图像描述效果得到显著提升,针对基于深度神经网络的图像描述方法及其研究现状进行详细综述。图像描述算法结合计算机视觉和自然语言处理的知识,根据图像中检测到的内容自动生成自然语言描述,是场景理解的重要部分。图像描述任务中,一般采用由编码器和解码器组成的基本架构。改进编码器或解码器,应用生成对抗网络、强化学习、无监督学习以及图卷积神经网络等方法能有效提高图像描述算法的性能。对每类方法的代表模型算法的效果以及优缺点进行分析,并介绍适用的公开数据集,在此基础上进行对比实验。对图像描述面临的挑战以及未来工作的发展方向做出展望。
展开更多
关键词
深度神经网络
计算机视觉
图像描述
编码器-解码器架构
注意力机制
在线阅读
下载PDF
职称材料
融合文本分类的多任务学习摘要模型
被引量:
3
9
作者
周伟枭
蓝雯飞
《计算机工程》
CAS
CSCD
北大核心
2021年第4期48-55,共8页
应包含源文本中所有重要信息,传统基于编码器-解码器架构的摘要模型生成的摘要准确性较低。根据文本分类和文本摘要的相关性,提出一种多任务学习摘要模型。从文本分类辅助任务中学习抽象信息改善摘要生成质量,使用K-means聚类算法构建Cl...
应包含源文本中所有重要信息,传统基于编码器-解码器架构的摘要模型生成的摘要准确性较低。根据文本分类和文本摘要的相关性,提出一种多任务学习摘要模型。从文本分类辅助任务中学习抽象信息改善摘要生成质量,使用K-means聚类算法构建Cluster-2、Cluster-10和Cluster-20文本分类数据集训练分类器,并研究不同分类数据集参与训练对摘要模型的性能影响,同时利用基于统计分布的判别法全面评价摘要准确性。在CNNDM测试集上的实验结果表明,该模型在ROUGE-1、ROUGE-2和ROUGE-L指标上相比强基线模型分别提高了0.23、0.17和0.31个百分点,生成摘要的准确性更高。
展开更多
关键词
编码器-解码器架构
文本摘要
文本分类
多任务学习
聚类算法
统计分布
在线阅读
下载PDF
职称材料
题名
基于编码器-解码器架构的藏医药文本实体关系联合抽取
1
作者
高兴
拥措
机构
西藏大学信息科学技术学院
西藏自治区藏文信息技术人工智能重点实验室
藏文信息技术教育部工程研究中心
出处
《高原科学研究》
CSCD
2024年第4期115-128,共14页
基金
科技创新2030——“新一代人工智能”重大项目(2022ZD0116100)
西藏自治区科技厅项目(XZ202401JD0010)。
文摘
在藏医药领域,准确提取医学文本中的医学实体及其关系并结构化为三元组,对于构建藏医药知识图谱具有重要意义。然而,现有方法主要依赖通用预训练模型处理藏医药文本,这些模型未能充分覆盖藏医药领域的专业术语,且在泛化性和鲁棒性方面存在不足。为此,文章提出了一种新型模型,该模型基于编码器-解码器架构,并融合了指针机制。在编码阶段,BERT和GloVe被用于生成丰富的嵌入表示,这些表示经过融合,增强了模型对医学领域文本的理解力;在解码阶段,通过将Transformer解码器和指针机制结合,模型直接生成与实体和关系相关的结构化信息。此外,文章通过引入“相似跨度”的概念和相应的惩罚性训练策略,进一步增强了模型识别实体的能力。通过在CMeIE-V2和藏医药数据集TibetanAI_TMDisRE_v1.0上进行广泛实验,并与基线模型进行对比,验证了文章模型的卓越性能和鲁棒性。
关键词
编码器-解码器架构
指针机制
藏医药文本
实体关系联合抽取
Keywords
encoder
-
decoder architecture
pointer mechanism
Tibetan medicine texts
joint entity and relation extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于分段注意力机制的时间序列预测模型
2
作者
王慧斌
胡展傲
胡节
徐袁伟
文博
机构
国网四川岷江供电有限责任公司
西南交通大学计算机与人工智能学院
出处
《计算机应用》
北大核心
2025年第7期2262-2268,共7页
基金
四川省电力公司常规科技项目(5219T8230001)。
文摘
针对时间序列分段后存在因采样间隔增大而导致的长期预测过程中局部依赖关系丢失的情况,提出一种基于分段注意力机制的时间序列预测模型(SAMformer)。首先,显式地将时间静态协变量与原始数据按比例融合,以增强数据的时域信息表征能力;其次,同时引入两个连续的带偏置的线性层和一个激活函数来微调融合数据,从而提高模型对非线性数据的拟合能力;然后,在分段序列的每个段内引入点积注意力机制,以便捕获局部特征依赖关系;最后,利用跨尺度依赖的编码器-解码器架构预测时序数据。所提模型在公开的5个时间序列数据集上的实验结果表明,相较于Crossformer、 Pyraformer和Informer等其他监督学习时序预测模型,SAMformer的均方误差(MSE)和平均绝对误差(MAE)分别降低了2.0%~62.0%和0.9%~49.8%。此外,通过消融实验验证了所提不同组件的完备性和有效性,进一步说明了融合时域信息和段内注意力机制有助于提高时间序列预测的精度。
关键词
深度神经网络
时间序列预测
时域信息融合
编码器-解码器架构
注意力机制
Keywords
Deep Neural Network(DNN)
time series forecasting
time domain information fusion
encoder
-
decoder architecture
attention mechanism
分类号
O211.61 [理学—概率论与数理统计]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
融合渐进式去雨网络的军用车辆检测算法
3
作者
苏胜君
仝秋红
柴国庆
苏海东
王凯
胡待方
机构
长安大学汽车学院
中国科学院西安光学精密机械研究所
陕西智能网联汽车研究院有限公司
长安大学信息工程学院
出处
《现代电子技术》
北大核心
2025年第5期127-134,共8页
基金
国家重点研发计划(2022YFC3002602)
“两链”融合企业(院所)联合重点专项-工业领域(2022LL-JB-03)。
文摘
针对雨天场景下检测军用车辆目标时出现的精度退化问题,提出一种将渐进式去雨算法与高精确率检测器相融合的军用车辆检测方法。首先设计了一个图像去雨算法HISPNet,其包括轻量级高效雨纹特征提取模块和跨子网雨纹特征融合模块,捕获雨纹信息的同时缓解卷积过程中的细节特征丢失问题;其次引入SPPFCSPC模块改进了单阶段检测器,保证检测器感受野的同时提高了效率,增强了检测模型的表达能力。自建数据集中的实验结果表明,雨天场景下,相较于经典检测算法YOLOv7,所提算法的mAP@0.5、mAP@0.5:0.95分别提升了4.4%、2.8%,算法检测速度达到21.05 f/s,基本满足检测实时性要求,证明了所提算法的有效性与实用性。
关键词
图像去雨
编码器-解码器架构
轻量级高效雨纹特征提取模块
跨子网雨纹特征融合模块
SPPFCSPC模块
军用车辆检测
Keywords
image deraining
encoder
-
decoder architecture
lightweight and efficient rain streak feature extraction module
cross
-
subnet rain streak feature fusion module
SPPFCSPC module
military vehicle detection
分类号
TN911.7-34 [电子电信—通信与信息系统]
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
神经机器翻译前沿进展
被引量:
116
4
作者
刘洋
机构
清华大学计算机科学与技术系
清华信息科学与技术国家实验室(筹)
智能技术与系统国家重点实验室(清华大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第6期1144-1149,共6页
基金
国家自然科学基金优秀青年科学基金项目(61522204)~~
文摘
机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一.近年来,基于深度学习的神经机器翻译方法获得迅速发展,目前已取代传统的统计机器翻译成为学术界和工业界新的主流方法.首先介绍神经机器翻译的基本思想和主要方法,然后对最新的前沿进展进行综述,最后对神经机器翻译的未来发展方向进行展望.
关键词
人工智能
深度学习
神经机器翻译
编码器-解码器架构
注意力机制
Keywords
artificial intelligence
deep learning
neural machine translation
encoder
-
decoder framework
attention mechanism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
图像描述生成研究进展
被引量:
8
5
作者
李志欣
魏海洋
张灿龙
马慧芳
史忠植
机构
广西多源信息挖掘与安全重点实验室(广西师范大学)
西北师范大学计算机科学与工程学院
中国科学院智能信息处理重点实验室(中国科学院计算技术研究所)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第9期1951-1974,共24页
基金
国家自然科学基金项目(61966004,61663004,61866004,61762078)
广西自然科学基金项目(2019GXNSFDA245018,2018GXNSFDA281009,2017GXNSFAA198365)。
文摘
图像描述生成结合了计算机视觉和自然语言处理2个研究领域,不仅要求完备的图像语义理解,还要求复杂的自然语言表达,是进一步研究符合人类感知的视觉智能的关键任务.对图像描述生成的研究进展做了回顾.首先,归纳分析了当前基于深度学习的图像描述生成方法涉及的5个关键技术,包括整体架构、学习策略、特征映射、语言模型和注意机制.然后,按照发展进程将现有的图像描述生成方法分为四大类,即基于模板的方法、基于检索的方法、基于编码器-解码器架构的方法和基于复合架构的方法,并阐述了各类方法的基本概念、代表性方法和研究现状,重点讨论了基于编码器-解码器架构的各种方法及其创新思路,如多模态空间、视觉空间、语义空间、注意机制、模型优化等.接着,从实验的角度给出图像描述生成的常用数据集和评估措施,并在2个基准数据集上比较了一些典型方法的性能.最后,以提升图像描述的准确性、完整性、新颖性、多样性为依据,展示了图像描述生成的未来发展趋势.
关键词
图像描述生成
编码器-解码器架构
复合
架构
注意机制
卷积神经网络
循环神经网络
长短期记忆网络
Keywords
image captioning
encoder
-
decoder architecture
compositional architecture
attention mechanism
convolutional neural network
recurrent neural network
long short
-
term memory
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于双注意模型的图像描述生成方法研究
被引量:
9
6
作者
卓亚琦
魏家辉
李志欣
机构
桂林理工大学理学院
广西师范大学广西多源信息挖掘与安全重点实验室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2022年第5期1123-1130,共8页
基金
国家自然科学基金(No.61966004,No.61866004)
广西自然科学基金(No.2019GXNSFDA245018)
广西研究生教育创新计划(No.XY-CBZ2021002)。
文摘
现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信息,来表示生成语句所需的图像全局信息.在此基础上,结合语句级注意和单词级注意进一步提出了双注意模型,以此来生成更准确的图像描述.通过在模型的中间阶段实施监督和优化,以解决信息间的干扰问题.此外,将强化学习应用于两阶段的训练来优化模型的评估度量.通过在MSCOCO和Flickr30K两个基准数据集上的实验评估,结果表明本文提出的方法能够生成更加准确和丰富的描述语句,并且在各项评价指标上优于现有的多种基于注意机制的方法.
关键词
图像描述生成
编码器-解码器架构
单词级注意
语句级注意
双注意模型
强化学习
Keywords
image captioning
encoder
-
decoder architecture
word
-
level attention
sentence
-
level attention
double attention model
reinforcement learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
语言结构引导的可解释视频语义描述
被引量:
1
7
作者
李冠彬
张锐斐
刘梦梦
刘劲
林倞
机构
中山大学计算机学院
人工智能与数字经济广东省实验室(广州)
出处
《软件学报》
EI
CSCD
北大核心
2023年第12期5905-5920,共16页
基金
国家自然科学基金(61976250,U1811463)
广东省基础与应用基础研究基金(2020B1515020048)。
文摘
视频描述技术旨在为视频自动生成包含丰富内容的文字描述,近年来吸引了广泛的研究兴趣.一个准确而精细的视频描述生成方法,不仅需要对视频有全局上的理解,更离不开具体显著目标的局部空间和时序特征.如何建模一个更优的视频特征表达,一直是视频描述工作的研究重点和难点.另一方面,大多数现有工作都将句子视为一个链状结构,并将视频描述任务视为一个生成单词序列的过程,而忽略了句子的语义结构,这使得算法难以应对和优化复杂的句子描述及长句子中易引起的逻辑错误.为了解决上述问题,提出一种新颖的语言结构引导的可解释视频语义描述生成方法,通过设计一个基于注意力的结构化小管定位机制,充分考虑局部对象信息和句子语义结构.结合句子的语法分析树,所提方法能够自适应地加入具有文本内容的相应时空特征,进一步提升视频描述的生成效果.在主流的视频描述任务基准数据集MSVD和MSR-VTT上的实验结果表明,所提出方法在大多数评价指标上都达到了最先进的水平.
关键词
视频描述
编码器-解码器架构
小管
注意力机制
依存分析
Keywords
video captioning
encoder
-
decoder framework
tubelet
attention machanism
dependency parsing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
深度神经网络图像描述综述
被引量:
14
8
作者
许昊
张凯
田英杰
种法广
王子超
机构
上海电力大学计算机科学与技术学院
国家电网公司上海电器科学研究院
出处
《计算机工程与应用》
CSCD
北大核心
2021年第9期9-22,共14页
基金
国家自然科学基金(61872230,61802248,61802249,61702321)
上海高校青年教师培养资助计划(ZZsdl18006)。
文摘
深度学习的迅速发展使得图像描述效果得到显著提升,针对基于深度神经网络的图像描述方法及其研究现状进行详细综述。图像描述算法结合计算机视觉和自然语言处理的知识,根据图像中检测到的内容自动生成自然语言描述,是场景理解的重要部分。图像描述任务中,一般采用由编码器和解码器组成的基本架构。改进编码器或解码器,应用生成对抗网络、强化学习、无监督学习以及图卷积神经网络等方法能有效提高图像描述算法的性能。对每类方法的代表模型算法的效果以及优缺点进行分析,并介绍适用的公开数据集,在此基础上进行对比实验。对图像描述面临的挑战以及未来工作的发展方向做出展望。
关键词
深度神经网络
计算机视觉
图像描述
编码器-解码器架构
注意力机制
Keywords
deep neural network
computer vision
image caption
encoder
-
decoder architecture
attention mechanism
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合文本分类的多任务学习摘要模型
被引量:
3
9
作者
周伟枭
蓝雯飞
机构
中南民族大学计算机科学学院
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第4期48-55,共8页
基金
国家自然科学基金(61772562)。
文摘
应包含源文本中所有重要信息,传统基于编码器-解码器架构的摘要模型生成的摘要准确性较低。根据文本分类和文本摘要的相关性,提出一种多任务学习摘要模型。从文本分类辅助任务中学习抽象信息改善摘要生成质量,使用K-means聚类算法构建Cluster-2、Cluster-10和Cluster-20文本分类数据集训练分类器,并研究不同分类数据集参与训练对摘要模型的性能影响,同时利用基于统计分布的判别法全面评价摘要准确性。在CNNDM测试集上的实验结果表明,该模型在ROUGE-1、ROUGE-2和ROUGE-L指标上相比强基线模型分别提高了0.23、0.17和0.31个百分点,生成摘要的准确性更高。
关键词
编码器-解码器架构
文本摘要
文本分类
多任务学习
聚类算法
统计分布
Keywords
encoder
-
decoder architecture
text summarization
text classification
Multi
-
Task Learning(MTL)
clustering algorithm
statistical distribution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于编码器-解码器架构的藏医药文本实体关系联合抽取
高兴
拥措
《高原科学研究》
CSCD
2024
0
在线阅读
下载PDF
职称材料
2
基于分段注意力机制的时间序列预测模型
王慧斌
胡展傲
胡节
徐袁伟
文博
《计算机应用》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
融合渐进式去雨网络的军用车辆检测算法
苏胜君
仝秋红
柴国庆
苏海东
王凯
胡待方
《现代电子技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
4
神经机器翻译前沿进展
刘洋
《计算机研究与发展》
EI
CSCD
北大核心
2017
116
在线阅读
下载PDF
职称材料
5
图像描述生成研究进展
李志欣
魏海洋
张灿龙
马慧芳
史忠植
《计算机研究与发展》
EI
CSCD
北大核心
2021
8
在线阅读
下载PDF
职称材料
6
基于双注意模型的图像描述生成方法研究
卓亚琦
魏家辉
李志欣
《电子学报》
EI
CAS
CSCD
北大核心
2022
9
在线阅读
下载PDF
职称材料
7
语言结构引导的可解释视频语义描述
李冠彬
张锐斐
刘梦梦
刘劲
林倞
《软件学报》
EI
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
8
深度神经网络图像描述综述
许昊
张凯
田英杰
种法广
王子超
《计算机工程与应用》
CSCD
北大核心
2021
14
在线阅读
下载PDF
职称材料
9
融合文本分类的多任务学习摘要模型
周伟枭
蓝雯飞
《计算机工程》
CAS
CSCD
北大核心
2021
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部