期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于贝叶斯分类的中文物种描述文本的语义标注研究 被引量:3
1
作者 段宇锋 黑珍珍 +1 位作者 鞠菲 崔红 《情报学报》 CSSCI 北大核心 2012年第8期805-812,共8页
本研究从《中国植物志》中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注。通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率。采用先导词后,F平均值提高0... 本研究从《中国植物志》中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注。通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率。采用先导词后,F平均值提高0.048~0.107,尤以Fr为2时效果最好,整体标注性能F平均值高达0.902。各元素的标注性能也较为理想。Fr分别取1、2、3时,大部分元素的F值为0.730~0.964。 展开更多
关键词 朴素贝叶斯 先导词 物种描述文本 语义标注
在线阅读 下载PDF
策略性管理活动描述文本的创建方法研究 被引量:2
2
作者 史旗凯 郭菊娥 《科技进步与对策》 CSSCI 北大核心 2009年第1期23-26,共4页
为了应用文本挖掘技术处理实践中大量产生的管理类信息,探讨了策略性管理活动的涵义及其结构化信息的表示方法,并提出用集成指向同一目标的管理事件的方法,来创建策略性管理活动描述文本的基本框架的思想和方法。在考察自然语言处理技... 为了应用文本挖掘技术处理实践中大量产生的管理类信息,探讨了策略性管理活动的涵义及其结构化信息的表示方法,并提出用集成指向同一目标的管理事件的方法,来创建策略性管理活动描述文本的基本框架的思想和方法。在考察自然语言处理技术与信息技术的现有水平和发展趋势的基础上,提出了3种创建策略性管理活动描述文本的方法及其具体步骤,并用实例说明了策略性管理活动的结构化信息的表示方法。 展开更多
关键词 策略性管理活动 管理事件 创建方法 描述文本
在线阅读 下载PDF
基于依存句法的图像描述文本生成 被引量:3
3
作者 毕健旗 刘茂福 +1 位作者 胡慧君 代建华 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期431-440,共10页
现有图像描述文本生成模型能够应用词性序列和句法树使生成的文本更符合语法规则,但文本多为简单句,在语言模型促进深度学习模型的可解释性方面研究甚少。将依存句法信息融合到深度学习模型以监督图像描述文本生成的同时,可使深度学习... 现有图像描述文本生成模型能够应用词性序列和句法树使生成的文本更符合语法规则,但文本多为简单句,在语言模型促进深度学习模型的可解释性方面研究甚少。将依存句法信息融合到深度学习模型以监督图像描述文本生成的同时,可使深度学习模型更具可解释性。图像结构注意力机制基于依存句法和图像视觉信息,用于计算图像区域间关系并得到图像区域关系特征;融合图像区域关系特征和图像区域特征,与文本词向量通过长短期记忆网络(LSTM),用于生成图像描述文本。在测试阶段,通过测试图像与训练图像集的内容关键词,计算2幅图像的内容重合度,间接提取与测试图像对应的依存句法模板;模型基于依存句法模板,生成多样的图像描述文本。实验结果验证了模型在改善图像描述文本多样性和句法复杂度方面的能力,表明模型中的依存句法信息增强了深度学习模型的可解释性。 展开更多
关键词 图像描述文本生成 依存句法 图像结构注意力 内容重合度 深度模型可解释性
在线阅读 下载PDF
融合多步关系路径和实体描述信息的知识图谱表示学习模型
4
作者 冯勇 徐涵琪 +2 位作者 贾永鑫 徐红艳 王嵘冰 《计算机应用》 北大核心 2025年第S1期19-23,共5页
传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的... 传统的知识图谱表示学习模型主要聚焦于三元组内部的结构信息,而未能充分利用外部语义增强嵌入表征能力,如没有充分考虑实体间的多步关系路径信息以及不同路径的重要程度,且没有利用实体描述信息增强上下文感知能力。为提升知识图谱的应用效果,提出融合多步关系路径和实体描述信息的知识图谱表示学习(MPDRL)模型。首先,对两实体间的路径信息进行编码,并使用自注意力机制计算路径权重,从而获得关系路径信息的表示;其次,使用BERT(Bidirectional Encoder Representations from Transformers)模型对实体描述信息进行编码,并利用双向注意力机制计算实体描述信息嵌入与三元组关系嵌入之间的注意力权重,从而增强实体的语义信息;最后,将关系路径信息嵌入、实体描述信息嵌入和三元组结构嵌入融合起来进行训练。为评估模型性能,在公开数据集上针对所提模型和基准模型进行链接预测和三元组分类的实验。结果表明:在链接预测任务中,与融合关系路径与实体描述信息的知识图谱表示学习方法(PDRL)、多跳关系路径模型Att-ConvBiLSTM以及融合实体描述与关系路径信息的知识图谱嵌入模型TPKGE相比,所提模型在FB15k-237数据集上的Hit@10指标分别提高了5.7、2.9、2.5个百分点;在三元组分类任务上,所提模型在FB15k-237和WN18RR数据集上的准确率较最优基准模型PDRL分别提升了2.81和0.90个百分点。 展开更多
关键词 知识表示 关系路径 知识图谱 链接预测 文本描述
在线阅读 下载PDF
图像的文本描述方法研究综述 被引量:6
5
作者 马龙龙 韩先培 孙乐 《中文信息学报》 CSCD 北大核心 2018年第4期1-12,共12页
随着深度学习技术的兴起,自然语言处理与计算机视觉领域呈现相结合的趋势。作为融合视觉和语言的多模态研究任务,图像的文本描述可应用于基于文本内容的图像检索、网络图像分析等众多场景中,从而受到了研究界和企业界的广泛关注。图像... 随着深度学习技术的兴起,自然语言处理与计算机视觉领域呈现相结合的趋势。作为融合视觉和语言的多模态研究任务,图像的文本描述可应用于基于文本内容的图像检索、网络图像分析等众多场景中,从而受到了研究界和企业界的广泛关注。图像的文本描述方法可归纳为三大类:基于生成的方法、基于检索的方法和基于编码—解码的方法。该文详细介绍了这三类方法各自具有代表性的工作,并进一步分析了各方法的优劣;然后对图像文本描述方法的相关数据集、评测标准和主要开源工具包进行了阐述;最后,分析了图像的文本描述中需要解决的关键技术问题。 展开更多
关键词 图像的文本描述 生成 检索 编码—解码
在线阅读 下载PDF
结合描述性文本的三维模型语义检索方法
6
作者 王羡慧 覃征 +1 位作者 庄春晓 张选平 《计算机应用》 CSCD 北大核心 2011年第1期1-5,36,共6页
为了提高三维模型的检索性能,针对当前三维模型检索系统的语义检索功能无法支持用户的主观性描述文字的问题,提出一种基于内容和描述性文本结合的三维模型语义检索方法。该方法首先为三维模型构造语义树;然后,利用语料统计的方法,计算... 为了提高三维模型的检索性能,针对当前三维模型检索系统的语义检索功能无法支持用户的主观性描述文字的问题,提出一种基于内容和描述性文本结合的三维模型语义检索方法。该方法首先为三维模型构造语义树;然后,利用语料统计的方法,计算输入的描述性文本和语义树节点扩充信息的相关程度,将相关度较高的一部分节点的三维模型实例提取出来,得到一个经过语义约束的较小的三维模型集合;最后,使用用户输入的三维模型实例在这个经过语义约束的较小的三维模型集合里进行形状相似性匹配,依据匹配度的大小返回给用户三维模型检索结果。实验中,使用WordNet对一些名词的释义作为描述性文本输入。在普林斯顿大学的PSB三维模型数据集上的实验结果表明,该方法在大多数类别中的查准率—查全率性能好于传统的基于内容的三维模型检索方法。 展开更多
关键词 三维模型 语义检索 描述文本 WORDNET
在线阅读 下载PDF
基于文本描述的装配体零件尺寸自动协调
7
作者 吴勇 曹毓秀 《机械科学与技术》 CSCD 北大核心 1998年第A11期171-172,175,共3页
参数化特征方法已经在零件设计中得到了较为广泛的应用。当把这种方法应用于装配体的设计时,必须涉及零部件尺寸约束的描述表示与求解。本文以文本描述的方法表示零部件间的尺寸驱动关系,实现了装配体零部件尺寸的自动协调。
关键词 装配体 参数化 尺寸协调 文本描述 CAD 机械设计
在线阅读 下载PDF
语义增强图像-文本预训练模型的零样本三维模型分类
8
作者 丁博 张立宝 +1 位作者 秦健 何勇军 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3314-3323,共10页
目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法... 目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法。该方法首先将3维模型表示成多视图;然后为了增强零样本学习对未知类别的识别能力,通过视觉语言生成模型获得每张视图及其类别的语义描述性文本,并将其作为视图和类别提示文本之间的语义桥梁,语义描述性文本采用图像字幕和视觉问答两种方式获取;最后微调语义编码器将语义描述性文本具化为类别的语义描述,其拥有丰富的语义信息和较好的可解释性,有效减小了视图和类别提示文本的语义鸿沟。实验表明,该文方法在ModelNet10和ModelNet40数据集上的分类性能优于现有的零样本分类方法。 展开更多
关键词 3维模型分类 零样本 基于对比学习的图像-文本预训练模型 语义描述文本
在线阅读 下载PDF
图像语义相似性网络的文本描述方法 被引量:2
9
作者 刘畅 周向东 施伯乐 《计算机应用与软件》 北大核心 2018年第1期211-216,231,共7页
图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网... 图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网络,引入图像间的视觉相似性和文本相似性信息,从而在预测图像的文本描述时保持相似图像的有效语义信息。增加栈式隐层和普通隐层的深度来提高语言模型的学习能力,最终得到接近自然语言的文本。实验结果表明,该方法在BLEU、ROUGE、METEOR和CIDEr等评价指标上均取得较好的效果,能够生成符合图像内容的高质量文本描述。 展开更多
关键词 图像文本描述 递归神经网络 语义相似性 语言模型 语义鸿沟 束搜索
在线阅读 下载PDF
融合实体描述与关系路径信息的知识图谱嵌入模型 被引量:1
10
作者 翟社平 李方怡 +1 位作者 亢鑫年 杨锐 《小型微型计算机系统》 CSCD 北大核心 2024年第12期2867-2874,共8页
目前已有的知识图谱嵌入方法主要关注三元组结构信息,未充分利用外部文本补充知识图谱的语义信息,同时由于现有模型仅使用单跳输出结果进行知识图谱嵌入,这导致在嵌入过程中丢失了大量的路径信息.针对以上问题,本文提出了一种融合实体... 目前已有的知识图谱嵌入方法主要关注三元组结构信息,未充分利用外部文本补充知识图谱的语义信息,同时由于现有模型仅使用单跳输出结果进行知识图谱嵌入,这导致在嵌入过程中丢失了大量的路径信息.针对以上问题,本文提出了一种融合实体描述与关系路径信息的语义嵌入模型TPKGE,该模型首先利用软注意力机制对三元组和实体描述文本进行过滤,提取与特定关系相关的有效信息,其次以分层的方式学习多跳关系路径特征嵌入,最终将两部分结果合并到同一实体和关系嵌入表示中.在4个公开的数据集上进行实验,结果表明TPKGE与其他基线模型相比更具竞争力,验证了同时考虑文本描述以及多跳关系路径信息的有效性. 展开更多
关键词 知识图谱嵌入 文本描述 关系路径 注意力机制
在线阅读 下载PDF
融合文本和路径语义的知识图谱嵌入学习模型 被引量:4
11
作者 肖宝 韦丽娜 +1 位作者 李璞 蒋运承 《华南师范大学学报(自然科学版)》 CAS 北大核心 2020年第6期103-112,共10页
针对现有的融合文本和路径信息的模型未能充分挖掘和利用文本与路径语义的问题,提出了新的知识图谱嵌入学习模型(GETR模型):首先,利用LDA丰富实体描述文本语义并用TWE获取词和主题向量,采用Bi-LSTM模型把词和主题向量编码融入实体向量... 针对现有的融合文本和路径信息的模型未能充分挖掘和利用文本与路径语义的问题,提出了新的知识图谱嵌入学习模型(GETR模型):首先,利用LDA丰富实体描述文本语义并用TWE获取词和主题向量,采用Bi-LSTM模型把词和主题向量编码融入实体向量表示中,以增强结点的语义表达能力;其次,设计了以组合PageRank和余弦相似度算法为策略的随机游走算法,以获取实体间的多步路径,并利用自注意力机制捕获路径的重要语义融入到翻译模型中进行联合训练,从而达到有效过滤路径中的噪声和提高模型效率的目的.最后,在数据集FB15K、FB20K和WN18上,对GETR、TransE、DKRL、TKGE模型进行知识补全和实体分类任务的评测,结果表明:GETR模型具有更好的性能表现,是一种更加高效的知识表示方法. 展开更多
关键词 知识图谱嵌入 随机游走 自注意力机制 多步路径 实体描述文本
在线阅读 下载PDF
一种基于向量空间模型的文本分类方法 被引量:31
12
作者 李雪蕾 张冬茉 《计算机工程》 CAS CSCD 北大核心 2003年第17期90-92,共3页
介绍的文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。通过分析网页的特点及因特网用户感兴趣的查询信息,提出了一种基于机器学习的、独立于语种的文本分类模型。这一模型的关键算法主要利用字间的相关信息、... 介绍的文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。通过分析网页的特点及因特网用户感兴趣的查询信息,提出了一种基于机器学习的、独立于语种的文本分类模型。这一模型的关键算法主要利用字间的相关信息、词频、页面的标记信息以及对用户的查询信息的浅层语义分析,提取网页特征,并计算可调的词频加权参数和增加特征词的可分性信息,然后通过本类和非本类训练,建立预定义类的特征向量空间,进一步对文本进行分类。这种分类方法在相似文本分类中具有明显的优势。 展开更多
关键词 文本分类 文本描述语言 可分性判据 层次分类
在线阅读 下载PDF
基于多模态融合与多层注意力的视频内容文本表述研究 被引量:10
13
作者 赵宏 郭岚 +1 位作者 陈志文 郑厚泽 《计算机工程》 CAS CSCD 北大核心 2022年第10期45-54,共10页
针对现有视频内容文本表述模型存在生成的文本表述单一、准确率不高等问题,提出一种融合帧级图像及音频信息的视频内容文本表述模型。基于自注意力机制设计单模态嵌入层网络结构,并将其嵌入单模态特征中学习单模态特征参数。采用联合表... 针对现有视频内容文本表述模型存在生成的文本表述单一、准确率不高等问题,提出一种融合帧级图像及音频信息的视频内容文本表述模型。基于自注意力机制设计单模态嵌入层网络结构,并将其嵌入单模态特征中学习单模态特征参数。采用联合表示、协作表示两种方法对单模态嵌入层输出的高维特征向量进行双模态特征融合,使模型能关注视频中不同目标间的交互关系,从而生成更加丰富、准确的视频文本表述。使用大规模数据集对模型进行预训练,并提取视频帧、视频所携带的音频等表征信息,将其送入编解码器实现视频内容的文本表述。在MSR-VTT和LSMDC数据集上的实验结果表明,所提模型的BLEU4、METEOR、ROUGEL和CIDEr指标分别为0.386、0.250、0.609和0.463,相较于MSR-VTT挑战赛中IIT DeIhi发布的模型,分别提升了0.082、0.037、0.115和0.257,能有效提升视频内容文本表述的准确率。 展开更多
关键词 视频内容文本描述 多模态融合 联合表示 协作表示 自注意力机制
在线阅读 下载PDF
基于XML的安全漏洞通用描述语言
14
作者 刘楠 罗军勇 问斌 《计算机应用与软件》 CSCD 北大核心 2005年第6期9-11,125,共4页
在计算机安全漏洞的研究中,安全漏洞的通用描述是一个亟待解决的问题。本文首先对当前安全漏洞的描述方法进行分析,指出当前的描述方法主要基于文本描述、不同安全组织定义的描述方法所描述的内容不一致,不利于安全工具及安全漏洞信息... 在计算机安全漏洞的研究中,安全漏洞的通用描述是一个亟待解决的问题。本文首先对当前安全漏洞的描述方法进行分析,指出当前的描述方法主要基于文本描述、不同安全组织定义的描述方法所描述的内容不一致,不利于安全工具及安全漏洞信息源之间的协同工作。本文基于XML定义了通用漏洞描述语言UVML,这种语言在传统安全漏洞描述方法的基础上定义了一种统一的安全漏洞描述语言,可以作为不同的安全工具和安全漏洞源之间交换信息的统一模型,解决安全漏洞内容、标识的不一致问题,有助于安全工具间的协同工作及对安全漏洞信息的进一步分析。 展开更多
关键词 安全漏洞 描述语言 XML 通用 描述方法 安全工具 协同工作 文本描述 安全组织 统一模型 计算机 定义 信息源 交换
在线阅读 下载PDF
零件二维视图描述及转换器设计
15
作者 刘晓婷 姬连俊 孙伯耳 《西北建筑工程学院学报(自然科学版)》 1998年第3期49-52,共4页
在二维特征类库的基础上,针对特定的CAD系统,采用文本描述方法对特征类库中的特征赋予实例及描述基本几何实体,并进行相对应的转换,从而生成零件二维图形.
关键词 转换器 特征 文本描述 零件二维图形
在线阅读 下载PDF
基于Transformer交叉注意力的文本生成图像技术 被引量:6
16
作者 谈馨悦 何小海 +2 位作者 王正勇 罗晓东 卿粼波 《计算机科学》 CSCD 北大核心 2022年第2期107-115,共9页
近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展。文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像。目前,主流的方法是通过预训练文本编码器来完... 近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展。文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像。目前,主流的方法是通过预训练文本编码器来完成对输入文本描述的编码,但这些方法在文本编码器中未考虑与对应图像的语义对齐问题,独立对输入文本进行编码,忽略了语言空间与图像空间之间的语义鸿沟问题。为解决这一问题,文中设计了一种基于交叉注意力编码器的对抗生成网络(CAE-GAN),该网络通过交叉注意力编码器,将文本信息与视觉信息进行翻译和对齐,以捕捉文本与图像信息之间的跨模态映射关系,从而提升生成图像的逼真度和与输入文本描述的匹配度。实验结果表明,在CUB和coco数据集上,与当前主流的方法DM-GAN模型相比,CAE-GAN模型的IS(Inception Score)分数分别提升了2.53%和1.54%,FID (Fréchet Inception Distance)分数分别降低了15.10%和5.54%,由此可知,CAE-GAN模型生成图像的细节更加完整、质量更高。 展开更多
关键词 文本描述生成图像 生成对抗网络 交叉注意力编码 图像生成 计算机视觉
在线阅读 下载PDF
一种相似网页文本分类方法的研究
17
作者 李雪蕾 张冬茉 《计算机工程》 CAS CSCD 北大核心 2003年第z1期13-14,92,共3页
通过分析网页的特点及因特网用户感兴趣的查询信息,提出了一种基于机器学习的、独立于语种的文本分类模型.这一模型的算法主要利用字间的相关信息、词频、页面的标记信息以及对用户的查询信息的浅层语义分析,提取网页特征,并计算可调的... 通过分析网页的特点及因特网用户感兴趣的查询信息,提出了一种基于机器学习的、独立于语种的文本分类模型.这一模型的算法主要利用字间的相关信息、词频、页面的标记信息以及对用户的查询信息的浅层语义分析,提取网页特征,并计算可调的词频加权参数和增加特征词的可分性信息,然后通过本类和非本类训练,建立预定义类的特征向量空间,进一步对文本进行分类.这种分类方法在对于相似文本分类中具有明显的优势. 展开更多
关键词 文本分类 文本描述语言 可分性判据 层次分类
在线阅读 下载PDF
SVG在WebGIS中的应用 被引量:27
18
作者 周强中 谈俊忠 《计算机应用研究》 CSCD 北大核心 2003年第1期108-110,121,共4页
首先讨论了WebGIS现在面临的一些挑战和技术瓶颈 ,随后介绍了一种新兴的、开放标准的、基于XML的文本式矢量图形描述语言———SVG的概念以及它的特征和优点 ;并且基于SVG/XML从数据结构和系统结构入手 ,阐述了SVG在WebGIS中的应用。
关键词 SVG WEBGIS 地理信息系统 文本式矢量图形描述语言 INTERNET
在线阅读 下载PDF
基于图结构与文本信息对比的知识图谱补全
19
作者 翟社平 杨晴 黄妍 《计算机工程与应用》 2025年第17期200-208,共9页
目前知识图谱补全方法主要使用图神经网络对图数据进行建模,忽视了文本信息在知识整合中的重要性。此外,现有模型未能充分挖掘细粒度三元组关系对实体嵌入更新的影响。针对以上问题,提出基于图结构与文本信息对比学习的知识图谱补全方法... 目前知识图谱补全方法主要使用图神经网络对图数据进行建模,忽视了文本信息在知识整合中的重要性。此外,现有模型未能充分挖掘细粒度三元组关系对实体嵌入更新的影响。针对以上问题,提出基于图结构与文本信息对比学习的知识图谱补全方法SCLKGC。在图编码器中采用特定类型的注意力机制,为实体邻域分配与其重要性相匹配的权重,从而实现实体邻域信息的更精准聚合。分别使用基于层次邻域和基于语义-结构的对比学习方法,以更有效地学习实体在知识图谱中的表示。实验部分使用两个真实数据集对所提方法进行验证。实验结果表明,与基线方法得到的最佳效果相比,在FB15k-237数据集上,SCLKGC的平均倒数排名(MRR)、Hits@1、Hits@3、Hits@10分别提高了0.008、0.016、0.011、0.013;在WN18RR数据集上,SCLKGC的MRR、Hits@1、Hits@3、Hits@10分别提高了0.006、0.008、0.006、0.012,验证了所提方法的有效性。 展开更多
关键词 知识图谱补全 对比学习 文本描述 注意力机制
在线阅读 下载PDF
融合语义信息的视频摘要生成 被引量:2
20
作者 滑蕊 吴心筱 赵文天 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期650-657,共8页
任务旨在通过生成简短的视频片段来表示原视频的主要内容,针对现有方法缺乏对语义信息探索的问题,提出了一种融合语义信息的视频摘要生成模型,学习视频特征使其包含丰富的语义信息,进而同时生成描述原始视频内容的视频摘要和文本摘要。... 任务旨在通过生成简短的视频片段来表示原视频的主要内容,针对现有方法缺乏对语义信息探索的问题,提出了一种融合语义信息的视频摘要生成模型,学习视频特征使其包含丰富的语义信息,进而同时生成描述原始视频内容的视频摘要和文本摘要。该模型分为3个模块:帧级分数加权模块、视觉-语义嵌入模块、视频文本描述生成模块。帧级分数加权模块结合卷积网络与全连接层以获取帧级重要性分数;视觉-语义嵌入模块将视觉特征与文本特征映射到同一空间,以使2种特征相互靠近;视频文本描述生成模块最小化视频摘要的生成描述与文本标注真值之间的距离,以生成带有语义信息的视频摘要。测试时,在获取视频摘要的同时,该模型获得简短的文本摘要作为副产品,可以帮助人们更直观地理解视频内容。在SumMe和TVSum数据集上的实验表明:该模型通过融合语义信息,比现有先进方法取得了更好的性能,在这2个数据集上F-score指标分别提高了0.5%和1.6%。 展开更多
关键词 视频摘要 视觉-语义嵌入空间 视频文本描述 视频关键帧 长短期记忆(LSTM)模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部