-
题名基于层次化结构表示的数据到文本生成方法
被引量:1
- 1
-
-
作者
龚永罡
郭怡星
廉小亲
马虢春
王希
刘宏宇
-
机构
北京工商大学人工智能学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第8期2399-2403,共5页
-
基金
“十三五”时期北京市属高校高水平教师队伍建设支持计划资助项目(CIT&TCD201904037)。
-
文摘
最近的数据到文本生成方法广泛采用了编码器—解码器架构或其变体,但是这些方法无法识别数据中不同部分的信息的重要性,导致在选择适当的内容和排序方面表现不佳。针对这些问题,提出了一个基于层次化结构表示的数据到文本生成方法,它包括规划阶段和生成阶段,规划阶段通过实体级、记录级的多层次注意力来增强语义空间的表达能力,输出的计划代表重要内容的高层次表示,同时将计划输入给生成阶段的生成器得到最终的文本。通过在两个数据到文本生成的数据集上进行的广泛实验表明,该方法相比于已有的数据到文本生成方法,生成的文本对数据的描述更加准确,质量更高,该方法的提出为数据到文本生成的研究提供了一定的指导性作用。
-
关键词
数据到文本生成
多层次注意力
层次化结构表示
编码器—解码器架构
-
Keywords
data-to-text generation
multi-level attention
hierarchical structure representation
encoder-decoder architecture
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于细粒度主题建模的数据到文本生成模型
- 2
-
-
作者
王扬
郑阳
王旭强
田雨婷
杨青
-
机构
国网天津市电力公司信息通信公司
-
出处
《计算机应用与软件》
北大核心
2022年第10期285-291,共7页
-
基金
天津市科技计划项目(18ZXZNGX00310)
天津市电力公司科技项目(KJ19-1-38)。
-
文摘
数据到文本生成是自然语言生成领域中的一个重要任务。端到端的神经网络结构的性能仅依赖于模型自身的表示学习能力,而忽略了文本和数据之间的主题一致性,进而导致生成文本的质量不高。为建模文本和数据间的主题关联,提出一种基于细粒度主题建模的数据到文本生成模型。基于两个真实数据集上的实验结果表明,该模型取得了最优的性能效果。
-
关键词
数据到文本生成
细粒度
主题建模
-
Keywords
Data-to-text generation
Fine-grained
Topic modeling
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名一种使用多跳事实的端到端知识库实体描述生成方法
- 3
-
-
作者
孟庆松
张翔
何世柱
刘康
赵军
-
机构
哈尔滨理工大学自动化学院
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2019年第5期66-74,共9页
-
基金
国家自然科学基金(61533018
61702512)
国家重点研发计划(2017YFB1002101)
-
文摘
自动化实体描述生成有助于进一步提升知识图谱的应用价值,而流畅度高是实体描述文本的重要质量指标之一。该文提出使用知识库上多跳的事实来进行实体描述生成,从而贴近人工编撰的实体描述的行文风格,提升实体描述的流畅度。该文使用编码器—解码器框架,提出了一个端到端的神经网络模型,可以编码多跳的事实,并在解码器中使用关注机制对多跳事实进行表示。该文的实验结果表明,与基线模型相比,引入多跳事实后模型的BLEU-2和ROUGE-L等自动化指标分别提升约8.9个百分点和7.3个百分点。
-
关键词
知识图谱
实体描述
数据到文本生成
-
Keywords
knowledge graph
entity description
data-to-text generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名自然语言生成综述
被引量:26
- 4
-
-
作者
李雪晴
王石
王朱君
朱俊武
-
机构
扬州大学信息工程学院
中国科学院计算技术研究所
-
出处
《计算机应用》
CSCD
北大核心
2021年第5期1227-1235,共9页
-
基金
国家自然科学基金资助项目(61872313)
国家重点研发计划重点专项(2017YFB1002300,2018YFC1700302)。
-
文摘
自然语言生成(NLG)技术利用人工智能和语言学的方法来自动地生成可理解的自然语言文本。NLG降低了人类和计算机之间沟通的难度,被广泛应用于机器新闻写作、聊天机器人等领域,已经成为人工智能的研究热点之一。首先,列举了当前主流的NLG的方法和模型,并详细对比了这些方法和模型的优缺点;然后,分别针对文本到文本、数据到文本和图像到文本等三种NLG技术,总结并分析了应用领域、存在的问题和当前的研究进展;进而,阐述了上述生成技术的常用评价方法及其适用范围;最后,给出了当前NLG技术的发展趋势和研究难点。
-
关键词
自然语言生成
语言学
自然语言处理
评价方法
文本到文本生成
数据到文本生成
图像到文本生成
-
Keywords
Natural Language Generation(NLG)
linguistics
natural language processing
evaluation method
text-to-text generation
data-to-text generation
image-to-text generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-