-
题名基于双编码器的短文本自动摘要方法
被引量:4
- 1
-
-
作者
丁建立
李洋
王家亮
-
机构
中国民航大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2019年第12期3476-3481,共6页
-
基金
民航局科技重大专项基金资助项目(MHRD20150107,MHRD20160109)
中央高校基本科研业务费专项资金资助项目(3122018C025)
中国民航大学科研启动基金资助项目(2014QD13X)~~
-
文摘
针对当前生成式文本摘要方法存在的语义信息利用不充分、摘要精度不够等问题,提出一种基于双编码器的文本摘要方法。首先,通过双编码器为序列映射(Seq2Seq)架构提供更丰富的语义信息,并对融入双通道语义的注意力机制和伴随经验分布的解码器进行了优化研究;然后,在词嵌入生成技术中融合位置嵌入和词嵌入,并新增词频-逆文档频率(TF-IDF)、词性(POS)、关键性得分(Soc),优化词嵌入维度。所提方法对传统序列映射Seq2Seq和词特征表示进行优化,在增强模型对语义的理解的同时,提高了摘要的质量。实验结果表明,该方法在Rouge评价体系中的表现相比传统伴随自注意力机制的递归神经网络方法(RNN+atten)和多层双向伴随自注意力机制的递归神经网络方法(Bi-MulRNN+atten)提高10~13个百分点,其文本摘要语义理解更加准确、生成效果更好,拥有更好的应用前景。
-
关键词
生成式文本摘要
序列映射(Seq2Seq)
双编码器
经验分布
词特征表示
-
Keywords
generated text summarization
Sequence to Sequence(Seq2Seq)
double encoder
empirical distribution
word feature representation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-