-
题名基于门控化上下文感知网络的词语释义生成方法
被引量:2
- 1
-
-
作者
张海同
孔存良
杨麟儿
何姗
杜永萍
杨尔弘
-
机构
北京工业大学信息学部
北京语言大学国家语言资源监测与研究平面媒体中心
北京语言大学语言资源高精尖创新中心
北京语言大学信息科学学院
云南师范大学华文学院国际汉语教育学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第7期105-112,共8页
-
基金
语言资源高精尖创新中心项目(TYZ19005)
国家重点研发计划项目(2018YFC1900804)
国家语委信息化项目(ZOI135-105,YB135-89)
-
文摘
传统的词典编纂工作主要采用人工编纂的方式,效率较低且耗费大量的资源。为减少人工编纂的时间和经济成本,该文提出一种基于门控化上下文感知网络的词语释义生成方法,利用门控循环神经网络(GRU)对词语释义生成过程进行建模,自动为目标词生成词语释义。该模型基于编码器—解码器架构。编码器首先利用双向GRU对目标词的上下文进行编码,并采用不同的匹配策略进行目标词与上下文的交互,结合注意力机制分别从粗粒度和细粒度两个层次将上下文信息融合到目标词的向量表示中,最终获得目标词在特定语境中的编码向量。解码器则同时基于目标词的语境与语义信息为目标词生成上下文相关的词语释义。此外,通过向模型提供目标词字符级特征信息,进一步提高了生成释义的质量。在英文牛津词典数据集上进行的实验表明,该文提出的方法能够生成易于阅读和理解的词语释义,在释义建模的困惑度和生成释义的BLEU值上分别超出此前模型4.45和2.19,性能有显著提升。
-
关键词
释义生成
GRU
编码器—解码器
注意力机制
-
Keywords
definition generation
GRU
encoder-decoder
attention mechnism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-