-
题名融合多粒度信息与外部知识的短文本匹配模型
被引量:4
- 1
-
-
作者
梁登玉
刘大明
-
机构
上海电力大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第8期129-135,143,共8页
-
基金
甘肃省自然科学基金(SKLLDJ032016021)。
-
文摘
中文短文本通常使用单词序列而非字符序列进行语义匹配,以获得更好的语义匹配性能。然而,中文分词可能是错误或模糊的,容易引入噪声或者错误传播,从而损害模型的匹配性能。此外,多数中文词汇具有一词多义的特点,短文本由于缺少上下文环境,相比一词多义的长文本更难理解,这对于模型正确捕获语义信息是一个更大的挑战。提出一种短文本匹配模型,使用词格长短期记忆网络(Lattice LSTM)融合字符和字符序列的多粒度信息。引入外部知识HowNet解决多义词的问题,使用软注意力机制获取2个句子间的交互信息,并利用均值池化和最大池化算法进一步提取句子的特征信息,获取句子级语义编码表示。在数据集LCQMC和BQ上的实验结果表明,与ESIM、BIMPM和Lattice-CNN模型相比,该模型能有效提升中文短文本语义匹配的准确率。
-
关键词
短文本语义匹配
词格长短期记忆网络
多粒度信息
外部知识
软注意力机制
-
Keywords
short text semantic matching
Lattice Long Short Term Memory(Lattice LSTM)
multi-granularity information
external knowledge
soft-attention mechanism
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-