-
题名基于动态注意力和多角度匹配的答案选择模型
被引量:3
- 1
-
-
作者
李志超
吐尔地•托合提
艾斯卡尔•艾木都拉
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第11期3156-3163,共8页
-
基金
新疆维吾尔自治区自然科学基金资助项目(2021D01C076)。
-
文摘
针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了基于动态注意力和多角度匹配(DAMPM)的答案选择模型。首先,调用预训练语言模型的嵌入(ELMo)获得包含简单语义信息的词向量;接着,在注意力层采用过滤机制有效地去除句子中的噪声,从而更好地得到问句和答案句的句子表征;其次,在匹配层同时引入多种匹配策略来完成句子向量之间的信息交互;然后,利用双向长短期记忆(BiLSTM)网络对匹配层输出的句子向量进行拼接;最后,通过分类器来计算拼接向量的相似度大小,从而得到问句和答案句之间的语义关联。在文本检索会议问答(TRECQA)数据集上的实验结果表明,与基于比较聚合框架的基线模型中的动态滑动注意力网络(DCAN)方法相比,DAMPM在平均准确率均值(MAP)和平均倒数排名(MRR)两个性能指标上均提高了1.6个百分点。在维基百科问答(WikiQA)数据集上的实验结果表明,DAMPM相较DCAN在两个性能指标上分别提高了0.7个百分点和0.8个百分点。所提DAMPM相较于基线模型中的方法整体上有更好的性能表现。
-
关键词
神经网络
答案选择
动态注意力机制
多角度匹配
预训练语言模型
-
Keywords
neural network
answer selection
dynamic attention mechanism
multi-perspective matching
pre-trained language model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-