-
题名丰富特征提取的句子语义等价识别研究
- 1
-
-
作者
刘高军
寇婕
段建勇
霍卫涛
王昊
-
机构
北方工业大学信息学院
北方工业大学CNONIX国家标准应用与推广实验室
新东方教育科技集团ai研究院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第10期2017-2022,共6页
-
基金
国家自然科学基金项目(61972003,61672040)资助。
-
文摘
句子语义等价识别任务(SSEI)在问答任务中扮演着至关重要的角色.目前,基于中文的语义等价任务在没有给定场景的前提下直接判断两个问句的语义,仍存在相同的意思也会被错误理解的问题.因此,本文提出了一种丰富特征信息提取的RFEM (richer feature extraction model)模型.首先,在编码层中,使用CNN和LSTM分别提取局部特征、存储历史信息特征,融合后的编码信息经过对齐层中的变体多头注意力机制,更大化地保留了原始信息的完整性;其次,在对齐层中,对融入了残差特征的编码进行优化,避免网络加深引起的梯度消失问题,改进后的模型对于特征提取具备更好的效果.该实验结果在公开中文数据集BQ上达到了82.71%,比目前最好的结果高0.86%,在通过置信区间计算清洗后的BQ数据集上达到了93.2%,比基线结果高5.1%.
-
关键词
句子语义等价识别
特征提取
句子匹配
变体多头注意力机制
-
Keywords
sentence semantic equivalence identification
feature extraction
sentence matching
variant multi-head attention
-
分类号
TP389
[自动化与计算机技术—计算机系统结构]
-