-
题名基于自学习近邻图策略的短文本匹配方法
被引量:5
- 1
-
-
作者
付聪
李六武
杨振国
刘文印
-
机构
广东工业大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第6期1697-1701,共5页
-
基金
国家自然科学基金资助项目(61703109,91748107)
中国博士后科学基金资助项目(2018M643024)
广东省引进创新科研团队计划资助项目(2014ZT05G157)。
-
文摘
针对自然语言处理中的文本匹配问题,提出一种基于自学习文本近邻图框架的深度学习模型,以处理短文本匹配问题。文本近邻图可使用词嵌入将文本转换为向量形式,再通过构建文本相似度关系矩阵获得,可表达文本样本的近邻关系。现有方法通常构造静态的近邻图,这些方法一方面依赖先验知识,另一方面难以获得句子对的最优表示。因此,提出了利用孪生卷积神经网络学习更优的动态更新的近邻图。该模型在Quora数据集上的准确率和F1值分别是84. 15%和79. 88%,在MSRP数据集上的准确率和F1值分别是74. 55%和81. 63%。实验表明,提出模型能有效地提高文本识别和匹配的准确率。
-
关键词
文本匹配
自学习近邻图
词嵌入
孪生卷积神经网络
-
Keywords
text matching
self-adaptive affinity graph learning
word embedding
Siamese CNN
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-