-
题名基于词项语义映射的短文本相似度算法
被引量:11
- 1
-
-
作者
黄贤英
张金鹏
刘英涛
赵明军
-
机构
重庆理工大学计算机科学与工程学院
-
出处
《计算机工程与设计》
北大核心
2015年第6期1514-1518,1534,共6页
-
基金
国家自然科学基金项目(61173184)
重庆市教委科技计划基金项目(KJ100821)
+1 种基金
重庆理工大学研究生创新基金项目(YCX2012317)
重庆市科委自然科学基金项目(csct2012jjA40030)
-
文摘
针对HowNet语义词典对词项收录数量的有限性在一定程度上制约文本相似度运算准确性的问题,提出一种词项语义维度映射的方法。从词项词性的角度出发,按词性对短文本中词项进行切分,按词性特征对短文本之间进行词项归并,构建词性向量,依据词频和HowNet语义词典,词项完成词性向量中权值映射,将短文本之间相似度运算转换为词性向量之间相似度运算。将该算法运用于信箱测试数据集,实验结果表明,该算法提高了文本相似度运算的准确率和相似度平均值。
-
关键词
How
Net语义词典
词性向量
语义维度映射
词项词频
短文本相似度算法
-
Keywords
HowNet semantic library
part of speech vector
semantic space mapping
term frequency
short text similarity al-gorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-