-
题名基于混合策略的中文短文本相似度计算
被引量:8
- 1
-
-
作者
宋冬云
郑瑾
张祖平
-
机构
中南大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第12期116-120,205,共6页
-
基金
国家自然科学基金(No.61379109)
-
文摘
为提高中文短文本相似度计算的准确率,提出一种新的基于混合策略的中文短文本相似度计算方法。首先,根据词语的语义距离,利用层次聚类,构建短文本聚类二叉树,改进传统的向量空间模型(VSM),计算关键词加权的文本相似度。然后,通过提取句子的主干成分对传统的基于语法语义模型的方法进行改进,得到文本主干的语义相似度;最后,对两种相似度进行加权,计算最终的文本相似度。实验结果表明,提出的方法在短文本相似度计算方面准确性更高,更加适合人们的主观判断。
-
关键词
短文本相似度
关键词权重
层次聚类
二叉树
主干成分
-
Keywords
short text similarity
keyword weight
hierarchical clustering
binary tree
main components
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名当前我国无偿献血新特点
- 2
-
-
作者
杨青成
宋冬云
-
机构
湖北襄樊市中心血站
-
出处
《中国卫生事业管理》
2002年第7期420-420,共1页
-
-
关键词
献全血
献成分血
计划献血
自愿献血
城市居民
农村居民
-
分类号
D922.16
[政治法律—宪法学与行政法学]
-