-
题名基于PLSI的标签聚类研究
被引量:4
- 1
-
-
作者
吴志媛
钱雪忠
-
机构
江南大学物联网工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第5期1316-1319,共4页
-
基金
国家自然科学基金资助项目(61103129)
江苏省科技支撑计划资助项目(BE2009009)
-
文摘
针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜在语义下的条件概率,生成概率向量;在此基础上,提出凝聚式层次k中心点(hierarchical agglomerative K-mediods,HAK-mediods)聚类算法对概率向量进行聚类,并进行了相关对比实验。实验结果表明,HAK-mediods算法的聚类效果要好于传统的聚类算法,从而验证了该算法的可行性和有效性。
-
关键词
大众分类
概率潜在语义索引
语义标签
回火期望最大化算法
凝聚式层次k中心点聚类
-
Keywords
Folksonomy
PLSI
semantic tags
TEM algorithm
HAK-mediods clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-