-
题名基于LDA主题模型的标签传递算法
被引量:5
- 1
-
-
作者
刘培奇
孙捷焓
-
机构
西安建筑科技大学信息与控制工程学院
-
出处
《计算机应用》
CSCD
北大核心
2012年第2期403-406,410,共5页
-
文摘
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。
-
关键词
LDA主题模型
标签传递算法
半监督学习
数据降维
流行假设
-
Keywords
Latent Diriehlet Allocation (LDA) model
Label Propagation (LP) algorithm
semi-supervised learning
dimensional reduction
manifold assumption
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题和链接分析的微博社区发现算法
被引量:28
- 2
-
-
作者
闫光辉
舒昕
马志程
李祥
-
机构
兰州交通大学电子与信息工程学院
甘肃电力信息通信中心
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第7期1953-1957,共5页
-
基金
国家自然科学基金资助项目(61163010)
甘肃省陇原青年创新人才扶持计划资助项目(252003)
+1 种基金
兰州市科技计划资助项目(2008-1-28)
甘肃省电力信息通信中心项目(KJ[2012]80号)
-
文摘
针对传统社区发现方法大多基于链接或主题关系,且没有考虑获取微博用户社会信息时的限制,无法有效识别微博中多个社区的问题,提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及博文主题特性,定义了链接相关度和主题相关度公式;然后推出用户总相关度公式,以此来计算节点间的传递概率,用改进后的标签传递算法对用户分类;最终划分出兴趣相似且社会联系紧密的用户群。真实数据集上的仿真实验验证了该方法的合理性和有效性。
-
关键词
微博
社区发现
潜层Dirichlet分配
主题模型
链接分析
标签传递算法
-
Keywords
microblog
community discovery
LDA(latent Dirichlet allocalion)
topic model
link analysis
label propagation algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-