-
题名基于增量主题模型的微博在线事件分析
被引量:5
- 1
-
-
作者
马慧芳
王博
-
机构
西北师范大学计算机科学与工程学院
解放军南京政治学院上海校区军事信息管理系
-
出处
《计算机工程》
CAS
CSCD
2013年第3期191-196,共6页
-
基金
国家自然科学基金资助项目(61163039)
西北师范大学青年教师科研能力提升计划骨干基金资助项目(NWNU-LKQN-10-1)
-
文摘
为更好地利用微博结构化社会网络方面的信息,提出一种基于增量主题模型的微博在线事件分析算法。通过设计增量过程,保留已有的训练信息,采用自适应非对称学习算法融入新微博内容与用户关系。实验结果表明,该算法可在短暂的时间内建模,并有效提高事件分析的性能。
-
关键词
用户关系
话题检测与追踪
主题模型
自适应
增量概率
增量算法
-
Keywords
user relationship
Topic Detection and Tracking(TDT)
topic model
adaptive
incremental probability
incremental algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合链接文本的增量联合主题模型
- 2
-
-
作者
马慧芳
王博
-
机构
西北师范大学数学与信息科学学院计算机系
解放军南京政治学院上海校区军事信息管理系
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第4期1289-1293,共5页
-
基金
西北师范大学青年教师科研能力提升计划资助项目(NWNU-LKQN-10-1
SKQNGG10018)
-
文摘
在基于链接的概率隐含语义分析的基础上提出一种融合文本链接的增量方法进行主题建模。首先在原有网页集上进行主题建模;然后随着网页的结构和内容动态变化,利用一种合理的更新机制更新模型参数,从而高效快速地处理在线网页流的动态变化。此外,提出一个自适应非对称学习方法融合文本与链接模态的隐含主题。对于每个网页,它在两种模态上的主题分布通过加权进行融合,而权值由该网页的特征词分布的熵值确定。由于融合之后的概率结构合理地关联了链接模态和文本模态的信息,故能得到很好的建模效果。两种类型的数据集上的实验结果显示该算法可以有效地节省时间,并对网页分类有较大性能的提高,此外还提供了由本文模型生成的主题显示结果。
-
关键词
主题模型
增量学习
链接—概率隐含语义分析
自适应非对称学习
自适应增量链接—概率隐含语义分析
-
Keywords
topic models
incremental learning
link-PLSA
adaptive asymmetric learning
adaptive link-IPLSA
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-