-
题名基于话题标签的微博主题挖掘
被引量:10
- 1
-
-
作者
李敬
印鉴
刘少鹏
潘雅丽
-
机构
中山大学信息科学与技术学院计算机科学系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第4期30-35,共6页
-
基金
国家自然科学基金资助项目(61033010
61272065)
+3 种基金
广东省自然科学基金资助项目(S2011020001182
S2012010009311)
广东省科技计划基金资助项目(2011B040200007
2012A010701013)
-
文摘
随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使用Gibbs抽样法对模型进行推导,获取微博主题结构。在Twitter数据集上的实验结果表明,与ATM模型和基于潜在狄利克雷分布的微博生成模型相比,HC-ATM模型的主题困惑度更小、差异度更大,并且能有效挖掘出不同微博类型的主题分布。
-
关键词
主题挖掘
微博
社交网络
话题标签主题模型
作者主题模型
-
Keywords
topic mining
microblog
social network
hashtag topic model
Author Topic Model(ATM)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于话题标签的微博舆情热点挖掘系统设计
被引量:1
- 2
-
-
作者
尚晓燕
-
机构
河海大学
-
出处
《现代电子技术》
2023年第2期70-74,共5页
-
文摘
为在微博舆情信息高速转发时段内实现对热点数据的精准挖掘,文中设计一种基于话题标签的微博舆情热点挖掘系统。首先确定框架体系连接形式,并根据热点信息定义结果建立话题标签模型。以此为基础,对热点信息散列表进行排重处理,完成对微博舆情热点数据的处理。最后,联合采集到的目标信息样本对论坛结构进行分割处理,完成挖掘系统设计。实验结果表明,在话题标签模型作用下,系统主机对于热点数据的挖掘准确率较高,可以在微博舆情信息高速转发时段内实现对热点数据的精准挖掘,满足实际应用需求;与基于机器阅读理解的挖掘系统、基于跨语言神经主题模型的挖掘系统相比,这种新型挖掘系统能够在微博舆情信息高速转发时段内,对热点数据进行精准挖掘,与设计初衷相符合。
-
关键词
话题标签模型
微博舆情
高速转发
热点挖掘
目标信息
论坛结构
散列表
排重标准
-
Keywords
topic tag model
microblog public opinion
high-speed forwarding
hot spot mining
target information
forum structure
hash table
weight removal standard
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP393
[自动化与计算机技术—计算机应用技术]
-