摘要
在分析当前微博突发话题检测模型存在的问题的基础上,提出了基于信息密度的新型检测模型MBID。该模型通过动态滑动窗口采集微博信息流,以话题树进行信息归纳,并最终通过窗口和话题树的信息密度变化进行监测,发现突发话题,并从主题树中抽取描述词。仿真实验表明,MBID模型较之其他两种模型,具有较高的检测精度、全面性和较高的处理效能。
Based on the analysis of the existing problems of the present microblog bursty topic detection model, this paper puts forward a novel detection model based on information density. The MBID model uses dynamic sliding windows to get microblog infor- mation flows and summarizes information through topic trees. Finally, the paper detects and discovers topic through the information density of windows and topic trees, and extracts the description words from topic trees as well. The simulation results show that MBID has better detection accuracy, coverage and processing performance than the other two traditional models.
出处
《情报理论与实践》
CSSCI
北大核心
2016年第3期125-129,共5页
Information Studies:Theory & Application
基金
国家社会科学基金青年项目"群体性事件管理推演与应对措施验证研究"的成果
项目编号:14CGL050
关键词
突发话题
微博
信息密度
检测
bursty topic
mico-blog
information density
detection
作者简介
王征,男,1979年生,博士,副教授。研究方向:图书馆信息化等。
王林森,男,1978年生,博士生。研究方向:信息管理等。
赵磊,男,1979年生,博士,助理研究员。研究方向:群体管理。