期刊文献+

基于数据挖掘的微博突发事件检测的算法研究 被引量:1

Microblog Emergency Detection Algorithm Based on Data Mining
在线阅读 下载PDF
导出
摘要 如何高效地从海量数据中检测微博突发事件,成为近年来国内外学者的研究热点。分析突发事件的特征,采用词频增量、基于命名实体和微博传播特性的TF-PDF公式提取突发特征;引入项间关联规则,利用突发词的项间距离结合改进的Single-pass聚类算法生成突发簇集,识别出突发事件。通过新浪微博真实数据集的实验表明,该方法从海量微博中有效检测出微博突发事件。 How to efficiently detect data from the mass microblog emergencies in recent years become a hot research scholars at home and abroad.Analyses the emergency feature, uses word frequency increment, feature-based named entity extraction burst and microblog propagation characteristics of TF-PDF equation; the introduction of inter-item association rules between items, uses the word burst from the combination of an improved Single-pass clustering algorithm to generate a burst clusters, identified emergencies. Experiment by Sina microblog real data sets show that the method from the mass microblog can effectively detect emergencies.
作者 杨子 栾翠菊
出处 《现代计算机(中旬刊)》 2016年第6期28-32,共5页 Modern Computer
关键词 事件检测 特征 突发事件 聚类 Event Detection Feature Emergencies Clustering
作者简介 杨子(1993-),女,江苏徐州人,硕士研究生,研究方向为数据挖掘 栾翠菊(1974-),女,吉林梅河口人,博士,副教授,研究方向为智能决策、数据挖掘等
  • 相关文献

参考文献11

二级参考文献119

  • 1于满泉,骆卫华,许洪波,白硕.话题识别与跟踪中的层次化话题识别技术研究[J].计算机研究与发展,2006,43(3):489-495. 被引量:49
  • 2俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量:163
  • 3魏晓俊.基于科技文献中词语的科技发展监测方法研究[J].情报杂志,2007,26(3):34-36. 被引量:47
  • 4徐永东,徐志明,王晓龙,刘远超.中文文本时间信息获取及语义计算[J].哈尔滨工业大学学报,2007,39(3):438-442. 被引量:10
  • 5黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量:251
  • 6CROFT B, METZLER D, STROHMAN T. Search engines: information retrieval in practice [M]. Reading, MA, USA: Addison-Wesley Publishing Company, 2009: 552.
  • 7LI Hong, WEI Jinfeng. Netnews bursty hot topic detection based on bursty features [C] // Proceedings of International Conference on E-Business and E-Government. Washington DC, USA: IEEE, 2010:1437- 1440.
  • 8HOLZ F, TERESNIAK S. Towards automatic detection and tracking of topic change[M] // GELBUKH A. Computational Linguistics and Intelligent Text Processing. Berlin, Germany: Springer-Verlag, 2010: 327-339.
  • 9JING Qiu, LIAO Lejian, DONG Xiujie. Topic detection and tracking for Chinese news web pages [C]// Proceedings of Seventh International Conference on Advanced Language Processing and Web Information Technology. Washington DC, USA: IEEE Computer Society, 2008: 114-120.
  • 10ALLAN J, PAPKA R, LAVRENKO V. On-line new event detection and tracking [C]//Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA: ACM, 1998: 37-45.

共引文献122

同被引文献12

引证文献1

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部