- 
                题名面向微博热点话题发现的改进BBTM模型研究
                    被引量:4
            
- 1
- 
                
            
- 
                
                            作者
                                黄畅
                                郭文忠
                                郭昆
                
            
- 
                    机构
                    
                            福州大学数学与计算机科学学院
                            福州大学网络计算与智能信息处理重点实验室
                            福州大学空间数据挖掘与信息共享教育部重点实验室
                    
                
- 
                出处
                
                
                    《计算机科学与探索》
                    
                            CSCD
                            北大核心
                    
                2019年第7期1102-1113,共12页
            
- 
                        基金
                        
                                    国家自然科学基金Nos.61300104,61300103,61672158
                                    福建省高校杰出青年科学基金No.JA12016
                                +4 种基金
                                    福建省高等学校新世纪优秀人才支持计划No.JA13021
                                    福建省杰出青年科学基金Nos.2014J06017,2015J06014
                                    福建省科技创新平台计划项目Nos.2009J1007,2014H2005
                                    福建省自然科学基金Nos.2013J01230,2014J01232
                                福建省高校产学合作项目Nos.2014H6014,2017H6008~~
                        
                    
- 
                    文摘
                        针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM)。首先,利用词的突发概率进行特征选择,过滤非突发词。其次,结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBTM的先验概率。最后,利用基于密度的方法自适应选择BBTM的最优话题数目,确定最优BBTM,实现热点话题发现。在真实微博数据集上的实验表明,H-HBTM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型,并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法。
                        
                    
            
- 
                    关键词
                    
                            热点话题发现
                            微博
                            突发词对主题模型(bbtm)
                            主题模型
                    
                
- 
                    Keywords
                    
                            hot topic detection
                            microblog
                            bursty biterm topic model (bbtm)
                            topic model
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391
[自动化与计算机技术—计算机应用技术]                                
                            
                    
                
-