-
题名基于LDA模型的主题演化分析:以情报学文献为例
被引量:27
- 1
-
-
作者
朱茂然
王奕磊
高松
王洪伟
张晓鹏
-
机构
同济大学经济与管理学院
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2018年第7期1047-1053,共7页
-
基金
国家自然科学基金资助项目(71371144
71771177
71701085)
-
文摘
为了掌握科研动态和追踪研究热点,需要挖掘文献中的主题及其变化规律,因此,提出了一种基于隐性狄利克雷分布(latent Dirichlet allocation,LDA)的主题演化分析模型.首先,在整个文本集合上使用LDA模型识别主题及其关键词,并计算每个时间窗口中文档-主题概率分布;然后,对各个时间窗口下的文本集合分别使用LDA模型计算出主题-词汇概率分布,并计算不同时间窗口下不同主题的相似度,从而得出主题强度的演化趋势;最后,通过相似主题下的词汇的概率分布得到主题内容的变化.可观察到中文情报学领域,"语义分析"等主题的关注度具有持续上升的趋势.
-
关键词
主题演化
主题强度
主题内容
隐性狄利克雷分布
-
Keywords
evolution of topic
topic intensity
topic content
latent Dirichlet allocation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-