-
题名基于主题模型的检索结果聚类应用研究
被引量:14
- 1
-
-
作者
阮光册
夏磊
-
机构
华东师范大学经济与管理学部信息管理系
上海图书馆会展中心
-
出处
《情报杂志》
CSSCI
北大核心
2017年第3期179-184,共6页
-
基金
上海哲学社会科学一般项目"基于主题模型的学科交叉知识发现研究"(编号:2016BTQ002)的研究成果之一
-
文摘
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。
-
关键词
LDA
检索结果聚类
聚类标签
概率分布
语义挖掘
K-MEANS
-
Keywords
LDA retrieval results clustering cluster label probability distribution semantic mining K-means
-
分类号
G353
[文化科学—情报学]
-
-
题名基于词共现关系的检索结果知识关联研究
被引量:24
- 2
-
-
作者
阮光册
夏磊
-
机构
华东师范大学信息管理系
上海图书馆会展中心
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2017年第12期1247-1254,共8页
-
基金
上海哲学社会科学一般项目"基于主题模型的学科交叉知识发现研究"(2016BTQ002)
-
文摘
基于文献关键词的共现分析很难反映文献隐含知识的关联。文本将主题模型、关联规则、共词分析等方法相结合,探讨检索结果的知识关联问题。首先,采用主题模型抽取检索结果文献摘要中的主题,形成主题词集;然后分析主题词集的关联关系,选择高关联的主题词对进行词共现分析;最后挖掘检索结果文献的知识关联。与单纯的关键词进行共词分析相比较,本文的方法能够较好的揭示文献所记录知识之间的关联,有效的实现知识的归纳和总结。
-
关键词
共现分析
知识关联
主题模型
-
Keywords
co-word analysis
knowledge connection
topic model
-
分类号
G353.1
[文化科学—情报学]
-