-
题名基于吸收马尔可夫链的子话题发现方法
被引量:5
- 1
-
-
作者
魏明川
朱俊杰
张瑾
张凯
程学旗
任彦
-
机构
中国科学院计算技术研究所
中国科学院研究生院
国家计算机网络应急技术处理协调中心
-
出处
《中文信息学报》
CSCD
北大核心
2014年第1期41-46,55,共7页
-
基金
国家自然科学基金(60903139)
国家242专项(2011F45
+1 种基金
2011A001
2012G129)
-
文摘
受互联网文本信息话题内容多元性,演化性等特点的影响,传统的话题检测模型对子话题粒度的选取和检测质量很难保证。针对该问题,该文提出一种基于吸收马尔可夫链的子话题划分算法,该算法对基于网页聚类生成的话题关键词进行组合生成子话题,并以吸收马尔可夫链对子话题进行吸收衍化,进行重排序生成结果子话题。实验结果表明,该算法能同时保证生成子话题的重要性和多样性。
-
关键词
子话题划分
话题关键词
吸收马尔可夫链
-
Keywords
subtopic partition
topic keywords
absorbing Markov chain
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于用户影响力的热点话题检测方法研究
被引量:5
- 2
-
-
作者
裘江南
谷文静
翟劼
-
机构
大连理工大学管理与经济学部
-
出处
《情报杂志》
CSSCI
北大核心
2017年第4期156-161,共6页
-
基金
辽宁省社会科学规划基金重点项目"突发事件网络舆情的动态监测与预警策略研究"(编号:L15AGL017)
国家自然科学基金项目"在线知识社区中社会系统与知识系统协同序化机制和规律研究"(编号:71573030)的研究成果之一
-
文摘
[目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直观性较差。针对此问题,提出了基于用户影响力的热点话题检测方法。[方法/过程]首先识别用户特征要素,构建用户影响力模型,计算用户影响力;然后,综合考虑主题词影响力、影响力增长速度和增长斜率,提出基于用户影响力的微博热点话题主题词抽取方法,抽取主题词簇;之后,识别核心主题词并进行热点话题关键词抽取。最后,通过实验验证方法的有效性。[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题;该方法能有效提升实证性热点话题识别效率,减少娱乐性热点话题的识别;通过对不同时间窗口内同一话题的关键词抽取,可以实现对相应话题的热点跟踪。
-
关键词
抽取.最后
通过实验验证方法的有效性.[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题
该方法能有效提升实证性热点话题识别效率
减少娱乐性热点话题的识别
通过对不同时间窗口内同一话题的关键词抽取
可以实现对相应话题的热点跟踪.
-
Keywords
topic mining
user influence
Micro-blog
text mining
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名民族体育研究前沿与热点的文献计量学分析
被引量:7
- 3
-
-
作者
魏巍
刘江山
-
机构
河海大学体育系
江苏科技大学(张家港)
上海体育学院体育教育训练学院
-
出处
《体育文化导刊》
CSSCI
北大核心
2017年第10期51-55,共5页
-
基金
福建省社会科学规划项目(2014C066)
-
文摘
采用词频分析方法对民族体育研究前沿与热点进行文献计量学分析。研究结果显示:我国民族体育研究的发文量整体上呈现逐步增长的趋势;民族体育科研工作者之间缺乏合作与交流,民族体育的研究主要科研机构比较集中,且与该机构所处的地域性有直接的关联;民族体育文化、民族体育产业、传统体育活动等是目前该领域的研究热点;体育史、少数民族体育和群众体育方面是该领域的研究前沿。
-
关键词
和关键词是指文章中代表其内容特征的、最能说明问题的、起关键作用的词语
.本文通过对民族体育高频关键词知识图谱进行可视化分析
研究民族体育的热点问题(见图4).图4显示
每个圆形节点代表一个关键词
节点大小与关键词频次成正比
节点之间连线表
群众体育
体育科研
民族体育研究
文献计量学
-
分类号
G812.47
[文化科学—体育学]
G353.1
[文化科学—情报学]
-