-
题名一种融合标签语义的微博热点话题挖掘方法
被引量:3
- 1
-
-
作者
周福星
陈秀真
马进
李生红
-
机构
上海交通大学网络空间安全学院
上海市信息安全综合管理技术研究重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第10期283-287,共5页
-
基金
国家自然科学基金(61562004,61431008)
国家重点研发计划“网络空间安全”(2016YFB0801003)
-
文摘
由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。
-
关键词
微博文本
隐狄利克雷分布模型
标签语义
公共块
K-MEANS聚类
-
Keywords
microblog text
Latent Dirichlet Allocation(LDA)model
tag semantics
common block
K-means clustering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于药物疗效日志的临床路径挖掘方法
被引量:2
- 2
-
-
作者
李睿易
鲁法明
包云霞
曾庆田
朱冠烨
-
机构
山东科技大学计算机科学与工程学院
中国科学院计算技术研究所
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2019年第4期1017-1025,共9页
-
基金
国家自然科学基金资助项目(61602279
61472229)
+3 种基金
山东省科技发展计划资助项目(2016ZDJS02A11)
国家海洋局海洋遥测工程技术研究中心开放基金资助项目(2018002)
山东省博士后创新专项资金资助项目(201603056)
山东科技大学领军人才与优秀科研团队计划资助项目(2015TDJH102)~~
-
文摘
标准临床路径对于规范治疗流程、提高治疗效果具有重要作用,但当前的临床路径是面向同一病种的所有患者制定的,无法体现患者或者医疗部门的个性化信息。为了实现符合患者和医疗部门特点的个性化临床路径,从医疗信息化系统中记录的患者处方数据出发,进行药物治疗临床路径的挖掘。首先由处方数据结合DrugBank数据库生成患者的每日用药疗效文档;然后使用词对隐狄利克雷分布模型对这些药物疗效文档进行主题聚类,得到患者每日所用药物对应的疗效主题;最后以各个患者的药物疗效主题序列为输入,训练概率后缀树模型作为药物治疗的临床路径模型,该模型既可以辅助专家进行个性化临床路径的制定,也可以用于患者后续服用药物的推荐。以MIMIC-Ⅲ数据库中肺炎患者的处方数据为实例,对所提方法的可行性和有效性进行了验证。
-
关键词
过程挖掘
词对隐狄利克雷分布模型
概率后缀树
临床路径
-
Keywords
process mining
token-bigram latent Dirichlet allocation model
probabilistic suffix tree
clinical path
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-