-
题名基于多层次聚类的文本知识挖掘
被引量:6
- 1
-
-
作者
刘昕
席永轲
何杰
钱茛南
顾丽红
-
机构
中国石油大学(华东)计算机与科学技术学院
中电科大数据研究院有限公司
中国电子科技集团公司信息科学研究院提升政府治理能力大数据应用技术国家工程实验室
中国电子科技集团公司信息科学研究院
-
出处
《计算机工程与设计》
北大核心
2021年第1期106-112,共7页
-
基金
中央高校基本科研业务费专项基金项目(19CX05027B、19CX05003A-11)。
-
文摘
为解决在互联网文本信息爆炸性增长的前提下,在大规模文本数据中如何发现隐含的、有价值的潜在知识的问题,提出基于多层次文本聚类的文本知识挖掘方法,针对不同规模的文本数据进行不同粒度的聚类,实现不同层次知识的挖掘。针对最广义层次的文本知识挖掘可实现各主题事务划分,针对子级分类数据的文本知识挖掘可发现下一层次主题分类,针对自定义层次的文本知识挖掘可发现该事件中存在的具体细节。对诉求实际数据的分析结果表明,该方法可在所有诉求数据中挖掘出各种诉求主题,精确挖掘出其中的细节问题,为管理者提供数据和决策支持,提高服务效率。
-
关键词
文本知识
知识挖掘
机器学习
多层次聚类
诉求工单
-
Keywords
textual knowledge
knowledge mining
machine learning
multi-level clustering
appeal data
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-