摘要
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式。实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性。
In order to improve the depth and accuracy of text mining,a semantic text mining model based on domain ontology is proposed.In this model,semantic role labeling is applied to semantic analysis so that the semantic relations can be extracted accurately.For the defect of traditional knowledge mining algorithms that can not effectively mine semantic meta database,an association patterns mining algorithm based on semantic is designed and used to acquire the deep semantic association patterns from semantic meta database.Experimental results show that the model can mine deep semantic knowledge from text database.The pattern got has great potential applications,and the algorithm designed has strong adaptability and scalability.
出处
《情报学报》
CSSCI
北大核心
2011年第8期832-839,共8页
Journal of the China Society for Scientific and Technical Information
基金
教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)
国家自然科学基金项目(项目编号:71073121)
关键词
语义文本挖掘
领域本体
语义模式
semantic text mining
domain ontology
semantic patterns
作者简介
作者简介:张玉峰,女,1964年生,武汉大学信息管理学院教授,博士生导师,主要研究方向:计算机信息系统工程、人工智能、知识管理与数据挖掘。
何超,男,1985年生,武汉大学信息管理学院博士研究生,研究方向:智能信息系统与数据挖掘。E-mail:heeha0530@163.com。