期刊文献+

基于领域本体的语义文本挖掘研究 被引量:16

Research on Semantic Text Mining Based on Domain Ontology
在线阅读 下载PDF
导出
摘要 为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式。实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性。 In order to improve the depth and accuracy of text mining,a semantic text mining model based on domain ontology is proposed.In this model,semantic role labeling is applied to semantic analysis so that the semantic relations can be extracted accurately.For the defect of traditional knowledge mining algorithms that can not effectively mine semantic meta database,an association patterns mining algorithm based on semantic is designed and used to acquire the deep semantic association patterns from semantic meta database.Experimental results show that the model can mine deep semantic knowledge from text database.The pattern got has great potential applications,and the algorithm designed has strong adaptability and scalability.
作者 张玉峰 何超
出处 《情报学报》 CSSCI 北大核心 2011年第8期832-839,共8页 Journal of the China Society for Scientific and Technical Information
基金 教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225) 国家自然科学基金项目(项目编号:71073121)
关键词 语义文本挖掘 领域本体 语义模式 semantic text mining domain ontology semantic patterns
作者简介 作者简介:张玉峰,女,1964年生,武汉大学信息管理学院教授,博士生导师,主要研究方向:计算机信息系统工程、人工智能、知识管理与数据挖掘。 何超,男,1985年生,武汉大学信息管理学院博士研究生,研究方向:智能信息系统与数据挖掘。E-mail:heeha0530@163.com。
  • 相关文献

参考文献17

  • 1谌志群,张国煊.文本挖掘与中文文本挖掘模型研究[J].情报科学,2007,25(7):1046-1051. 被引量:55
  • 2Song D, Bruza P, Huang Z, et al. Classifying Document Titles Based on Information Inference [ C ]. Procedings of the lgth International Symposium on Methodologies for Intelligent Systems, 2003, Japan. Berlin, Heidelberg: Springer ,2003:297-306.
  • 3Zelikovitz S. Transductive LSI for Short Text Classification Problems [ C ]. Proeeedings of the 17th International FLAIRS Conference, Miami : AAAI Press ,2004.
  • 4Sedding J, Kazakov D. WordNet-based Text Document Clustering [ C ]. Proceedings of the Third Workshop on Robust Methods in Analysis of Natural Language Data ( ROMAND ) , Geneva, 2004 : 104-113.
  • 5Sarnovsky M, Paralic M. Text Mining Workflows Constr- uction with Support of Ontologies [ C ]. Proc. of the 6th International Symposium on Applied Machine Intelligence and Informatics, SAMI' 08, January 21-22,2008, Herlany, Slovakia. Hungary : Budapest Polytechnic, 2008 : 173-177.
  • 6Selvi P, Gopalan N P. Sentence Similarity Computation Based on Wordnet and Corpus Statistics [ C ]. Interna tional Conference on Computational Intelligence and Multimedia Applications, 13-15 Dec. 2007, Sivakasi, Tamil Nadu. Washington, DC: IEEE Computer Society, 2007,1:9-14.
  • 7Shehata S. A WordNet-based Semantic Model for Enh- ancing Text Clustering [ C ]. 2009 IEEE International Conference on Data Mining Workshops,2009:477-482.
  • 8郑旭玲,周昌乐,李堂秋,陈毅东.基于关联规则挖掘的汉语语义搭配规则获取方法[J].厦门大学学报(自然科学版),2007,46(3):331-336. 被引量:5
  • 9陈骏.基于语义网的文本信息分类技术研究[D].南京:南京理工大学,2007.
  • 10彭涛,曾蒸,代晓红,胡飞.基于语义分层迭代法的网页挖掘技术[J].重庆工商大学学报(自然科学版),2007,24(5):477-480. 被引量:2

二级参考文献70

共引文献100

同被引文献208

引证文献16

二级引证文献103

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部