基于领域本体的语义文本挖掘研究被引量：16

Research on Semantic Text Mining Based on Domain Ontology

在线阅读下载PDF

导出

摘要为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式。实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性。 In order to improve the depth and accuracy of text mining,a semantic text mining model based on domain ontology is proposed.In this model,semantic role labeling is applied to semantic analysis so that the semantic relations can be extracted accurately.For the defect of traditional knowledge mining algorithms that can not effectively mine semantic meta database,an association patterns mining algorithm based on semantic is designed and used to acquire the deep semantic association patterns from semantic meta database.Experimental results show that the model can mine deep semantic knowledge from text database.The pattern got has great potential applications,and the algorithm designed has strong adaptability and scalability.

作者张玉峰何超

机构地区武汉大学信息资源研究中心

出处《情报学报》 CSSCI 北大核心 2011年第8期832-839,共8页 Journal of the China Society for Scientific and Technical Information

基金教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”（项目编号：08JJD870225）国家自然科学基金项目（项目编号：71073121）

关键词语义文本挖掘领域本体语义模式 semantic text mining domain ontology semantic patterns

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

作者简介作者简介：张玉峰，女，1964年生，武汉大学信息管理学院教授，博士生导师，主要研究方向：计算机信息系统工程、人工智能、知识管理与数据挖掘。何超，男，1985年生，武汉大学信息管理学院博士研究生，研究方向：智能信息系统与数据挖掘。E-mail：heeha0530@163．com。

引文网络
相关文献

参考文献17

1谌志群,张国煊.文本挖掘与中文文本挖掘模型研究[J].情报科学,2007,25(7):1046-1051. 被引量：55
2Song D, Bruza P, Huang Z, et al. Classifying Document Titles Based on Information Inference [ C ]. Procedings of the lgth International Symposium on Methodologies for Intelligent Systems, 2003, Japan. Berlin, Heidelberg: Springer ,2003:297-306.
3Zelikovitz S. Transductive LSI for Short Text Classification Problems [ C ]. Proeeedings of the 17th International FLAIRS Conference, Miami : AAAI Press ,2004.
4Sedding J, Kazakov D. WordNet-based Text Document Clustering [ C ]. Proceedings of the Third Workshop on Robust Methods in Analysis of Natural Language Data ( ROMAND ) , Geneva, 2004 : 104-113.
5Sarnovsky M, Paralic M. Text Mining Workflows Constr- uction with Support of Ontologies [ C ]. Proc. of the 6th International Symposium on Applied Machine Intelligence and Informatics, SAMI' 08, January 21-22,2008, Herlany, Slovakia. Hungary : Budapest Polytechnic, 2008 : 173-177.
6Selvi P, Gopalan N P. Sentence Similarity Computation Based on Wordnet and Corpus Statistics [ C ]. Interna tional Conference on Computational Intelligence and Multimedia Applications, 13-15 Dec. 2007, Sivakasi, Tamil Nadu. Washington, DC: IEEE Computer Society, 2007,1:9-14.
7Shehata S. A WordNet-based Semantic Model for Enh- ancing Text Clustering [ C ]. 2009 IEEE International Conference on Data Mining Workshops,2009:477-482.
8郑旭玲,周昌乐,李堂秋,陈毅东.基于关联规则挖掘的汉语语义搭配规则获取方法[J].厦门大学学报（自然科学版）,2007,46(3):331-336. 被引量：5
9陈骏.基于语义网的文本信息分类技术研究[D].南京:南京理工大学,2007.
10彭涛,曾蒸,代晓红,胡飞.基于语义分层迭代法的网页挖掘技术[J].重庆工商大学学报（自然科学版）,2007,24(5):477-480. 被引量：2

二级参考文献70

1刘云峰 ,齐欢 ,HU Xiang'en ,CAI Zhiqiang ,代建民 .基于潜在语义空间维度特性的多层文档聚类[J].清华大学学报（自然科学版）,2005,45(S1):1783-1786. 被引量：11
2陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008,45(z1):321-325. 被引量：12
3常育红,姜哲,朱小燕.基于标记树表示方法的页面结构分析[J].计算机工程与应用,2004,40(16):129-132. 被引量：24
4李善平,尹奇韡,胡玉杰,郭鸣,付相君.本体论研究综述[J].计算机研究与发展,2004,41(7):1041-1052. 被引量：278
5孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：39
6陈康,武港山.基于Ontology的信息检索技术研究[J].中文信息学报,2005,19(2):51-57. 被引量：29
7卢娇丽,郑家恒.基于粗糙集的文本分类方法研究[J].中文信息学报,2005,19(2):66-70. 被引量：16
8谌志群,张国煊.文本挖掘研究进展[J].模式识别与人工智能,2005,18(1):65-74. 被引量：53
9朱庆生,邹景华.基于本体论的论文检索[J].计算机科学,2005,32(5):172-173. 被引量：20
10袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：23

共引文献100

1沈昕怡,柯艺璐,徐成龙.基于文本挖掘的我国全民健身政策量化评价[J].体育视野,2023(24):6-8.
2肖建国.试论文本挖掘及其应用[J].图书馆学研究,2008(4):22-24. 被引量：10
3化柏林.数据挖掘与知识发现关系探析[J].情报理论与实践,2008,31(4):507-510. 被引量：31
4王道平,刘涛.基于本体的敏捷供应链知识服务检索模型研究[J].情报杂志,2009,28(12):118-121. 被引量：3
5蔡迎春,罗永刚,穆卫国.基于知识提取技术的同步创新知识服务体系[J].情报理论与实践,2010,33(2):93-96. 被引量：4
6张玉峰,胡凤,董坚峰.泛在知识环境中数据挖掘技术进展分析[J].情报学报,2010,29(2):202-207. 被引量：9
7付苓,崔新春,谢娟,连慧平.基于语义信息链的语义检索研究[J].山东图书馆学刊,2010(4):76-79. 被引量：1
8张晓孪,王西锋.概念图知识表示方法及其应用[J].价值工程,2010,29(26):145-146. 被引量：2
9钟晓旭,胡学钢.基于数据挖掘的Web招聘信息相关性分析[J].安徽建筑工业学院学报（自然科学版）,2010,18(4):93-96. 被引量：12
10马中杰,郑诚,苏喻.一种基于知识库的语义检索系统模型[J].微型机与应用,2010,29(20):70-73. 被引量：2

同被引文献208

1唐涛.基于文本挖掘的领域本体学习模型研究[J].图书情报工作,2010,54(S2):348-352. 被引量：3
2吴晓伟 ,徐福缘 ,吴伟昶 .基于神经网络的企业竞争对手分析[J].情报学报,2004,23(4):502-506. 被引量：9
3蔡莉静,陈曹维.河北省社科信息资源现状调查与分析[J].情报资料工作,2005,26(1):72-74. 被引量：5
4唐爱民,真溱,樊静.基于叙词表的领域本体构建研究[J].现代图书情报技术,2005(4):1-5. 被引量：43
5杜小勇,马文峰.学科领域知识本体建设方法研究[J].图书情报工作,2005,49(8):74-78. 被引量：33
6薛为民,陆玉昌.文本挖掘技术研究[J].北京联合大学学报,2005,19(4):59-63. 被引量：63
7吴晓伟,徐福缘,宋文官.基于人际网络节点中心度的竞争对手分析[J].情报学报,2006,25(1):122-128. 被引量：51
8冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006,32(2):88-92. 被引量：579
9马文峰,杜小勇.领域本体进化研究[J].图书情报工作,2006,50(6):71-75. 被引量：23
10马金娜,田大钢.基于SVM的中文文本自动分类研究[J].计算机与现代化,2006(8):5-8. 被引量：8

引证文献16

1涂军,曹鹏.数字图书馆中基于本体的语义检索模型研究[J].情报杂志,2012,31(7):191-194. 被引量：8
2明均仁.融合语义关联挖掘的文本情感分析算法研究[J].图书情报工作,2012,56(15):99-103. 被引量：6
3张玉峰,何超,王志芳,周磊.融合语义聚类的企业竞争力影响因素分析研究[J].现代图书情报技术,2012(9):49-55. 被引量：3
4黎九平.基于SOM文本聚类的领域本体学习研究[J].情报探索,2012(11):89-92. 被引量：1
5明均仁.基于本体图的文本聚类模型研究[J].情报科学,2013,31(2):29-33. 被引量：6
6唐晓波,郭萍.基于语义文本挖掘的企业竞争对手分析模型研究[J].情报学报,2013,32(1):28-36. 被引量：4
7尹裴,王洪伟,郭恺强.中文产品评论的“特征观点对”识别:基于领域本体的建模方法[J].系统工程,2013,31(1):68-77. 被引量：16
8何超,张玉峰.融合语义关联的企业竞争力影响因素分析研究[J].情报资料工作,2013,34(4):62-66.
9李爱明.数字图书馆中基于语义关联挖掘的跨媒体检索研究:模型设计与实验分析[J].情报科学,2014,32(1):85-88. 被引量：13
10苏小英,胡彦鹏,杨竣辉,李明.一种新的用于文本分类的概率分类器设计[J].计算机技术与发展,2014,24(3):46-48. 被引量：1

二级引证文献103

1赵翠翠,尹春华.K-means和SOM在商品评论中的情感词聚类对比[J].北京信息科技大学学报（自然科学版）,2020,35(1):23-26. 被引量：6
2尚伟.基于认知心理视角的古文字信息处理研究[J].情报科学,2013,31(7):135-139. 被引量：2
3何超,张玉峰.融合语义关联的企业竞争力影响因素分析研究[J].情报资料工作,2013,34(4):62-66.
4张玉峰,何超.馆藏资源聚合结果的层次可视化方法研究[J].情报理论与实践,2013,36(8):41-44. 被引量：10
5杨现民,余胜泉.学习资源语义特征自动提取研究[J].中国电化教育,2013(11):74-80. 被引量：9
6顾伟,傅德胜,蔡玮.基于语义Web挖掘的宽范围扫描环境弱信号识别[J].科学技术与工程,2013,21(29):8791-8797. 被引量：1
7王益明,黄容,许春雯.2012年我国情报学研究进展[J].山东图书馆学刊,2013(5):18-22. 被引量：5
8张瑞,水静.基于移动设备的数字图书馆检索新技术研究[J].现代情报,2013,33(11):49-51. 被引量：2
9洪韵佳,许鑫.基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):19-26. 被引量：9
10张薷,王凤暄.图书情报学领域的情感问题研究综述[J].图书情报工作,2014,58(9):114-120. 被引量：2

1王静.面向语义文本的WEB数据挖掘研究[J].硅谷,2009,2(14).
2李旭,董争鸣,吴洪森.面向隐含语义文本的WEB数据挖掘研究[J].中国人民公安大学学报（自然科学版）,2010,16(1):58-61.
3杜坤,刘怀亮,王帮金.基于语义相关度的中文文本聚类方法研究[J].情报理论与实践,2016,39(2):129-133. 被引量：9
4秦永俊.有色金属交易信息特定属性挖掘算法研究[J].世界有色金属,2016,41(3):112-113.
5罗小玲,薛河儒.基于模糊关联优化的中文语义深度挖掘仿真[J].计算机仿真,2016,33(1):362-364. 被引量：5
6王哲.特征空间互信息区域划分语义离散度增强算法[J].计算机仿真,2015,32(5):266-269. 被引量：2
7林伟,孟凡荣,王志晓.基于概念特征的语义文本分类[J].计算机工程与应用,2011,47(28):139-142. 被引量：4
8沈佳杰,江红,王肃.基于关键词的云计算语义文本自适应分类[J].计算机工程,2014,40(7):247-253.
9侯泽民,巨筱.一种改进的基于潜在语义索引的文本聚类算法[J].计算机与现代化,2014(7):24-27. 被引量：3
10杨欢.文本情感分类预处理研究[J].电子技术与软件工程,2016(10):187-187. 被引量：1

情报学报

2011年第8期

浏览历史

内容加载中请稍等...

基于领域本体的语义文本挖掘研究被引量：16

参考文献17

二级参考文献70

共引文献100

同被引文献208

引证文献16

二级引证文献103

相关作者

相关机构

相关主题

浏览历史

基于领域本体的语义文本挖掘研究 被引量：16

参考文献17

二级参考文献70

共引文献100

同被引文献208

引证文献16

二级引证文献103

相关作者

相关机构

相关主题

浏览历史

基于领域本体的语义文本挖掘研究被引量：16