摘要
指出作为处理海量数据的有效工具,文本挖掘技术近年来在人文社科领域得到广泛重视。概述文本挖掘的相关技术和研究现状,介绍信息抽取、文本分类、文本聚类、关联规则与模式发现等常用的文本挖掘方法在人文社科研究中的具体应用,以拓展文本挖掘的应用领域,并为人文社科研究的方法创新提供新的思路。
As an effective method to handle data deluge, text mining has earned widespread respect in humanities and social science in recent years. This paper firstly summarizes the relevant techniques of text mining and current situation of study, then introduces spe- cific applications of frequently - used text mining techniques like information extraction, text classification, text clustering, association rules and pattern discovery in the domain of humanities and social science, so as to expand the domain of text mining application as well as providing new ideas for humanities and social science research.
出处
《图书情报工作》
CSSCI
北大核心
2012年第8期10-17,共8页
Library and Information Service
基金
2010年度国家社会科学基金重点项目"我国图书馆核心价值体系构建研究"(项目编号:10ATQ002)研究成果之一
关键词
文本挖掘
人文社科
技术应用
text mining humanities and social science technology application
作者简介
郭金龙,男,1988年生,硕士研究生,发表论文2篇
许鑫,男,1976年生,副教授,博士,发表论文60余篇,出版专著2部
陆宇杰,男,1988年生,硕士研究生,发表论文2篇。