-
题名Web文本挖掘系统及其关键技术研究
被引量:11
- 1
-
-
作者
钟艳花
余伟红
余永权
-
机构
广东工业大学计算机学院
广东江门电子技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第34期167-169,196,共4页
-
文摘
随着网络信息的迅猛发展,信息量日益增加,怎样从海量的Internet上获取有用信息,WEB文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别内容类别的过程,论文对文本中所涉及的关键技术,包括K-最近邻参照法模型、基于隐马尔科夫模型(HMM)的信息抽取、机器学习方法,进行了研究和探讨,并且给出了基于信息抽取的文本挖掘系统的设计实现和下一步的研究重点。
-
关键词
WEB文本挖掘
k-最近邻参照法
信息抽取
隐马尔科夫模型(HMM)
-
Keywords
Text mining based on Web,k-Nearest Neighbor,Information Extraction,Hide in Markov Model (HMM)
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
-