摘要
主题追踪系统是Web挖掘的重要研究方向,它是指在给定的主题下,根据文本的内容自动判别文本归属主题的过程,该文对主题追踪系统中所涉及的关键技术,包括训练算法、追踪算法和阈值确定方法,进行了研究和探讨,并且提出了主题追踪系统的结构,给出了评估实验结果。
Topic Tracking,the automated assigning of natural language texts to predefined topics based on their contents,is a task of increasing importance on web mining.This paper gives a research to several key techniques about Topic Tracking,including training algorithm,tracking algorithm,and threshold measure.It also proposes a Topic Tracking System architecture,and gives the evaluations and results.
出处
《计算机工程与应用》
CSCD
北大核心
2006年第2期179-181,共3页
Computer Engineering and Applications
关键词
主题追踪
中文信息处理
WEB
topic tracking,Chinese information processing,Web
作者简介
莫倩(1974-),男,博士,讲师,当前研究领域为数据挖掘和中文信息处理。
刘书家(1959-),男,教授,院长,当前研究领域为计算机应用。
李凯(1964-),男,高级工程师。