摘要
当前搜索引擎技术被广泛地应用,这使得全文检索技术和中文分词技术的研究逐渐深入.中文分词是中文信息的关键技术之一.其质量高低直接影响中文信息处理效率。文章致力于研究中文分词算法,对多种中文分词算法、自动分词系统的理论模型进行了详细的阐述和讨论.为中文分词的进一步发展提供基础和方向。
Currently, the search engine technology has been widely used,which brings in-depth researches to full-text search technology, and Chinese segmentations; Chinese Segmentation is one of the key technologies of Chinese informiation, it directly affects the quality of Chinese information processing effficiency.This article dedicated to Research on Chinese Segmentation Algorithm, described in detail and discuss to some kinds of Chinese Segmentation Algorithms, Theoretical model of Auto-Segmentation system. Provide foundation and direction for the further development of Chinese segmentations.
作者
龙树全
赵正文
唐华
LONG Shu-quan, ZHAO Zheng-wen, TANG Hua (Department of Computer Science and Technology, Southwest Petroleum University, Chengdu 610500, China)
出处
《电脑知识与技术》
2009年第4期2605-2607,共3页
Computer Knowledge and Technology
关键词
中文分词
全文检索
算法
搜索引擎
歧义切分
chinese segmentations
full-text search
algorithm
search engine
ambiguous word segmentation
作者简介
龙树全(1982-),男,四川阆中人,硕士,主要研究方向:计算机软件与理论net分布式应用程序。
赵正文(1969-),男,博士,教授,主要研究方向:数据库系统实现技术,数据仓库,数据挖掘
唐华(1983-),男,硕士,主要研究方向:计算机软件与理论。