摘要
文本预处理是文本分析理解的基础,预处理结果可以直接影响到文本分析的准确率。中文文本语句结构复杂,词语之间没有明显的分隔标记,需要进行分词来理解语句。分词是文本预处理的基础,词的切分准确性影响文本预处理结果。本文分词采用jieba中文分词工具,实现了文本预处理模块。
出处
《电脑知识与技术》
2020年第14期248-251,257,共5页
Computer Knowledge and Technology
基金
安徽省教育厅科学研究项目资助(KJ2017A852)。
作者简介
石凤贵(1982—),男,安徽宿松人,讲师,硕士,研究方向:自动问答、人工智能应用。