期刊文献+

基于jieba中文分词的中文文本语料预处理模块实现 被引量:41

在线阅读 下载PDF
导出
摘要 文本预处理是文本分析理解的基础,预处理结果可以直接影响到文本分析的准确率。中文文本语句结构复杂,词语之间没有明显的分隔标记,需要进行分词来理解语句。分词是文本预处理的基础,词的切分准确性影响文本预处理结果。本文分词采用jieba中文分词工具,实现了文本预处理模块。
作者 石凤贵
出处 《电脑知识与技术》 2020年第14期248-251,257,共5页 Computer Knowledge and Technology
基金 安徽省教育厅科学研究项目资助(KJ2017A852)。
作者简介 石凤贵(1982—),男,安徽宿松人,讲师,硕士,研究方向:自动问答、人工智能应用。
  • 相关文献

同被引文献355

引证文献41

二级引证文献77

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部