检索结果-维普期刊中文期刊服务平台

面向文本数字化的自动纠错方法被引量：3: 1; 作者陈翔徐平先张玉志《计算机应用研究》 CSCD 北大核心 2008年第5期1434-1436,共3页; 为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%... 展开更多; 关键词自动纠错文本数字化频率统计树切分信息表形码; 在线阅读下载PDF 职称材料

数字化时代中文课外阅读文本库的构建被引量：2: 2; 作者姜丽萍杨曦《中国大学教学》 CSSCI 北大核心 2023年第3期83-88,共6页; 课外阅读是学习者提升中文阅读能力的重要途径。当前,适合国际中文学习者阅读的文本素材匮乏,而基于数字化的文本阅读具有来源广泛、内容丰富、使用便利等优势。文章综合分析了将数字化文本用于课外阅读的优势与潜在问题,提出构建数字... 展开更多; 关键词中文阅读数字化文本库构建课外阅读; 在线阅读下载PDF 职称材料

一种基于自组织神经网络的中文文本聚类新方法被引量：11: 3; 作者徐建锁王正欧王莉《情报学报》 CSSCI 北大核心 2003年第6期676-680,共5页; 针对传统K-均值等算法在文本聚类中的缺陷,本文提出了一种树形动态自组织映射(TGSOM)神经网络来实现中文文本聚类,克服了传统的K-均值等算法中文本种类需要预先给定的缺点.本文详尽描述了该网络模型的生成算法和算法中扩展因子的作用,... 展开更多; 关键词中文文本文本聚类自组织映射 TGSOM 神经网络 K-均值算法文本数字化; 在线阅读下载PDF 职称材料