期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向文本数字化的自动纠错方法 被引量:3
1
作者 陈翔 徐平先 张玉志 《计算机应用研究》 CSCD 北大核心 2008年第5期1434-1436,共3页
为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%... 为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%,误判率为9.07%,能够满足数字化系统需求。 展开更多
关键词 自动纠错 文本数字化 频率统计树 切分信息 表形码
在线阅读 下载PDF
数字化时代中文课外阅读文本库的构建 被引量:2
2
作者 姜丽萍 杨曦 《中国大学教学》 CSSCI 北大核心 2023年第3期83-88,共6页
课外阅读是学习者提升中文阅读能力的重要途径。当前,适合国际中文学习者阅读的文本素材匮乏,而基于数字化的文本阅读具有来源广泛、内容丰富、使用便利等优势。文章综合分析了将数字化文本用于课外阅读的优势与潜在问题,提出构建数字... 课外阅读是学习者提升中文阅读能力的重要途径。当前,适合国际中文学习者阅读的文本素材匮乏,而基于数字化的文本阅读具有来源广泛、内容丰富、使用便利等优势。文章综合分析了将数字化文本用于课外阅读的优势与潜在问题,提出构建数字化课外阅读文本库的设想,重点讨论了数字化文本库的特征、功能与实现路径,以期为开展中文课外阅读、促进中文学习者阅读能力提升及阅读习惯的养成提供新的思路。 展开更多
关键词 中文阅读 数字化文本 构建 课外阅读
在线阅读 下载PDF
一种基于自组织神经网络的中文文本聚类新方法 被引量:11
3
作者 徐建锁 王正欧 王莉 《情报学报》 CSSCI 北大核心 2003年第6期676-680,共5页
针对传统K-均值等算法在文本聚类中的缺陷,本文提出了一种树形动态自组织映射(TGSOM)神经网络来实现中文文本聚类,克服了传统的K-均值等算法中文本种类需要预先给定的缺点.本文详尽描述了该网络模型的生成算法和算法中扩展因子的作用,... 针对传统K-均值等算法在文本聚类中的缺陷,本文提出了一种树形动态自组织映射(TGSOM)神经网络来实现中文文本聚类,克服了传统的K-均值等算法中文本种类需要预先给定的缺点.本文详尽描述了该网络模型的生成算法和算法中扩展因子的作用,并阐述了中文文本的数字化方法--TF.IDF.IG方法. 展开更多
关键词 中文文本 文本聚类 自组织映射 TGSOM 神经网络 K-均值算法 文本数字化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部