-
题名中文文本自动校对技术的研究
被引量:21
- 1
-
-
作者
骆卫华
罗振声
宫小瑾
-
机构
清华大学中国语言文学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第1期244-249,共6页
-
文摘
传统的自动校对技术多是基于字、词级的统计方法 ,有很多局限 ,通过讨论中文文本自动校对技术的设计思想与实现方法及中英文自动校对的异同 ,提出了词法、句法、语义多层次结合校对策略 ,从而能够检查以往无法查出的错误 描述了自动校对系统的整体框架 ,并具体给出可操作的实现方法 这些方法针对非受限领域的文本 。
-
关键词
中文文本自动校对
N元模型
主题相关度
语义共现矩阵
-
Keywords
automatic proofreading for Chinese texts
n-gram modal
degree of subject relativity
semantic co-concurrence matrix
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本自动校对的语义级查错研究
被引量:13
- 2
-
-
作者
骆卫华
罗振声
龚小谨
-
机构
清华大学中文系
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第12期115-118,共4页
-
文摘
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。
-
关键词
中文文本自动校对
基于实例
语义相邻矩阵
语义共现矩阵
-
Keywords
Automatic Proofreading for Chinese Text,Instance-based,Semantic Adjacent Matrix,Semantic Co-occurrence Matrix
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于二元接续关系检查的字词级自动查错方法
被引量:29
- 3
-
-
作者
张仰森
丁冰青
-
机构
山西大学计算机科学系
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2001年第3期36-43,共8页
-
基金
山西省自然科学基金!(9810 31)
-
文摘
本文探讨了基于字字同现、词性二元接续和语义二元接续的中文文本的自动查错原理和查错算法 ;给出了字词接续判断模型 ,并讨论了与接续判断模型相关的查错知识库的构造方法。通过对实验结果的分析和评测 ,证明本文所述方法是可行的。
-
关键词
中文文本自动校对
自动查错
二元接续关系
-
Keywords
Chinese text automatic proofread
automatic error detecting
bi neighborship
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-