期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文文本自动校对技术的研究
被引量:
21
1
作者
骆卫华
罗振声
宫小瑾
《计算机研究与发展》
EI
CSCD
北大核心
2004年第1期244-249,共6页
传统的自动校对技术多是基于字、词级的统计方法 ,有很多局限 ,通过讨论中文文本自动校对技术的设计思想与实现方法及中英文自动校对的异同 ,提出了词法、句法、语义多层次结合校对策略 ,从而能够检查以往无法查出的错误 描述了自动校...
传统的自动校对技术多是基于字、词级的统计方法 ,有很多局限 ,通过讨论中文文本自动校对技术的设计思想与实现方法及中英文自动校对的异同 ,提出了词法、句法、语义多层次结合校对策略 ,从而能够检查以往无法查出的错误 描述了自动校对系统的整体框架 ,并具体给出可操作的实现方法 这些方法针对非受限领域的文本 。
展开更多
关键词
中文
文本自动校对
N元模型
主题相关度
语义共现矩阵
在线阅读
下载PDF
职称材料
中文文本自动校对的语义级查错研究
被引量:
13
2
作者
骆卫华
罗振声
龚小谨
《计算机工程与应用》
CSCD
北大核心
2003年第12期115-118,共4页
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略...
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。
展开更多
关键词
中文
文本自动校对
基于实例
语义相邻矩阵
语义共现矩阵
在线阅读
下载PDF
职称材料
文本自动校对技术研究综述
被引量:
39
3
作者
张仰森
俞士汶
《计算机应用研究》
CSCD
北大核心
2006年第6期8-12,共5页
概述了文本自动校对技术的产生背景,分析了中西文文本的各自特点以及它们之间的异同,对中西文文本校对的技术难点和解决方法以及国内外的研究现状进行了回顾和评述,探讨了文本校对技术未来的发展方向及需要解决的问题。
关键词
文本自动校对
孤立词
校对
策略
上下文相关的
校对
策略
语言模型
在线阅读
下载PDF
职称材料
领域问答系统中的文本错误自动发现方法
被引量:
19
4
作者
刘亮亮
王石
+2 位作者
王东升
汪平仄
曹存根
《中文信息学报》
CSCD
北大核心
2013年第3期77-83,共7页
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合...
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。
展开更多
关键词
文本自动校对
问答系统
非词错误
真词错误
错别字对
在线阅读
下载PDF
职称材料
基于N-gram的哈萨克语文本校对系统的设计与实现
被引量:
4
5
作者
玛依来.哈帕尔
古丽拉.阿东别克
《计算机应用与软件》
CSCD
北大核心
2012年第4期9-12,15,共5页
在哈萨克语文本非词查错方面,归纳和总结查错方法,在一定规模的哈萨克语词库的支持下,利用哈萨克语的特点,用哈萨克语词干切分程序和哈萨克语的音节规则,从文本中找出非词错误,再用最小编辑距离算法提供最有可能的候选词。在哈萨克语文...
在哈萨克语文本非词查错方面,归纳和总结查错方法,在一定规模的哈萨克语词库的支持下,利用哈萨克语的特点,用哈萨克语词干切分程序和哈萨克语的音节规则,从文本中找出非词错误,再用最小编辑距离算法提供最有可能的候选词。在哈萨克语文本真词查错部分,根据上下文信息,采用基于N-gram的语言模型,利用文本的局部连接同现概率三元语法模型来进行真词查错,再用基于编辑距离的模式匹配方法对真词错误提供纠错建议。实验结果表明,系统的查错与纠错效率较好,实验方案是可行的。
展开更多
关键词
文本自动校对
哈萨克语
最小编辑距离
N元语法
模式匹配
在线阅读
下载PDF
职称材料
基于二元接续关系检查的字词级自动查错方法
被引量:
29
6
作者
张仰森
丁冰青
《中文信息学报》
CSCD
北大核心
2001年第3期36-43,共8页
本文探讨了基于字字同现、词性二元接续和语义二元接续的中文文本的自动查错原理和查错算法 ;给出了字词接续判断模型 ,并讨论了与接续判断模型相关的查错知识库的构造方法。通过对实验结果的分析和评测 ,证明本文所述方法是可行的。
关键词
中文
文本自动校对
自动
查错
二元接续关系
在线阅读
下载PDF
职称材料
题名
中文文本自动校对技术的研究
被引量:
21
1
作者
骆卫华
罗振声
宫小瑾
机构
清华大学中国语言文学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第1期244-249,共6页
文摘
传统的自动校对技术多是基于字、词级的统计方法 ,有很多局限 ,通过讨论中文文本自动校对技术的设计思想与实现方法及中英文自动校对的异同 ,提出了词法、句法、语义多层次结合校对策略 ,从而能够检查以往无法查出的错误 描述了自动校对系统的整体框架 ,并具体给出可操作的实现方法 这些方法针对非受限领域的文本 。
关键词
中文
文本自动校对
N元模型
主题相关度
语义共现矩阵
Keywords
automatic proofreading for Chinese texts
n-gram modal
degree of subject relativity
semantic co-concurrence matrix
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中文文本自动校对的语义级查错研究
被引量:
13
2
作者
骆卫华
罗振声
龚小谨
机构
清华大学中文系
出处
《计算机工程与应用》
CSCD
北大核心
2003年第12期115-118,共4页
文摘
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。
关键词
中文
文本自动校对
基于实例
语义相邻矩阵
语义共现矩阵
Keywords
Automatic Proofreading for Chinese Text,Instance-based,Semantic Adjacent Matrix,Semantic Co-occurrence Matrix
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
文本自动校对技术研究综述
被引量:
39
3
作者
张仰森
俞士汶
机构
北京大学计算语言学研究所
出处
《计算机应用研究》
CSCD
北大核心
2006年第6期8-12,共5页
基金
国家"973"计划资助项目(2004CB318102)
国家"863"计划资助项目(2001AA114210
+1 种基金
2002AA117010)
中国博士后科学基金项目(2005038026)
文摘
概述了文本自动校对技术的产生背景,分析了中西文文本的各自特点以及它们之间的异同,对中西文文本校对的技术难点和解决方法以及国内外的研究现状进行了回顾和评述,探讨了文本校对技术未来的发展方向及需要解决的问题。
关键词
文本自动校对
孤立词
校对
策略
上下文相关的
校对
策略
语言模型
Keywords
Text Automatic Proofreading
Strategy for Isolate-word Error Correction
Strategy for Context-sensitive Error Correction
Language Model
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
领域问答系统中的文本错误自动发现方法
被引量:
19
4
作者
刘亮亮
王石
王东升
汪平仄
曹存根
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院大学
出处
《中文信息学报》
CSCD
北大核心
2013年第3期77-83,共7页
基金
国家自然科学基金项目(60573063
60573064
+2 种基金
60773059
61035004)
国家社科基金重点项目(10AYY003)
文摘
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。
关键词
文本自动校对
问答系统
非词错误
真词错误
错别字对
Keywords
text automatic proofreading
question answering system
no-word error
real-word error
typos pair
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于N-gram的哈萨克语文本校对系统的设计与实现
被引量:
4
5
作者
玛依来.哈帕尔
古丽拉.阿东别克
机构
新疆大学信息科学与工程学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第4期9-12,15,共5页
基金
国家自然科学基金项目(60763005)
国家教育部
国家语委民族语言文字规范标准建设及信息化科研项目(MZ115-92)
文摘
在哈萨克语文本非词查错方面,归纳和总结查错方法,在一定规模的哈萨克语词库的支持下,利用哈萨克语的特点,用哈萨克语词干切分程序和哈萨克语的音节规则,从文本中找出非词错误,再用最小编辑距离算法提供最有可能的候选词。在哈萨克语文本真词查错部分,根据上下文信息,采用基于N-gram的语言模型,利用文本的局部连接同现概率三元语法模型来进行真词查错,再用基于编辑距离的模式匹配方法对真词错误提供纠错建议。实验结果表明,系统的查错与纠错效率较好,实验方案是可行的。
关键词
文本自动校对
哈萨克语
最小编辑距离
N元语法
模式匹配
Keywords
Automatic text proofreading Kazakh language Minimum edit distance algorithm N-gram Pattern matching
分类号
TP399 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于二元接续关系检查的字词级自动查错方法
被引量:
29
6
作者
张仰森
丁冰青
机构
山西大学计算机科学系
中国科学院自动化研究所模式识别国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2001年第3期36-43,共8页
基金
山西省自然科学基金!(9810 31)
文摘
本文探讨了基于字字同现、词性二元接续和语义二元接续的中文文本的自动查错原理和查错算法 ;给出了字词接续判断模型 ,并讨论了与接续判断模型相关的查错知识库的构造方法。通过对实验结果的分析和评测 ,证明本文所述方法是可行的。
关键词
中文
文本自动校对
自动
查错
二元接续关系
Keywords
Chinese text automatic proofread
automatic error detecting
bi neighborship
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文文本自动校对技术的研究
骆卫华
罗振声
宫小瑾
《计算机研究与发展》
EI
CSCD
北大核心
2004
21
在线阅读
下载PDF
职称材料
2
中文文本自动校对的语义级查错研究
骆卫华
罗振声
龚小谨
《计算机工程与应用》
CSCD
北大核心
2003
13
在线阅读
下载PDF
职称材料
3
文本自动校对技术研究综述
张仰森
俞士汶
《计算机应用研究》
CSCD
北大核心
2006
39
在线阅读
下载PDF
职称材料
4
领域问答系统中的文本错误自动发现方法
刘亮亮
王石
王东升
汪平仄
曹存根
《中文信息学报》
CSCD
北大核心
2013
19
在线阅读
下载PDF
职称材料
5
基于N-gram的哈萨克语文本校对系统的设计与实现
玛依来.哈帕尔
古丽拉.阿东别克
《计算机应用与软件》
CSCD
北大核心
2012
4
在线阅读
下载PDF
职称材料
6
基于二元接续关系检查的字词级自动查错方法
张仰森
丁冰青
《中文信息学报》
CSCD
北大核心
2001
29
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部