-
题名一种解决英语动名词搭配错误的模型
被引量:2
- 1
-
-
作者
杜一民
吴桂兴
吴敏
-
机构
中国科学技术大学软件学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第7期230-233,250,共5页
-
基金
江苏省科技项目-基础研究计划(自然科学基金)面上研究项目(BK20141209)资助
-
文摘
英语学习者易犯动名词搭配错误。通过分析CLEC中的动名词搭配错误,提出一种纠正中国学习者的动名词搭配错误的模型。首先构建了一个动名词搭配库,接着提出了一种度量搭配间的相似度的方法,通过计算目标搭配和搭配库的相似度得到粗略的相似搭配集,使用分类的方法过滤掉相似搭配集中不能将测试句划为正确类的搭配,得到候选结果集,最后使用语言模型对候选结果集打分排序,得到最终的纠正建议。在使用BNC构造的测试集上,这种综合相似性推理和上下文特征的方法对动名词搭配纠错具有显著效果。
-
关键词
搭配错误
分类
语言模型
-
Keywords
Collocation error, Classification, Language model
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于《知网》义原搭配的中文文本语义级自动查错研究
被引量:12
- 2
-
-
作者
郭充
张仰森
-
机构
北京信息科技大学计算机学院智能信息处理研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第17期3924-3928,共5页
-
基金
国家自然科学基金项目(60873013)
北京市自然科学基金B类重点项目(KZ200811232019)
北京市属市管高校人才强教计划基金项目(PXM2008_014215_055942)
-
文摘
语义级的自动查错一直是汉语文本自动校对技术的难点。针对汉语文本中的语义搭配错误,提出了一种基于《知网》义原搭配的有效的自动查错方法,主要包括语义知识库的构建和自动查错算法。语义知识库的构建分为两步:①根据规则从训练语料中统计出大量的动词与名词之间的二元搭配组合,并利用互信息等因素筛选记录;②利用《知网》对词语义项的义原描述(对于动词抽取其义项中的主义原,名词抽取其义项中的主义原和常见的4个辅助义原),将动词与名词的二元搭配组合转变为义原之间相互制约的多元组合。在语义知识库的基础上设计相应的自动查错算法。实验结果显示,该方法的召回率为35%,精确率为82.3%,具有较好的应用前景。
-
关键词
语义搭配错误
互信息
知网
义原
语义知识库
-
Keywords
semantic matching error
mutual information
Hownet
sememe
semantic repository
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名北京某些地区宣传物语言规范情况的调查
被引量:1
- 3
-
-
作者
刘一玲
-
出处
《语文建设》
1987年第1期38-41,共4页
-
文摘
一1985年4月——12月和1986年4月,我们对社会上使用较多的广告、标语、招贴、公约等宣传物的语言作了初步调查。地点主要是在北京市长安街和王府井、东单、西单三个商业区。我们看到了不少好的用例。譬如,不少单位联系实际制定了一些宣传公约,以和蔼礼貌的口气,通过准确朴实的语言教育群众、要求自己。我们主要还是调查了语言使用中的问题。问题大致可分两类:第一类,不规范的用法。第二类,不够好的用法。
-
关键词
语言规范
语言教育
西单商场
搭配错误
书写台
经营宗旨
东单
语言文字
孔雀牌
四字格
-
分类号
G6
[文化科学—教育学]
-