-
题名汉英动词次范畴化对应类型的统计分析
- 1
-
-
作者
韩习武
赵铁军
-
机构
黑龙江大学计算机科学技术学院
哈尔滨工业大学计算机科学技术学院
-
出处
《计算机科学》
CSCD
北大核心
2010年第3期230-233,共4页
-
基金
国家自然科学基金(60773069
60873169)资助
-
文摘
基于大规模句子级,对齐双语语料库进行了统计分析汉英动词次范畴化对应类型的系统性实验。首先以语言学量度为启发,应用双重最大似然检验的统计过滤方法初步估计了654种汉英次范畴化对应类型的概率分布;然后根据汉英句法特点对次范畴化对应类型进行了语言学分类;最后针对每一种对应类型及其背景语料进行了基于支持向量机的语言学类别标注和统计可靠性分析。
-
关键词
汉英动词次范畴化
统计分析
支持向量机
-
Keywords
Chinese-English verb subcategorization, Statistical analysis, SVM
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名汉英动词次范畴化对应关系自动获取
- 2
-
-
作者
韩习武
-
机构
黑龙江大学计算语言学研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第6期9-13,28,共6页
-
基金
国家自然科学基金(the National Natural Science Foundation of Chinaunder Grant No.60773069)
中国博士后一等资助项目(No.20060400246)
黑龙江省博士后资助项目(No.LBH-Z06217)。
-
文摘
动词次范畴化及其自动获取的研究已经在英、汉等很多语种里取得了较好的成果,但跨语言的次范畴化研究仍然很少,并且不成体系。描述了基于汉英双语语料库的统计分析并获取跨语言次范畴化对应关系的系统化实验。首先,根据双语词典和句法相似度识别谓词可能对齐的句对;然后,应用双重最大似然检验的统计过滤方法自动获取了654种次范畴化框架对应类型。实验结果分析表明,这些对应类型具备统计和句法意义上的协调性。
-
关键词
动词次范畴化
跨语言对应关系
自动获取
-
Keywords
verb subcategorization
cross-lingual relations
acquisition
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名动词次范畴英汉论元对应关系获取
被引量:1
- 3
-
-
作者
朱聪慧
赵铁军
韩习武
郑德权
-
机构
教育部-微软语言语音重点实验室
计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2010年第2期91-95,121,共6页
-
基金
国家自然科学基金资助项目(60773069,60973169)
-
文摘
动词次范畴是根据句法行为对动词的进一步划分,它是由核心动词和一系列论元组成。其相关研究在英汉等多种语言方面都取得了较好的成果,但跨语言之间的研究还很少。该文提出了一种基于主动学习策略的英汉动词次范畴论元对应关系自动获取方法,这种方法可以在双语平行语料上,几乎不需要任何先验的语言学知识的情况下,自动获取英汉论元的对应关系。然后我们将这些对应关系加入了统计机器翻译系统。实验结果表明,融合了英汉动词次范畴论元对应关系的SMT系统在性能上有明显的提升,证明了自动抽取的对应关系的有效性,也为SMT提供了新的研究方向。
-
关键词
人工智能
机器翻译
动词次范畴化
跨语言论元对应关系
自动获取
统计机器翻译
-
Keywords
artificial intelligence
machine translation
verb subcategorization
cross-lingual argument crrespon- dence
automatic acquisition
statistical machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-