-
题名语言学与统计方法结合建立汉语动词SCF类型集
被引量:2
- 1
-
-
作者
冀铁亮
孙薇薇
穗志方
-
机构
北京大学计算语言学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2007年第5期118-125,共8页
-
基金
国家自然科学基金资助项目(60503071)
-
文摘
动词子语类框架(Subcategorization Frame以下简称SCF)在句法分析、语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建立了获得普遍共识的子语类框架类型集。而汉语方面还没有标准的动词子类框架类型集。本文提出一种语言学知识与统计方法相结合的汉语动词子语类框架类型集的半自动获取方案。初步建立起既符合统计结果又基本符合语言学理论的汉语动词子语类框架类型集。实验证明,加入语言学理论的子语类框架类型集降低了对语料的依赖程度,比完全由分析语料产生的类型集更完备。
-
关键词
计算机应用
中文信息处理
动词子语类框架
类型集
语言学与统计方法结合
-
Keywords
computer application
Chinese information processing
verb' s subcategorization frame
lexicon
the hybrid of linguistic theory and statistical algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名从真实语料中自动获取汉语动词次范畴化信息
被引量:1
- 2
-
-
作者
韩习武
赵铁军
-
机构
哈尔滨工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第19期1-4,181,共5页
-
基金
国家自然科学基金项目"汉语动词次范畴化自动获取技术的研究"(编号:60373101)
-
文摘
描述了一种自动获取汉语动词次范畴化信息的可行技术和一个从大规模真实文本中构建动词次范畴化词汇知识库的系统性实验。实验基于语言学启发信息生成次范畴化框架假设,然后应用统计方法进行假设检验。对20个句模多元化动词获取结果的初步评价表明,该技术已经达到了目前国际上同类研究相应水平的精确率和召回率;并且,所得知识库在一个PCFG句法分析器上的简单应用体现了次范畴化信息在自然语言处理领域有着可观的潜在价值。
-
关键词
汉语动词
谓词
次范畴化
次范畴化框架
-
Keywords
Chinese verb,predicate,subcategorization,subcategorization frame
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-