-
题名关联词搭配的自动发现
被引量:12
- 1
-
-
作者
姚双云
胡金柱
肖升
沈威
-
机构
华中师范大学语言与语言教育研究中心
湖南省第一师范学院信息科学与工程系
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第12期4426-4428,4432,共4页
-
基金
国家自然科学基金资助项目(60703008)
国家重点实验室开放研究基金资助项目(SKLSE04-018)
+1 种基金
教育部人文社科重点研究基地重大资助项目(10JJD740012)
湖北省科技攻关资助项目(2007AA101C49)
-
文摘
提出了关联词搭配模式自动发现的基本方法。建立一个大规模语料库,然后作分词处理,并对关联词进行自动标注和人工校对;评估关联词搭配的三个重要参数(搭配距离、搭配强度MI值、搭配强度Z值),并设定阈值,超过阈值的格式自动作为候选搭配模式。通过实验,标注的准确率为88.75%,表明本方法具有较好效果。运用该方法,发现了以往大量未被注意的句法搭配模式,对研制高质量的关联词知识库起到了积极的促进作用,对复句句法、语义的自动分析具有重要的意义。
-
关键词
语料库
关联词
搭配
自动发现
-
Keywords
corpus
conjunction
collocation pattern
automatic discovery
-
分类号
H146.2
[语言文字—汉语]
-