-
题名现代汉语语义资源用于短语歧义模式消歧研究
被引量:9
- 1
-
-
作者
王锦
陈群秀
-
机构
清华大学计算机科学与技术系
-
出处
《中文信息学报》
CSCD
北大核心
2007年第5期80-86,共7页
-
基金
国家863高科技项目(2001AA114210)
-
文摘
现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词与词之间正确的搭配关系。本文研究了大量包含歧义的短语实例,分析了计算机处理汉语结构时面临的定界歧义和结构关系歧义问题,在已有短语结构规则的基础上归纳出了七种结构歧义模式,提出了分析歧义模式的关键是四种基本搭配信息的判断,并实现了基于语义知识和搭配知识的消歧算法。对887处短语进行排歧的实验结果表明,处理短语结构的正确率由82.30%上升到87.18%。
-
关键词
计算机应用
中文信息处理
现代汉语语义知识库
搭配词典
短语歧义排歧
-
Keywords
computer application
Chinese information processing
Chinese semantic knowledge base
collocation dictionary
disambiguation of ambiguous phrases
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多知识源的语义搭配知识库的构建及应用
被引量:3
- 2
-
-
作者
管君
谢玮
张仰森
-
机构
北京信息科技大学计算机学院智能信息处理研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第6期2136-2140,共5页
-
基金
国家自然科学基金项目(61070119)
北京大学计算语言学教育部重点实验室开放课题基金项目(KLCL-1005)
+1 种基金
北京市属市管高等学校人才强教计划基金项目(PHR201007131)
北京市教委专项基金项目(PXM2012-014224-000020)
-
文摘
针对汉语文本语义搭配错误,在对《现代汉语语义信息词典》(以下简称《语义词典》)及《知网》相关属性的研究基础上,提出了基于多知识源的语义搭配知识库的构建方法,并设计出了面向汉语文本语义查错的三层语义搭配知识库结构。在此基础上,设计并实现了一个汉语文本自动查错算法。实验结果表明,基于上述方法所设计的语义搭配知识库,可以大大提高汉语文本语义查错算法错误查找的召回率,对于语义查错的研究具有一定的借鉴作用。
-
关键词
汉语文本
语义搭配
多知识源
三层语义知识库
语义查错
-
Keywords
Chinese text
semantic collocation
multiple knowledge bases
three-layer semantic collocation knowledge base
error-detection algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-