-
题名中文基本复合名词短语语义关系体系及知识库构建
被引量:6
- 1
-
-
作者
刘鹏远
刘玉洁
-
机构
北京语言大学信息科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第4期20-28,共9页
-
基金
教育部人文社科规划项目(18YJA740030)
北京市自然科学基金(4192057)
国家自然科学基金(61872402)
-
文摘
名词短语一直是中外语言学领域的重要研究对象,近年来在自然语言处理领域也受到了研究者的持续关注。英文方面,已建立了一定规模的名词短语语义关系知识库。但迄今为止,尚未建立相应或更大规模的描述名词短语语义关系的中文资源。该文借鉴国内外诸多学者对名词短语语义分类的研究成果,对大规模真实语料中的基本复合名词短语实例进行试标注与分析,建立了中文基本复合名词短语语义关系体系及相应句法语义知识库,该库能够为中文基本复合名词短语句法语义的研究提供基础数据资源。目前该库共含有18 281条高频基本复合名词短语,每条短语均标注了语义关系、短语结构及是否指称实体等信息,每条短语包含的两个名词还分别标注了语义类信息。语义类信息基于北京大学《现代汉语语义词典》。基于该知识库,该文还做了基本复合名词短语句法语义的初步统计与分析。
-
关键词
基本复合名词短语
语义关系体系
知识库
-
Keywords
noun compounds
semantic relations hierarchy
knowledge base
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语基本复合名词短语语义关系知识库构建与识别
被引量:2
- 2
-
-
作者
张文敏
李华勇
邵艳秋
-
机构
北京语言大学信息科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第12期28-36,共9页
-
基金
国家自然科学基金(61872402)
教育部人文社科规划基金(17YJAZH068)
北京语言大学校级项目(中央高校基本科研业务费专项资金)(18ZDJ03)
-
文摘
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。
-
关键词
汉语基本复合名词短语
语义关系体系
定界识别
-
Keywords
Chinese basic compound noun phrases
semantic relational system
delimitation recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-