摘要
基于大规模语料库,建立了汉语依存句法网络,并从复杂网络的角度对该网络进行了系统的实验考察。实验结果表明汉语依存句法网络具有复杂网络的两个基本性质:小世界效应和无标度特性,并在其他方面也体现了复杂网络的重要性质。汉语的这些句法上的统计特性,与捷克语、德语和罗马尼亚语等极为相似,说明虽然不同语言有着极为不同的句法规则,但它们具有类似的统计特性,这种共性对人类语言本质的研究具有一定的启发意义。
In this paper, we build Chinese syntactic dependency network based on a large corpus and adopt complex network as the tool to analyze the language network. The network shows two important features: the small world effect and the scale-free property. The statistical properties are similar to Czech, German and Romanian which indicate that there are underlying common characteristics among different human languages in despite of their different grammar rules. The common characteristics might make sense for the study of evolution and essence of human languages.
出处
《复杂系统与复杂性科学》
EI
CSCD
2008年第2期37-45,共9页
Complex Systems and Complexity Science
基金
国家自然科学基金项目(60573187
60621062
60520130299)
关键词
依存句法
汉语
复杂网络
小世界
无标度
同现
dependency grammar
Chinese
complex network
small world
scale free
co-occurrence
作者简介
刘知远(1984-),男,山东泰安人,博士研究生,主要研究方向为自然语言处理、复杂网络、数据挖掘等。