摘要
短语是具有统计意义的词语共现,它包括固定词组、准固定词组和半自由词组。短语自动识别是短语学研究的基本问题之一,是连接短语学理论和实践的桥梁。本文阐述了三种基于统计的短语自动识别方法,并指出,英语短语自动识别虽存缺陷,但其总体适应性较好,汉语短语自动识别由于汉语自身的特点而更具复杂性。文章具体分析了汉语短语自动识别存在的主要问题,并提出了解决相关问题的初步方案。
出处
《外语研究》
CSSCI
北大核心
2014年第6期8-13,共6页
Foreign Languages Research
作者简介
李德俊,博士,教授。研究方向:语料库语言学,词典学。