摘要
文章介绍和论述了基于1.3亿字节藏文语料库,对藏文词汇频度与通用度进行统计研究及其具体实现的方法与过程。其研究成果有助于藏族基础教育、扫盲教育的语言文字教学,对藏语语言学研究和藏文信息处理具有重要的研究与应用价值。
Based on the Tibetan language cortms with 130 million bytes, this essay introduces and expounds the frequency and generality of Tibetan vocabulary with statistics and its accomplishment process. The research result lends itself to the elementary education, eliminates illiteracy of Tibetan Language, and has greatly theoretical and applicable value for studying Tibetan Linguisties and establishment of Tibetan language information system.
出处
《图书与情报》
CSSCI
2006年第3期74-77,共4页
Library & Information
基金
国家社会科学研究规划基金2005年重点项目<藏语语料库建设研究>(批准号:05AYY001)资助。
关键词
藏文
语料库
词汇
频度
通用度
信息处理
统计研究
Tibetan
corpus
vocabulary
frequency statistics
generality
Tibetan information process
作者简介
卢亚军(1956-),男,西北民族大学藏语言文化学院副教授、硕士生导师,主要从事藏族语言文学、语料库语言学教学与研究;罗广(1972-).男.东方航空公司甘肃分公司电子工程师,主要从事计算机软件编程。