期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
计算机识别藏语虚词的方法研究 被引量:15
1
作者 高定国 扎西加 赵栋材 《中文信息学报》 CSCD 北大核心 2014年第1期113-117,共5页
藏文虚词的研究是藏文信息处理技术中词、句及语义研究的基础,而计算机自动识别藏文虚词又是藏语虚词研究的前提。该文在论述藏语虚词在藏语文本中的作用和使用方法的基础上,分析了计算机识别藏语虚词的难度,提出了一个计算机识别藏语... 藏文虚词的研究是藏文信息处理技术中词、句及语义研究的基础,而计算机自动识别藏文虚词又是藏语虚词研究的前提。该文在论述藏语虚词在藏语文本中的作用和使用方法的基础上,分析了计算机识别藏语虚词的难度,提出了一个计算机识别藏语虚词的方法,并用2 525句典型藏文句子进行了验证,对结果进行分析发现藏文虚词识别的正确率高达97.076 8%。 展开更多
关键词 识别 藏语 虚词
在线阅读 下载PDF
印刷体藏文文字识别技术研究 被引量:12
2
作者 欧珠 普次仁 +3 位作者 大罗桑朗杰 赵栋才 刘芳 边巴旺堆 《计算机工程与应用》 CSCD 北大核心 2009年第24期165-169,172,共6页
藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于... 藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于网格的模糊笔划特征提取等。实验结果说明,这些方法可提高印刷体藏文文字识别系统的正确识别率和抗干扰能力。 展开更多
关键词 印刷体藏文字符 切分 藏文文字识别 光学字符识别
在线阅读 下载PDF
藏文停用词选取与自动处理方法研究
3
作者 珠杰 李天瑞 《中文信息学报》 CSCD 北大核心 2015年第2期125-132,共8页
停用词的处理是文本挖掘中一个关键的预处理步骤。该文结合现有停用词的处理技术,研究了基于统计的藏文停用词选取方法,通过实验分析了词项频率、文档频率、熵等方法的藏文停用词选用情况,提出了藏文虚词、特殊动词和自动处理方法相结... 停用词的处理是文本挖掘中一个关键的预处理步骤。该文结合现有停用词的处理技术,研究了基于统计的藏文停用词选取方法,通过实验分析了词项频率、文档频率、熵等方法的藏文停用词选用情况,提出了藏文虚词、特殊动词和自动处理方法相结合的藏文停用词选取方法。实验结果表明,该方法可以确定一个较合理的藏文停用词表。 展开更多
关键词 藏文停用词 词频统计 文档频数
在线阅读 下载PDF
藏语语料库TEI标记规范探讨
4
作者 扎西加 高定国 《中文信息学报》 CSCD 北大核心 2011年第4期66-70,81,共6页
在语言信息处理过程中,大规模真实文本处理已成为一个研究热点。藏语语料库的标记在汉藏英机器翻译、信息检索、文本数据挖掘、词典编纂的研究工作中占很重要的地位。为了便于数据交换和共享,该文基于TEI编码的藏语语料,对藏语语料库中... 在语言信息处理过程中,大规模真实文本处理已成为一个研究热点。藏语语料库的标记在汉藏英机器翻译、信息检索、文本数据挖掘、词典编纂的研究工作中占很重要的地位。为了便于数据交换和共享,该文基于TEI编码的藏语语料,对藏语语料库中文本的属性信息和结构信息标记做了系统而全面的探讨。 展开更多
关键词 藏语 语料库 TEI标记
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部