期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
西藏大学藏文字文学馆简介
1
《西藏大学学报(社会科学版)》 北大核心 2025年第2期F0002-F0002,F0003,共2页
西藏大学藏文字文学馆是我国首个以藏文字文学为主题的专题展馆,是依托西藏大学中国少数民族语言文学(藏语言文学)学科优势和专业特点重点打造的社科普及宣传基地,是西藏大学中国少数民族语言文学(藏语言文学)和西藏大学历史学专业实训... 西藏大学藏文字文学馆是我国首个以藏文字文学为主题的专题展馆,是依托西藏大学中国少数民族语言文学(藏语言文学)学科优势和专业特点重点打造的社科普及宣传基地,是西藏大学中国少数民族语言文学(藏语言文学)和西藏大学历史学专业实训基地;是集学术研究、教学实践和文化体验为一体的多功能平台。 展开更多
关键词 专题展馆 藏文字文学馆 西藏大学
在线阅读 下载PDF
一种基于向量模型的藏文字拼写检查方法 被引量:14
2
作者 才智杰 孙茂松 才让卓玛 《中文信息学报》 CSCD 北大核心 2018年第9期47-55,共9页
自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是... 自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是藏文字拼写检查的基础和重点。该文通过分析藏文文法中的构字规则,利用藏文字向量模型将藏文字用计算机易于操作的数字(向量)表示,建立基于规则约束的藏文字向量模型,进而设计该模型下的藏文字拼写检查模型及算法。算法简单易实现,经测试算法拼写检查的平均准确率达99.995%,平均每秒检查1 060个字。 展开更多
关键词 自然语言处理 向量模型 藏文字 拼写检查 非真
在线阅读 下载PDF
藏文字同现网络的小世界效应和无标度特性 被引量:3
3
作者 才智杰 孙茂松 才让卓玛 《中文信息学报》 CSCD 北大核心 2018年第10期45-52,共8页
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇... 复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。 展开更多
关键词 藏文字 同现网络 小世界效应 无标度特性
在线阅读 下载PDF
藏文字自动生成技术研究 被引量:1
4
作者 才智杰 孙茂松 才让卓玛 《高原科学研究》 2017年第1期98-103,共6页
字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字... 字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字符基字的竖直方向上所含成分将藏文字分成了8个大类,对不同类型藏文字分析了其生成模型及生成算法,经测试可自动生成符合现代藏文文法的所有现代藏文字。 展开更多
关键词 中文信息处理 藏文字 自动生成
在线阅读 下载PDF
小字符集现代藏文排序技术的研究 被引量:3
5
作者 完么扎西 尼玛扎西 《计算机工程与应用》 CSCD 2013年第8期146-150,共5页
构成藏文音节的字母具有一定的顺序,ISO/IEC10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC10646(Tibetan)的藏文排... 构成藏文音节的字母具有一定的顺序,ISO/IEC10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC10646(Tibetan)的藏文排序算法,主要思想是:从文本中读入藏文音节,并把它转化为一维的字母串;识别基字及调整构成藏文音节的字母(构件)顺序,并且在缺构件位置上添加相应的空格符;用快速排序法对藏文音节串进行排序;构成藏文音节的字母(构件)顺序调回到原来的顺序,去除空格符,并输出。 展开更多
关键词 藏文音节 现代藏文字 词典排序规则 ISO IEC 10646(Tibetan) 藏文排序
在线阅读 下载PDF
藏文编码字符集的扩充集在Linux上的实现 被引量:5
6
作者 张兴亮 芮建武 +2 位作者 谢谦 程伟 吴健 《中文信息学报》 CSCD 北大核心 2007年第2期122-128,共7页
国内藏文软件开发普遍使用的是基于垂直预组合字符的实现方案,但是缺乏统一的编码标准。藏文编码字符集扩充集的推出,对于国内藏文软件的标准化、国际化具有重要意义。本文通过分析ISO/IEC 10646藏文编码字符集基本集、藏文编码字符集... 国内藏文软件开发普遍使用的是基于垂直预组合字符的实现方案,但是缺乏统一的编码标准。藏文编码字符集扩充集的推出,对于国内藏文软件的标准化、国际化具有重要意义。本文通过分析ISO/IEC 10646藏文编码字符集基本集、藏文编码字符集扩充集国家标准,区分它们描述字丁的差异,分析由编码方案所导致的实现上的关键问题。最后,针对藏文扩充集B的特殊性,提出并实现了基于Linux国际化架构下支持藏文扩充集标准的解决方案。 展开更多
关键词 计算机应用 中文信息处理 藏文字 扩充集OpenType 扩充QT方案
在线阅读 下载PDF
现代藏文基字识别的算法设计 被引量:3
7
作者 拉巴顿珠 欧珠 《西藏大学学报(社会科学版)》 CSSCI 2016年第2期82-88,共7页
藏文基字是藏文字符的核心构件,能够在藏文音节结构中准确地识别基字,不仅有利于解析藏文字符的构件,对实现藏文排序算法也具有重要意义。文章依据藏文文法,严格遵循现代藏文音节字的结构特征,设计了现代藏文音节字的基字识别算法,并对... 藏文基字是藏文字符的核心构件,能够在藏文音节结构中准确地识别基字,不仅有利于解析藏文字符的构件,对实现藏文排序算法也具有重要意义。文章依据藏文文法,严格遵循现代藏文音节字的结构特征,设计了现代藏文音节字的基字识别算法,并对不符合现代藏文构字规则的高频字进行了特殊处理,设计实现了现代藏文音节字的基字识别软件。该软件对18785个现代藏文音节字进行测试,识别率达到100%。 展开更多
关键词 藏文字处理 藏文 识别算法
在线阅读 下载PDF
基于规则的现代藏文音节字检错研究 被引量:6
8
作者 才让叁智 关白 《西藏大学学报(社会科学版)》 CSSCI 2017年第2期70-77,共8页
藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,... 藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,对非规则音节字采用建立梵源藏文词典、音译藏文词典和本体非规则音节字词典进行检错。实验表明,文章提出的藏文音节字检错方法对报纸类藏文的检错率为100%。 展开更多
关键词 藏文音节 音节组件 组合规则 检错
在线阅读 下载PDF
现代藏文信息熵及其属性 被引量:2
9
作者 完么扎西 尼玛扎西 《西藏大学学报(社会科学版)》 CSSCI 2017年第2期51-57,共7页
文章将信息论的方法引入藏文信息处理技术研究领域,利用统计的方法研究了以字符为单位和以音节字为单位的藏文信息熵。通过对275万多音节字的大规模藏语单语语料进行统计,给出了以字符为统计单位和以音节字为统计单位的现代藏文的熵,其... 文章将信息论的方法引入藏文信息处理技术研究领域,利用统计的方法研究了以字符为单位和以音节字为单位的藏文信息熵。通过对275万多音节字的大规模藏语单语语料进行统计,给出了以字符为统计单位和以音节字为统计单位的现代藏文的熵,其值分别为4.17和8.21比特,并从信息论的角度证明了藏文具有拼音文字和音节字特征的双重属性。 展开更多
关键词 藏文字 藏文(音节) 藏文信息熵
在线阅读 下载PDF
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
10
作者 才让当知 黄鹤鸣 +1 位作者 李鑫元 张会云 《中文信息学报》 CSCD 北大核心 2023年第12期62-69,75,共9页
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文... 藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文本识别。首先,在CNN的每个卷积层中添加循环连接,增强CNN提取乌梅字粘连片段的特征和集成上下文信息的能力;其次,对提取的图像文本特征序列采用BiLSTM进行建模;最后,采用字丁切分模块增强CTC对图像序列和标签对齐的监督能力。在自行构建的Cursive Script-C517测试数据集上,该模型的最高准确率和平均准确率分别达到了99.80%和91.43%,分别比基线提高了1.45和48.47个百分点。此外,通过字符级词典库训练,使模型的训练时间减少了13.63%。实验表明,该方法有效解决了乌梅字体中笔画粘连和交错现象严重导致的识别错误问题,显著提升了印刷体藏文乌梅识别精度,减少了训练时间,且具有较好的鲁棒性。 展开更多
关键词 循环卷积神经网络 印刷体藏文识别 图像序列识别 印刷体藏文乌梅识别 藏文字丁切分
在线阅读 下载PDF
关于藏族语文之现代化研究
11
作者 于洪志 《西北民族学院学报(哲学社会科学版)》 2002年第3期72-75,共4页
影响藏族地区社会发展的原因是多方面的 ,其中藏汉双语教育和藏族语言文字能否实现现代化是重要的因素之一。我国藏文信息技术具有全方位、多次层处理藏文自然科学和社会科学的能力。
关键词 语文现代化 信息处理 现代化 藏文字处理软件 藏双语信息处理系统
在线阅读 下载PDF
敦煌本《吐蕃大事纪年》部分地名及疑难词句研究 被引量:3
12
作者 索南加 《西藏大学学报(社会科学版)》 CSSCI 北大核心 2021年第1期36-42,共7页
敦煌本《吐蕃大事纪年》是众所周知的研究吐蕃历史文化最重要的文献,自上世纪40年代由国外学者刊布译注本以来,极大地推动了吐蕃史等领域的研究。由于该文献成书年代较早,用词及文法规则也较现在存在诸多差异,因而在各种注疏中对部分词... 敦煌本《吐蕃大事纪年》是众所周知的研究吐蕃历史文化最重要的文献,自上世纪40年代由国外学者刊布译注本以来,极大地推动了吐蕃史等领域的研究。由于该文献成书年代较早,用词及文法规则也较现在存在诸多差异,因而在各种注疏中对部分词句的解释出现了错漏之处。文章利用各种新、旧研究成果,对《吐蕃大事纪年》中■之地望、659年条纪事内容,对■字之认识及几组动词的用法等方面,从词义学及地名学角度进行进一步分析并提出了新的看法。 展开更多
关键词 《吐蕃大事纪年》 藏文 659年条纪事 藏文■与■
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部