期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
12
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
西藏大学藏文字文学馆简介
1
《西藏大学学报(社会科学版)》
北大核心
2025年第2期F0002-F0002,F0003,共2页
西藏大学藏文字文学馆是我国首个以藏文字文学为主题的专题展馆,是依托西藏大学中国少数民族语言文学(藏语言文学)学科优势和专业特点重点打造的社科普及宣传基地,是西藏大学中国少数民族语言文学(藏语言文学)和西藏大学历史学专业实训...
西藏大学藏文字文学馆是我国首个以藏文字文学为主题的专题展馆,是依托西藏大学中国少数民族语言文学(藏语言文学)学科优势和专业特点重点打造的社科普及宣传基地,是西藏大学中国少数民族语言文学(藏语言文学)和西藏大学历史学专业实训基地;是集学术研究、教学实践和文化体验为一体的多功能平台。
展开更多
关键词
专题展馆
藏文字
文学馆
西藏大学
在线阅读
下载PDF
职称材料
一种基于向量模型的藏文字拼写检查方法
被引量:
14
2
作者
才智杰
孙茂松
才让卓玛
《中文信息学报》
CSCD
北大核心
2018年第9期47-55,共9页
自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是...
自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是藏文字拼写检查的基础和重点。该文通过分析藏文文法中的构字规则,利用藏文字向量模型将藏文字用计算机易于操作的数字(向量)表示,建立基于规则约束的藏文字向量模型,进而设计该模型下的藏文字拼写检查模型及算法。算法简单易实现,经测试算法拼写检查的平均准确率达99.995%,平均每秒检查1 060个字。
展开更多
关键词
自然语言处理
向量模型
藏文字
拼写检查
非真
字
在线阅读
下载PDF
职称材料
藏文字同现网络的小世界效应和无标度特性
被引量:
3
3
作者
才智杰
孙茂松
才让卓玛
《中文信息学报》
CSCD
北大核心
2018年第10期45-52,共8页
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇...
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。
展开更多
关键词
藏文字
同现网络
小世界效应
无标度特性
在线阅读
下载PDF
职称材料
藏文字自动生成技术研究
被引量:
1
4
作者
才智杰
孙茂松
才让卓玛
《高原科学研究》
2017年第1期98-103,共6页
字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字...
字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字符基字的竖直方向上所含成分将藏文字分成了8个大类,对不同类型藏文字分析了其生成模型及生成算法,经测试可自动生成符合现代藏文文法的所有现代藏文字。
展开更多
关键词
中文信息处理
藏文字
自动生成
在线阅读
下载PDF
职称材料
小字符集现代藏文排序技术的研究
被引量:
3
5
作者
完么扎西
尼玛扎西
《计算机工程与应用》
CSCD
2013年第8期146-150,共5页
构成藏文音节的字母具有一定的顺序,ISO/IEC10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC10646(Tibetan)的藏文排...
构成藏文音节的字母具有一定的顺序,ISO/IEC10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC10646(Tibetan)的藏文排序算法,主要思想是:从文本中读入藏文音节,并把它转化为一维的字母串;识别基字及调整构成藏文音节的字母(构件)顺序,并且在缺构件位置上添加相应的空格符;用快速排序法对藏文音节串进行排序;构成藏文音节的字母(构件)顺序调回到原来的顺序,去除空格符,并输出。
展开更多
关键词
藏文
音节
现代
藏文字
词典排序规则
ISO
IEC
10646(Tibetan)
藏文
排序
在线阅读
下载PDF
职称材料
藏文编码字符集的扩充集在Linux上的实现
被引量:
5
6
作者
张兴亮
芮建武
+2 位作者
谢谦
程伟
吴健
《中文信息学报》
CSCD
北大核心
2007年第2期122-128,共7页
国内藏文软件开发普遍使用的是基于垂直预组合字符的实现方案,但是缺乏统一的编码标准。藏文编码字符集扩充集的推出,对于国内藏文软件的标准化、国际化具有重要意义。本文通过分析ISO/IEC 10646藏文编码字符集基本集、藏文编码字符集...
国内藏文软件开发普遍使用的是基于垂直预组合字符的实现方案,但是缺乏统一的编码标准。藏文编码字符集扩充集的推出,对于国内藏文软件的标准化、国际化具有重要意义。本文通过分析ISO/IEC 10646藏文编码字符集基本集、藏文编码字符集扩充集国家标准,区分它们描述字丁的差异,分析由编码方案所导致的实现上的关键问题。最后,针对藏文扩充集B的特殊性,提出并实现了基于Linux国际化架构下支持藏文扩充集标准的解决方案。
展开更多
关键词
计算机应用
中文信息处理
藏文字
丁
扩充集OpenType
扩充QT方案
在线阅读
下载PDF
职称材料
现代藏文基字识别的算法设计
被引量:
3
7
作者
拉巴顿珠
欧珠
《西藏大学学报(社会科学版)》
CSSCI
2016年第2期82-88,共7页
藏文基字是藏文字符的核心构件,能够在藏文音节结构中准确地识别基字,不仅有利于解析藏文字符的构件,对实现藏文排序算法也具有重要意义。文章依据藏文文法,严格遵循现代藏文音节字的结构特征,设计了现代藏文音节字的基字识别算法,并对...
藏文基字是藏文字符的核心构件,能够在藏文音节结构中准确地识别基字,不仅有利于解析藏文字符的构件,对实现藏文排序算法也具有重要意义。文章依据藏文文法,严格遵循现代藏文音节字的结构特征,设计了现代藏文音节字的基字识别算法,并对不符合现代藏文构字规则的高频字进行了特殊处理,设计实现了现代藏文音节字的基字识别软件。该软件对18785个现代藏文音节字进行测试,识别率达到100%。
展开更多
关键词
藏文字
处理
藏文
基
字
识别算法
在线阅读
下载PDF
职称材料
基于规则的现代藏文音节字检错研究
被引量:
6
8
作者
才让叁智
关白
《西藏大学学报(社会科学版)》
CSSCI
2017年第2期70-77,共8页
藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,...
藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,对非规则音节字采用建立梵源藏文词典、音译藏文词典和本体非规则音节字词典进行检错。实验表明,文章提出的藏文音节字检错方法对报纸类藏文的检错率为100%。
展开更多
关键词
藏文
音节
字
音节
字
组件
组合规则
检错
在线阅读
下载PDF
职称材料
现代藏文信息熵及其属性
被引量:
2
9
作者
完么扎西
尼玛扎西
《西藏大学学报(社会科学版)》
CSSCI
2017年第2期51-57,共7页
文章将信息论的方法引入藏文信息处理技术研究领域,利用统计的方法研究了以字符为单位和以音节字为单位的藏文信息熵。通过对275万多音节字的大规模藏语单语语料进行统计,给出了以字符为统计单位和以音节字为统计单位的现代藏文的熵,其...
文章将信息论的方法引入藏文信息处理技术研究领域,利用统计的方法研究了以字符为单位和以音节字为单位的藏文信息熵。通过对275万多音节字的大规模藏语单语语料进行统计,给出了以字符为统计单位和以音节字为统计单位的现代藏文的熵,其值分别为4.17和8.21比特,并从信息论的角度证明了藏文具有拼音文字和音节字特征的双重属性。
展开更多
关键词
藏文字
符
藏文
(音节)
字
藏文
信息熵
在线阅读
下载PDF
职称材料
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
10
作者
才让当知
黄鹤鸣
+1 位作者
李鑫元
张会云
《中文信息学报》
CSCD
北大核心
2023年第12期62-69,75,共9页
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文...
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文本识别。首先,在CNN的每个卷积层中添加循环连接,增强CNN提取乌梅字粘连片段的特征和集成上下文信息的能力;其次,对提取的图像文本特征序列采用BiLSTM进行建模;最后,采用字丁切分模块增强CTC对图像序列和标签对齐的监督能力。在自行构建的Cursive Script-C517测试数据集上,该模型的最高准确率和平均准确率分别达到了99.80%和91.43%,分别比基线提高了1.45和48.47个百分点。此外,通过字符级词典库训练,使模型的训练时间减少了13.63%。实验表明,该方法有效解决了乌梅字体中笔画粘连和交错现象严重导致的识别错误问题,显著提升了印刷体藏文乌梅识别精度,减少了训练时间,且具有较好的鲁棒性。
展开更多
关键词
循环卷积神经网络
印刷体
藏文
识别
图像序列识别
印刷体
藏文
乌梅识别
藏文字
丁切分
在线阅读
下载PDF
职称材料
关于藏族语文之现代化研究
11
作者
于洪志
《西北民族学院学报(哲学社会科学版)》
2002年第3期72-75,共4页
影响藏族地区社会发展的原因是多方面的 ,其中藏汉双语教育和藏族语言文字能否实现现代化是重要的因素之一。我国藏文信息技术具有全方位、多次层处理藏文自然科学和社会科学的能力。
关键词
语文现代化
信息处理
现代化
藏文字
处理软件
藏双语信息处理系统
在线阅读
下载PDF
职称材料
敦煌本《吐蕃大事纪年》部分地名及疑难词句研究
被引量:
3
12
作者
索南加
《西藏大学学报(社会科学版)》
CSSCI
北大核心
2021年第1期36-42,共7页
敦煌本《吐蕃大事纪年》是众所周知的研究吐蕃历史文化最重要的文献,自上世纪40年代由国外学者刊布译注本以来,极大地推动了吐蕃史等领域的研究。由于该文献成书年代较早,用词及文法规则也较现在存在诸多差异,因而在各种注疏中对部分词...
敦煌本《吐蕃大事纪年》是众所周知的研究吐蕃历史文化最重要的文献,自上世纪40年代由国外学者刊布译注本以来,极大地推动了吐蕃史等领域的研究。由于该文献成书年代较早,用词及文法规则也较现在存在诸多差异,因而在各种注疏中对部分词句的解释出现了错漏之处。文章利用各种新、旧研究成果,对《吐蕃大事纪年》中■之地望、659年条纪事内容,对■字之认识及几组动词的用法等方面,从词义学及地名学角度进行进一步分析并提出了新的看法。
展开更多
关键词
《吐蕃大事纪年》
藏文
■
字
659年条纪事
藏文
■与■
在线阅读
下载PDF
职称材料
题名
西藏大学藏文字文学馆简介
1
出处
《西藏大学学报(社会科学版)》
北大核心
2025年第2期F0002-F0002,F0003,共2页
文摘
西藏大学藏文字文学馆是我国首个以藏文字文学为主题的专题展馆,是依托西藏大学中国少数民族语言文学(藏语言文学)学科优势和专业特点重点打造的社科普及宣传基地,是西藏大学中国少数民族语言文学(藏语言文学)和西藏大学历史学专业实训基地;是集学术研究、教学实践和文化体验为一体的多功能平台。
关键词
专题展馆
藏文字
文学馆
西藏大学
分类号
G64 [文化科学—高等教育学]
在线阅读
下载PDF
职称材料
题名
一种基于向量模型的藏文字拼写检查方法
被引量:
14
2
作者
才智杰
孙茂松
才让卓玛
机构
青海师范大学计算机学院藏文信息处理教育部重点实验室
清华大学计算机科学与技术系清华信息科学与技术国家实验室
出处
《中文信息学报》
CSCD
北大核心
2018年第9期47-55,共9页
基金
国家自然科学基金(61163018
61262051
+14 种基金
61363055
61866032)
国家社会科学基金(13BYY141
16BYY167
15BYY167)
教育部"春晖计划"合作科研项目(Z2012093
Z2016077)
青海省基础研究项目(2017-ZJ-767
2014-SF-129
2015-SF-520)
"长江学者和创新团队发展计划"创新团队资助项目(IRT1068)
青海省重点实验室项目(2013-Z-Y32
2014-Z-Y32
2015-Z-Y03)
藏文信息处理与机器翻译重点实验室项目(2013-Y-17)
文摘
自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是藏文字拼写检查的基础和重点。该文通过分析藏文文法中的构字规则,利用藏文字向量模型将藏文字用计算机易于操作的数字(向量)表示,建立基于规则约束的藏文字向量模型,进而设计该模型下的藏文字拼写检查模型及算法。算法简单易实现,经测试算法拼写检查的平均准确率达99.995%,平均每秒检查1 060个字。
关键词
自然语言处理
向量模型
藏文字
拼写检查
非真
字
Keywords
NLP
vector model
Tibetan characters
spelling chezking
non-real characters
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
藏文字同现网络的小世界效应和无标度特性
被引量:
3
3
作者
才智杰
孙茂松
才让卓玛
机构
青海师范大学计算机学院藏文信息处理教育部重点实验室
清华大学计算机科学与技术系清华信息科学与技术国家实验室
出处
《中文信息学报》
CSCD
北大核心
2018年第10期45-52,共8页
基金
国家自然科学基金(61866032
61163018
+15 种基金
61262051
61363055
61662061)
国家社会科学基金(13BYY141
16BYY167
15BYY167)
教育部"春晖计划"合作科研项目(Z2012093
Z2016077)
青海省基础研究项目(2017-ZJ-767
2019-SF-129
2015-SF-520)
"长江学者和创新团队发展计划"创新团队资助项目(IRT1068)
青海省重点实验室项目(2013-Z-Y17
2014-Z-Y32
2015-Z-Y03)
藏文信息处理与机器翻译重点实验室项目(2013-Y-17)
文摘
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。
关键词
藏文字
同现网络
小世界效应
无标度特性
Keywords
Tibetan characters
co-occurrence network
small world effect
scale-free property
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
藏文字自动生成技术研究
被引量:
1
4
作者
才智杰
孙茂松
才让卓玛
机构
青海师范大学计算机学院藏文信息处理教育部重点实验室
清华大学计算机科学与技术系清华信息科学与技术国家实验室
出处
《高原科学研究》
2017年第1期98-103,共6页
基金
国家自然科学基金项目(61163018
61262051
+11 种基金
61662061)
国家哲学社会科学基金项目(13BYY141
16BYY167)
教育部"春晖计划"合作科研项目(Z2012093
Z2016077)
青海省基础研究项目(2017-ZJ-767
2015-SF-520)
"长江学者和创新团队发展计划"创新团队资助项目(IRT1068)
青海省重点实验室项目(2013-Z-Y17
2014-Z-Y32
2015-Z-Y03)
藏文信息处理与机器翻译重点实验室(2013-Y-17)
文摘
字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字符基字的竖直方向上所含成分将藏文字分成了8个大类,对不同类型藏文字分析了其生成模型及生成算法,经测试可自动生成符合现代藏文文法的所有现代藏文字。
关键词
中文信息处理
藏文字
自动生成
Keywords
Chinese information processing
Tibetan Character
automatic generation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
小字符集现代藏文排序技术的研究
被引量:
3
5
作者
完么扎西
尼玛扎西
机构
西藏大学工学院计科系
西藏大学现代教育技术中心
出处
《计算机工程与应用》
CSCD
2013年第8期146-150,共5页
基金
科技部973计划前期研究专项项目课题(No.2009CB326201)
"长江学者与创新团队发展计划"藏文信息技术创新团队计划(No.IRT0975)
"西藏大学211工程"三期项目
文摘
构成藏文音节的字母具有一定的顺序,ISO/IEC10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC10646(Tibetan)的藏文排序算法,主要思想是:从文本中读入藏文音节,并把它转化为一维的字母串;识别基字及调整构成藏文音节的字母(构件)顺序,并且在缺构件位置上添加相应的空格符;用快速排序法对藏文音节串进行排序;构成藏文音节的字母(构件)顺序调回到原来的顺序,去除空格符,并输出。
关键词
藏文
音节
现代
藏文字
词典排序规则
ISO
IEC
10646(Tibetan)
藏文
排序
Keywords
Tibetan syllable
Tibetan dictionary sort rules
ISO/IEC 10646(Tibetan)
Tibetan-sort
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
藏文编码字符集的扩充集在Linux上的实现
被引量:
5
6
作者
张兴亮
芮建武
谢谦
程伟
吴健
机构
中国科学院软件研究所开放系统与中文信息处理中心
出处
《中文信息学报》
CSCD
北大核心
2007年第2期122-128,共7页
基金
国家863计划资助项目(2003AA1Z2110
2002AA001033)
文摘
国内藏文软件开发普遍使用的是基于垂直预组合字符的实现方案,但是缺乏统一的编码标准。藏文编码字符集扩充集的推出,对于国内藏文软件的标准化、国际化具有重要意义。本文通过分析ISO/IEC 10646藏文编码字符集基本集、藏文编码字符集扩充集国家标准,区分它们描述字丁的差异,分析由编码方案所导致的实现上的关键问题。最后,针对藏文扩充集B的特殊性,提出并实现了基于Linux国际化架构下支持藏文扩充集标准的解决方案。
关键词
计算机应用
中文信息处理
藏文字
丁
扩充集OpenType
扩充QT方案
Keywords
computer application
Chinese information processing
Tibetan character set
Tibetan coded characterset extension A
Tibetan coded character set extension B
OpenType
extended QT solution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
现代藏文基字识别的算法设计
被引量:
3
7
作者
拉巴顿珠
欧珠
机构
西藏大学藏文信息技术研究中心
出处
《西藏大学学报(社会科学版)》
CSSCI
2016年第2期82-88,共7页
基金
2014年度西藏自治区哲学社会科学基金项目"藏语言文字现代化与信息化研究"(项目号:14AYY001)
2015年度西藏大学硕士研究生高水平人才培养项目"现代藏文基字识别的算法设计"阶段性成果
文摘
藏文基字是藏文字符的核心构件,能够在藏文音节结构中准确地识别基字,不仅有利于解析藏文字符的构件,对实现藏文排序算法也具有重要意义。文章依据藏文文法,严格遵循现代藏文音节字的结构特征,设计了现代藏文音节字的基字识别算法,并对不符合现代藏文构字规则的高频字进行了特殊处理,设计实现了现代藏文音节字的基字识别软件。该软件对18785个现代藏文音节字进行测试,识别率达到100%。
关键词
藏文字
处理
藏文
基
字
识别算法
Keywords
Tibetan processing
Tibetan base word
recognition algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于规则的现代藏文音节字检错研究
被引量:
6
8
作者
才让叁智
关白
机构
西藏大学信息科学技术学院
出处
《西藏大学学报(社会科学版)》
CSSCI
2017年第2期70-77,共8页
基金
2016年度西藏高校青年教师创新支持计划项目"藏文网页关键信息抽取技术研究"(项目号:QCZ2016-13)
2016年度西藏高校青年教师创新支持计划项目"现代藏文音节字表构建与音节字构件的识别研究"(项目号:QCZ2016-11)
2015年度珠峰学者人才发展支持计划--青年骨干教师项目阶段性成果
文摘
藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,对非规则音节字采用建立梵源藏文词典、音译藏文词典和本体非规则音节字词典进行检错。实验表明,文章提出的藏文音节字检错方法对报纸类藏文的检错率为100%。
关键词
藏文
音节
字
音节
字
组件
组合规则
检错
Keywords
Tibetan syllable words
Components of Syllable words
Combination rule
Error detection
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
现代藏文信息熵及其属性
被引量:
2
9
作者
完么扎西
尼玛扎西
机构
青海师范大学民族师范学院
西藏大学信息科学技术学院
出处
《西藏大学学报(社会科学版)》
CSSCI
2017年第2期51-57,共7页
文摘
文章将信息论的方法引入藏文信息处理技术研究领域,利用统计的方法研究了以字符为单位和以音节字为单位的藏文信息熵。通过对275万多音节字的大规模藏语单语语料进行统计,给出了以字符为统计单位和以音节字为统计单位的现代藏文的熵,其值分别为4.17和8.21比特,并从信息论的角度证明了藏文具有拼音文字和音节字特征的双重属性。
关键词
藏文字
符
藏文
(音节)
字
藏文
信息熵
Keywords
Tibetan Character
Tibetan syllable
Tibetan information Entropy
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
10
作者
才让当知
黄鹤鸣
李鑫元
张会云
机构
青海师范大学计算机学院
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室
青海师范大学藏文信息处理教育部重点实验室
出处
《中文信息学报》
CSCD
北大核心
2023年第12期62-69,75,共9页
基金
青海省科技计划项目(2017-GX-146)
国家自然科学基金(62066039,62166034)。
文摘
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文本识别。首先,在CNN的每个卷积层中添加循环连接,增强CNN提取乌梅字粘连片段的特征和集成上下文信息的能力;其次,对提取的图像文本特征序列采用BiLSTM进行建模;最后,采用字丁切分模块增强CTC对图像序列和标签对齐的监督能力。在自行构建的Cursive Script-C517测试数据集上,该模型的最高准确率和平均准确率分别达到了99.80%和91.43%,分别比基线提高了1.45和48.47个百分点。此外,通过字符级词典库训练,使模型的训练时间减少了13.63%。实验表明,该方法有效解决了乌梅字体中笔画粘连和交错现象严重导致的识别错误问题,显著提升了印刷体藏文乌梅识别精度,减少了训练时间,且具有较好的鲁棒性。
关键词
循环卷积神经网络
印刷体
藏文
识别
图像序列识别
印刷体
藏文
乌梅识别
藏文字
丁切分
Keywords
recurrent convolution neural network
printed Tibetan recognition
image sequence recognition
printed Tibetan cursive script recognition
Tibetan character segmentation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
H214 [语言文字—少数民族语言]
在线阅读
下载PDF
职称材料
题名
关于藏族语文之现代化研究
11
作者
于洪志
机构
西北民族学院信息所
出处
《西北民族学院学报(哲学社会科学版)》
2002年第3期72-75,共4页
文摘
影响藏族地区社会发展的原因是多方面的 ,其中藏汉双语教育和藏族语言文字能否实现现代化是重要的因素之一。我国藏文信息技术具有全方位、多次层处理藏文自然科学和社会科学的能力。
关键词
语文现代化
信息处理
现代化
藏文字
处理软件
藏双语信息处理系统
Keywords
Tibetan
modernization of language
Tibetan language
information processing
分类号
H214 [语言文字—少数民族语言]
在线阅读
下载PDF
职称材料
题名
敦煌本《吐蕃大事纪年》部分地名及疑难词句研究
被引量:
3
12
作者
索南加
机构
西南民族大学西南民族研究院
出处
《西藏大学学报(社会科学版)》
CSSCI
北大核心
2021年第1期36-42,共7页
基金
2017年度国家社会科学基金重大项目“《敦煌本吐蕃历史文书》相关民族、人物、事件研究及分年分类辑注”阶段性成果,批准号:17ZDA212。
文摘
敦煌本《吐蕃大事纪年》是众所周知的研究吐蕃历史文化最重要的文献,自上世纪40年代由国外学者刊布译注本以来,极大地推动了吐蕃史等领域的研究。由于该文献成书年代较早,用词及文法规则也较现在存在诸多差异,因而在各种注疏中对部分词句的解释出现了错漏之处。文章利用各种新、旧研究成果,对《吐蕃大事纪年》中■之地望、659年条纪事内容,对■字之认识及几组动词的用法等方面,从词义学及地名学角度进行进一步分析并提出了新的看法。
关键词
《吐蕃大事纪年》
藏文
■
字
659年条纪事
藏文
■与■
Keywords
Old Tibetan Annals
the Tibetan word■
the events occurred in 659
the Tibetan words■and■
分类号
K870.6 [历史地理—考古学及博物馆学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
西藏大学藏文字文学馆简介
《西藏大学学报(社会科学版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
一种基于向量模型的藏文字拼写检查方法
才智杰
孙茂松
才让卓玛
《中文信息学报》
CSCD
北大核心
2018
14
在线阅读
下载PDF
职称材料
3
藏文字同现网络的小世界效应和无标度特性
才智杰
孙茂松
才让卓玛
《中文信息学报》
CSCD
北大核心
2018
3
在线阅读
下载PDF
职称材料
4
藏文字自动生成技术研究
才智杰
孙茂松
才让卓玛
《高原科学研究》
2017
1
在线阅读
下载PDF
职称材料
5
小字符集现代藏文排序技术的研究
完么扎西
尼玛扎西
《计算机工程与应用》
CSCD
2013
3
在线阅读
下载PDF
职称材料
6
藏文编码字符集的扩充集在Linux上的实现
张兴亮
芮建武
谢谦
程伟
吴健
《中文信息学报》
CSCD
北大核心
2007
5
在线阅读
下载PDF
职称材料
7
现代藏文基字识别的算法设计
拉巴顿珠
欧珠
《西藏大学学报(社会科学版)》
CSSCI
2016
3
在线阅读
下载PDF
职称材料
8
基于规则的现代藏文音节字检错研究
才让叁智
关白
《西藏大学学报(社会科学版)》
CSSCI
2017
6
在线阅读
下载PDF
职称材料
9
现代藏文信息熵及其属性
完么扎西
尼玛扎西
《西藏大学学报(社会科学版)》
CSSCI
2017
2
在线阅读
下载PDF
职称材料
10
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
才让当知
黄鹤鸣
李鑫元
张会云
《中文信息学报》
CSCD
北大核心
2023
0
在线阅读
下载PDF
职称材料
11
关于藏族语文之现代化研究
于洪志
《西北民族学院学报(哲学社会科学版)》
2002
0
在线阅读
下载PDF
职称材料
12
敦煌本《吐蕃大事纪年》部分地名及疑难词句研究
索南加
《西藏大学学报(社会科学版)》
CSSCI
北大核心
2021
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部