期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
藏文自动排序研究综述
1
作者
才让叁智
仁青东主
+2 位作者
多拉
洛桑嘎登
仁增多杰
《高原科学研究》
CSCD
2024年第2期106-117,共12页
藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值。藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂。文章对已...
藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值。藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂。文章对已有研究提出的藏文自动排序方法、规则、算法和模型等进行了较为全面的分析与总结,为研究人员了解藏文自动排序中的构件识别、排序规则和方法以及优化藏文自动排序相关工作提供参考。
展开更多
关键词
藏文自动排序
字符优先级
结构优先级
构件比较顺序
在线阅读
下载PDF
职称材料
基于深度学习的梵藏文本识别
2
作者
才让叁智
仁增多杰
+1 位作者
多拉
索南尖措
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2024年第6期1059-1066,共8页
[目的]梵藏文本识别是自动排序、词法分析和自动校对等研究的重要前期工作环节.当前基于规则的梵藏文本识别方法中存在无法有效识别短梵文词语等诸多问题.[方法]在自建的梵藏文本识别数据集上,采用基于双向长短时记忆网络和自注意力的...
[目的]梵藏文本识别是自动排序、词法分析和自动校对等研究的重要前期工作环节.当前基于规则的梵藏文本识别方法中存在无法有效识别短梵文词语等诸多问题.[方法]在自建的梵藏文本识别数据集上,采用基于双向长短时记忆网络和自注意力的梵藏文本识别方法、基于预训练语言模型CINO的梵藏文本识别方法和基于规则的梵藏文本识别方法之间进行实验对比,并分析它们的识别结果,进而选出最优的梵藏文本识别方法.[结果]基于双向长短时记忆网络和自注意力机制的梵藏文本识别模型的宏准确率、召回率和F1值分别达到了98.09%、99.22%和98.65%,其效果优于多语言预训练模型CINO和其他3种基于规则的方法.[结论]基于skip-gram、CBOW和GloVe的藏文字符表示模型使用相同的小规模、无重样的训练数据集时,CBOW的字符表示效果优于其他两者;训练数据相同的情况下,基于双向长短时记忆网络和自注意力机制的梵藏文本识别模型优于多语言预训练模型CINO,同时,也优于基于规则的梵藏文本识别模型.
展开更多
关键词
藏文信息处理
梵藏文本识别
字符表示
STTRM_BS模型
在线阅读
下载PDF
职称材料
题名
藏文自动排序研究综述
1
作者
才让叁智
仁青东主
多拉
洛桑嘎登
仁增多杰
机构
西藏大学
信息
科学
技术
学院
西北民族
大学
中国语言文学学部
西藏大学藏文信息技术国家地方联合工程研究中心
青海师范
大学
藏语智能
信息
处理及应用
国家
重点实验室
出处
《高原科学研究》
CSCD
2024年第2期106-117,共12页
基金
国家自然科学基金项目(62266037)
西藏大学校级科研培育基金项目(ZDCZJH19-19)
+1 种基金
西藏自治区自然基金项目(XZ202101ZR0108G)
省部共建藏语智能信息处理及应用国家重点实验室开放课题项目(2023-Z-006)。
文摘
藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值。藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂。文章对已有研究提出的藏文自动排序方法、规则、算法和模型等进行了较为全面的分析与总结,为研究人员了解藏文自动排序中的构件识别、排序规则和方法以及优化藏文自动排序相关工作提供参考。
关键词
藏文自动排序
字符优先级
结构优先级
构件比较顺序
Keywords
Tibetan automatic sorting
character priority
structure priority
component comparison order
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于深度学习的梵藏文本识别
2
作者
才让叁智
仁增多杰
多拉
索南尖措
机构
西藏大学
信息
科学
技术
学院
西北民族
大学
中国语言文学学部
西藏大学藏文信息技术国家地方联合工程研究中心
省部共建藏语智能
信息
处理及应用
国家
重点实验室
青海师范
大学
藏语智能
信息
处理及应用
国家
重点实验室
出处
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2024年第6期1059-1066,共8页
基金
国家自然科学基金项目(62266037)
西藏自治区自然科学基金项目(XZ202101ZR0108G)
+2 种基金
西藏大学珠峰学科建设计划项目(zf22002001)
西藏大学校级科研培育基金项目(ZDCZJH19-19)
西藏自治区科技厅中央引导地方科技发展资金(XZ202102YD0018C)。
文摘
[目的]梵藏文本识别是自动排序、词法分析和自动校对等研究的重要前期工作环节.当前基于规则的梵藏文本识别方法中存在无法有效识别短梵文词语等诸多问题.[方法]在自建的梵藏文本识别数据集上,采用基于双向长短时记忆网络和自注意力的梵藏文本识别方法、基于预训练语言模型CINO的梵藏文本识别方法和基于规则的梵藏文本识别方法之间进行实验对比,并分析它们的识别结果,进而选出最优的梵藏文本识别方法.[结果]基于双向长短时记忆网络和自注意力机制的梵藏文本识别模型的宏准确率、召回率和F1值分别达到了98.09%、99.22%和98.65%,其效果优于多语言预训练模型CINO和其他3种基于规则的方法.[结论]基于skip-gram、CBOW和GloVe的藏文字符表示模型使用相同的小规模、无重样的训练数据集时,CBOW的字符表示效果优于其他两者;训练数据相同的情况下,基于双向长短时记忆网络和自注意力机制的梵藏文本识别模型优于多语言预训练模型CINO,同时,也优于基于规则的梵藏文本识别模型.
关键词
藏文信息处理
梵藏文本识别
字符表示
STTRM_BS模型
Keywords
Tibetan information processing
Sanskrit-Tibetan text recognition
character representation
STTRM_BS model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
藏文自动排序研究综述
才让叁智
仁青东主
多拉
洛桑嘎登
仁增多杰
《高原科学研究》
CSCD
2024
0
在线阅读
下载PDF
职称材料
2
基于深度学习的梵藏文本识别
才让叁智
仁增多杰
多拉
索南尖措
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部