期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于隔行对照标注策略的少数民族古文献开发研究——以藏文古文献隔行标注为例
1
作者
龙从军
安波
赵维纳
《中文信息学报》
北大核心
2025年第3期49-58,共10页
少数民族古籍是我国古籍文献的重要组成部分,是中华文明不可或缺的文明成果。但受制于语言文字识读的限制,参与民族古籍整理、挖掘和开发利用的研究团队规模小,技术力量不足,民族古籍文献的利用和普及传播力度不够。基于此,该文提出民...
少数民族古籍是我国古籍文献的重要组成部分,是中华文明不可或缺的文明成果。但受制于语言文字识读的限制,参与民族古籍整理、挖掘和开发利用的研究团队规模小,技术力量不足,民族古籍文献的利用和普及传播力度不够。基于此,该文提出民族古籍隔行对照标注策略,旨在一定程度上解决文字识读困难,鼓励更多跨学科研究者参与民族古籍文献的研究,提高民族古籍开发效率。该文以藏文古文献为例,探索隔行标注策略,在人工标注一定规模语料的前提下,提出了基于多任务学习的隔行对照标注策略。该方法有效提升了隔行数据标注速度,减少了人工标注的工作量,有利于构建大规模的隔行对照数据库。实验结果表明,经过10000条标注语料训练后,该模型在分词行和标注行上分别取得70.9%和63.2%的F 1值,在翻译行上取得18.7%的BLEU值。基于隔行对照标注策略的方法显著地提升了民族古文献的研究范围和深度,避免了民族语本身带来的限制,为挖掘和弘扬中华民族传统文化贡献力量。
展开更多
关键词
藏文古文献
隔行标注
多任务学习
机器学习
民族
古文献
在线阅读
下载PDF
职称材料
题名
基于隔行对照标注策略的少数民族古文献开发研究——以藏文古文献隔行标注为例
1
作者
龙从军
安波
赵维纳
机构
中国社会科学院大学文学院
青海师范大学计算机学院
出处
《中文信息学报》
北大核心
2025年第3期49-58,共10页
基金
中国社会科学院实验室综合资助项目(2024SYZH005)
国家自然科学基金(62266036)。
文摘
少数民族古籍是我国古籍文献的重要组成部分,是中华文明不可或缺的文明成果。但受制于语言文字识读的限制,参与民族古籍整理、挖掘和开发利用的研究团队规模小,技术力量不足,民族古籍文献的利用和普及传播力度不够。基于此,该文提出民族古籍隔行对照标注策略,旨在一定程度上解决文字识读困难,鼓励更多跨学科研究者参与民族古籍文献的研究,提高民族古籍开发效率。该文以藏文古文献为例,探索隔行标注策略,在人工标注一定规模语料的前提下,提出了基于多任务学习的隔行对照标注策略。该方法有效提升了隔行数据标注速度,减少了人工标注的工作量,有利于构建大规模的隔行对照数据库。实验结果表明,经过10000条标注语料训练后,该模型在分词行和标注行上分别取得70.9%和63.2%的F 1值,在翻译行上取得18.7%的BLEU值。基于隔行对照标注策略的方法显著地提升了民族古文献的研究范围和深度,避免了民族语本身带来的限制,为挖掘和弘扬中华民族传统文化贡献力量。
关键词
藏文古文献
隔行标注
多任务学习
机器学习
民族
古文献
Keywords
Tibetan ancient ethnic documents
interlinearized
multi-task learning
machine learning
ancient ethnic documents
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于隔行对照标注策略的少数民族古文献开发研究——以藏文古文献隔行标注为例
龙从军
安波
赵维纳
《中文信息学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部