期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于通用大模型的民族语言大模型构建技术
1
作者
余杰
飞龙
+9 位作者
郭陆祥
尼玛扎西
汤勇韬
李莎莎
郑思
刘晓东
马俊
李琢
王倚晴
李剑峰
《中文信息学报》
北大核心
2025年第8期75-81,共7页
通用大模型是人工智能领域中的一项重要且基础性的研究工作。该文根据民族语言结构特征,在分析民族语言规则、难点以及创新方法的基础上,建立大模型语料库,提出一种基于通用大模型的民族语言大模型构建方法。首先,通过民族语言信息嵌入...
通用大模型是人工智能领域中的一项重要且基础性的研究工作。该文根据民族语言结构特征,在分析民族语言规则、难点以及创新方法的基础上,建立大模型语料库,提出一种基于通用大模型的民族语言大模型构建方法。首先,通过民族语言信息嵌入将输入序列映射到通用大模型的语义空间,解决了民族语言输入适配大模型的难题;其次,通用大模型将不同的民族语言的表示作为输入,并进行语义理解和推理;然后,利用4层Transformer和编码器实现语言的输出对齐;最后,对整体模型进行指令微调,提升民族语言大模型的句子级语义理解能力、Token级语义理解能力和翻译能力。该文以启元国家实验室的九格大模型和内蒙古大学的蒙古文语料为基础,基于上述方法实现了蒙古文大模型。实验表明,该模型的分类评估F 1值和生成能力评估BLEU值分别为82.9%和39.5%,并通过12组组合实验进一步验证了其通用性与有效性。
展开更多
关键词
民族语言大模型
语义对齐
指令微调
在线阅读
下载PDF
职称材料
题名
基于通用大模型的民族语言大模型构建技术
1
作者
余杰
飞龙
郭陆祥
尼玛扎西
汤勇韬
李莎莎
郑思
刘晓东
马俊
李琢
王倚晴
李剑峰
机构
国防科技大学计算机学院
内蒙古大学计算机学院
西藏大学信息科学技术学院
启元实验室
麒麟软件有限公司
出处
《中文信息学报》
北大核心
2025年第8期75-81,共7页
基金
国家自然科学基金(62066033)
湖南省自然科学基金(2022JJ30046,2022JJ30668)
内蒙古自然科学基金杰出青年基金(2022JQ05)。
文摘
通用大模型是人工智能领域中的一项重要且基础性的研究工作。该文根据民族语言结构特征,在分析民族语言规则、难点以及创新方法的基础上,建立大模型语料库,提出一种基于通用大模型的民族语言大模型构建方法。首先,通过民族语言信息嵌入将输入序列映射到通用大模型的语义空间,解决了民族语言输入适配大模型的难题;其次,通用大模型将不同的民族语言的表示作为输入,并进行语义理解和推理;然后,利用4层Transformer和编码器实现语言的输出对齐;最后,对整体模型进行指令微调,提升民族语言大模型的句子级语义理解能力、Token级语义理解能力和翻译能力。该文以启元国家实验室的九格大模型和内蒙古大学的蒙古文语料为基础,基于上述方法实现了蒙古文大模型。实验表明,该模型的分类评估F 1值和生成能力评估BLEU值分别为82.9%和39.5%,并通过12组组合实验进一步验证了其通用性与有效性。
关键词
民族语言大模型
语义对齐
指令微调
Keywords
large language model of national language
semantic alignment
instruction fine-tuning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于通用大模型的民族语言大模型构建技术
余杰
飞龙
郭陆祥
尼玛扎西
汤勇韬
李莎莎
郑思
刘晓东
马俊
李琢
王倚晴
李剑峰
《中文信息学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部