-
题名基于预训练及控制码的藏文律诗自动生成方法
- 1
-
-
作者
色差甲
慈祯嘉措
才让加
华果才让
-
机构
藏语智能全国重点实验室
青海省藏文信息处理工程技术研究中心
-
出处
《中文信息学报》
北大核心
2025年第3期42-48,共7页
-
基金
青海省重点研发与转化计划项目(2022-GX-104)
青海师范大学青年科研基金(2024QER14)
藏语智能信息处理及应用国家重点实验室项目(2024-SK1-006)。
-
文摘
诗歌自动写作研究是自然语言生成的一个重要研究领域,被认为是极具挑战且有趣的任务之一。该文提出一种基于预训练及控制码的藏文律诗生成方法。在藏文预训练语言模型上进行微调后,生成质量显著提升;同时引入控制码后,在很大程度上确保了扣题程度,即关键词在生成诗作中的平均覆盖率居高。此外,在生成的诗作中,不仅提高了词汇的丰富性,而且生成结果的多样性也明显提升。测试表明,基于预训练及控制码的生成方法显著优于基线方法。
-
关键词
藏文律诗自动生成
藏文预训练模型
控制码
-
Keywords
automatic generation of Tibetan poems
Tibetan Pre-training Model
control code
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名注意力的端到端模型生成藏文律诗
被引量:1
- 2
-
-
作者
色差甲
华果才让
才让加
慈祯嘉措
柔特
-
机构
青海师范大学藏文信息处理教育部重点实验室
青海师范大学藏文信息处理与机器翻译省级重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2019年第4期68-74,共7页
-
基金
国家重点研发计划(2017YFB1402200)
国家自然科学基金(61063033
+2 种基金
61662061)
青海省科技厅项目(2015-SF-520)
国家社会科学基金(14BYY132)
-
文摘
文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验结果表明,该文提出的方法在藏文律诗生成结果中BLEU值和ROUGE值分别能达到59.27%、62.34%,并无需任何人为的特征设置。
-
关键词
藏文律诗生成
字嵌入
注意力机制
编码-解码器
-
Keywords
Tibetan poems generation
embedding
attention
encoder-decoder
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-