-
题名基于预训练的符号化音乐生成
- 1
-
-
作者
洪予晨
李金龙
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《计算机应用》
北大核心
2025年第2期578-583,共6页
-
文摘
为解决音乐表征学习领域缺少充足成对多轨乐谱数据集的问题,提出一种音乐生成的预训练模型。首先,基于多轨音乐的生成需要保证单轨内的连续性的同时保证轨道间的和谐性的事实,提出基于Transformers的多生成器的生成模型,即基于预训练的多轨音乐生成网络(MMGPNet)作为基线模型;其次,为利用充足的单轨乐器数据集,在生成模型上设计音乐预训练模块;最后,在预训练过程中设计一个重建任务遮盖音乐符号的属性并对它们进行重建。实验结果表明,所提模型加速了模型训练,并提高了预测准确率,且该模型生成的多轨序列在多种音乐领域的评价指标相较于MuseGAN(Multi-track sequential Generative Adversarial Network)、SymphonyNet等基线模型更接近真实音乐。听力测试结果进一步验证了所提模型的有效性。
-
关键词
音乐生成
多轨音乐
序列模型
预训练模型
音乐序列表示
-
Keywords
music generation
multi-track music
sequence model
pre-training model
music sequence representation
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
TP18
[自动化与计算机技术—控制理论与控制工程]
-