检索结果-维普期刊中文期刊服务平台

融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法被引量：1: 1; 作者鲁超峰陶冶 +4 位作者文连庆孟菲秦修功杜永杰田云龙《计算机应用》北大核心 2025年第3期815-822,共8页; 针对很少有人将说话人转换和情感转换结合起来研究,且实际场景中的目标说话人情感语料通常很少,不足以从头训练一个强泛化性模型的问题,提出一种融合大语言模型和预训练情感语音合成模型的少量语料说话人-情感语音转换(LSEVC)方法。首先... 展开更多; 关键词少量语料说话人-情感语音转换大语言模型预训练情感语音合成模型微调; 在线阅读下载PDF 职称材料

维吾尔语情感语音韵律转换研究被引量：2: 2; 作者杜楠楠赵晖《计算机工程与应用》 CSCD 北大核心 2016年第19期154-160,共7页; 面向维吾尔语情感语音转换,提出一种韵律建模转换方法。该方法结合了维吾尔语韵律特点及语言特点,首次利用离散余弦变换(DCT)分别参数化维吾尔语音节和韵律短语的情感基频。采用高斯混合模型(GMM)训练中性-情感基频联合特征,同时合成中... 展开更多; 关键词基频情感语音转换离散余弦变换高斯混合模型音节韵律短语; 在线阅读下载PDF 职称材料

基于非负矩阵分解的情感语音基频转换研究被引量：1: 3; 作者邓叶勋赵晖《计算机工程》 CAS CSCD 北大核心 2018年第5期256-261,共6页; 为解决情感语音基频转换过程中基频建模的间断性问题,提高生成语音的情感自然度,利用非负矩阵分解(NMF)技术,提出带有参数控制的情感语音基频转换方法。选择连续小波变换参数化基频并对语音韵律结构中的各层级进行独立建模,采用NMF将基... 展开更多; 关键词情感语音转换连续小波变换非负矩阵分解基频转换韵律层级; 在线阅读下载PDF 职称材料

基于多领域条件生成的语音情感转换被引量：1: 4; 作者姚文翰柯登峰 +3 位作者黄良杰胡睿欣项敏特张劲松《郑州大学学报（理学版）》 CAS 北大核心 2023年第5期67-72,共6页; 语音情感转换是在不改变话者声纹、语义的情况下,将一种情感语音转换成另一种情感语音的技术,本质是实现语音的风格迁移。主流的风格迁移技术有对抗生成技术(如CycleGAN,StarGAN)和实例规一化技术(如IN,CIN)。CIN相对于IN添加了均值方... 展开更多; 关键词语音情感转换域转换条件实例归一化生成对抗网络; 在线阅读下载PDF 职称材料

题名融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法被引量：1: 1; 作者鲁超峰陶冶文连庆孟菲秦修功杜永杰田云龙; 机构青岛科技大学信息科学技术学院临沂大学信息科学与工程学院北京机械工业自动化研究所有限公司数字家庭网络国家工程实验室; 出处《计算机应用》北大核心 2025年第3期815-822,共8页; 基金国家重点研发计划项目(2023YFF0612100) 青岛市关键技术攻关及产业化示范类项目(24-1-2-qljh-19-gx)。; 文摘针对很少有人将说话人转换和情感转换结合起来研究,且实际场景中的目标说话人情感语料通常很少,不足以从头训练一个强泛化性模型的问题,提出一种融合大语言模型和预训练情感语音合成模型的少量语料说话人-情感语音转换(LSEVC)方法。首先,使用大语言模型生成带有所需情感标签的文本;其次,使用目标说话人语料微调预训练情感语音合成模型以嵌入目标说话人;然后,将生成的文本合成情感语音,以达到数据增强的目的;再次,使用合成语音与源目标语音共同训练说话人-情感语音转换模型;最后,为了进一步提升转换语音的说话人相似度和情感相似度,使用源目标说话人情感语音微调模型。在公共语料库和一个中文小说语料库上的实验结果表明,综合考虑评价指标情感相似度平均得分(EMOS)、说话人相似度平均意见得分(SMOS)、梅尔倒谱失真(MCD)和词错误率(WER)时,所提方法优于CycleGAN-EVC、Seq2Seq-EVC-WA2和SMAL-ET2等方法。; 关键词少量语料说话人-情感语音转换大语言模型预训练情感语音合成模型微调; Keywords limited corpus speaker-emotion voice conversion large language model pre-trained emotional speech synthesis model fine-tuning; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名维吾尔语情感语音韵律转换研究被引量：2: 2; 作者杜楠楠赵晖; 机构新疆大学信息科学与工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2016年第19期154-160,共7页; 基金国家自然科学基金(N0.61261037); 文摘面向维吾尔语情感语音转换,提出一种韵律建模转换方法。该方法结合了维吾尔语韵律特点及语言特点,首次利用离散余弦变换(DCT)分别参数化维吾尔语音节和韵律短语的情感基频。采用高斯混合模型(GMM)训练中性-情感基频联合特征,同时合成中性语速情感语音和情感语速情感语音,主观评测结果显示情感语速更有助于表达情感效果。主客观实验结果显示转换方法可有效进行维吾尔语情感韵律转换,三种情感下,音节和韵律短语的结果均达到75%以上,韵律短语的转换效果要稍优于音节。; 关键词基频情感语音转换离散余弦变换高斯混合模型音节韵律短语; Keywords fundamental frequency emotional speech conversion Discrete Cosine Transform(DCT) Gaussian Mixture Model(GMM) syllable prosodic phrase; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于非负矩阵分解的情感语音基频转换研究被引量：1: 3; 作者邓叶勋赵晖; 机构新疆大学信息科学与工程学院; 出处《计算机工程》 CAS CSCD 北大核心 2018年第5期256-261,共6页; 基金国家自然科学基金(61561047); 文摘为解决情感语音基频转换过程中基频建模的间断性问题,提高生成语音的情感自然度,利用非负矩阵分解(NMF)技术,提出带有参数控制的情感语音基频转换方法。选择连续小波变换参数化基频并对语音韵律结构中的各层级进行独立建模,采用NMF将基频特征数据分解为基范例及其对应的权重,将目标基范例替换待转换语音基范例并重建目标语音基频。此外,引入激活度调整因子作为参数控制对现有模型进行优化。实验结果表明,在小数据库语料中,该方法在基频重建误差与情感力度方面都显示出优势,且能够有效地将中性语音转换为情感语音。; 关键词情感语音转换连续小波变换非负矩阵分解基频转换韵律层级; Keywords emotional voice conversion Continuous Wavelet Transform （CWT） Non-negative Matrix Factorization（NMF） F0 conversion prosody level; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于多领域条件生成的语音情感转换被引量：1: 4; 作者姚文翰柯登峰黄良杰胡睿欣项敏特张劲松; 机构北京语言大学信息科学学院; 出处《郑州大学学报（理学版）》 CAS 北大核心 2023年第5期67-72,共6页; 基金汉考国际科研基金项目(HT-202011-374)。; 文摘语音情感转换是在不改变话者声纹、语义的情况下,将一种情感语音转换成另一种情感语音的技术,本质是实现语音的风格迁移。主流的风格迁移技术有对抗生成技术(如CycleGAN,StarGAN)和实例规一化技术(如IN,CIN)。CIN相对于IN添加了均值方差选择性模块,具有更强的风格迁移能力。提出了将StarGAN和CIN结合的语音情感转换模型CIN-StarGAN,将CIN模块嵌入到StarGAN生成器。在ESD数据集上的实验结果表明,CINStarGAN比基于CycleGAN的情感转换模型收敛速度快28%,具有较好的风格转换能力。在多领域情感转换方法上具有潜在研究价值。; 关键词语音情感转换域转换条件实例归一化生成对抗网络; Keywords emotional speech conversion domain transfer conditional instance normalization generator adversarial network; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法	鲁超峰陶冶文连庆孟菲秦修功杜永杰田云龙	《计算机应用》北大核心	2025	1	在线阅读下载PDF 职称材料
2	维吾尔语情感语音韵律转换研究	杜楠楠赵晖	《计算机工程与应用》 CSCD 北大核心	2016	2	在线阅读下载PDF 职称材料
3	基于非负矩阵分解的情感语音基频转换研究	邓叶勋赵晖	《计算机工程》 CAS CSCD 北大核心	2018	1	在线阅读下载PDF 职称材料
4	基于多领域条件生成的语音情感转换	姚文翰柯登峰黄良杰胡睿欣项敏特张劲松	《郑州大学学报（理学版）》 CAS 北大核心	2023	1	在线阅读下载PDF 职称材料