基于StarGAN-VC的语音风格转换技术

Speech Style Conversion Technology Based on StarGAN-VC

在线阅读下载PDF

导出

摘要文章基于星型生成式对抗网络-语音转换(Star Generative Adversarial Networks-Voice Conversion,StarGAN-VC)模型,研究了一种先进的语音风格转换技术,旨在实现对语音信号的高效转换。首先,详细阐述了基于StarGAN-VC的语音转换方法的基本原理。其次,深入研究特征提取和基频转换方法,以及StarGAN-VC模型的数学原理。最后,通过在VCC2018数据集上的实验,验证了该方法的性能。实验结果表明,该方法在频谱包络相似度和基频准确度等指标上均取得了令人满意的效果。 Based on the Star Generative Adversary Networks-Voice Conversion(StarGAN-VC)model,this paper studies an advanced voice style conversion technology,aiming at achieving efficient conversion of voice signals.Firstly,the basic principle of voice conversion method based on StarGAN-VC is expounded in detail.Secondly,the methods of feature extraction and fundamental frequency conversion and the mathematical principle of StarGAN-VC model are deeply studied.Finally,the performance of this method is verified by experiments on VCC2018 data sets.The experimental results show that this method has achieved satisfactory results in spectral envelope similarity and fundamental frequency accuracy.

作者申少鹏胡松涛 SHEN Shaopeng;HU Songtao(Henan Vocational and Technical College of Architecture,Zhengzhou 450000,China)

机构地区河南建筑职业技术学院

出处《电声技术》 2024年第1期35-37,共3页 Audio Engineering

关键词深度学习语言风格转换星型生成式对抗网络-语音转换(StarGAN-VC)模型频谱分析 deep learning language style conversion Star Generative Adversarial Networks-Voice Conversion(StarGAN-VC)model spectral analysis

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介申少鹏(1985-),男,硕士,助教,研究方向为计算机科学与技术。

引文网络
相关文献

参考文献10

1刘曙光,郑崇勋,刘明远.前馈神经网络中的反向传播算法及其改进:进展与展望[J].计算机科学,1996,23(1):76-79. 被引量：52
2王卓鑫,赵海涛,谢月涵,任翰韬,袁明清,张博明,陈吉安.反向传播神经网络联合遗传算法对复合材料模量的预测[J].上海交通大学学报,2022,56(10):1341-1348. 被引量：6
3唐诗尧,何佳,任锦胜,吴仕明,柳亦兵.基于频谱包络改进的EWT方法的滚动轴承故障诊断研究[J].可再生能源,2022,40(1):60-66. 被引量：5
4周义明,李英顺,田小平.基于瑞利多径衰落信道的信号包络频谱感知[J].电子与信息学报,2020,42(5):1231-1236. 被引量：4
5陈军波,刘蓉,刘明,冯杨.基于条件生成式对抗网络的面部表情迁移模型[J].计算机工程,2020,46(4):228-235. 被引量：3
6许新征,常建英,丁世飞.基于StarGAN和类别编码器的图像风格转换[J].软件学报,2022,33(4):1516-1526. 被引量：5
7高俊峰,陈俊国.基于Style-CycleGAN-VC的非平行语料下的语音转换[J].计算机应用与软件,2021,38(9):133-139. 被引量：3
8甘玉珏,苏军根,林健,洪博宇,鲁维.智能语音产品现状及展望[J].广东通信技术,2017,37(12):66-68. 被引量：20
9张雁冰,方雪,吕巍.人工智能语音助手智能程度对消费者使用意愿的影响研究[J].上海管理科学,2020,42(4):11-15. 被引量：6
10刘豫军,夏聪.计算机语音合成技术研究及发展方向[J].网络安全技术与应用,2014(12):22-22. 被引量：4

二级参考文献26

1阿日木扎,包春梅,马占新.语音合成技术及其研究进展[J].内蒙古科技与经济,2010(18):31-33. 被引量：4
2李生.自然语言处理的研究与发展[J].燕山大学学报,2013,37(5):377-384. 被引量：51
3陈拥权,张羽,胡翀豪,楚瑾.计算机语音合成技术研究及发展方向[J].科技与企业,2014(1):125-125. 被引量：1
4程军圣,李海龙,杨宇.改进ITD和能量矩在齿轮故障诊断中的应用[J].振动．测试与诊断,2013,33(6):954-959. 被引量：17
5贾熹滨,尹宝才,孙艳丰.基于双层码本的语音驱动视觉语音合成系统[J].计算机科学,2014,41(1):100-104. 被引量：2
6徐英进,贾珈,蔡莲红.汉语语音合成中说话人自适应的时长优化[J].清华大学学报（自然科学版）,2013,53(11):1597-1600. 被引量：1
7林小平,鲁青,郭伟,邓杰航,王超.一种SmartFusion FPGA的快速语音合成系统设计[J].广东工业大学学报,2014,31(2):43-48. 被引量：4
8卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：577
9杨红,程万里,任丽丽.高温高压蒸汽改性落叶松木材力学性能预测模型的建立[J].东北林业大学学报,2016,44(4):77-80. 被引量：1
10周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1834

共引文献98

1王懿.刍议智能语音技术的应用与风险防范[J].法制与社会（旬刊）,2020(14):222-223. 被引量：3
2裴淑红.运用结构性神经网络预测上海市国际集装箱生成量[J].北京城市学院学报,2002(1):47-51. 被引量：1
3肖俊芳,王耀青.一种激励函数可调的快速BP算法[J].自动化技术与应用,2002(6):26-29. 被引量：10
4高志明,关岩,于洪梅,吴秀红,李井会.人工神经网络在化学中的应用进展[J].鞍山科技大学学报,2000,23(3):164-169. 被引量：4
5李国玉,孙以材,潘国峰,何平.基于BP网络的压力传感器信息融合[J].仪器仪表学报,2005,26(2):168-171. 被引量：27
6赵基花,付永锋,沈冰,张西乾.建立水库优化调度函数的人工神经网络方法研究[J].水电能源科学,2005,23(2):28-30. 被引量：4
7苏小红,王亚东,马培军.基于反馈调控参数的BP学习算法研究[J].哈尔滨工业大学学报,2005,37(10):1311-1314. 被引量：5
8柯达重组完成战略布局[J].印刷世界,2006(2):58-58.
9杨俊东,杨崇.基于BP神经网络的图像异常辩识算法设计[J].辽宁工程技术大学学报（自然科学版）,2007,26(5):740-743.
10邓斌,周志刚,马泽粦,易来龙,张锡萍,郭晃潮,梅月志.肺结核病与气象因素关系的BP神经网络模型研究[J].国际医药卫生导报,2008,14(1):17-20. 被引量：7

电声技术

2024年第1期

浏览历史

内容加载中请稍等...

基于StarGAN-VC的语音风格转换技术

参考文献10

二级参考文献26

共引文献98

相关作者

相关机构

相关主题

浏览历史