基于AR-HMM在线能量调整的语音增强方法被引量：6

Online Energy Adjustment Using AR-HMM for Speech Enhancement

在线阅读下载PDF

导出

摘要针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型(Auto-Regressive Hidden Markov Model,AR-HMM)和纯净语音的AR-HMM,在最小均方误差准则下估计语音和噪声的功率谱.考虑到非平稳环境中训练集和测试集的差异性,需在线调整语音模型和噪声模型中的能量,语音模型的能量调整采用迭代的期望最大化算法;噪声模型的能量调整则利用的是模型训练过程中的能量重估方法,并以最小值控制的递归平均算法确定噪声能量调整的初始值.在ITU-T G.160标准下对算法进行性能测试,测试结果表明,本文方法对非平稳噪声的跟踪效果较好,对噪声衰减量较大,收敛时间较短. Because the existing single channel speech enhancement technologies perform not w ell in the tracking and suppression of non-stationary noise,the speech enhancement method based on online energy adjustment is proposed.The normalized critical band energy parameters are employed as the feature in Gaussian mixture model（ GM M） to distinguish the background noises.Based on the AR-HM M of clean speech and the noise of corresponding type,the pow er spectrums of speech and noise are estimated under minimum mean square error（ M M SE） criteria.When the differences betw een the training data and test data are considered in the non-stationary noise environment,the online adjustment method for the speech and noise models is necessary.The scaling factor of speech energy is estimated w ith the iterative expectation maximization（ EM） algorithm and the one of noise energy is estimated with the re-estimation approach similar to the training stage.And the initial scaling factor of noise energy is obtained by minima-controlled recursive averaging（ M CRA） algorithm.The evaluation of the proposed method is performed under the standard of ITU-T G.160.The test results reveal that,comparing w ith the tw o reference methods,the proposed method performs w ell in non-stationary noise environments,including larger noise reduction and shorter convergence time.

作者何玉文鲍长春夏丙寅

机构地区北京工业大学电子信息与控制工程学院语音与音频信号处理实验室

出处《电子学报》 EI CAS CSCD 北大核心 2014年第10期1991-1997,共7页 Acta Electronica Sinica

基金国家自然科学基金(No.61072089) 北京市教育委员会科技发展计划重点项目(No.KZ201110005005)

关键词语音增强非平稳噪声隐马尔可夫模型高斯混合模型 speech enhancement non-stationary noise hidden M arkov model Gaussian mixture model

分类号 TP912.3 [自动化与计算机技术]

作者简介何玉文女，1988年生于北京，北京工业大学硕士研究生，主要研究方向为语音增强．E—mail：iamhyw@emails．Bjut．Edu．Cn 鲍长春男，1965年生于内蒙古赤峰，博士，北京工业大学教授、博士生导师，IEEE高级会员，国际语音通信学会（ISCh）会员，亚太信号与信息处理学会（APSIAP）会员，中国电子学会理事，中国声学学会理事，信号处理学会委员．主要研究方向为语音与音频信号处理．E-mail：chchbao@bjut．Edu．Cn 夏丙寅男，1986年生于北京，北京工业大学博士生，主要研究方向为语音编码与增强．E—mail：xby-abc@emails．bjut．edu．Cn

引文网络
相关文献

参考文献12

1Ephraim Y. A Bayesian estimation approach for speech en- hancement using hidden Markov models[J]. IEEE Transactious on Signal Processing, 1992,40(4) :725 - 735.
2Ephraim Y. Gain-adapted hidden Markov models for recogni- tion of clean and noisy speech[J]. IEEE Transactions on Signal Processing, 1992,40(6) : 1303 - 1316.
3Sameti H, Sheikhzadeh H, Deng L, Brennan R L. HMM-based strategies for enhancement of speech signals embedded in non- stationary noise [J]. IEEE Transactions on Speech and Audio Processing, 1998,6 (5) : 445 - 455.
4Srinivasan S, Samuelsson J, Kleijn W B. Codebook-based Bayesian speech enhancement[A].IEEE International Confer- ence on Acoustics, Speech, and Signal Processing[C]. IEEE, 2005.1077 - 1080.
5Zhao D Y, Kleijn W B. HMM-based gain modeling for en- hancement of speech in noise[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2007,15 (3) : 882 - 892.
6Zhao D Y, Kleijn W B, Ypma A, et al. Online noise estimation using stochastic-gain HMM for speech enhancement [J]. IEEE Transactions on Audio, Speech, and Language Processing, 2008,16(4) :835 - 846.
7Srinivasan S, Samuelsson J, Kleijn W B. Codebook-based Bayesian speech enhancement for nonstationary environments [J]. IEEE Transactions on Audio, Speech, and Language Pro- cessing,2007,15(2) :441 - 452.
8Varga A, Steeneken H J M. Assessment for automatic speech recognition: H. NOISEX-92: a database and an experiment to study the effect of additive noise on speech recognition systems [J]. Speech Communication, 1993,12 (3) :247 - 251.
9Johnston J D. Transform coding of audio signals using percep- tual noise criteria[J]. IEEE Journal on Selected Areas in Com- munications, 1988,6(2) :314 - 323.
10Ephraim Y. A minimum mean square error approach for speech enhancement[A]. International Conference on Acous- tics, Speech, and Signal Processing [ C ]. IEEE, 1990. 829 - 832.

同被引文献42

1王晶,傅丰林,张运伟.语音增强算法综述[J].声学与电子工程,2005(1):22-26. 被引量：22
2马秉伟,刘会金,周莉,崔福鑫.一种基于自回归模型的间谐波谱估计的改进算法[J].中国电机工程学报,2005,25(15):79-83. 被引量：47
3刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
4徐耀华,王刚,郭英.基于时频阈值的小波包语音增强算法[J].电子与信息学报,2008,30(6):1363-1366. 被引量：16
5ZHANG Yong,HU Ruimin.Speech wideband extension based on Gaussian mixture model[J].Chinese Journal of Acoustics,2009,28(4):362-377. 被引量：4
6龚亮,张艳萍.基于掩蔽效应的改进型自适应语音增强算法[J].南京信息工程大学学报（自然科学版）,2010,2(6):529-532. 被引量：6
7张雪英,贾海蓉,靳晨升.子空间与维纳滤波相结合的语音增强方法[J].计算机工程与应用,2011,47(14):146-148. 被引量：6
8曹玉萍.基于信号子空间的语音增强方法[J].电子测试,2012,23(6):54-57. 被引量：3
9李星秀,韦志辉.基于局部自回归模型的压缩感知视频图像递归重建算法[J].电子学报,2012,40(9):1795-1800. 被引量：5
10梁岩,鲍长春,夏丙寅,何玉文,周璇,李娜.基于高斯混合模型的压缩域语音增强方法[J].电子学报,2012,40(10):2031-2038. 被引量：9

引证文献6

1袁文浩,梁春燕,夏斌,孙文珠.一种融合相位估计的深度卷积神经网络语音增强方法[J].电子学报,2018,46(10):2359-2366. 被引量：7
2陈楠,鲍长春.基于双耳线索编码原理的语音增强方法[J].电子学报,2019,47(1):227-233. 被引量：3
3袁文浩,娄迎曦,梁春燕,夏斌.利用生成噪声提高语音增强方法的泛化能力[J].电子学报,2019,47(4):791-797. 被引量：6
4夏鼎,徐文涛.基于生成对抗网络合成噪声的语音增强方法研究[J].电子技术应用,2020,46(11):56-59. 被引量：5
5许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
6崔子豪,鲍长春.基于广义合成分析和深度神经网络的自回归系数估计方法[J].电子学报,2021,49(1):29-39. 被引量：4

二级引证文献25

1刘元,匡文凯,苏盛,李彬.基于双通道能量差的环网柜局放信号消噪方法[J].仪器仪表学报,2021,42(2):218-227. 被引量：8
2范珍艳,王莲子,庄晓东.基于FrFT的自适应阈值语音滤波降噪研究[J].青岛大学学报（工程技术版）,2019,34(4):18-23. 被引量：1
3方旖,毕大平,潘继飞,陈秋菊.基于神经网络的多功能雷达行为辨识方法[J].空军工程大学学报（自然科学版）,2020,21(3):78-84. 被引量：3
4王冬霞,张伟,于玲,刘孟美.基于BLSTM神经网络的回声和噪声抑制算法[J].信号处理,2020,36(6):991-1000. 被引量：8
5袁文浩,胡少东,时云龙,李钊,梁春燕.一种用于语音增强的卷积门控循环网络[J].电子学报,2020,48(7):1276-1283. 被引量：13
6李子珩.基于LSTM-RNN的多目标深度学习语音增强[J].IT经理世界,2020(2):91-91.
7田玉静,左红伟,王超.语声通信降噪研究[J].应用声学,2020,39(6):932-939. 被引量：1
8肖鑫鑫.复杂噪声环境下的普通话测试系统设计[J].信息技术,2020,44(11):78-82. 被引量：1
9曹洁,周尧风,于泓,李晓旭.基于SI-SDR优化的生成对抗网络语音增强方法[J].华中科技大学学报（自然科学版）,2020,48(11):17-23. 被引量：6
10郑昌艳,杨吉斌,张雄伟,孙蒙.在波形网络中融合相位信息的骨导语音增强[J].声学学报,2021,46(2):309-320. 被引量：5

1胡沙沙,周群彪,吕学斌,陈正茂.基于UKF滤波算法的语音增强技术[J].四川大学学报（自然科学版）,2006,43(5):996-1000. 被引量：3
2张恩东,黄文浩.基于小波变换和Kalman滤波的语音增强方法[J].模式识别与人工智能,2009,22(1):28-31. 被引量：4
3时文华,张雄伟,张瑞昕,韩伟.深度学习理论及其应用专题讲座(四) 第8讲深度学习方法在语音增强中的应用[J].军事通信技术,2016,37(3):98-104. 被引量：2
4汤少杰,黄魁东,吴青,王郑耀,范九伦.基于双侧滤波与短时傅里叶变换的改进双域滤波[J].计算机科学与探索,2015,9(11):1371-1381. 被引量：4
5徐嗣鑫,许小电.一类非平稳噪声扰动下的时变系统辨识[J].信息与控制,1992,21(6):369-373. 被引量：1
6黄东,宋文忠.用模型扩展法辨识具有非平稳扰动的系统[J].东南大学学报（自然科学版）,1990,20(3):66-73.
7刘钰,马艳丽,董蓓蓓.语音增强技术及算法综述[J].电脑编程技巧与维护,2010(16):88-89. 被引量：1
8听写机及其语音模型[J].科技开发动态,2003(8):24-24.
9顾成奎,王正欧.非平稳环境下提高神经网络辨识能力的新方法[J].系统工程学报,2003,18(4):300-305. 被引量：3
10黄苏雨,梁声灼,黄苏园.语音增强方法综述[J].计算机与现代化,2007(3):16-20. 被引量：17

电子学报

2014年第10期

浏览历史

内容加载中请稍等...

基于AR-HMM在线能量调整的语音增强方法被引量：6

参考文献12

同被引文献42

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于AR-HMM在线能量调整的语音增强方法 被引量：6

参考文献12

同被引文献42

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于AR-HMM在线能量调整的语音增强方法被引量：6