基于BLSTM-CTC的语音特征的音素识别研究被引量：1

Research on Phoneme Recognition Based on Speech Features

在线阅读下载PDF

导出

摘要音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能。本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能。 Phoneme is the smallest modeling unit in natural language,and the quality of phoneme recognition model directly affects the performance of keyword retrieval and continuous speech recognition.This paper firstly conducts a series of comparative experimental studies on the amplitude feature MSRCC and the phase feature PSRCC,and finds that the fusion of the amplitude fea⁃ture and the phase feature can achieve better recognition results;For phoneme recognition,simulation experiments show that the acoustic model based on BLSTM-CTC has better recognition performance than other models.

作者吴丹丹夏秀渝 Wu Dandan;Xia Xiuyu(College of Electronic and Information Engineering,Sichuan University,Chengdu 610065)

机构地区四川大学电子信息学院

出处《现代计算机》 2022年第10期32-38,共7页 Modern Computer

关键词音素识别深度神经网络语音特征 phoneme recognition deep neural network acoustic characteristics

分类号 TN912.34 [电子电信—通信与信息系统]

作者简介吴丹丹(1997-),女,四川广元人,硕士,学生,研究方向为语音信号处理、语音识别;夏秀渝(1970-),女,四川成都人,博士,副教授,研究方向为语音信号处理。

引文网络
相关文献

参考文献2

1余琳,姜囡.基于Gammatone滤波器的混合特征语音情感识别[J].光电技术应用,2020,35(3):50-54. 被引量：7
2刘晓峰,宋文爱,陈小东,郇晋侠,李志媛.基于多核卷积融合网络的BLSTM-CTC语音识别[J].计算机应用与软件,2021,38(11):167-173. 被引量：13

二级参考文献13

1赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
2韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：172
3徐照松,元建.基于BP神经网络的语音情感识别研究[J].软件导刊,2014,13(4):11-13. 被引量：6
4茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
5林海波,王可佳.一种新的听觉特征提取算法研究[J].南京邮电大学学报（自然科学版）,2017,37(2):27-32. 被引量：11
6王庆楠,郭武,解传栋.基于端到端技术的藏语语音识别[J].模式识别与人工智能,2017,30(4):359-364. 被引量：8
7周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1836
8马志强,李图雅,闫瑞,张力.一种构建自适应蒙古语语音识别声学模型的方法[J].计算机应用与软件,2018,35(2):167-171. 被引量：1
9周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：44
10罗相林,秦雪佩,贾年.基于MFCC及其一阶差分特征的语音情感识别研究[J].现代计算机,2019,25(11):20-24. 被引量：6

共引文献18

1张金光,孔江平.基于wav2vec2的普通话音素识别分析[J].中国语音学报,2023(2):159-166.
2华春梦,臧艳辉,马伙财.一种基于CRNN的车牌识别算法研究与应用[J].现代信息科技,2021,5(20):78-81. 被引量：5
3王磊磊,张嵩阳,王枭,张光明,王广周,王东晖.基于听觉谱特征的变压器绕组状态检测研究[J].应用声学,2022,41(2):216-224. 被引量：3
4陈亮,邵玉斌,龙华,杜庆治,彭艺,唐维康.基于时域Gammatone滤波特征的广播语种识别[J].信号处理,2022,38(3):599-608. 被引量：4
5张敏,贾海蓉,张刚敏,王素英.结合自适应软掩模和混合特征的语音增强[J].西安电子科技大学学报,2022,49(2):108-115.
6邵玉斌,陈亮,龙华,杜庆治.基于改进GFCC特征参数的广播音频语种识别[J].吉林大学学报（理学版）,2022,60(2):417-424. 被引量：1
7陈严,李浩.基于机器学习算法的中文语音识别效果评估方法[J].信息记录材料,2022,23(8):97-99. 被引量：3
8蔡先治,王栋,鲁旭葆,苗泽宇.基于改进的Yolov5的端到端车牌识别算法[J].计算机时代,2022(12):28-33. 被引量：5
9张鹏程,吐松江·卡日,伊力哈木·亚尔买买提,刘萍,邸强,李振恩.基于YOLOv5与改进VGG-CTC的数字仪表自动读数方法[J].现代电子技术,2023,46(2):107-112. 被引量：2
10张冠萍.英语机器翻译人翻译错误自动检测系统研究[J].自动化与仪器仪表,2022(12):132-137. 被引量：1

同被引文献9

1张毅,谢延义,罗元,席兵.一种语音特征提取中Mel倒谱系数的后处理算法[J].智能系统学报,2016,11(2):208-215. 被引量：12
2张来洪,邱波,刘红玉.一种基于感知特征动态失真度量的语音质量评估算法[J].自动化技术与应用,2017,36(4):1-4. 被引量：3
3林海波,王可佳.一种新的听觉特征提取算法研究[J].南京邮电大学学报（自然科学版）,2017,37(2):27-32. 被引量：11
4杨明极,张贵山.基于栈式自动编码机的语音质量评价方法[J].小型微型计算机系统,2018,39(10):2134-2137. 被引量：3
5宣章健,蔡晓霞,廖锡畅,丁睿.一种基于改进Mel倒谱的语音质量评估方法[J].电子信息对抗技术,2019,34(1):51-55. 被引量：2
6曾春艳,马超峰,王志锋,孔祥斌.基于卷积神经网络的鲁棒性说话人识别方法[J].华中科技大学学报（自然科学版）,2020,48(6):39-44. 被引量：10
7李兆悦.面向管制员语音疲劳判别任务的语音特征提取研究[J].航空计算技术,2020,50(5):56-60. 被引量：5
8李江岱,段云涛,胡四平.基于LM-BP神经网络的采摘机器人语音智能识别系统[J].农机化研究,2021,43(9):215-218. 被引量：14
9芮贤义,陈小平,俞一彪.基于高斯混合模型的说话人识别系统实验设计[J].实验技术与管理,2022,39(2):166-170. 被引量：2

引证文献1

1傅强,李贵民,吴岳洲.基于BP神经网络的管制语音质量评价方法[J].航空计算技术,2023,53(3):1-5. 被引量：1

二级引证文献1

1阮西玥,许政,黄鹤.基于BP神经网络的生产效能评价方法[J].航空计算技术,2024,54(5):79-83.

1何立,刘丹阳.从文献角度浅谈中国持久性有机污染物研究工作的发展[J].环境与发展,2022,34(5):103-108.
2兰朝凤,刘岩,赵宏运,刘春东.基于波束形成的长短时记忆网络语音分离算法研究[J].电子与信息学报,2022,44(7):2531-2538. 被引量：3
3赵恺捷,朱永强,郑焓,项倩红.基于语音识别的语音保密信息监管算法[J].网络安全技术与应用,2022(6):36-38.
4蓝康澍,雷柞,何祎雯,高龙鑫,潘传英,王勇胜.利用文献计量学解析全球miRNA最新研究趋势[J].中国畜禽种业,2022,18(6):26-30. 被引量：3
5王保成,刘利军,黄青松.面向中文医疗问答网站的相似问题检索研究[J].中文信息学报,2022,36(6):135-145. 被引量：2
6吴圣洁,朱余兵,荆莉.多奈哌齐治疗阿尔茨海默病导致的窦性心动过缓及文献回顾[J].中国新药杂志,2022,31(11):1132-1136. 被引量：3
7荣红国,李琪,董玥,夏如玉,费宇彤.基于政策工具的我国儿童用药政策分析[J].中国药房,2022,33(14):1665-1670. 被引量：9
8禹定乐,李莉,陈杰华,李雨铮,郑跃杰,王文建.肺炎链球菌相关溶血尿毒综合征1例[J].中国微生态学杂志,2022,34(5):553-556. 被引量：1

现代计算机

2022年第10期

浏览历史

内容加载中请稍等...

基于BLSTM-CTC的语音特征的音素识别研究被引量：1

参考文献2

二级参考文献13

共引文献18

同被引文献9

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于BLSTM-CTC的语音特征的音素识别研究 被引量：1

参考文献2

二级参考文献13

共引文献18

同被引文献9

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于BLSTM-CTC的语音特征的音素识别研究被引量：1