基于复数帧段特征的语音情感识别方法

A Method of Speech Emotion Recognition Based on Complex Frame Segment Feature

在线阅读下载PDF

导出

摘要提出了一种基于复数帧段特征的语音情感识别方法,采用相继的复数帧组成的特征参数矢量作为语音情感识别GMM的输入,能有效地在语音情感识别GMM中引入帧间相关动态信息,同时为了改善复数帧段输入GMM的输出概率密度函数性能,在GMM的前端增加语音帧段参数压缩的主分量分析神经网络(PCANN)。语音情感识别实验证实了引入帧间相关动态信息方法的有效性,新方法在识别率上较状态输出独立GMM方法有一定程度的提升。 A method of speech emotion recognition is proposed based on complex frame segment feature.Through combining several successive frames as a segmental unit witch is treated as an input vector for Gaussian Mixture Model(GMM).The inter-frame correlation information is effectively introduced into the process of speech emotion recognition.Furthermore,principal components analysis neural nerwork(PCANN)is adopted before GMM for the purpose of frame parameter compression,to improve the performance of output probability density function.Corresponding experiments are performed and the results show that the recognition rate of the proposed method is improved to some extend comparing with the traditional status output independent GMM,thus the effectiveness of introducing dynamic inter-frame correlation information into the process of speech emotion recognition is validated.

作者张霞杨勇赵力 ZHANG Xia;YANG Yong;ZHAO Li(School of Mechanical,Electrical and Information Engineering,Putian University,Putian Fujian 351100,China;School of Information Science and Engineering,Southeast University,Nanjing Jiangsu 210096,China)

机构地区莆田学院机电与信息工程学院东南大学信息科学与工程学院

出处《电子器件》 CAS 北大核心 2022年第2期479-482,共4页 Chinese Journal of Electron Devices

基金福建省中青年教师教育科研项目(JAT200535)

关键词语音情感识别高斯混合模型主分量分析神经网络复数帧段特征 speech emotion recognition Gaussian mixture model principal components analysis neural network complex frame segment feature

分类号 TN912.34 [电子电信—通信与信息系统]

作者简介张霞(1983-),女,工学硕士,莆田学院讲师,研究方向为信号与信息处理、人工智能等,concise.zhang@gmail.com;杨勇(1981-),男,河北涉县人,工学博士,现为东南大学信息科学与工程学院博士后,副教授,研究方向为信号与信息处理,YongYang@cumt.edu.cn;赵力(1958-),男,东南大学信息科学与工程学院教授,博士生导师,研究方向为信号与信息处理等

引文网络
相关文献

参考文献6

1赵力,黄程韦.实用语音情感识别中的若干关键技术[J].数据采集与处理,2014,29(2):157-170. 被引量：36
2张会云,黄鹤鸣,李伟,康杰,无.语音情感识别研究综述[J].计算机仿真,2021,38(8):7-17. 被引量：20
3何振亚,顾明亮,王太君,史笑兴.语音信号的主分量特征[J].应用科学学报,1999,17(4):427-437. 被引量：12
4王卫东,徐金慧,张志峰,杨习贝.基于密度峰值聚类的高斯混合模型算法[J].计算机科学,2021,48(10):191-196. 被引量：12
5郭倩岩,白静.基于PCA鸟群算法的SVM参数优化及应用[J].计算机工程与设计,2018,39(4):1029-1033. 被引量：8
6李思奇,吕王勇,邓柙,陈雯.基于改进PCA的朴素贝叶斯分类算法[J].统计与决策,2022,38(1):34-37. 被引量：23

二级参考文献85

1李海军,王钲旋,王利民,苑森淼.基于主成分分析提升朴素贝叶斯[J].仪器仪表学报,2004,25(z3):384-386. 被引量：7
2赵力,王治平,卢韦,邹采荣,吴镇扬.全局和时序结构特征并用的语音信号情感特征识别方法[J].自动化学报,2004,30(3):423-429. 被引量：15
3王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
4岳佳,王士同.高斯混合模型聚类中EM算法及初始化的研究[J].微计算机信息,2006,22(11X):244-246. 被引量：51
5杨行峻迟惠生等.语言信号数字处理[M].北京:电子工业出版社,1995.34-36.
6Chen S H，IEEE Trans Speech Audio Processing，1995年，3卷，2期，141页
7杨行峻，语音信号数字处理，1995年，34页
8Zhu S，ICASSP-96，1页
9秦锋,任诗流,程泽凯,罗慧.基于ICA方法的朴素贝叶斯分类器[J].计算机工程与设计,2007,28(20):4873-4874. 被引量：7
10Picard R W. Affective computing[M]. Cambridge: MIT Press, 1997.

共引文献105

1王迪先,宁立森.广电全媒体环境下的情绪建模与语音情感合成技术研究[J].广播电视网络,2024,31(S01):6-12.
2张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
3张银娟,张玲华,朱国洋.语音特征参数在说话人识别中的应用[J].金陵科技学院学报,2006,22(1):31-34. 被引量：1
4马军,杨苹.一种聚焦式模糊分段算法及其在语音识别中的应用[J].科技资讯,2006,4(7):2-4.
5李志农,曾明如,韩捷,何永勇,褚福磊.主分量分析和因子隐Markov模型在机械故障诊断中的应用[J].机械强度,2007,29(1):25-29. 被引量：3
6夏菽兰.基于PCANN/PDP混合结构的噪声环境下说话人识别方法的研究[J].盐城工学院学报（自然科学版）,2008,21(2):35-38.
7曾庆虎,邱静,刘冠军,苗强.基于KPCA-HSMM设备退化状态识别方法的研究[J].兵工学报,2009,30(6):740-745. 被引量：5
8赵力,邹采荣,吴镇扬.基于PCANN/HMM混合结构的语音识别方法[J].信号处理,2001,17(5):473-476. 被引量：2
9徐霄鹏,吴及,刘庆升,黄文浩.孤立词语音识别算法性能研究与改进[J].计算机工程与应用,2001,37(21):144-146. 被引量：5
10张明阳,查诚,塔什甫拉提.尼扎木丁,徐新洲,赵力.结合数据场情感空间和混合蛙跳算法的连续语音情感变化趋势检测[J].声学学报,2019,44(1):12-19. 被引量：5

1陈晓芝,任善英.我国数字普惠金融的减贫效应研究[J].特区经济,2022(8):75-78. 被引量：1
2王国志,侯杰文,张元彬.基于BP神经网络的接触网绝缘子干冰清洗研究[J].计算机与数字工程,2022,50(7):1609-1614.
3茹妞妞,于晋伟,杨卫华,卞玮.基于压缩与精化深度体素流模型的视频插值[J].计算机工程,2022,48(9):248-253.

电子器件

2022年第2期

浏览历史

内容加载中请稍等...

基于复数帧段特征的语音情感识别方法

参考文献6

二级参考文献85

共引文献105

相关作者

相关机构

相关主题

浏览历史