期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
情感语音特征对语料库依赖性的统计分析 被引量:3
1
作者 孙颖 张雪英 《噪声与振动控制》 CSCD 北大核心 2011年第4期132-136,共5页
简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征... 简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征在单一的语料库单一语言条件下均能够有效地表征语音的情感特征,其中MFCC特征对情感的识别率最高。第二种实验是混合语料库的单一语言实验。之前大多数关于情感特征的研究都是基于某一种语料库中某种特定语言的,但在实际中,说话人的背景环境总是多种多样。因此,对特征的混合语料库研究是有现实意义的。第二种实验证明这四种特征都是语料库依赖性的,其中ZCPA特征的识别率下降最少。 展开更多
关键词 声学 信号处理 情感语音识别 语料库依赖性 情感特征 混合语料库
在线阅读 下载PDF
跨语言语料库的语音情感识别对比研究 被引量:5
2
作者 钟琪 冯亚琴 王蔚 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第5期765-773,共9页
情感感知具有普遍性和差异性,不同语言表达的情感有不同的情感特征,但也存在相似的情感特征.选择IEMOCAP 英语情感数据库、CASIA 汉语情感数据库、EMO?BD 德语情感数据库,以中性、生气、快乐、悲伤四种情感为研究对象,了解在单语言语料... 情感感知具有普遍性和差异性,不同语言表达的情感有不同的情感特征,但也存在相似的情感特征.选择IEMOCAP 英语情感数据库、CASIA 汉语情感数据库、EMO?BD 德语情感数据库,以中性、生气、快乐、悲伤四种情感为研究对象,了解在单语言语料库、混合语言语料库、跨语料库的语音情感识别情况.使用支持向量机(SupportVector Machine,SVM)、卷积神经网络(Convolutional Neural Networks,CNN)和长短时记忆网络(Long?Short TermMemory,LSTM)为分类器进行训练,对情感进行识别.从实验结果可以看出,不同语料库的语音情感的识别模式存在相似性,也存在相似的语言情感特性.还发现英文的中性情感和中文的悲伤情感具有良好的模型泛化性,英文的悲伤情感和中文的中性情感有较好的适应性. 展开更多
关键词 语料库 语音情感 深度学习 分类器 迁移学习
在线阅读 下载PDF
基于深度域适应CNN决策树的跨语料库情感识别 被引量:2
3
作者 孙林慧 赵敏 王舜 《数据采集与处理》 CSCD 北大核心 2023年第3期704-716,共13页
在跨语料库语音情感识别中,由于目标域和源域样本不匹配,导致情感识别性能很差。为了提高跨语料库语音情感识别性能,本文提出一种基于深度域适应和卷积神经网络(Convolutional neural network,CNN)决策树模型的跨语料库语音情感识别方... 在跨语料库语音情感识别中,由于目标域和源域样本不匹配,导致情感识别性能很差。为了提高跨语料库语音情感识别性能,本文提出一种基于深度域适应和卷积神经网络(Convolutional neural network,CNN)决策树模型的跨语料库语音情感识别方法。首先构建基于联合约束深度域适应的局部特征迁移学习网络,通过最小化目标域和源域在特征空间和希尔伯特空间的联合差异,挖掘两个语料库之间的相关性,学习从目标域到源域的可迁移不变特征。然后,为了降低跨语料库背景下多种情感间的易混淆情感的分类误差,依据情感混淆度构建CNN决策树多级分类模型,对多种情感先粗分类再细分类。使用CASIA,EMO-DB和RAVDESS三个语料库进行验证。实验结果表明,本文的跨语料库语音情感识别方法比CNN基线方法平均识别率高19.32%~31.08%,系统性能得到很大提升。 展开更多
关键词 语料库语音情感识别 深度域适应 迁移学习 决策树模型 卷积神经网络
在线阅读 下载PDF
基于图卷积深浅特征融合的跨语料库情感识别 被引量:2
4
作者 杨子秀 金赟 +3 位作者 马勇 戴妍妍 俞佳佳 顾煜 《数据采集与处理》 CSCD 北大核心 2023年第1期111-120,共10页
语音情感识别任务的训练数据和测试数据往往来源于不同的数据库,二者特征空间存在明显差异,导致识别率很低。针对该问题,本文提出新的构图方法表示源和目标数据库之间的拓扑结构,利用图卷积神经网络进行跨语料库的情感识别。针对单一情... 语音情感识别任务的训练数据和测试数据往往来源于不同的数据库,二者特征空间存在明显差异,导致识别率很低。针对该问题,本文提出新的构图方法表示源和目标数据库之间的拓扑结构,利用图卷积神经网络进行跨语料库的情感识别。针对单一情感特征识别率不高的问题,提出一种新的特征融合方法。首先利用OpenSMILE提取浅层声学特征,然后利用图卷积神经网络提取深层特征。随着卷积层的不断深入,节点的特征信息被传递给其他节点,使得深层特征包含更明确的节点特征信息和更详细的语义信息,然后将浅层特征和深层特征进行特征融合。采用两组实验进行验证,第1组用eNTERFACE库训练测试Berlin库,识别率为59.4%;第2组用Berlin库训练测试eNTERFACE库,识别率为36.1%。实验结果高于基线系统和文献中最优的研究成果,证明本文提出方法的有效性。 展开更多
关键词 图卷积神经网络 语料库 语音情感识别 构图 深层和浅层特征融合
在线阅读 下载PDF
实用语音情感识别中的若干关键技术 被引量:36
5
作者 赵力 黄程韦 《数据采集与处理》 CSCD 北大核心 2014年第2期157-170,共14页
介绍了语音情感识别领域的最新进展和今后的发展方向,特别是介绍了结合实际应用的实用语音情感识别的研究状况。主要内容包括:对情感计算研究领域的历史进行了回顾,探讨了情感计算的实际应用;对语音情感识别的一般方法进行了总结,包括... 介绍了语音情感识别领域的最新进展和今后的发展方向,特别是介绍了结合实际应用的实用语音情感识别的研究状况。主要内容包括:对情感计算研究领域的历史进行了回顾,探讨了情感计算的实际应用;对语音情感识别的一般方法进行了总结,包括情感建模、情感数据库的建立、情感特征的提取,以及情感识别算法等;结合具体应用领域的需求,对实用语音情感识别方法进行了重点分析和探讨;分析了实用语音情感识别中面临的困难,针对烦躁等实用情感,总结了实用情感语音语料库的建立、特征分析和实用语音情感建模的方法等。最后,对实用语音情感识别研究的未来发展方向进行了展望,分析了今后可能面临的问题和解决的途径。 展开更多
关键词 实用语音情感识别 情感计算 特征分析 情感模型 语料库 识别方法
在线阅读 下载PDF
融合说话者特征的个性化自然语音情感识别 被引量:4
6
作者 贾宁 郑纯军 孙伟 《计算机应用与软件》 北大核心 2022年第12期201-207,共7页
情感特征的高级表示与说话者的个性化特征之间存在较强相关性,因此以提升个性化情感识别精度为目标,设计一组融合说话者特征和语音情感特征的识别模型,利用卷积神经网络模型获取说话者类别,在融合说话人特征高阶表达的基础上,利用卷积... 情感特征的高级表示与说话者的个性化特征之间存在较强相关性,因此以提升个性化情感识别精度为目标,设计一组融合说话者特征和语音情感特征的识别模型,利用卷积神经网络模型获取说话者类别,在融合说话人特征高阶表达的基础上,利用卷积循环神经网络训练个性化情感识别模型,结合自建的成人自然情感语料库,在多项语音情感语料库上测试识别模型性能,从而验证该模型的有效性。 展开更多
关键词 语音情感识别 说话者特征 卷积循环神经网络 语谱图 个性化模型 成人自然情感语料库
在线阅读 下载PDF
基于MFCCG-PCA的语音情感识别 被引量:16
7
作者 陈炜亮 孙晓 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期269-274,共6页
针对语音情感值维度大、难处理的问题,结合MFCC改进算法和PCA模型,进行二次优化,提出一种新的语音情感值提取模型MFCCG-PCA。多组实验表明,相比一般的MFCC模型,MFCCG-PCA模型在语音情感识别方面的性能有较大提高。
关键词 语音情感 梅尔频率倒谱系数 主成分析 MFCCG-PCA 支持向量机 CASIA汉语情感语料库
在线阅读 下载PDF
融合图像显著性的声波动方程情感识别模型 被引量:1
8
作者 贾宁 郑纯军 《数据采集与处理》 CSCD 北大核心 2021年第5期1062-1072,共11页
语音情感识别(Speech emotion recognition,SER)是计算机理解人类情感的关键之处,也是人机交互的重要组成部分。当情感语音信号在不同的介质传播时,使用深度学习模型获得的识别精度不高,识别模型的迁移能力不强。为此,设计了一种融合图... 语音情感识别(Speech emotion recognition,SER)是计算机理解人类情感的关键之处,也是人机交互的重要组成部分。当情感语音信号在不同的介质传播时,使用深度学习模型获得的识别精度不高,识别模型的迁移能力不强。为此,设计了一种融合图像显著性和门控循环的声波动方程情感识别(Image saliency gated recurrent acoustic wave equation emotion recognition,ISGR-AWEER)模型,该模型由图像显著性提取和基于门控循环的声波动模型构成。前者模拟注意力机制,用于提取语音中情感表达的有效区域,后者设计了一个声波动情感识别模型,该模型模拟循环神经网络的流程,可以有效提升跨介质下语音情感识别的精度,同时可快速地实现跨介质下的模型迁移。通过实验,在交互情感二元动作捕捉(Interactive emotional dyadic motion capture,IEMOCAP)情感语料库和自建多介质情感语音语料库上验证了当前模型的有效性,与传统的循环神经网络相比,情感识别精度获得了25%的改善,并且具有较强的跨媒介迁移能力。 展开更多
关键词 语音情感识别 图像显著性和门控循环的声波动方程情感识别 图像显著性 声波动方程 门控循环 多介质情感语音语料库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部