-
题名一种自然语流的声源分析方法
- 1
-
-
作者
周斌
戴礼荣
凌震华
王仁华
-
机构
中国科学技术大学电子工程与信息科学系
-
出处
《数据采集与处理》
CSCD
北大核心
2005年第3期297-301,共5页
-
文摘
在研究传统的逆滤波和声源建模相结合的分析方法所存在的问题的基础上,提出了一种改进的声源分析算法和利用该算法自动分析自然语流的方法。该方法对于传统的方法所存在着的鲁棒性低、分析不精确、不能自动分析大规模的自然语流等问题具有较好的改进;文中给出的对合成元音以及自然语流的实验结果验证了所提方法的有效性。
-
关键词
声源
源-滤波器模型
逆滤波
自然语流
-
Keywords
voice source
source-filter model
inverse filtering
natural utterance
-
分类号
TN911
[电子电信—通信与信息系统]
-
-
题名基于经验模式分解的音频带宽扩展算法
被引量:2
- 2
-
-
作者
邓杰海
姜林
-
机构
江西中医药高等专科学校教育技术中心
东华理工大学信息工程学院
-
出处
《科学技术与工程》
北大核心
2018年第12期109-114,共6页
-
基金
国家自然科学基金(61762005)
江西省教育厅科技项目(GJJ150585)
江西省经济犯罪侦查与防控技术协同创新中心开放课题(JXJZXTCX-025)资助
-
文摘
音频带宽扩展是现代音频编解码器的重要组成模块,它可以大幅降低编码码率。现有方法大多将低频复制到高频,然后利用少量高频参数进行调整得到重建的高频信号。这种复制方法假设高低频信号间具有相关性;但是,当这种相关性变弱时,编码质量急剧下降。为解决该问题,提出一种经验模式分解的方法重建高频信号。首先对高频和低频激励信号进行经验模式分解,然后选择与高频模式分量相关度较大的低频模式分量作为高频重建中的源信号。在得到高频重建的源信号后,再利用模式分量能量进行调整;最后通过源滤波器模型合成高频信号。实验结果表明,该方法与3GPP WB+和AVS P10编码标准中的带宽扩展算法相比,编码质量得到了明显提升;与最新的3GPP EVS中的时域带宽扩展算法相比,主观音质相当,码率下降33.3%。
-
关键词
经验模式分解
带宽扩展
源滤波器模型
音频编码
-
Keywords
empirical mode
decomposition
audio bandwidth extension
source-filter modelaudio coding
-
分类号
TN912.202
[电子电信—通信与信息系统]
-
-
题名基于声门波和声道特征的语音情感识别
被引量:6
- 3
-
-
作者
李永伟
陶建华
李凯
-
机构
中国科学院自动化研究所模式识别国家重点实验室
清华大学自动化系
北陆先端科学技术大学院大学
-
出处
《信号处理》
CSCD
北大核心
2023年第4期632-638,共7页
-
基金
国家自然科学基金(62201571,U21B2010)。
-
文摘
语音情感识别是实现自然人机交互不可缺失的部分,是人工智能的重要组成部分。发音器官的调控引起情感语音声学特征的差异,从而被感知到不同的情感。传统的语音情感识别只是针对语音信号中的声学特征或听觉特征进行情感分类,忽略了声门波和声道等发音特征对情感感知的重要作用。在我们前期工作中,理论分析了声门波和声道形状对感知情感的重要影响,但未将声门波与声道特征用于语音情感识别。因此,本文从语音生成的角度重新探讨了声门波与声道特征对语音情感识别的可能性,提出一种基于源-滤波器模型的声门波和声道特征语音情感识别方法。首先,利用Liljencrants-Fant和Auto-Regressive eXogenous(ARX-LF)模型从语音信号中分离出情感语音的声门波和声道特征;然后,将分离出的声门波和声道特征送入双向门控循环单元(BiGRU)进行情感识别分类任务。在公开的情感数据集IEMOCAP上进行了情感识别验证,实验结果证明了声门波和声道特征可以有效的区分情感,且情感识别性能优于一些传统特征。本文从发音相关的声门波与声道研究语音情感识别,为语音情感识别技术提供了一种新思路。
-
关键词
语音情感特征
声门波与声道
源-滤波器模型
语音情感识别
-
Keywords
speech emotion features
glottal source and vocal tract
source-filter model
speech emotion recognition
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-