-
题名基于基音周期与清浊音信息的梅尔倒谱参数
被引量:1
- 1
-
-
作者
郭武
王仁华
戴礼荣
-
机构
中国科技大学电子工程与信息科学系
-
出处
《数据采集与处理》
CSCD
北大核心
2007年第2期229-233,共5页
-
基金
中国科技大学青年教师基金
国家863(2006AA010104)资助项目
-
文摘
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。
-
关键词
说话人确认
梅尔倒谱参数
基音频率
清浊音信息
-
Keywords
speaker verification
Mel-cepstrum
pitch frequency
information of voiced/unvoiced
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名一种新的四元阵列融合声源识别方法
被引量:3
- 2
-
-
作者
刘亚雷
顾晓辉
甘宁
-
机构
中国人民武装警察部队海警学院舰艇指挥系
南京理工大学智能弹药技术国防重点学科重点实验室
-
出处
《科学技术与工程》
北大核心
2020年第28期11620-11625,共6页
-
基金
国家自然科学基金青年基金(51605227)
公安部科技创新项目(2017JSYJC11)。
-
文摘
针对声源识别中观测模型线性化误差,信号特征参数提取依赖于经验分析阈值判断而造成信息丢失的问题,从信号观测模型、预处理、特征提取与分类识别、半实物仿真试验等方面,提出了一种新的四元阵列融合声源识别方法。首先在系统坐标系下建立了四元阵列有色噪声环境下的观测模型;其次基于经验模态分解(empirical mode decomposition,EMD)理论,给出了四元阵列EMD融合算法,有效抑制了高频信号的干扰;再次基于梅尔频率倒谱系数-动态时间规整(Mel-frequency cepstrum coefficient-dynamic time warping,MFCC-DTW)方法,设计了阵列信号特征提取与分类识别算法;最后通过半实物仿真试验,并与相关研究基础对比,分别验证了提出的EMD融合算法及阵列信号特征提取与分类识别算法的有效性。
-
关键词
被动声识别
经验模式分解
梅尔倒谱参数
动态时间规整
-
Keywords
passive acoustic identification
empirical mode decomposition
Mel-frequency cepstrum coefficient
dynamic time warping
-
分类号
TN911.72
[电子电信—通信与信息系统]
-
-
题名采用主成分分析的特征映射
被引量:8
- 3
-
-
作者
郭武
戴礼荣
王仁华
-
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
-
出处
《自动化学报》
EI
CSCD
北大核心
2008年第8期876-879,共4页
-
基金
国家高技术研究发展计划(863计划)(2006AA010104)
中国科学技术大学青年教师基金资助~~
-
文摘
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%.
-
关键词
说话人确认
混合高斯模型
超矢量
梅尔刻度式倒谱参数
-
Keywords
Speaker verification, Gaussian mixture model (GMM), supervector, Mel frequency cepstral coefficients (MFCC)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名说话人识别中改进特征提取算法的研究
被引量:3
- 4
-
-
作者
宋乐
白静
-
机构
太原理工大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第5期1772-1775,1781,共5页
-
基金
国家自然科学基金项目(61072087)
山西省科技攻关基金项目(20120313013-6)
-
文摘
为了提取到能够区分不同说话人个性特征的最优特征参数,采用在Mel频率倒谱系数(Mel-frequency cepstrum coefficients,MFCC)基础上进行改进的复合参数,即增加归一化短时能量参数和一阶差分所构成的特征矢量作为特征。针对高维特征参数,提出了一种基于相关距离Fisher准则的特征选取方法,利用该方法对提取出的参数进行加权降维。通过实验对比结果表明,该算法提高了识别率,具备可行性与优越性,是一种有效的特征提取算法。
-
关键词
说话人识别
特征提取
归一化短时能量
梅尔倒谱复合参数
相关距离Fisher准则
-
Keywords
speaker recognition
feature extraction
the normalized short-term energy
Mel cepstrum composite coefficients
Fisher criterion with correlation distance
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-