-
题名改进加权线性预测倒谱的复合参数说话人识别
- 1
-
-
作者
杨顺辽
林峰
刘焕升
陈玉炎
-
机构
长江大学电信学院
-
出处
《计算机应用与软件》
CSCD
2011年第2期242-245,共4页
-
基金
大学生创新实验计划项目(091048936)
-
文摘
说话人识别和确认是信号处理中研究的热点之一,但有关文献表明识别效率并不是很高,而且训练和识别的语音要求都比较长,距离实际应用还有一定差距。分析了说话人识别中有关参数的选取对识别结果的影响,采用线性预测倒谱和基音参数共同作为识别参数,并采用矢量量化,改进了线性预测倒谱距离的加权函数,提供了与文本无关的说话人识别系统。最后给出了实验结果和有关分析,在低噪声时识别正确率可达99%以上,在高噪声时也能达到98%以上的正确率。
-
关键词
说话人识别
线性预测倒谱
基音
矢量量化
-
Keywords
speaker recognition lp cepstrum pitch vector quantization
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名说话人识别技术及其在工厂自动控制系统中的应用
被引量:1
- 2
-
-
作者
覃爱娜
韩华
-
机构
中南大学信息科学与工程学院
-
出处
《长沙电力学院学报(自然科学版)》
2003年第2期68-70,共3页
-
文摘
说话人识别是以话音对说话人进行区分,从而进行身份鉴别与认证的技术.介绍了在工厂自动控制系统中说话人识别技术的应用,包含其原理、所采用的识别方法及其系统实现.
-
关键词
说话人识别
身份鉴别
语音识别
工厂自动控制系统
实时端点检测算法
MEL倒谱系数
动态时间规整
矢量量化
-
Keywords
speaker recognition
frame-based real-time endpoint detection
Mel frequency cepstrum coefficient
dynamic time warping
vector quantization
-
分类号
TN912.34
[电子电信—通信与信息系统]
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名说话人识别的特征组合方法
被引量:2
- 3
-
-
作者
毛燕湖
曾以成
陈雨莺
谢小娟
-
机构
湘潭大学物理与光电工程学院
-
出处
《计算机应用》
CSCD
北大核心
2015年第A02期242-244,共3页
-
基金
国家自然科学基金资助项目(60972147)
-
文摘
针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率谱通过三角形滤波器组,并取对数;最后,将取对数后的输出做离散余弦变换,得到新特征线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。实验结果表明,在纯净语音环境下,提出的LPMFCC参数的说话人识别率较LPC参数和MFCC参数的说话人识别率分别提升了18.57%和10%,在不同噪声环境下,分别提高了13.22%和4.55%。
-
关键词
说话人识别
梅尔频率倒谱系数
线性预测系数
矢量量化
高斯混合模型
-
Keywords
speaker recognition
Mel frequency cepstrum coefficient
linear prediction coefficient
vector quantization(VQ)
Gaussian Mixture Model(GMM)
-
分类号
TN912
[电子电信—通信与信息系统]
-