-
题名基于滑动倒谱的自动语言辨识
被引量:4
- 1
-
-
作者
王洪海
刘刚
郭军
-
机构
北京邮电大学信息工程学院
-
出处
《智能系统学报》
2008年第4期336-341,共6页
-
基金
"十一五"国家863计划重点项目课题(2006AA010102)
-
文摘
滑动差分倒谱在自动语言辨识的研究中获得了广泛的应用.但是滑动差分倒谱并没有利用语音信号的静态倒谱信息,在方言辨识中的研究表明静态倒谱比差分倒谱含有更多的特征信息.为此,提出了滑动倒谱(SC)的概念,并与滑动差分倒谱特征矢量进行了对比研究.首先利用开发集的语音考察了滑动差分倒谱和滑动倒谱的控制参数在不同取值的情况下对识别性能的影响,利用爬山法确定了这2类特征矢量达到局部最优控制参数组合的路径,然后利用测试集的数据对优化后的2类特征矢量建立的模型进行了闭集辨识和开集辨识.2种情况下的测试结果都表明滑动倒谱的性能优于滑动差分倒谱.并且这2种参数还具有特征互补性,将它们进行决策级数据融合可以进一步提高系统的性能.
-
关键词
自动语言辨识
滑动倒谱
滑动差分倒谱
高斯混合模型
-
Keywords
automatic language identification
shifted cepstra
shifted delta cepstra
Gaussian mixture model
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名Cohen类双线性时频分布在语音识别上的应用
- 2
-
-
作者
蒋治宏
黄力
莫徽忠
-
机构
柳州职业技术学院
-
出处
《现代电子技术》
2007年第16期128-130,共3页
-
文摘
短时分析技术有着与生俱来的短时平稳假设限制,众多非平稳信号处理技术有着克服这一根本技术限制的潜力。非平稳信号处理技术中的Cohen类双线性时频分布技术拥有良好的时频分辨率,其中的WVD的时频分辨率已达到不确定原理下界,在非平稳信号处理技术中有独特优势。详细介绍了将这一优势在语音自动识别上的应用原理,提出了一种新型的语音智能识别方法。
-
关键词
自动语言辨识
时频主分量分析
Cohen类双线性时频分布
核函数
-
Keywords
automatic language identification
time - frequency principal component analysis
Cohen bilinear time - frequency distribution
kernel function
-
分类号
TP311.134.3
[自动化与计算机技术—计算机软件与理论]
-