-
题名汉语普通话易混淆音素的识别
被引量:4
- 1
-
-
作者
李晨冲
董滨
潘复平
曾兴雯
颜永红
-
机构
西安电子科技大学通信工程学院
中国科学院声学研究所中科信利语音实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第23期201-203,共3页
-
基金
国家"863"计划基金资助项目(2006AA010102
2006AA01Z195)
+2 种基金
国家"973"计划基金资助项目(2004CB318106)
国家自然科学基金资助项目(10574140
60535030)
-
文摘
针对汉语普通话语音识别中易混淆音素的声学特征,把小波包分解理论应用在感觉加权线性预测(PLP)特征中,提出一种新的特征参数提取算法,可以更精确地描述易混淆音素的频谱特征。使用高斯混合模型对新的声学特征进行分类,从而达到区分的目的。实验结果证明,新的特征参数识别结果优于使用传统PLP特征参数的识别结果,识别错误率下降30%以上。
-
关键词
小波包分解
感觉加权线性预测
语音识别
-
Keywords
wavelet packet decomposition
Perceptual Linear Predictive(PLP)
speech recognition
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名基于模板子空间的快速固定音频检索方法
被引量:3
- 2
-
-
作者
谈会星
陈福才
李邵梅
-
机构
国家数字交换系统工程技术研究中心
-
出处
《计算机工程》
CAS
CSCD
2012年第20期260-263,共4页
-
基金
国家"863"计划基金资助项目(2011AA010603)
-
文摘
针对大容量模板库条件下固定音频检索面临检索速度慢的问题,提出一种基于模板子空间的快速固定音频检索方法。利用相同或相似音频数据间存在一定相关性的特点,采用基于模板子空间的方法快速筛选出相似度较高的候选模板集,对候选集内的所有模板进行精细检索以得到最终结果。实验结果表明,与已有方法相比,该方法可以在几乎不损失精度的情况下大幅提高检索速度。
-
关键词
固定音频检索
矢量量化
子空间
两阶段法
部分距离
感觉加权线性预测
-
Keywords
regular audio retrieval
vector quantization
subspace
two-stage method
partial distance
Perceptual Linear Predictive(PLP)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名噪声条件下的语音特征PLP参数的提取
被引量:6
- 3
-
-
作者
魏艳
张雪英
-
机构
太原理工大学信息工程学院
-
出处
《太原理工大学学报》
CAS
北大核心
2009年第3期222-224,共3页
-
基金
国家自然科学基金(60472094)
山西省自然科学基金(20051039)
-
文摘
研究了噪声背景条件下的语音特征提取。使用特征补偿的方法,并运用听觉心理学的三个概念:临界带谱分析、等响度曲线、强度响度听觉幂率,实现了PLP语音特征参数的提取。在此基础上用RATSA技术和半升正弦函数倒谱提升技术来改进此参数,并获得了良好的效果。
-
关键词
特征提取
听觉模型
感觉加权线性预测
半升正弦函数
-
Keywords
feature extraction
auditory model
perceptual linear prediction (PLP)
half raised-sine function (HRSF)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-