期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
递归趋势分析在汉语语音声韵母切分中的应用研究 被引量:5
1
作者 闫润强 祖漪清 朱贻盛 《信号处理》 CSCD 北大核心 2007年第4期521-525,共5页
基于隐马尔可夫模型(HMM)的连续语音自动切分方法由于较高的切分精度得到了广泛的应用,然而其切分结果还不能够直接应用于基于脚本的语音拼接合成系统,需要音素边界的再调整。本文分析了不同的汉语语音音素的非线性动力学物理模型在其... 基于隐马尔可夫模型(HMM)的连续语音自动切分方法由于较高的切分精度得到了广泛的应用,然而其切分结果还不能够直接应用于基于脚本的语音拼接合成系统,需要音素边界的再调整。本文分析了不同的汉语语音音素的非线性动力学物理模型在其递归图(RP)上的表现,通过递归趋势(RT)这一衡量系统稳定性程度的量化参数,揭示了语音产生过程中的不稳定性。结合基于HMM的连续语音初始切分结果,从定位语音动力学特性突变点的角度,调整声韵母切分边界,在10、20、30毫秒基准范围内,切分精度分别提高了13.88%、4.19%、3.19%。 展开更多
关键词 隐马尔可夫模型 基于脚本的语音拼接合成系统 语音动力学 递归图 递归趋势分析
在线阅读 下载PDF
基于笔划的手写体汉字方向分解特征提取方法 被引量:6
2
作者 高学 金连文 +1 位作者 尹俊勋 黄建成 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期11-14,共4页
提出了一种基于笔划的手写体汉字方向分解特征提取的新方法 .根据每个笔划像素点及其邻域像素点的方向分布特征 ,汉字图像被分解为“横”、“竖”、“撇”和“捺”4种子模式 ,而无需提取轮廓和骨架 .文中构造了 5种不同的弹性网格 ,并... 提出了一种基于笔划的手写体汉字方向分解特征提取的新方法 .根据每个笔划像素点及其邻域像素点的方向分布特征 ,汉字图像被分解为“横”、“竖”、“撇”和“捺”4种子模式 ,而无需提取轮廓和骨架 .文中构造了 5种不同的弹性网格 ,并将其应用于方向分解特征的提取 ,最后 ,应用 86 3手写样本库HCL2 0 0 展开更多
关键词 笔划 方向分解 手写体汉字识别 特征提取 模式识别 方向分布
在线阅读 下载PDF
语音驱动唇形自动合成算法 被引量:6
3
作者 林鑫 陈桦 +1 位作者 王开志 王继成 《计算机工程》 CAS CSCD 北大核心 2007年第17期237-238,269,共3页
定义了10种基本的嘴形。以Mel频率倒谱系数(MFCC)作为语音特征,通过SVM分类器进行元音a,i,u的识别,根据其对应量化后的语音能量,映射到嘴形序列,进行中值滤波和排除"奇异点"。该算法在基于语音驱动人脸动画系统中的应用取得... 定义了10种基本的嘴形。以Mel频率倒谱系数(MFCC)作为语音特征,通过SVM分类器进行元音a,i,u的识别,根据其对应量化后的语音能量,映射到嘴形序列,进行中值滤波和排除"奇异点"。该算法在基于语音驱动人脸动画系统中的应用取得了良好的效果。 展开更多
关键词 语音 嘴形 MEL频率倒谱系数 能量
在线阅读 下载PDF
一种基于噪声模型的语音/噪声分类方法 被引量:1
4
作者 吴边 任晓林 +1 位作者 刘重庆 张亚昕 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第9期1528-1531,共4页
提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成... 提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成进一个ASR系统,并在Com-paqiPAQ上进行了测试,其计算代价不到整个系统代价的10%. 展开更多
关键词 语音识别 语音/噪声分类 噪声鲁棒性
在线阅读 下载PDF
一种基于实例学习的高精度英文未登录词发音的自动预测方法
5
作者 王浩 陈桂林 徐良贤 《计算机研究与发展》 EI CSCD 北大核心 2004年第5期796-801,共6页
在英文TTS(texttospeech)系统中 ,需要根据文本中每一个单词的发音来合成语音 由于在真实文本的处理中 ,无论词典规模如何大 ,都不可能包括文本中的每一个单词 ,所以需要使用某种算法来预测词典中未登录单词的发音 介绍了一种基于实... 在英文TTS(texttospeech)系统中 ,需要根据文本中每一个单词的发音来合成语音 由于在真实文本的处理中 ,无论词典规模如何大 ,都不可能包括文本中的每一个单词 ,所以需要使用某种算法来预测词典中未登录单词的发音 介绍了一种基于实例学习的方法 ,并在一个大规模的英语词典上进行了性能评测 结果表明 ,这种方法的单词发音正确率可以达到 70 1% 。 展开更多
关键词 机器学习 实例学习
在线阅读 下载PDF
基于顺序统计滤波的实时语音端点检测算法 被引量:6
6
作者 郭丽惠 何昕 +1 位作者 张亚昕 吕岳 《自动化学报》 EI CSCD 北大核心 2008年第4期419-425,共7页
针对嵌入式语音识别系统,提出了一种高效的实时语音端点检测算法.算法以子带频谱熵为语音/噪声的区分特征,首先将每帧语音的频谱划分成若干个子带,计算出每个子带的频谱熵,然后把相继若干帧的子带频谱熵经过一组顺序统计滤波器获得每帧... 针对嵌入式语音识别系统,提出了一种高效的实时语音端点检测算法.算法以子带频谱熵为语音/噪声的区分特征,首先将每帧语音的频谱划分成若干个子带,计算出每个子带的频谱熵,然后把相继若干帧的子带频谱熵经过一组顺序统计滤波器获得每帧的频谱熵,根据频谱熵的值对输入的语音进行分类.实验结果表明,该算法能够有效地区分语音和噪声,可以显著地提高语音识别系统的性能.在不同的噪声环境和信噪比条件下具有鲁棒性.此外,本文提出的算法计算代价小,简单易实现,适合实时嵌入式语音识别系统的应用. 展开更多
关键词 语音端点检测 顺序统计滤波 子带频谱熵 语音识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部