期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于语言学知识的发音质量评价算法改进 被引量:14
1
作者 刘庆升 魏思 +2 位作者 胡郁 郭武 王仁华 《中文信息学报》 CSCD 北大核心 2007年第4期92-96,共5页
随着普通话推广工作的深入,采用计算机进行普通话的辅助测试和学习的需求日益迫切。本文针对普通话发音特点,提出了一种改进的基于音素的自动发音质量评价算法。新算法在隐马尔科夫模型的对数后验概率算法基础上,引入普通话发音的语言... 随着普通话推广工作的深入,采用计算机进行普通话的辅助测试和学习的需求日益迫切。本文针对普通话发音特点,提出了一种改进的基于音素的自动发音质量评价算法。新算法在隐马尔科夫模型的对数后验概率算法基础上,引入普通话发音的语言学知识。与改进前相比,新算法不仅降低了运算量,而且在普通话水平测试的303人现场录音库上,使得机器打分与国家级评测员打分之间的相关度从0.704提升到0.795。 展开更多
关键词 计算机应用 中文信息处理 语音识别 发音质量评价 对数后验概率 语言学知识
在线阅读 下载PDF
基于UBM的发音质量评价算法 被引量:2
2
作者 李婧 黄双 张波 《计算机工程》 CAS CSCD 北大核心 2008年第22期207-209,共3页
将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化... 将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整旬发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算法。 展开更多
关键词 全局背景模型 对数似然比 高斯混合模型 发音质量评价
在线阅读 下载PDF
普通话发音质量评价算法改进研究
3
作者 陈彩华 《贵州师范大学学报(自然科学版)》 CAS 2013年第6期95-99,共5页
隐马尔科夫模型的对数后验概率算法是计算机辅助语言学习系统中用来衡量考生发音质量的重要指标。但在普通话智能测试系统中,传统的后验概率算法与专家评分之间存在比较明显的差距。文章从普通话语音评价的主观标准出发,将普通话发音的... 隐马尔科夫模型的对数后验概率算法是计算机辅助语言学习系统中用来衡量考生发音质量的重要指标。但在普通话智能测试系统中,传统的后验概率算法与专家评分之间存在比较明显的差距。文章从普通话语音评价的主观标准出发,将普通话发音的语言学知识引入后验概率算法,重构算法的语音识别网络,同时从音素评分模型角度对现有的发音质量评价算法进行改进。 展开更多
关键词 发音质量评价 对数后验概率 普通话智能测试 评分模型
在线阅读 下载PDF
基于KLD差的统计错误模式生成算法 被引量:1
4
作者 刘庆升 魏思 +1 位作者 胡郁 王仁华 《数据采集与处理》 CSCD 北大核心 2009年第1期32-37,共6页
研究了用于指导计算机发音质量评价的错误模式的生成算法,它是普通话CALL系统研究工作中的一部分。传统的错误模式是根据语言学知识来生成的,只能得到那些最重要的常见错误模式。为了提高错误模式的覆盖面,本文提出了一种基于KLD差的统... 研究了用于指导计算机发音质量评价的错误模式的生成算法,它是普通话CALL系统研究工作中的一部分。传统的错误模式是根据语言学知识来生成的,只能得到那些最重要的常见错误模式。为了提高错误模式的覆盖面,本文提出了一种基于KLD差的统计错误模式生成算法,用模型间KLD作为模型间的距离,以标准模型间KLD与带方言口音模型间KLD的差代表两种模型间的差异,并以之为度量来生成错误模式。实验证明在引入了此算法生成的错误模式后,系统性能由0.809提升到0.826。 展开更多
关键词 语音识别 中文信息处理 发音质量评价 KLD
在线阅读 下载PDF
A new formant feature and its application in Mandarin vowel pronunciation quality assessment
5
作者 卢小春 潘复平 +1 位作者 尹俊勋 胡维平 《Journal of Central South University》 SCIE EI CAS 2013年第12期3573-3581,共9页
In order to improve the Mandarin vowel pronunciation quality assessment, a nox/el formant feature was proposed and applied to formant classification for Chinese Mandarin vowel pronunciation quality evaluation. Formant... In order to improve the Mandarin vowel pronunciation quality assessment, a nox/el formant feature was proposed and applied to formant classification for Chinese Mandarin vowel pronunciation quality evaluation. Formant candidates of each frame were plotted on the time-frequency plane to form a bitmap, and its Gabor feature was extracted to represent the formant trajectory. The feature was then classified by using GMM model and the classification posterior probability was mapped to pronunciation quality grade. The experiments of comparing the Gabor transformation based formant trajectory feature with several other kinds of traditionally used features show that with this method, a human-machine scoring correlation coefficient (CC) of 0.842 can be achieved, which is better than the result of 0.832 by traditional speech recognition techniques. At the same time, considering that the long-term information of formant classification and the short-term information of speech recognition technique are complementary to each other, it is investigated to combine their results with linear or nonlinear methods to further improve the evaluation performance. As a result, experiments on PSK show that the best CC of 0.913, which is very close to the correlation of inter-human rating of 0.94, is gotten by using neural network. 展开更多
关键词 computer assisted language learning speech recognition Gaussian mixture model FORMANT Gabor feature NEURALNETWORK
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部