-
题名基于全局背景模型和竞争者模型的说话人确认系统
被引量:1
- 1
-
-
作者
马静
侯丽敏
王朔中
-
机构
上海大学通信与信息工程学院
-
出处
《声学技术》
CSCD
北大核心
2007年第1期105-110,共6页
-
文摘
大多数说话人确认系统都设置一个背景模型用于描述假冒者的特性。文章提出一种新的说话人确认的背景模型,对所有说话人采用同一全局背景模型(简称UBM),并为每个说话人建立一个竞争者模型(cohort model)。在全局背景模型不能做出准确判断的情况下,启用竞争者模型再次进行判决。该模型充分利用了传统全局背景模型和竞争者模型的互补性。实验表明新的背景模型使系统性能有较明显的提高。
-
关键词
说话人确认
背景模型
竞争者模型
全局背景模型
-
Keywords
speaker verification
background speaker model
cohort model
universal background model
-
分类号
TB53
[理学—声学]
O429
[理学—声学]
-
-
题名基于GMBM-UBBM模型的语言辨识研究
- 2
-
-
作者
屈丹
王炳锡
-
机构
解放军信息工程大学
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第3期29-32,共4页
-
基金
国家自然科学基金资助项目(批准号:60372038)
-
文摘
高斯混合模型(GMM)是进行说话人无关的语言辨识的一种有效方法,高斯混合二元模型(GMBM)是GMM模型的二元时序扩展,该文在GMBM和GMM-UBM模型的基础上提出了一种基于GMBM-UBBM模型的语言辨识系统,并利用OGI-TS电话语音库对算法的性能进行了测试,然后给出了实验结果。实验结果表明,该算法也是进行语言辨识的一种有效方法,与传统的GMM-UBM算法相比,该算法最多可以获得4.378%的相对改善率。
-
关键词
高斯混合模型
高斯混合二元模型
全局背景模型
全局背景二元模型
贝叶斯自适应
语言辨识
-
Keywords
Gaussian mixture model,Gaussian mixture bigram model,Universal background model,Universal background bigram model,Bayesian adaptation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于SVM-UBM的语言辨识系统
- 3
-
-
作者
张文林
李弼程
屈丹
-
机构
信息工程大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第10期41-43,共3页
-
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60372038)
-
文摘
支持向量机作为强大的理论和计算工具,已成功地应用在模式识别的众多领域中。研究了将支持向量机模型(SVM)应用于语言辨识的理论框架,提出了将Louradour序列核应用于语言辨识,并利用高斯混合模型(GMM)构造全局背景模型(UBM)对其进行了改进,从而导出了基于SVM-UBM的语言辨识系统。相关实验结果表明,该系统的识别率高于经典的高斯混合模型(GMM)和基于广义线性区分性核(GLDS)的支持向量机模型。
-
关键词
语言辨识
支持向量机
序列核
高斯混合模型
全局背景模型
-
Keywords
language identification
support vector machine
sequence kernel
Gaussian mixture model
universal background model
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于UBM的发音质量评价算法
被引量:2
- 4
-
-
作者
李婧
黄双
张波
-
机构
天津理工大学计算机科学与技术学院
南开大学软件学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第22期207-209,共3页
-
文摘
将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整旬发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算法。
-
关键词
全局背景模型
对数似然比
高斯混合模型
发音质量评价
-
Keywords
Universal Background Model(UBM)
log-likelihood ratio
Gaussian Mixture ModeI(GMM)
pronunciation quality scoring
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-