期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于高维空间映射失配补偿方法的说话人确认
1
作者 郭伟 李辉 +1 位作者 许敏强 刘青松 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第2期152-156,共5页
针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射... 针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射支持向量机模型(PSVM)的说话人确认系统.首先用大量已知信道类型的语音训练出信道空间及映射矩阵,然后训练语音和测试语音都通过映射,消除因信道不同而导致的失配影响.在NIST数据库上的实验结果表明,这种方法弥补了训练语音和测试语音的失配,说话人确认系统的性能有了明显的提高. 展开更多
关键词 说话人确认 支持向量机映射模型 失配补偿 映射矩阵 高维空间映射
在线阅读 下载PDF
基于GMM和二分类特征筛选的多级音频分类方法
2
作者 高前勇 戴蓓蒨 许东星 《中国科学技术大学学报》 CAS CSCD 北大核心 2007年第12期1466-1471,共6页
采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gau... 采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少. 展开更多
关键词 音频分类 Mel倒谱系数及其动态参数 区分性模型训练 特征筛选 多级二分类方法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部