期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于卷积神经网络的说话人识别算法 被引量:13
1
作者 胡青 刘本永 《计算机应用》 CSCD 北大核心 2016年第A01期79-81,200,共4页
语音信号是一个时变信号,受个体、环境等影响较大。为提高说话人识别率,对原始语音信号进行一定预处理是必要的,提出一种利用卷积神经网络的说话人识别算法。该算法利用卷积神经网络的卷积和降采样两种操作对说话人识别中的语音信号进... 语音信号是一个时变信号,受个体、环境等影响较大。为提高说话人识别率,对原始语音信号进行一定预处理是必要的,提出一种利用卷积神经网络的说话人识别算法。该算法利用卷积神经网络的卷积和降采样两种操作对说话人识别中的语音信号进行预处理,通过构建一维和二维卷积操作,对预处理后的信号提取梅尔频率倒谱系数特征参数,并采用经典的通用背景模型对说话人进行识别模型建模。通过自建库和TIMIT标准库测试表明,该算法与经典的直接基于梅尔频率倒谱系数特征和通用背景模型的方法相比,识别率提升了8%~15%,并且有效地降低了算法的时间复杂度和空间复杂度。 展开更多
关键词 卷积神经网络 说话人识别 通用背景模型 梅尔频率倒谱系数 预处理
在线阅读 下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
2
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
基于背景噪声估计的说话人识别算法 被引量:1
3
作者 钱博 唐振民 +1 位作者 李燕萍 徐利敏 《计算机工程》 CAS CSCD 北大核心 2008年第14期14-16,共3页
基于同段语音中有声和无声部分具有相同的背景噪声特征的假设,该文提出基于背景噪声模型估计的说话人识别算法。该算法从无声信号中提取背景噪声的HMM参数,并结合含噪音频特征估计说话人特征参数,进行识别处理。实验表明,该方法具有比... 基于同段语音中有声和无声部分具有相同的背景噪声特征的假设,该文提出基于背景噪声模型估计的说话人识别算法。该算法从无声信号中提取背景噪声的HMM参数,并结合含噪音频特征估计说话人特征参数,进行识别处理。实验表明,该方法具有比传统去噪技术更好的识别能力,混合噪声下的说话人识别正确率达到了90%以上。 展开更多
关键词 说话人识别 背景噪声估计 高斯混合模型 自适应
在线阅读 下载PDF
嵌入自联想神经网络的高斯混合背景模型说话人确认 被引量:2
4
作者 陈存宝 赵力 《应用科学学报》 EI CAS CSCD 北大核心 2010年第1期38-43,共6页
提出在高斯混合背景模型中嵌入自联想神经网络的方法,并将它用于说话人确认.该方法利用神经网络和高斯混合背景模型各自的优点,以极大似然概率为训练准则,将两者作为一个整体进行训练,揭示了特征向量的空间信息.嵌入的神经网络起到了数... 提出在高斯混合背景模型中嵌入自联想神经网络的方法,并将它用于说话人确认.该方法利用神经网络和高斯混合背景模型各自的优点,以极大似然概率为训练准则,将两者作为一个整体进行训练,揭示了特征向量的空间信息.嵌入的神经网络起到了数据整形的作用,增强了目标说话人数据的相似性.在背景模型和目标模型的训练中交替更新高斯混合模型和神经网络的参数.实验表明,采用本文提出的模型并结合TNorm方法,比基线系统的确认率提高26%. 展开更多
关键词 说话人确认 高斯混合背景模型 自联想神经网络 嵌入
在线阅读 下载PDF
基于自适应同源方差控制的法庭自动说话人识别
5
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《应用科学学报》 CAS CSCD 北大核心 2014年第6期582-587,共6页
提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的... 提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的需求.与基本识别系统相比的测试结果表明,使用该算法的识别系统不但具有更优良的识别性能和可靠性,而且提高了语音证据对判别结论的支持强度. 展开更多
关键词 法庭自动说话人识别 背景模型-高斯混合模型 似然比 自适应同源方差控制
在线阅读 下载PDF
基于贝叶斯算法与高斯混和模型的语者确认研究
6
作者 胡海波 傅鹂 +2 位作者 向宏 周元 刘晓艳 《计算机工程与应用》 CSCD 北大核心 2007年第29期225-227,共3页
文章针对统一背景模型与群模型两种反模型进行了分析,在基于统一背景模型与群模型的改进说话人确认模型的基础上,将贝叶斯自适应算法引入到基于高斯混合统一背景模型的说话人确认系统,解决了说话人确认中存在的模型不匹配问题,通过文本... 文章针对统一背景模型与群模型两种反模型进行了分析,在基于统一背景模型与群模型的改进说话人确认模型的基础上,将贝叶斯自适应算法引入到基于高斯混合统一背景模型的说话人确认系统,解决了说话人确认中存在的模型不匹配问题,通过文本无关的测试语音库进行的实验和分析显示,改进算法具有更好的识别效果。 展开更多
关键词 说话人确认 高斯混合模型 贝叶斯自适应算法 统一背景模型 群模型
在线阅读 下载PDF
基于全局背景模型和竞争者模型的说话人确认系统 被引量:1
7
作者 马静 侯丽敏 王朔中 《声学技术》 CSCD 北大核心 2007年第1期105-110,共6页
大多数说话人确认系统都设置一个背景模型用于描述假冒者的特性。文章提出一种新的说话人确认的背景模型,对所有说话人采用同一全局背景模型(简称UBM),并为每个说话人建立一个竞争者模型(cohort model)。在全局背景模型不能做出准确判... 大多数说话人确认系统都设置一个背景模型用于描述假冒者的特性。文章提出一种新的说话人确认的背景模型,对所有说话人采用同一全局背景模型(简称UBM),并为每个说话人建立一个竞争者模型(cohort model)。在全局背景模型不能做出准确判断的情况下,启用竞争者模型再次进行判决。该模型充分利用了传统全局背景模型和竞争者模型的互补性。实验表明新的背景模型使系统性能有较明显的提高。 展开更多
关键词 说话人确认 背景模型 竞争者模型 全局背景模型
在线阅读 下载PDF
一种概率序列核在说话人识别中的应用
8
作者 雷震春 《计算机工程与应用》 CSCD 北大核心 2011年第6期151-155,共5页
以说话人识别中的背景模型为基础,根据模型中的各个高斯分量,构造出说话人特征空间,将长度不一样的语句映射成为空间中大小相同的向量,且经过相关矩阵进行规整后,采用线性支持向量机进行说话人识别。借鉴几种常见的特征规整方式,结合语... 以说话人识别中的背景模型为基础,根据模型中的各个高斯分量,构造出说话人特征空间,将长度不一样的语句映射成为空间中大小相同的向量,且经过相关矩阵进行规整后,采用线性支持向量机进行说话人识别。借鉴几种常见的特征规整方式,结合语句映射后的向量,提出四种不同的规整方法:均值/方差规整、权重规整、WLOG规整和球形规整,并与概率序列核进行比较研究。根据语音特征向量序列中相邻的特征向量的前后转移关系,结合提出的概率序列核,构造出转移概率序列核。实验在NIST2001库上进行,结果表明概率序列核模型识别性能接近经典的UBM-MAP模型,将这两类模型得分进行融合,可非常明显地提高识别性能,进一步融合转移概率序列核后,性能还可提高19.1%。 展开更多
关键词 说话人识别 概率序列核 通用背景模型 支持向量机
在线阅读 下载PDF
用于说话人辨识的评分规整
9
作者 刘明辉 黄中伟 熊继平 《计算机工程与应用》 CSCD 北大核心 2010年第12期133-135,共3页
在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,... 在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,有效地提高了系统性能。在NIST’031spk数据库上的说话人辨识实验表明了评分规整技术对说话人辨识的有效性。 展开更多
关键词 评分规整 说话人辨识 高斯混合模型 统一背景模型最大后验概率估计(UBM-MAP)
在线阅读 下载PDF
一种适用于远程电话音识别的自适应建模方法(英文)
10
作者 陈大为 吴朝晖 杨莹春 《广西师范大学学报(自然科学版)》 CAS 2003年第A01期185-190,共6页
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅... 在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅度降低.为了修补这种差异,就需要较长的训练时间,使得这种方法不利于比较实时的应用,比如通过电话进行远程说话人识别,在这种情况中需要较快的响应速度.本文中提出了一个利用全局模型并能适用于远程说话人识别的方法.基本思路就是在进行识别时利用以前的模型,然后再系统空闲时采取了一个改进的自适应算法快速重建全局模型.试验结果证明了这种方法是可行的. 展开更多
关键词 说话人识别 自适应建模 训练
在线阅读 下载PDF
基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统 被引量:4
11
作者 茅正冲 王俊俊 《南京理工大学学报》 EI CAS CSCD 北大核心 2018年第1期82-88,共7页
为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔... 为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔伯特变换从TEO导出分析信号的瞬时相位信息,结合耳蜗倒谱系数(Cochlear filter cepstral coefficients,CFCC)得到融合特征参数。实现了对特征参数的补偿,提高了说话人识别系统的识别率。使用NIST-2002说话者识别评估(Speakers recognition evaluation,SRE)数据库,在高斯混合模型-通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)的说话人识别系统上进行实验。实验结果表明TEO相位与CFCC的结合比单独CFCC更好,其识别精度比现有的CFCC特征和线性预测梅尔频率倒谱系数(Linear prediction Meyer frequency cepstral coefficient,LPMFCC)分别提高了8.32%和3.15%。这表明TEO相位包含与CFCC特征互补的信息,且具有较高的识别率。 展开更多
关键词 能量算子 耳蜗倒谱系数 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
基于UBM降阶算法的高效说话人识别系统
12
作者 单振宇 杨莹春 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第6期978-982,共5页
为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决... 为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率. 展开更多
关键词 说话人识别 高斯混合模型 通用背景模型
在线阅读 下载PDF
基于聚类和排序高斯混合模型的说话人确认
13
作者 余巍 李辉 《计算机工程》 CAS CSCD 北大核心 2011年第23期162-164,共3页
基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库... 基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库的实验结果表明,该方法能在基本保持系统识别性能的前提下,降低UBM的训练运算量。 展开更多
关键词 说话人确认 高斯混合模型 通用背景模型 聚类 排序高斯混合模型
在线阅读 下载PDF
非线性幂变换Gammachirp滤波器的鲁棒语音特征提取 被引量:3
14
作者 李聪 葛洪伟 《计算机科学与探索》 CSCD 北大核心 2019年第8期1351-1359,共9页
针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gam... 针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gammachirp滤波器组代替Gammatone滤波器组进行滤波,并在特征参数中融合了分段式非线性幂函数变换的方式。另外,算法中利用了均值方差归一化和时间序列滤波等技术的方法,进一步提高了其在噪声环境下的鲁棒性,并在改进的i-vector+PLDA模型下进行了测试。实验结果表明,相较于目前常用的一些说话人语音特征提取算法,在不同噪声和不同信噪比下,NPGFCC特征具有最佳抗噪性能,特别是在信噪比较低的情况下,与其他语音特征相比,NPGFCC特征具有更大的优势。 展开更多
关键词 特征提取 说话人识别 伽马啁啾滤波器 高斯混合模型-通用背景模型(GMM-UBM) 辨识向量(i-vector) 概率线性判别分析(PLDA)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部