-
题名基于深度学习的小样本声纹识别方法
被引量:19
- 1
-
-
作者
李靓
孙存威
谢凯
贺建飚
-
机构
长江大学电子信息学院
长江大学计算机科学学院
中南大学信息科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期262-267,272,共7页
-
基金
国家自然科学基金(61272147)
湖北省教育厅项目(B2015446)
+1 种基金
长江大学青年基金(2016cqn10)
大学生创新创业计划基金(2017009)
-
文摘
利用小样本声纹作为训练集训练卷积神经网络(CNN)时,网络不能达到较好的收敛状态,从而导致识别率较低。为此,提出一种新的声纹识别方法。利用深度CNN提取潜在的声纹特征,在CNN训练过程中采用基于凸透镜成像原理的图像增多算法解决小样本训练样本不足的问题,并在卷积过程中引入快速批量归一化(FBN)方法以提高网络收敛速度、缩短训练时间。在包含630人的TIMIT语音数据库中进行训练、验证和测试,结果表明,FBN-Alexnet网络比Alexnet网络训练时间缩短48.2%,与GMM、GMM-UBM及GMM-SVM方法相比,该方法识别率分别提高7.3%、2.2%、2.8%。
-
关键词
声纹识别
深度学习
FBN-Alexnet网络
小样本
快速批量归一化
图像增多算法
-
Keywords
voiceprint recognition
deep learning
FBN-Alexnet network
small sample
Fast Batch Normalization (FBN)
image increasing algorithm
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名深度迁移模型下的小样本声纹识别方法
被引量:5
- 2
-
-
作者
孙存威
文畅
谢凯
贺建飚
-
机构
长江大学计算机科学学院
长江大学电子信息学院
中南大学信息科学与工程学院
-
出处
《计算机工程与设计》
北大核心
2018年第12期3816-3822,共7页
-
基金
国家自然科学基金项目(61272147)
长江大学青年基金项目(2016cqn10)
大学生创新创业训练计划基金项目(2017009)
-
文摘
基于神经网络的生物特征识别通常需要大量训练样本,目标数据集不足使得神经网络难以获得实际应用。在小样本声纹识别中,为提高识别的准确率,结合卷积神经网络与迁移学习提出一种基于小样本的说话人识别方法。在卷积过程中引入快速批量归一化(fast batch normalization,FBN),提高深度神经网络收敛速度。将预训练模型中的全连接层改为RBM(restricted Boltzmann machine),用小样本声纹训练RBM和分类器,RBM能够进一步学习小样本声纹特有的高阶特征,消除在迁移过程中声纹数据集间的差异。选取包含400人的AISHELL-ASR0009-OS1语音数据库及实验室自采的20人语音库进行实验,实验结果表明,融合FBN的神经网络相比原始网络的训练时间减少了35.6%,最优方法相比其它两种方法识别率提高了9.7%-41.3%,验证了所提方法的可行性和有效性。
-
关键词
声纹识别
受限玻尔兹曼机
卷积神经网络
快速批量归一化
迁移学习
小样本
-
Keywords
voiceprint recognition
restricted Boltzmann machine
convolutional neural network
fast batch normalization
transfer learning
small sample
-
分类号
TN912.34
[电子电信—通信与信息系统]
-