-
题名基于双通道特征的含噪声纹识别方法研究
- 1
-
-
作者
伍雄
陈为真
-
机构
武汉轻工大学电气与电子工程学院
-
出处
《计算机应用与软件》
北大核心
2025年第7期205-211,共7页
-
基金
湖北省教育厅科学研究项目(B2020061)。
-
文摘
针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱系数特征,结合它们的差分谱构成混合特征,融合成双通道声纹特征(DCVF)。实验结果表明:在纯净语音数据集中,双通道声纹特征可达到99.5%的识别率;在含噪语音数据集下,DCVF的识别效果有明显提升。
-
关键词
声纹识别
梅尔频率倒谱系数
伽马通倒谱系数
特征融合
抗噪性
-
Keywords
Voiceprint recognition
Mel frequency cepstral coefficients(MFCC)
Gammatone frequency cepstral coefficient(GFCC)
Feature fusion
Anti-noise performance
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于计算听觉场景分析的说话人转换检测
被引量:1
- 2
-
-
作者
杨登舟
刘加
夏善红
-
机构
中国科学院电子学研究所
中国科学院大学
清华大学电子工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第2期316-321,共6页
-
基金
国家自然科学基金"噪声和短语音条件下的说话人识别"(61370034)
-
文摘
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的浊、清音边界,实现对零散清、浊音子段的拼接。利用贝叶斯信息准则判决语音子段间的疑似转换点,并运用音高特征做区间验证。实验结果表明,该方法在平均语音子段时长为1.34 s的极短语音条件下,可使说话人转换检测的等错率降至23.2%,F1值达到70%。
-
关键词
说话人转换检测
计算听觉场景分析
伽马通能量倒谱系数
音高
贝叶斯信息准则
-
Keywords
Speaker Change Detection(SCD)
Computational Auditory Scene Analysis(CASA)
Gammatone Energy Cepstral Coefficients(GECC)
pitch
Bayesian Information Criterion(BCI)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-