-
题名基于时域Gammatone滤波特征的广播语种识别
被引量:4
- 1
-
-
作者
陈亮
邵玉斌
龙华
杜庆治
彭艺
唐维康
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《信号处理》
CSCD
北大核心
2022年第3期599-608,共10页
-
基金
国家自然科学基金(61761025)。
-
文摘
针对广播语种识别问题,提出一种语音时域滤波方法,用gammatone时域函数与预处理后的语音信号进行卷积滤波,再分帧加窗并求对数化能量得到时域GF(gammatone filterbank)特征。将特征参数图像化表示,然后通过VGG19和Resnet34分类网络进行语种识别实验。同时,也使用自动色阶算法对加噪语音的图像化特征参数进行去噪,并对比不同维数的特征参数以及不同噪声类型和信噪比对语种识别率的影响。结果表明,采用该特征参数的广播语种识别准确率高于使用传统的GFCC特征、GFCC-D-A特征、GFCC-SDC特征及Fbank特征,且在不同噪声类型和不同信噪比的广播语音识别场景下,语种识别准确率均有一定提升。
-
关键词
广播语种识别
gammatone时域滤波
时域gammatone
filterbank
自动色阶算法
-
Keywords
broadcast language identification
gammatone time-domain filtering
time-domain gammatone filterbank
automatic color-grading algorithm
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名面向战场环境下的语种识别
- 2
-
-
作者
华英杰
刘晶
邵玉斌
朵琳
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2023年第7期2197-2206,共10页
-
基金
国家自然科学基金项目(61962032)
云南省科技厅优秀青年项目(202001AW07000)。
-
文摘
为实现语种识别在战场环境下保持较高的识别性能,提出一种基于语谱图灰度变换的语种识别方法。根据语音信息和战场环境下的噪声信息在语谱图上的分布特性,引入带通滤波;根据人耳听觉特性提取对数灰度语谱图;采用自动色阶算法抑制语谱图上的噪声信息,增强语种信息,并采用残差神经网络模型进行训练识别。实验结果表明:在-10 dB掠夺者战斗机驾驶舱噪声环境下,相对于线性灰度语谱图特征,识别正确率提升了46%;在其他噪声环境下,识别性能也大幅度提升。
-
关键词
语种识别
对数灰度语谱图
自动色阶算法
残差神经网络
-
Keywords
language identification
logarithmic grayscale spectrogram
automatic tone scale algorithm
residual neural network
-
分类号
TN912.3
[电子电信—通信与信息系统]
-