-
题名基于卷积递归神经网络的声源信号识别与定位
- 1
-
-
作者
李青
敖邦乾
阎昌国
陈孝玉
张南庆
-
机构
遵义师范学院工学院
-
出处
《声学技术》
北大核心
2025年第3期454-462,共9页
-
基金
遵义师范学院产学研项目(遵师CXY[2023]8号)
遵义市科技计划项目(遵市科合[2022]129号,遵市科合HZ字[2023]152号,遵市科合HZ字[2024]149号)。
-
文摘
为了有效识别声源信号的类别及定位声源位置,结合卷积神经网络强大的特征提取能力和递归神经网络可处理文本间数据的长期依赖性等优点,设计一种双输入双输出结构模型的卷积递归神经网络(convolutional recurrent neural network,CRNN),用于对声源信号进行识别和定位。首先设计圆形阵列用于接收声源信号,并对收集到的声源信号数据进行扩展等预处理,然后将声源波形信号转换成相位谱和幅度谱,输入到CRNN中进行学习训练,其输出为声源信号识别的分类概率以及声源信号的定位回归坐标位置,具体步骤为:设置分类识别阈值,当检测到的声源信号阈值大于0.5时,定义为活跃事件,然后对活跃事件的声源信号进行定位。最后,使用设计的CRNN模型分别对无干扰单声源、有回声声源以及混合声源三种声源信号进行分类及定位测试,与传统方法相比,分类准确率提高了42.29个百分点,定位精确度提高了14.09个百分点,与其他神经网络相比,在不明显提高算法复杂度的前提下,在分类准确率及定位精确度综合性能方面提高13.61个百分点,同时,设计的网络模型结构还具有较强的鲁棒性,可应用于声源探测等方面。
-
关键词
声源信号
卷积神经网络
递归神经网络
信号识别定位
-
Keywords
sound event
convolutional neural network(CNN)
recurrent neural network(RNN)
signal classification and localization
-
分类号
TP23
[自动化与计算机技术—检测技术与自动化装置]
-