-
题名基于EMBFLN的移动声源定位方法
- 1
-
-
作者
蒋芳
王凯
管灵
董纯柱
陈志菲
许耀华
胡艳军
-
机构
安徽大学计算智能与信号处理教育部重点实验室
北京环境特性研究所
南京大学功能材料与智能研究院
-
出处
《安徽大学学报(自然科学版)》
北大核心
2025年第5期65-74,共10页
-
基金
安徽省高校自然科学研究重点项目(2022AH050109)
安徽省质量基础设施标准化专项项目(2023MKS10)。
-
文摘
针对传统声源定位,在噪声和混响较大时声源定位的准确性急剧下降的问题,提出了一种使用二十面体多层分支特征学习网络(eicosahedral multilayer branching feature learning network,简称EMBFLN)结构进行声源定位的方法.首先,在最大可控响应功率波束形成法(steered response power with phase transform,简称SRP-PHAT)的基础上引入最大化及最小化操作,从而得到最小化噪声与混响影响以及最大化真实传输路径信号后的响应功率谱图,并将其作为网络输入送入EMBLFN结构中;然后,将Mish激活函数应用到声源定位的深度学习神经网络中,以此平滑网络的输出并提高模型的泛化能力;最后,通过仿真实验验证所提方法的有效性.此外,为了验证所提模型应用场景的可扩展性,该文还使用了近距离采集的无人机音频数据制作半合成的移动无人机声学场景对模型进行了测试.
-
关键词
阵列信号处理
声源定位
深度学习
二十面体卷积神经网络
-
Keywords
array signal processing
sound source localization
deep learning
icosahedral convolutional neural network
-
分类号
O429
[理学—声学]
-