期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
密集连接神经网络在远距离水声目标探测中的性能分析
1
作者 胡梦璐 冯海泓 +1 位作者 洪峰 毛海全 《声学技术》 CSCD 北大核心 2024年第6期782-789,共8页
由于水声目标辐射噪声的低信噪比特性,探测远距离水声目标具有一定挑战。为提升远距离水声目标探测的准确率,文章提出一种基于密集连接神经网络和自注意力机制的方法。该方法提取信号的梅尔倒谱系数作为特征,在密集连接神经网络头部添... 由于水声目标辐射噪声的低信噪比特性,探测远距离水声目标具有一定挑战。为提升远距离水声目标探测的准确率,文章提出一种基于密集连接神经网络和自注意力机制的方法。该方法提取信号的梅尔倒谱系数作为特征,在密集连接神经网络头部添加自注意力模块以捕获关键信息,经过多个密集块后输出探测结果。在实测数据集上进行实验,分析了自注意力机制添加与否、输入特征不同、接收端深度不同时模型的性能变化。应用在未来几天的数据测试模型的任务中,探测范围在小于10 km时,探测准确率为93.3%,探测范围扩大至20 km时,探测准确率为90.34%。实验结果表明,模型在信噪比不小于−6 dB时实现了水声目标探测,在增加更多的低信噪比样本后,仍具有一定探测能力,且其性能优于其他模型。此外,训练集包含多种信噪比条件下的数据时,探测性能会有进一步提升。 展开更多
关键词 密集连接神经网络 水声目标探测 深度学习 特征提取 信噪比
在线阅读 下载PDF
基于迁移学习和基频特征融合的文本相关说话人识别框架 被引量:1
2
作者 马皓天 洪峰 +5 位作者 毛海全 徐楚林 胡梦璐 牟宏宇 陈友元 许伟杰 《声学技术》 CSCD 北大核心 2024年第5期677-685,共9页
目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景... 目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景中的数字串声纹识别研究,并提出一种基于迁移学习和基频特征融合的文本相关说话人识别框架,提高了文本相关说话人识别技术的可靠性。在数字串SHALCAS-WXSD22B-d006和SHALCAS-WXSD22B-d007语料实验中,所提框架实现的最佳等错误率分别为0.88%和1.05%,与ECAPA-TDNN基线模型相比等错误率相对降低了17和20个百分点,且达到了支付场景下的声纹识别安全性指标。实验结果表明,文中所提框架不仅具有更好的识别准确率和安全性能,而且同样能提高框架中包括ResNet34在内的其他log-Mel识别模型的性能。 展开更多
关键词 文本相关说话人识别 迁移学习 基频特征 嵌入级融合 决策级融合
在线阅读 下载PDF
结合多尺度卷积网络和双端注意力机制的水声目标识别 被引量:3
3
作者 刘承伟 洪峰 +1 位作者 冯海泓 胡梦璐 《声学技术》 CSCD 北大核心 2023年第2期161-167,共7页
水声目标识别是被动声呐系统的主要应用之一。为了进一步提升小样本条件下水下目标的识别率,文章提出一种基于多尺度卷积和双端注意力机制相融合的方法。首先,提取梅尔倒谱系数,色度谱和计算谱对比度等特征,建立基于多类别特征子集的三... 水声目标识别是被动声呐系统的主要应用之一。为了进一步提升小样本条件下水下目标的识别率,文章提出一种基于多尺度卷积和双端注意力机制相融合的方法。首先,提取梅尔倒谱系数,色度谱和计算谱对比度等特征,建立基于多类别特征子集的三维聚合特征。其次,采用多尺度卷积滤波器算子构造多分辨率卷积神经网络,以更好地适应三维聚合特征的时频结构。另外,采用双端注意力模型捕获样本的全局依赖和局部特性。采用基于指数加权的对数交叉熵函数作为损失函数,提升样本数较少类别的识别率。实验结果表明,该方法在ShipsEar数据上的平均识别率为95.5%,取得了较好的分类效果。 展开更多
关键词 水下目标识别 注意力机制 多尺度卷积 特征融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部