期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多优化机制下深度神经网络的音频场景识别 被引量:3
1
作者 杨立东 胡江涛 《信号处理》 CSCD 北大核心 2021年第10期1969-1976,共8页
随着并行计算能力的不断攀升和音频数据量的日益扩增,音频场景识别成为场景理解领域重要的研究内容之一。针对音频场景识别建模难度大和识别准确率不高的问题,本文提出了融合多优化机制的并行卷积循环神经网络算法模型。首先,将音频信... 随着并行计算能力的不断攀升和音频数据量的日益扩增,音频场景识别成为场景理解领域重要的研究内容之一。针对音频场景识别建模难度大和识别准确率不高的问题,本文提出了融合多优化机制的并行卷积循环神经网络算法模型。首先,将音频信号经预处理后转化为一定尺寸的梅尔声谱图,之后输入到网络模型中进行充分的空间特征和时间特征学习,最后进行识别。为了验证模型的有效性,在DCASE2019音频场景数据集上进行识别性能测试,结果显示,该算法模型对音频场景的识别准确率能够达到88.84%,优于传统网络模型,说明该算法模型对音频场景识别问题的有效性。 展开更多
关键词 音频场景识别 卷积神经网络 批标准化机制 双向门控循环单元
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部