期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
无参注意力结合自监督改善音频分类方法 被引量:1
1
作者 公绪超 李宗民 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第3期434-440,共7页
基于transformer端到端音频分类方法在许多场景下证明可以达到优于二维卷积的效果.针对目前常用的transformer音频分类方法只关注不同时序间的特征重要性,而对同时序间的特征重要程度刻画程度不足的问题,提出一种无参注意力结合自监督... 基于transformer端到端音频分类方法在许多场景下证明可以达到优于二维卷积的效果.针对目前常用的transformer音频分类方法只关注不同时序间的特征重要性,而对同时序间的特征重要程度刻画程度不足的问题,提出一种无参注意力结合自监督特征构建的方法改善音频分类效果.通过在同时序特征中构造无参多局部极值注意力机制,拟合特征多局部极值分布,刻画同时序间的特征重要性;通过对输入的音频频谱图在时域和频域上随机掩码,加入自监督信息,有效地学习音频频谱细节及分类信息.采用audio set数据集,esc50数据集以及Speech Command数据集进行对比实验,实验结果表明,该算法比基准方法在识别准确率指标上提升了0.46%~1.20%. 展开更多
关键词 TRANSFORMER 注意力机制 自监督 音频分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部