期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于多组多分辨率特征和小波通道注意力的环境声音分类
1
作者 李军 王子壬 +1 位作者 向彦伯 钮焱 《无线电工程》 2024年第8期1862-1870,共9页
针对目前环境声音分类(Environmental Sound Classification, ESC)方法对音频特征提取中反映的时频维度信息不足的问题,提出基于多组多分辨率特征和小波通道注意力的分类方法。采用多组多分辨率特征组成的多特征作为网络输入,通过多组... 针对目前环境声音分类(Environmental Sound Classification, ESC)方法对音频特征提取中反映的时频维度信息不足的问题,提出基于多组多分辨率特征和小波通道注意力的分类方法。采用多组多分辨率特征组成的多特征作为网络输入,通过多组滤波器,多个频率分辨率,在时间和频率维度上实现数据增强,同时实现信息互补。为了更好地衡量各个通道的重要性,针对一维音频图像特征设计了小波通道注意力模块,采用离散小波变换(Discrete Wavelet Transform, DWT)将信号的低频子带和高频子带有效结合,得到通道标量,利用Gram-Schmidt正交化方法使网络在信道注意压缩阶段提取的信息多样化,利用长短期记忆(Long Short Term Memory, LSTM)网络长时间保存信息,提高学习的长期可靠性。实验结果表明,在ESC-10和ESC-50数据集上的分类准确度分别达到了98.7%和93.6%,取得了较好的效果,为音频特征处理提供了一种新的研究思路。 展开更多
关键词 环境声音分类 多组多分辨率特征 小波通道注意力 长短期记忆网络
在线阅读 下载PDF
基于PANNs-CNN的环境声音分类算法研究及应用
2
作者 关志广 《无线互联科技》 2024年第16期12-15,共4页
环境声音分类(ESC)技术主要涉及声音特征提取和分类器算法的选择。为了探索最佳的特征提取方法和分类器组合,文章对深度学习模型PANNs-CNN进行了研究和分析,对不同的特征提取方法进行了实验对比。实验结果表明,在与同类模型对比中,选用... 环境声音分类(ESC)技术主要涉及声音特征提取和分类器算法的选择。为了探索最佳的特征提取方法和分类器组合,文章对深度学习模型PANNs-CNN进行了研究和分析,对不同的特征提取方法进行了实验对比。实验结果表明,在与同类模型对比中,选用预训练且更深层的CNN模型可以提高ESC的预测性能;Log-Mel特征可以更好地保留声音信号高维度特征及特征相关性,有助于提升模型分类准确率。文章研究的基于Log-Mel特征提取方式和PANNs-CNN 14的环境声音分类算法在ESC-50数据集上的分类准确率最好,并且在实际应用中验证了该算法的有效性。 展开更多
关键词 环境声音分类 预训练音频神经网络 卷积神经网络 Log-Mel MEL频率倒谱系数
在线阅读 下载PDF
一种基于卷积神经网络的环境声音分类方法 被引量:2
3
作者 朱敏 邓伟 赵力 《电子器件》 CAS 北大核心 2021年第2期423-427,共5页
卷积神经网络(CNN)辨别频域-时域模式的能力使其适合于环境声音分类。然而数据的相对稀缺使该方法的应用受限。所以使用数据增强与卷积神经网络结合的方法来克服这一难点。首先,提出使用音频数据增强来增加训练数据,然后提出了一种卷积... 卷积神经网络(CNN)辨别频域-时域模式的能力使其适合于环境声音分类。然而数据的相对稀缺使该方法的应用受限。所以使用数据增强与卷积神经网络结合的方法来克服这一难点。首先,提出使用音频数据增强来增加训练数据,然后提出了一种卷积神经网络模型进行分类。所提出的方法对于环境声音分类的准确率达到了79.5%,这种方法既优于没有增强的CNN模型也优于具有增强的SVM模型。 展开更多
关键词 环境声音分类 环境声音数据集 数据增强 卷积神经网络
在线阅读 下载PDF
基于颜色通道特征融合的环境声音分类方法 被引量:1
4
作者 董绍江 夏蒸富 +2 位作者 方能炜 邢镔 胡小林 《应用科学学报》 CAS CSCD 北大核心 2023年第4期669-681,共13页
针对传统神经网络提取的复杂环境声音特征微弱,导致分类准确率低的问题,提出了一种基于颜色通道特征融合的环境声音分类方法。首先,从原始音频数据中提取出三种声音特征,即对数梅尔频谱图(log-Mel spectrogram,LMS)、梅尔倒谱系数(Mel-s... 针对传统神经网络提取的复杂环境声音特征微弱,导致分类准确率低的问题,提出了一种基于颜色通道特征融合的环境声音分类方法。首先,从原始音频数据中提取出三种声音特征,即对数梅尔频谱图(log-Mel spectrogram,LMS)、梅尔倒谱系数(Mel-scale frequency cepstral coefficients,MFCC)以及能量谱图(energy spectrum,ES);其次,分别将以上三者作为RGB颜色通道分量进行特征融合,形成包含更多特征信息的声谱图,更全面表征环境声音;再次,为了避免由于数据集较少导致所训练的模型泛化能力较差,对预训练模型VGG-16采用微调方法进行训练;最后,在两个广泛使用的环境声音分类数据集以及实际场景采集的音频上验证本文所提方法的有效性,并与其他模型的准确率进行对比。结果表明,本文所提方法在ESC-10以及ESC-50数据集上的准确率分别能够达到88.2%和65.2%,并且能提高实际场景采集的音频分类效果。 展开更多
关键词 RGB颜色通道 特征融合 微调训练 环境声音分类 预训练模型
在线阅读 下载PDF
基于鲁棒纹理特征的环境声音事件检测方法 被引量:1
5
作者 吴婷 刘琼 郭慧茹 《电子器件》 CAS 2024年第2期530-535,共6页
针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特... 针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特征维度过高问题,先利用随机森林算法后结合主成分分析(PCA)算法,提出了RF-PCA降维方法;最后使用支持向量机(SVM)对不同环境的声音进行分类。在公开数据集ESC-10上的仿真实验结果表明,利用所提出的基于鲁棒纹理特征的环境声音事件检测方法所提取的特征对声音分类可达到93.00%的分类效果。 展开更多
关键词 环境声音分类 类伽马声谱图 SHEARLET变换 CBP算法 RF-PCA
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部