期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种密集卷积神经网络的电视语音响度补偿方法
1
作者 谢仁礼 秦宇 罗雪倩 《电声技术》 2021年第6期18-24,共7页
现有的电视语音响度补偿是针对人耳听阈和听力障碍的损失进行均衡补偿,这类方法会放大同频段的非人声。针对这类方法的缺陷,提出利用深度学习语音增强技术将人声从电视节目音频中分离出来,使用户直接听到清晰人声。对此提出密集连接卷... 现有的电视语音响度补偿是针对人耳听阈和听力障碍的损失进行均衡补偿,这类方法会放大同频段的非人声。针对这类方法的缺陷,提出利用深度学习语音增强技术将人声从电视节目音频中分离出来,使用户直接听到清晰人声。对此提出密集连接卷积网络(Densely Connected Convolutional Network,DenseNet)结合卷积神经网络编解码器(Convolutional Encoder-Decoder,CED)结构的新型神经网络语音增强模型。该模型量级较轻,能够在电视上实时运行,与同量级网络参数的卷积神经网络(Convolutional Neural Networks,CNN)语音增强模型相比,效果更好且模型更小。 展开更多
关键词 密集连接卷积神经网络 卷积编解码器 实时语音增强 残差连接
在线阅读 下载PDF
基于音频特征融合的振动筛故障诊断方法
2
作者 李越 李敬兆 +2 位作者 何长林 王斌 李彪 《兰州工业学院学报》 2025年第1期60-67,共8页
为及时发现振动筛的故障,提出一种融合改进梅尔频率倒谱系数(MFCC)、密集卷积神经网络(Dense-CNN)和双向长短期记忆网络(BiLSTM)的振动筛故障诊断模型(Dense-CNN-BiLSTM)。首先,利用固有时间尺度分解(ITD)对振动筛音频信号进行时频分析... 为及时发现振动筛的故障,提出一种融合改进梅尔频率倒谱系数(MFCC)、密集卷积神经网络(Dense-CNN)和双向长短期记忆网络(BiLSTM)的振动筛故障诊断模型(Dense-CNN-BiLSTM)。首先,利用固有时间尺度分解(ITD)对振动筛音频信号进行时频分析,提取其固有旋转分量(PRC);其次,提取由独立成分分析(ICA)改进的13维MFCC特征参数,并将特征参数输入Dense-CNN-BiLSTM模型,实现振动筛的故障诊断。结果表明:改进的MFCC特征参数能表示振动筛不同运行状态的音频信号特征,验证了基于音频特征融合实现振动筛故障诊断的可行性。 展开更多
关键词 振动筛 梅尔频率倒谱系数 密集卷积神经网络 双向长短期记忆网络
在线阅读 下载PDF
N-DenseNet的城市声音事件分类模型 被引量:6
3
作者 曹毅 黄子龙 +2 位作者 张威 刘晨 李巍 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期9-16,94,共9页
针对城市声音事件分类领域中现有模型分类准确率不高、泛化能力不强的问题,提出了一种N阶密集卷积神经网络的城市声音事件分类模型。首先,介绍了密集卷积神经网络的结构;其次,基于N阶马尔可夫模型将密集连接改进为N阶有关连接;然后,结... 针对城市声音事件分类领域中现有模型分类准确率不高、泛化能力不强的问题,提出了一种N阶密集卷积神经网络的城市声音事件分类模型。首先,介绍了密集卷积神经网络的结构;其次,基于N阶马尔可夫模型将密集连接改进为N阶有关连接;然后,结合两者提出了一种更适合音频分类的模型--N阶密集卷积神经网络。该模型在避免梯度消失的前提下,有针对性、规律性减少了特征图层之间的连接,更高效地融合了前N特征图层的信息,使得模型的收敛速度更快;最后,为了验证该模型,采用N阶密集卷积神经网络的一阶、二阶子模型,基于UrbanSound8K和Dcase2016数据集开展了城市声音事件分类研究。研究结果表明,其模型准确率分别为83.63%、81.03%,验证了该模型具有良好的分类准确率和泛化能力。 展开更多
关键词 声音事件分类 密集卷积神经网络 N阶马尔可夫模型 N阶密集卷积神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部