期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
声景识音:数字化时代声学场景分类的探索与前沿
1
作者 庞鑫 葛凤培 李艳玲 《计算机工程》 北大核心 2025年第6期1-19,共19页
声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技... 声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。 展开更多
关键词 声学场景分类 深度学习 音频分类 语音识别 数据增强
在线阅读 下载PDF
基于神经网络的声场景数据声谱图提取方法 被引量:2
2
作者 韦娟 丁智恺 宁方立 《系统工程与电子技术》 EI CSCD 北大核心 2021年第12期3462-3469,共8页
在复杂环境声场景识别任务中,梅尔频谱作为输入的深度卷积神经网络有良好的识别能力,然而梅尔滤波器组依据人耳生理特征设计,对于声场景识别并非最优滤波器组。针对此问题提出声谱图提取神经网络取代传统梅尔频谱提取过程,通过训练该网... 在复杂环境声场景识别任务中,梅尔频谱作为输入的深度卷积神经网络有良好的识别能力,然而梅尔滤波器组依据人耳生理特征设计,对于声场景识别并非最优滤波器组。针对此问题提出声谱图提取神经网络取代传统梅尔频谱提取过程,通过训练该网络使声谱图自动适应声场景数据集。声谱图提取神经网络连接ResNet50作为声场景识别架构,在DCASE2019声场景数据集上进行训练与测试,实验结果表明该架构比传统模型有更高的识别率,能够有效调整频率曲线、滤波器幅值以及滤波器形状。 展开更多
关键词 声场景分类 深度卷积神经网络 声谱图提取神经网络 梅尔频谱
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部