检索结果-维普期刊中文期刊服务平台

基于深度学习的多声音事件检测研究综述: 1; 作者张珑张恒远 +1 位作者魏育华杨烁祯《天津师范大学学报（自然科学版）》 CAS 北大核心 2024年第6期1-12,共12页; 多声音事件检测是当前语音处理的研究热点之一,本文对近年来基于深度学习的多声音事件检测模型进行综述.首先介绍了4种监督学习模型和13种弱监督学习模型,弱监督学习模型包括基于平均教师的模型、基于注意力的模型、基于源分离的模型、... 展开更多; 关键词深度学习多声音事件检测弱监督学习半监督学习; 在线阅读下载PDF 职称材料

端到端流式语音识别研究综述被引量：14: 2; 作者王澳回张珑 +1 位作者宋文宇孟杰《计算机工程与应用》 CSCD 北大核心 2023年第2期22-33,共12页; 语音识别是实现人机交互的一种重要途径,是自然语言处理的基础环节,随着人工智能技术的发展,人机交互等大量应用场景存在着流式语音识别的需求。流式语音识别的定义是一边输入语音一边输出结果,它能够大大减少人机交互过程中语音识别的... 展开更多; 关键词人机交互语音识别端到端流式延迟; 在线阅读下载PDF 职称材料

声音事件检测综述被引量：3: 3; 作者杨烁祯张珑 +1 位作者王建华张恒远《广西师范大学学报（自然科学版）》 CAS 北大核心 2023年第2期1-18,共18页; 声音事件检测技术能够识别出一个音频段中存在的事件类别并标注出各事件的起止时间,在智能城市、医疗监控、野生动物保护等应用场景有巨大潜力,是机器听觉领域的一个重要研究课题。本文从监督学习和半监督学习2个方面对声音事件检测方... 展开更多; 关键词声音事件检测机器学习深度学习神经网络监督学习半监督学习; 在线阅读下载PDF 职称材料