期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究 被引量:2
1
作者 许雯婷 龚晓峰 《计算机应用与软件》 北大核心 2024年第2期130-137,共8页
Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成... Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成深度全卷积神经网络(Deep Fully Convolutional Neural Networks,DFCNN)结构,提出一种基于DFCNN的弹性网络条件梯度惩罚(Wasserstein Conditional Generative Adversal Network Gradient Penalty,WCGAN-GP)模型。改进后的模型可以达到真实Lipschitz限制条件,提高了可控性、稳定性和特征提取能力,能更快优化训练。实验将改进后的模型与WGAN对不同噪声条件下的语音进行增强,结果证实了改进后的模型在语音增强方面的优越性。 展开更多
关键词 Wasserstein距离 深度全卷积神经网络 梯度惩罚 弹性网络 条件约束
在线阅读 下载PDF
基于神经网络的语音信号识别与分类 被引量:1
2
作者 薛雅洁 贺红霞 杨祎 《现代电子技术》 2023年第24期79-84,共6页
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语... 针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。 展开更多
关键词 语音信号识别 深度序列卷积神经网络 隐马尔可夫链 声学特征提取 梅尔倒谱系数 CTC损失函数
在线阅读 下载PDF
基于局部-全局一致性学习的弱监督人手分割
3
作者 谢志坚 李寅霖 郑碎武 《计算机应用与软件》 北大核心 2019年第1期204-210,319,共8页
随着可穿戴设备的日益普及,人的上肢行为数据急剧增长,而自然场景下的人手分割研究较少。针对现有的算法对手工设计特征、像素级标签、设备、环境等的依赖,造成的精度有限或设备、人工标注成本较高的问题,提出一种弱监督人手分割算法,... 随着可穿戴设备的日益普及,人的上肢行为数据急剧增长,而自然场景下的人手分割研究较少。针对现有的算法对手工设计特征、像素级标签、设备、环境等的依赖,造成的精度有限或设备、人工标注成本较高的问题,提出一种弱监督人手分割算法,并将其应用到人手操作行为分割中。在像素级标签的源数据集上,利用全卷积神经网络(FCN)预训练。在只有类别标签的目标数据集上,实现基于超像素的局部-全局一致性学习的分割优化,进而实现FCN网络训练和分割优化的交替迭代。使用全连接条件随机场(CRF)进行后处理。提出基于边界框的弱监督分割,以及半监督分割方法。与其他方法的对比实验表明,该方法具有较高的召回率和区域交叠率。 展开更多
关键词 人手分割 深度全卷积神经网络 弱监督学习 条件随机场
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部