期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究
被引量:
2
1
作者
许雯婷
龚晓峰
《计算机应用与软件》
北大核心
2024年第2期130-137,共8页
Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成...
Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成深度全卷积神经网络(Deep Fully Convolutional Neural Networks,DFCNN)结构,提出一种基于DFCNN的弹性网络条件梯度惩罚(Wasserstein Conditional Generative Adversal Network Gradient Penalty,WCGAN-GP)模型。改进后的模型可以达到真实Lipschitz限制条件,提高了可控性、稳定性和特征提取能力,能更快优化训练。实验将改进后的模型与WGAN对不同噪声条件下的语音进行增强,结果证实了改进后的模型在语音增强方面的优越性。
展开更多
关键词
Wasserstein距离
深度全卷积神经网络
梯度惩罚
弹性
网络
条件约束
在线阅读
下载PDF
职称材料
基于神经网络的语音信号识别与分类
被引量:
1
2
作者
薛雅洁
贺红霞
杨祎
《现代电子技术》
2023年第24期79-84,共6页
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语...
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
展开更多
关键词
语音信号识别
深度
全
序列
卷积
神经网络
隐马尔可夫链
声学特征提取
梅尔倒谱系数
CTC损失函数
在线阅读
下载PDF
职称材料
基于局部-全局一致性学习的弱监督人手分割
3
作者
谢志坚
李寅霖
郑碎武
《计算机应用与软件》
北大核心
2019年第1期204-210,319,共8页
随着可穿戴设备的日益普及,人的上肢行为数据急剧增长,而自然场景下的人手分割研究较少。针对现有的算法对手工设计特征、像素级标签、设备、环境等的依赖,造成的精度有限或设备、人工标注成本较高的问题,提出一种弱监督人手分割算法,...
随着可穿戴设备的日益普及,人的上肢行为数据急剧增长,而自然场景下的人手分割研究较少。针对现有的算法对手工设计特征、像素级标签、设备、环境等的依赖,造成的精度有限或设备、人工标注成本较高的问题,提出一种弱监督人手分割算法,并将其应用到人手操作行为分割中。在像素级标签的源数据集上,利用全卷积神经网络(FCN)预训练。在只有类别标签的目标数据集上,实现基于超像素的局部-全局一致性学习的分割优化,进而实现FCN网络训练和分割优化的交替迭代。使用全连接条件随机场(CRF)进行后处理。提出基于边界框的弱监督分割,以及半监督分割方法。与其他方法的对比实验表明,该方法具有较高的召回率和区域交叠率。
展开更多
关键词
人手分割
深度全卷积神经网络
弱监督学习
条件随机场
在线阅读
下载PDF
职称材料
题名
基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究
被引量:
2
1
作者
许雯婷
龚晓峰
机构
四川大学电气工程学院
出处
《计算机应用与软件》
北大核心
2024年第2期130-137,共8页
基金
四川省重点研发计划项目(2020YFG0051)
国家自然科学基金项目(61876114)
校企合作项目(19H1121,19H0355)。
文摘
Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成深度全卷积神经网络(Deep Fully Convolutional Neural Networks,DFCNN)结构,提出一种基于DFCNN的弹性网络条件梯度惩罚(Wasserstein Conditional Generative Adversal Network Gradient Penalty,WCGAN-GP)模型。改进后的模型可以达到真实Lipschitz限制条件,提高了可控性、稳定性和特征提取能力,能更快优化训练。实验将改进后的模型与WGAN对不同噪声条件下的语音进行增强,结果证实了改进后的模型在语音增强方面的优越性。
关键词
Wasserstein距离
深度全卷积神经网络
梯度惩罚
弹性
网络
条件约束
Keywords
Wasserstein distance
Deep fully convolutional neural networks
Gradient penalty
Elastic networks
Conditional constraints
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
基于神经网络的语音信号识别与分类
被引量:
1
2
作者
薛雅洁
贺红霞
杨祎
机构
西安邮电大学电子工程学院
出处
《现代电子技术》
2023年第24期79-84,共6页
基金
西安市科技计划项目(101/203010002)。
文摘
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
关键词
语音信号识别
深度
全
序列
卷积
神经网络
隐马尔可夫链
声学特征提取
梅尔倒谱系数
CTC损失函数
Keywords
speech signal recognition
deep full convolutional neural network
hidden Markov chain
acoustic feature extraction
Mel cepstrum coefficient
CTC loss function
分类号
TN912-34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于局部-全局一致性学习的弱监督人手分割
3
作者
谢志坚
李寅霖
郑碎武
机构
广州市机电技师学院智能控制系
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
中国科学院自动化研究所惠州先进制造产业技术研究中心
出处
《计算机应用与软件》
北大核心
2019年第1期204-210,319,共8页
基金
国家自然科学基金青年科学基金项目(61702516
51705515)
+1 种基金
国家自然科学基金委NSFC-深圳机器人基础研究中心项目(U1713201)
广东省重大科技专项(2016B090910001)
文摘
随着可穿戴设备的日益普及,人的上肢行为数据急剧增长,而自然场景下的人手分割研究较少。针对现有的算法对手工设计特征、像素级标签、设备、环境等的依赖,造成的精度有限或设备、人工标注成本较高的问题,提出一种弱监督人手分割算法,并将其应用到人手操作行为分割中。在像素级标签的源数据集上,利用全卷积神经网络(FCN)预训练。在只有类别标签的目标数据集上,实现基于超像素的局部-全局一致性学习的分割优化,进而实现FCN网络训练和分割优化的交替迭代。使用全连接条件随机场(CRF)进行后处理。提出基于边界框的弱监督分割,以及半监督分割方法。与其他方法的对比实验表明,该方法具有较高的召回率和区域交叠率。
关键词
人手分割
深度全卷积神经网络
弱监督学习
条件随机场
Keywords
Hand segmentation
Deep fully convolutional neural network
Weakly supervised learning
CRF
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究
许雯婷
龚晓峰
《计算机应用与软件》
北大核心
2024
2
在线阅读
下载PDF
职称材料
2
基于神经网络的语音信号识别与分类
薛雅洁
贺红霞
杨祎
《现代电子技术》
2023
1
在线阅读
下载PDF
职称材料
3
基于局部-全局一致性学习的弱监督人手分割
谢志坚
李寅霖
郑碎武
《计算机应用与软件》
北大核心
2019
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部