期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于临界频带的交互性双支路单通道语音增强模型
被引量:
3
1
作者
叶中付
赵紫微
于润祥
《数据采集与处理》
CSCD
北大核心
2023年第2期262-273,共12页
针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在...
针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在幅度补偿支路上直接对信号的全频带进行处理,提取全频带信息。复数谱支路负责初步恢复干净语音的幅度和相位,同时,该支路上学到的子带中间特征会被特定的模块传递给幅度补偿支路进行补偿;幅度补偿支路上的输出会对复数谱支路上输出的幅度做进一步的补偿,达到恢复干净语音频谱的目的。实验结果表明,提出的模型在恢复语音质量和可懂度方面优于其他先进的单通道语音增强模型。
展开更多
关键词
临界频带
交互性
子带
双支路
单通道语音增强
在线阅读
下载PDF
职称材料
基于字典学习和稀疏表示的单通道语音增强算法综述
被引量:
2
2
作者
叶中付
朱媛媛
贾翔宇
《应用声学》
CSCD
北大核心
2019年第4期645-652,共8页
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规...
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对 4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。
展开更多
关键词
单通道语音增强
稀疏表示
字典学习
在线阅读
下载PDF
职称材料
基于并行卷积循环网络的单通道语音增强系统
被引量:
5
3
作者
李鑫元
黄鹤鸣
《计算机工程与设计》
北大核心
2023年第4期1181-1188,共8页
为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器...
为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器处理后的语音特征,通过后处理模块处理并行结构的输出。在THCHS30和LibriSpeech语音库及NOISEX92和PNL100 NS噪声库上的实验结果表明,与多个目前最先进的语音增强系统相比,该方法获得了最高36.92%的性能提升和62.36%的收敛速度提升。
展开更多
关键词
语音
增强
单通道语音增强
深度学习
卷积循环网络
并行网络
门控线性单元
低资源训练
在线阅读
下载PDF
职称材料
基于多维注意力机制的单通道语音增强方法
被引量:
1
4
作者
姚瑶
杨吉斌
+2 位作者
张雄伟
陈乐乐
范君怡
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期669-679,共11页
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将...
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM-Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM-Net在VoiceBank-DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型.
展开更多
关键词
单通道语音增强
多维注意力
通道
注意力
TRANSFORMER
在线阅读
下载PDF
职称材料
改进NMF单通道语音增强算法
被引量:
1
5
作者
张星
《机械设计与制造》
北大核心
2019年第1期268-271,共4页
针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率...
针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率进行估计,以此对NMF识别基进行自适应补偿,从而提高识别基语音增强性能,然后通过残差消除进一步提高语音质量,实验结果表明,与传统的基于单通道的NMF方法相比,文中算法获得了更好的语音增强性能。
展开更多
关键词
单通道语音增强
语音
存在概率
非负矩阵分解
对数谱估计
无监督学习
在线阅读
下载PDF
职称材料
题名
基于临界频带的交互性双支路单通道语音增强模型
被引量:
3
1
作者
叶中付
赵紫微
于润祥
机构
中国科学技术大学电子工程与信息科学系
语音及语言信息处理国家工程研究中心
出处
《数据采集与处理》
CSCD
北大核心
2023年第2期262-273,共12页
基金
国家自然科学基金(61671418)。
文摘
针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在幅度补偿支路上直接对信号的全频带进行处理,提取全频带信息。复数谱支路负责初步恢复干净语音的幅度和相位,同时,该支路上学到的子带中间特征会被特定的模块传递给幅度补偿支路进行补偿;幅度补偿支路上的输出会对复数谱支路上输出的幅度做进一步的补偿,达到恢复干净语音频谱的目的。实验结果表明,提出的模型在恢复语音质量和可懂度方面优于其他先进的单通道语音增强模型。
关键词
临界频带
交互性
子带
双支路
单通道语音增强
Keywords
critical frequency band
interactive
subband
dual-branch
monaural speech enhancement
分类号
TN912.35 [电子电信—通信与信息系统]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于字典学习和稀疏表示的单通道语音增强算法综述
被引量:
2
2
作者
叶中付
朱媛媛
贾翔宇
机构
中国科学技术大学信息科学技术学院
出处
《应用声学》
CSCD
北大核心
2019年第4期645-652,共8页
基金
国家自然科学基金项目(61671418)
文摘
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对 4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。
关键词
单通道语音增强
稀疏表示
字典学习
Keywords
Single-channel speech enhancement
Sparse representation
Dictionary learning
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于并行卷积循环网络的单通道语音增强系统
被引量:
5
3
作者
李鑫元
黄鹤鸣
机构
青海师范大学计算机学院
青海师范大学藏语智能信息处理及应用国家重点实验室
出处
《计算机工程与设计》
北大核心
2023年第4期1181-1188,共8页
基金
国家自然科学基金项目(62066039)。
文摘
为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器处理后的语音特征,通过后处理模块处理并行结构的输出。在THCHS30和LibriSpeech语音库及NOISEX92和PNL100 NS噪声库上的实验结果表明,与多个目前最先进的语音增强系统相比,该方法获得了最高36.92%的性能提升和62.36%的收敛速度提升。
关键词
语音
增强
单通道语音增强
深度学习
卷积循环网络
并行网络
门控线性单元
低资源训练
Keywords
speech enhancement
monaural speech enhancement
deep learning
convolutional recurrent networks
parallel networks
gated linear unit
low-resource training
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于多维注意力机制的单通道语音增强方法
被引量:
1
4
作者
姚瑶
杨吉斌
张雄伟
陈乐乐
范君怡
机构
陆军工程大学指挥控制工程学院
中国科学院声学研究所东海研究站
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期669-679,共11页
基金
国家自然科学基金(62071484)
陆军工程大学基础前沿项目(KYZYJKQTZQ23001)。
文摘
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM-Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM-Net在VoiceBank-DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型.
关键词
单通道语音增强
多维注意力
通道
注意力
TRANSFORMER
Keywords
single⁃channel speech enhancement
multi⁃dimensional attention
channel attention
Transformer
分类号
TN912 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
改进NMF单通道语音增强算法
被引量:
1
5
作者
张星
机构
阿拉善职业技术学院
出处
《机械设计与制造》
北大核心
2019年第1期268-271,共4页
基金
国家自然科学基金(61271444)
文摘
针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率进行估计,以此对NMF识别基进行自适应补偿,从而提高识别基语音增强性能,然后通过残差消除进一步提高语音质量,实验结果表明,与传统的基于单通道的NMF方法相比,文中算法获得了更好的语音增强性能。
关键词
单通道语音增强
语音
存在概率
非负矩阵分解
对数谱估计
无监督学习
Keywords
Single-channel Speech Enhancement
Spectrotemporal Speech Presence Probability
Nonnegative Matrix Factorization
Log-spectral Amplitude
Unsupervised Learning Method
分类号
TH16 [机械工程—机械制造及自动化]
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于临界频带的交互性双支路单通道语音增强模型
叶中付
赵紫微
于润祥
《数据采集与处理》
CSCD
北大核心
2023
3
在线阅读
下载PDF
职称材料
2
基于字典学习和稀疏表示的单通道语音增强算法综述
叶中付
朱媛媛
贾翔宇
《应用声学》
CSCD
北大核心
2019
2
在线阅读
下载PDF
职称材料
3
基于并行卷积循环网络的单通道语音增强系统
李鑫元
黄鹤鸣
《计算机工程与设计》
北大核心
2023
5
在线阅读
下载PDF
职称材料
4
基于多维注意力机制的单通道语音增强方法
姚瑶
杨吉斌
张雄伟
陈乐乐
范君怡
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
5
改进NMF单通道语音增强算法
张星
《机械设计与制造》
北大核心
2019
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部