期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于临界频带的交互性双支路单通道语音增强模型 被引量:3
1
作者 叶中付 赵紫微 于润祥 《数据采集与处理》 CSCD 北大核心 2023年第2期262-273,共12页
针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在... 针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在幅度补偿支路上直接对信号的全频带进行处理,提取全频带信息。复数谱支路负责初步恢复干净语音的幅度和相位,同时,该支路上学到的子带中间特征会被特定的模块传递给幅度补偿支路进行补偿;幅度补偿支路上的输出会对复数谱支路上输出的幅度做进一步的补偿,达到恢复干净语音频谱的目的。实验结果表明,提出的模型在恢复语音质量和可懂度方面优于其他先进的单通道语音增强模型。 展开更多
关键词 临界频带 交互性 子带 双支路 单通道语音增强
在线阅读 下载PDF
基于字典学习和稀疏表示的单通道语音增强算法综述 被引量:2
2
作者 叶中付 朱媛媛 贾翔宇 《应用声学》 CSCD 北大核心 2019年第4期645-652,共8页
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规... 如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对 4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。 展开更多
关键词 单通道语音增强 稀疏表示 字典学习
在线阅读 下载PDF
基于并行卷积循环网络的单通道语音增强系统 被引量:5
3
作者 李鑫元 黄鹤鸣 《计算机工程与设计》 北大核心 2023年第4期1181-1188,共8页
为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器... 为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器处理后的语音特征,通过后处理模块处理并行结构的输出。在THCHS30和LibriSpeech语音库及NOISEX92和PNL100 NS噪声库上的实验结果表明,与多个目前最先进的语音增强系统相比,该方法获得了最高36.92%的性能提升和62.36%的收敛速度提升。 展开更多
关键词 语音增强 单通道语音增强 深度学习 卷积循环网络 并行网络 门控线性单元 低资源训练
在线阅读 下载PDF
基于多维注意力机制的单通道语音增强方法 被引量:1
4
作者 姚瑶 杨吉斌 +2 位作者 张雄伟 陈乐乐 范君怡 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期669-679,共11页
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将... 基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM-Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM-Net在VoiceBank-DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型. 展开更多
关键词 单通道语音增强 多维注意力 通道注意力 TRANSFORMER
在线阅读 下载PDF
改进NMF单通道语音增强算法 被引量:1
5
作者 张星 《机械设计与制造》 北大核心 2019年第1期268-271,共4页
针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率... 针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率进行估计,以此对NMF识别基进行自适应补偿,从而提高识别基语音增强性能,然后通过残差消除进一步提高语音质量,实验结果表明,与传统的基于单通道的NMF方法相比,文中算法获得了更好的语音增强性能。 展开更多
关键词 单通道语音增强 语音存在概率 非负矩阵分解 对数谱估计 无监督学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部