期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于混合混响模型的多通道语音增强算法 被引量:1
1
作者 解元 邹涛 +1 位作者 孙为军 谢胜利 《通信学报》 EI CSCD 北大核心 2024年第11期15-26,共12页
为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型... 为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型来建模,为优化模型参数,利用卡尔曼滤波器实施更新模型参数,并用多项式矩阵特征值分解进行空间、时间和频率解相关,实现去混响去噪声。实验结果表明,所提算法可以实现高低混响带噪声环境下的语音增强,相比于流行的语音增强算法,其增强效果更优越,其中语音质量客观评价(PESQ)值和短时客观可懂度(STOI)值最高分别提高了30%和20%。 展开更多
关键词 多通道语音增强 卡尔曼滤波器 多项式矩阵特征值分解
在线阅读 下载PDF
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
2
作者 杨俊杰 丁家辉 +2 位作者 杨柳 冯丽 杨超 《应用声学》 CSCD 北大核心 2024年第3期513-524,共12页
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模... 环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。 展开更多
关键词 环境声分类 梅尔Gammatone频率倒谱 多尺度核卷积 高效通道注意力 卷积神经网络
在线阅读 下载PDF
面向高混响环境的欠定卷积盲源分离算法 被引量:7
3
作者 解元 邹涛 +1 位作者 孙为军 谢胜利 《通信学报》 EI CSCD 北大核心 2023年第2期82-93,共12页
为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应... 为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应矩阵缩短了传统脉冲响应的长度,降低了高混响带来的模型变换近似误差。基于非负矩阵分解理论设计模型参数的实时更新学习规则,将源信号分离问题转换为模型参数优化问题,实现混叠信号的盲源分离。实验结果表明,所提算法可以有效地实现中英文语音、音乐混叠信号的盲源分离,与现有比较流行的盲源分离算法的对比验证了所提算法的优越性。 展开更多
关键词 盲源分离 欠定卷积混叠 高混响环境 全局脉冲响应网络 非负矩阵分解
在线阅读 下载PDF
面向卷积混叠环境下的盲源分离新方法 被引量:7
4
作者 解元 邹涛 +1 位作者 孙为军 谢胜利 《自动化学报》 EI CAS CSCD 北大核心 2023年第5期1062-1072,共11页
卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,... 卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,得到新的模型参数更新规则;并对解混叠矩阵进行标准化处理,避免幅度歧义性问题;在源信号的重构阶段,通过实时更新非负矩阵分解模型参数,避免源信号的排序歧义性问题.实验结果验证了所提算法在分离中英文语音混叠信号、音乐混叠信号时的有效性和优越性. 展开更多
关键词 盲源分离 卷积混叠 独立分量分析 非负矩阵分解
在线阅读 下载PDF
结合脉冲响应重塑和期望最大化的盲信号分离 被引量:2
5
作者 解元 张旭 +3 位作者 邹涛 马鸽 余锦视 孙为军 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3343-3353,共11页
多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效... 多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效的.本文针对具有声学回声和混响环境下的多通道欠定卷积语音混合信号的分离问题,提出一种结合脉冲响应重塑和期望最大化的盲信号分离算法,该算法在低混响和高混响下都表现出很好的分离性能.首先,利用基于无穷范数和p-范数的脉冲响应重塑技术设计预滤波器消除可听回声,完成对混合信号的重塑,提高混合信号的质量.然后,对重塑后的混合信号利用分层聚类方法估计混合矩阵,基于期望最大化算法框架,设计新的模型参数实时更新规则,通过结合脉冲响应重塑和期望最大化重构源信号.实验结果表明,所提算法可以有效地分离不同混响环境下带声学回声的欠定卷积混合信号,其分离性能优越,同时对噪声具有很好的鲁棒性. 展开更多
关键词 盲源分离 脉冲响应重塑 多通道卷积混合 期望最大化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部