-
题名基于混合混响模型的多通道语音增强算法
- 1
-
-
作者
解元
邹涛
孙为军
谢胜利
-
机构
广州大学机械与电气工程学院
广东工业大学物联网智能信息处理与系统集成教育部重点实验室
-
出处
《通信学报》
EI
CSCD
北大核心
2024年第11期15-26,共12页
-
基金
广州市基础与应用基础研究基金资助项目(No.SL2022A04J00289)
国家自然科学基金资助项目(No.62003095,No.52171331)
+1 种基金
广东省基础与应用基础研究基金资助项目(No.2023A1515011311)
广州市市校联合实验室基金资助项目(No.2023A03J0120)。
-
文摘
为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型来建模,为优化模型参数,利用卡尔曼滤波器实施更新模型参数,并用多项式矩阵特征值分解进行空间、时间和频率解相关,实现去混响去噪声。实验结果表明,所提算法可以实现高低混响带噪声环境下的语音增强,相比于流行的语音增强算法,其增强效果更优越,其中语音质量客观评价(PESQ)值和短时客观可懂度(STOI)值最高分别提高了30%和20%。
-
关键词
多通道语音增强
卡尔曼滤波器
多项式矩阵特征值分解
-
Keywords
multichannel speech enhancement
Kalman filter
polynomial matrix eigenvalue decomposition
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向高混响环境的欠定卷积盲源分离算法
被引量:6
- 2
-
-
作者
解元
邹涛
孙为军
谢胜利
-
机构
广州大学机械与电气工程学院
广东工业大学智能检测与制造物联教育部重点实验室
广东工业大学物联网智能信息处理与系统集成教育部重点实验室
-
出处
《通信学报》
EI
CSCD
北大核心
2023年第2期82-93,共12页
-
基金
国家自然科学基金资助项目(No.62003095,No.52171331)
广东省重点领域研发计划基金资助项目(No.2019B01054002)。
-
文摘
为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应矩阵缩短了传统脉冲响应的长度,降低了高混响带来的模型变换近似误差。基于非负矩阵分解理论设计模型参数的实时更新学习规则,将源信号分离问题转换为模型参数优化问题,实现混叠信号的盲源分离。实验结果表明,所提算法可以有效地实现中英文语音、音乐混叠信号的盲源分离,与现有比较流行的盲源分离算法的对比验证了所提算法的优越性。
-
关键词
盲源分离
欠定卷积混叠
高混响环境
全局脉冲响应网络
非负矩阵分解
-
Keywords
blind source separation
underdetermined convolutive mixture
high reverberation environment
global impulse response network
nonnegative matrix factorization
-
分类号
TN911.23
[电子电信—通信与信息系统]
-