期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于混合混响模型的多通道语音增强算法
被引量:
1
1
作者
解元
邹涛
+1 位作者
孙为军
谢胜利
《通信学报》
EI
CSCD
北大核心
2024年第11期15-26,共12页
为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型...
为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型来建模,为优化模型参数,利用卡尔曼滤波器实施更新模型参数,并用多项式矩阵特征值分解进行空间、时间和频率解相关,实现去混响去噪声。实验结果表明,所提算法可以实现高低混响带噪声环境下的语音增强,相比于流行的语音增强算法,其增强效果更优越,其中语音质量客观评价(PESQ)值和短时客观可懂度(STOI)值最高分别提高了30%和20%。
展开更多
关键词
多通道语音增强
卡尔曼滤波器
多项式矩阵特征值分解
在线阅读
下载PDF
职称材料
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
2
作者
杨俊杰
丁家辉
+2 位作者
杨柳
冯丽
杨超
《应用声学》
CSCD
北大核心
2024年第3期513-524,共12页
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模...
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。
展开更多
关键词
环境声分类
梅尔Gammatone频率倒谱
多尺度核卷积
高效通道注意力
卷积神经网络
在线阅读
下载PDF
职称材料
面向高混响环境的欠定卷积盲源分离算法
被引量:
7
3
作者
解元
邹涛
+1 位作者
孙为军
谢胜利
《通信学报》
EI
CSCD
北大核心
2023年第2期82-93,共12页
为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应...
为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应矩阵缩短了传统脉冲响应的长度,降低了高混响带来的模型变换近似误差。基于非负矩阵分解理论设计模型参数的实时更新学习规则,将源信号分离问题转换为模型参数优化问题,实现混叠信号的盲源分离。实验结果表明,所提算法可以有效地实现中英文语音、音乐混叠信号的盲源分离,与现有比较流行的盲源分离算法的对比验证了所提算法的优越性。
展开更多
关键词
盲源分离
欠定卷积混叠
高混响环境
全局脉冲响应网络
非负矩阵分解
在线阅读
下载PDF
职称材料
面向卷积混叠环境下的盲源分离新方法
被引量:
7
4
作者
解元
邹涛
+1 位作者
孙为军
谢胜利
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第5期1062-1072,共11页
卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,...
卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,得到新的模型参数更新规则;并对解混叠矩阵进行标准化处理,避免幅度歧义性问题;在源信号的重构阶段,通过实时更新非负矩阵分解模型参数,避免源信号的排序歧义性问题.实验结果验证了所提算法在分离中英文语音混叠信号、音乐混叠信号时的有效性和优越性.
展开更多
关键词
盲源分离
卷积混叠
独立分量分析
非负矩阵分解
在线阅读
下载PDF
职称材料
结合脉冲响应重塑和期望最大化的盲信号分离
被引量:
2
5
作者
解元
张旭
+3 位作者
邹涛
马鸽
余锦视
孙为军
《电子学报》
EI
CAS
CSCD
北大核心
2023年第11期3343-3353,共11页
多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效...
多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效的.本文针对具有声学回声和混响环境下的多通道欠定卷积语音混合信号的分离问题,提出一种结合脉冲响应重塑和期望最大化的盲信号分离算法,该算法在低混响和高混响下都表现出很好的分离性能.首先,利用基于无穷范数和p-范数的脉冲响应重塑技术设计预滤波器消除可听回声,完成对混合信号的重塑,提高混合信号的质量.然后,对重塑后的混合信号利用分层聚类方法估计混合矩阵,基于期望最大化算法框架,设计新的模型参数实时更新规则,通过结合脉冲响应重塑和期望最大化重构源信号.实验结果表明,所提算法可以有效地分离不同混响环境下带声学回声的欠定卷积混合信号,其分离性能优越,同时对噪声具有很好的鲁棒性.
展开更多
关键词
盲源分离
脉冲响应重塑
多通道卷积混合
期望最大化
在线阅读
下载PDF
职称材料
题名
基于混合混响模型的多通道语音增强算法
被引量:
1
1
作者
解元
邹涛
孙为军
谢胜利
机构
广州大学机械与电气工程学院
广东工业大学
物联网智能信息处理与系统集成教育部重点实验室
出处
《通信学报》
EI
CSCD
北大核心
2024年第11期15-26,共12页
基金
广州市基础与应用基础研究基金资助项目(No.SL2022A04J00289)
国家自然科学基金资助项目(No.62003095,No.52171331)
+1 种基金
广东省基础与应用基础研究基金资助项目(No.2023A1515011311)
广州市市校联合实验室基金资助项目(No.2023A03J0120)。
文摘
为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型来建模,为优化模型参数,利用卡尔曼滤波器实施更新模型参数,并用多项式矩阵特征值分解进行空间、时间和频率解相关,实现去混响去噪声。实验结果表明,所提算法可以实现高低混响带噪声环境下的语音增强,相比于流行的语音增强算法,其增强效果更优越,其中语音质量客观评价(PESQ)值和短时客观可懂度(STOI)值最高分别提高了30%和20%。
关键词
多通道语音增强
卡尔曼滤波器
多项式矩阵特征值分解
Keywords
multichannel speech enhancement
Kalman filter
polynomial matrix eigenvalue decomposition
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
2
作者
杨俊杰
丁家辉
杨柳
冯丽
杨超
机构
广东工业大学自动化学院
物联网智能信息处理与系统集成教育部重点实验室
广州大学计算机科学与网络工程学院
澳门科技大学资讯科技学院
出处
《应用声学》
CSCD
北大核心
2024年第3期513-524,共12页
基金
国家自然科学青年基金项目(62003101)
广东省自然科学基金面上基金项目(2022A1515010181,2023A1515011290)。
文摘
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。
关键词
环境声分类
梅尔Gammatone频率倒谱
多尺度核卷积
高效通道注意力
卷积神经网络
Keywords
Environmental sound classification
Mel-generalized cepstral coefficients
Multi-scale kernel convolution
Efficient channel attention
Convolutional neural network
分类号
TM595 [电气工程—电器]
在线阅读
下载PDF
职称材料
题名
面向高混响环境的欠定卷积盲源分离算法
被引量:
7
3
作者
解元
邹涛
孙为军
谢胜利
机构
广州大学机械与电气工程学院
广东工业大学
智能
检测与制造
物
联
教育部
重点
实验室
广东工业大学
物联网智能信息处理与系统集成教育部重点实验室
出处
《通信学报》
EI
CSCD
北大核心
2023年第2期82-93,共12页
基金
国家自然科学基金资助项目(No.62003095,No.52171331)
广东省重点领域研发计划基金资助项目(No.2019B01054002)。
文摘
为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应矩阵缩短了传统脉冲响应的长度,降低了高混响带来的模型变换近似误差。基于非负矩阵分解理论设计模型参数的实时更新学习规则,将源信号分离问题转换为模型参数优化问题,实现混叠信号的盲源分离。实验结果表明,所提算法可以有效地实现中英文语音、音乐混叠信号的盲源分离,与现有比较流行的盲源分离算法的对比验证了所提算法的优越性。
关键词
盲源分离
欠定卷积混叠
高混响环境
全局脉冲响应网络
非负矩阵分解
Keywords
blind source separation
underdetermined convolutive mixture
high reverberation environment
global impulse response network
nonnegative matrix factorization
分类号
TN911.23 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
面向卷积混叠环境下的盲源分离新方法
被引量:
7
4
作者
解元
邹涛
孙为军
谢胜利
机构
广州大学机械与电气工程学院
物联网智能信息处理与系统集成教育部重点实验室
广东省
物
联网
信息
技术
重点
实验室
智能
检测与制造
物
联
教育部
重点
实验室
基于
物
联网
技术的离散制造
智能
化学科创新引智基地
粤港澳离散制造
智能
化联合
实验室
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第5期1062-1072,共11页
基金
国家重点研发计划(2018YFB1802400)
国家自然科学基金(62003095,52171331)资助。
文摘
卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,得到新的模型参数更新规则;并对解混叠矩阵进行标准化处理,避免幅度歧义性问题;在源信号的重构阶段,通过实时更新非负矩阵分解模型参数,避免源信号的排序歧义性问题.实验结果验证了所提算法在分离中英文语音混叠信号、音乐混叠信号时的有效性和优越性.
关键词
盲源分离
卷积混叠
独立分量分析
非负矩阵分解
Keywords
Blind source separation(BSS)
convolutive mixtures
independent component analysis
nonnegative matrix factorization(NMF)
分类号
TN911.7 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
结合脉冲响应重塑和期望最大化的盲信号分离
被引量:
2
5
作者
解元
张旭
邹涛
马鸽
余锦视
孙为军
机构
广州大学机械与电气工程学院
智能
检测与制造
物
联
教育部
重点
实验室
粤港澳复杂制造多尺度
信息
融合与协同优化控制
重点
验室
广州市制造过程综合自动化
重点
实验室
广东省
物
联网
信息
技术
重点
实验室
物联网智能信息处理与系统集成教育部重点实验室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2023年第11期3343-3353,共11页
基金
广州市基础与应用基础研究项目(No.SL2022A04J00289)
广东省基础与应用基础研究基金(No.2023A1515011311)
+1 种基金
国家自然科学基金(No.62003095,No.52171331)
广州市市校联合实验室项目(No.2023A03J0120)。
文摘
多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效的.本文针对具有声学回声和混响环境下的多通道欠定卷积语音混合信号的分离问题,提出一种结合脉冲响应重塑和期望最大化的盲信号分离算法,该算法在低混响和高混响下都表现出很好的分离性能.首先,利用基于无穷范数和p-范数的脉冲响应重塑技术设计预滤波器消除可听回声,完成对混合信号的重塑,提高混合信号的质量.然后,对重塑后的混合信号利用分层聚类方法估计混合矩阵,基于期望最大化算法框架,设计新的模型参数实时更新规则,通过结合脉冲响应重塑和期望最大化重构源信号.实验结果表明,所提算法可以有效地分离不同混响环境下带声学回声的欠定卷积混合信号,其分离性能优越,同时对噪声具有很好的鲁棒性.
关键词
盲源分离
脉冲响应重塑
多通道卷积混合
期望最大化
Keywords
blind signal separation
impulse response remodeling
multichannel convolutive mixtures
expectation maximization
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于混合混响模型的多通道语音增强算法
解元
邹涛
孙为军
谢胜利
《通信学报》
EI
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
2
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
杨俊杰
丁家辉
杨柳
冯丽
杨超
《应用声学》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
面向高混响环境的欠定卷积盲源分离算法
解元
邹涛
孙为军
谢胜利
《通信学报》
EI
CSCD
北大核心
2023
7
在线阅读
下载PDF
职称材料
4
面向卷积混叠环境下的盲源分离新方法
解元
邹涛
孙为军
谢胜利
《自动化学报》
EI
CAS
CSCD
北大核心
2023
7
在线阅读
下载PDF
职称材料
5
结合脉冲响应重塑和期望最大化的盲信号分离
解元
张旭
邹涛
马鸽
余锦视
孙为军
《电子学报》
EI
CAS
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部