-
题名基于跨维度协同注意力机制的单通道语音增强方法
- 1
-
-
作者
康宏博
冯雨佳
台文鑫
蓝天
吴祖峰
刘峤
-
机构
电子科技大学信息与软件工程学院
电子科技大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第7期1639-1648,共10页
-
基金
国家自然科学基金项目(U19B2028)
国家科技重大专项(2021YFC3330403)
+1 种基金
中国电子科技集团54所开放课题(201148)
攀钢集团有限公司开放课题(211129)。
-
文摘
近年来,卷积神经网络在语音增强任务中得到了广泛的应用.然而,目前广泛使用的跳跃连接机制在特征信息传输时会引入噪声成分,从而不可避免地降低了去噪性能;除此之外,普遍使用的固定形状的卷积核在处理各种声纹信息时效率低下,基于上述考虑,提出了一种跨维度协同注意力机制和形变卷积模块的端到端编-解码器网络CADNet.具体来说,在跳跃连接中引入跨维度协同注意力模块,进一步提高信息控制能力.并且在每个标准卷积层之后引入形变卷积层,从而更好地匹配声纹的自然特征.在TIMIT公开数据集上进行的实验验证了所提出的方法在语音质量和可懂度的评价指标方面的有效性.
-
关键词
语音增强
自注意力
跨维度协同注意力
形变卷积
跳跃连接
-
Keywords
speech enhancement
self-attention
cross-dimensional collaborative attention
deformable convolution
skip connection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-