-
题名基于时频感知神经网络的语音频带扩展
被引量:2
- 1
-
-
作者
许春冬
凌贤鹏
应冬文
王晶
-
机构
江西理工大学信息工程学院
北京理工大学信息与电子学院
-
出处
《信号处理》
CSCD
北大核心
2021年第10期2004-2012,共9页
-
基金
国家自然科学基金项目(11864016,61671442)
江西省文化艺术项目(YG2017384)
江西理工大学研究生创新专项资金项目(ZS2019-S080)。
-
文摘
为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编解码器内部使用了时间卷积网络,有效提升了模型对语音时序数据上下文依赖关系的学习能力。为了促进模型朝更加准确的方向训练,还提出了一种时频感知损失函数,有利于模型在时域、频域以及感知域获取窄带语音到宽带语音的最优映射解。通过主观和客观实验结果表明,该方法优于传统方法和近几年基于深度神经网络的语音频带扩展方法。
-
关键词
语音频带扩展
时间卷积网络
时频感知目标损失
局部敏感哈希注意力机制
-
Keywords
speech bandwidth extension
temporal convolutional networks
time-frequency perception loss
local sensitive hash attention mechanism
-
分类号
TN912.3
[电子电信—通信与信息系统]
-