期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Kolmogorov-Arnold网络的混合激励线性预测语声编码改进算法
1
作者 俞英健 王德清 +1 位作者 魏云龙 张龙基 《应用声学》 北大核心 2025年第6期1641-1651,共11页
高效、高质量的极低码率语声压缩技术,是水声通信等极端通信的迫切需求。混合激励线性预测(MELP)编码通过线谱频率(LSF)等参数的量化实现压缩,是常用的语声编码方法,但其低比特率量化会带来量化失真,导致语声质量下降。为了提高MELP编... 高效、高质量的极低码率语声压缩技术,是水声通信等极端通信的迫切需求。混合激励线性预测(MELP)编码通过线谱频率(LSF)等参数的量化实现压缩,是常用的语声编码方法,但其低比特率量化会带来量化失真,导致语声质量下降。为了提高MELP编码的语声质量和效率,该文提出一种基于Kolmogorov-Arnold网络(KAN)和残差向量量化技术的KAN-AE自编解码器网络,对MELP编码中LSF参数的量化进行改进,从参数层提取接近语义层次的信息,从而减少冗余信息,实现更高效的编码。实验结果表明,在1.96 kbit/s的码率,LSF参数量化比特低于15 bit时,该方法的语声质量感知评价评分约为2.6,短时客观可懂度评分约为0.68,在多种语言和不同噪声环境下的性能良好,在嵌入式STM32MP135F-DK开发板的测试模型运行时间为2.74 ms,实时性较好。 展开更多
关键词 深度学习 重构性 低速率语声编码 混合激励线性预测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部