期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Kolmogorov-Arnold网络的混合激励线性预测语声编码改进算法
1
作者
俞英健
王德清
+1 位作者
魏云龙
张龙基
《应用声学》
北大核心
2025年第6期1641-1651,共11页
高效、高质量的极低码率语声压缩技术,是水声通信等极端通信的迫切需求。混合激励线性预测(MELP)编码通过线谱频率(LSF)等参数的量化实现压缩,是常用的语声编码方法,但其低比特率量化会带来量化失真,导致语声质量下降。为了提高MELP编...
高效、高质量的极低码率语声压缩技术,是水声通信等极端通信的迫切需求。混合激励线性预测(MELP)编码通过线谱频率(LSF)等参数的量化实现压缩,是常用的语声编码方法,但其低比特率量化会带来量化失真,导致语声质量下降。为了提高MELP编码的语声质量和效率,该文提出一种基于Kolmogorov-Arnold网络(KAN)和残差向量量化技术的KAN-AE自编解码器网络,对MELP编码中LSF参数的量化进行改进,从参数层提取接近语义层次的信息,从而减少冗余信息,实现更高效的编码。实验结果表明,在1.96 kbit/s的码率,LSF参数量化比特低于15 bit时,该方法的语声质量感知评价评分约为2.6,短时客观可懂度评分约为0.68,在多种语言和不同噪声环境下的性能良好,在嵌入式STM32MP135F-DK开发板的测试模型运行时间为2.74 ms,实时性较好。
展开更多
关键词
深度学习
重构性
低速率语声编码
混合激励线性预测
在线阅读
下载PDF
职称材料
题名
基于Kolmogorov-Arnold网络的混合激励线性预测语声编码改进算法
1
作者
俞英健
王德清
魏云龙
张龙基
机构
福州大学物理与信息工程学院
厦门大学信息与通信工程系
出处
《应用声学》
北大核心
2025年第6期1641-1651,共11页
基金
厦门市自然科学基金项目(3502Z20227177)。
文摘
高效、高质量的极低码率语声压缩技术,是水声通信等极端通信的迫切需求。混合激励线性预测(MELP)编码通过线谱频率(LSF)等参数的量化实现压缩,是常用的语声编码方法,但其低比特率量化会带来量化失真,导致语声质量下降。为了提高MELP编码的语声质量和效率,该文提出一种基于Kolmogorov-Arnold网络(KAN)和残差向量量化技术的KAN-AE自编解码器网络,对MELP编码中LSF参数的量化进行改进,从参数层提取接近语义层次的信息,从而减少冗余信息,实现更高效的编码。实验结果表明,在1.96 kbit/s的码率,LSF参数量化比特低于15 bit时,该方法的语声质量感知评价评分约为2.6,短时客观可懂度评分约为0.68,在多种语言和不同噪声环境下的性能良好,在嵌入式STM32MP135F-DK开发板的测试模型运行时间为2.74 ms,实时性较好。
关键词
深度学习
重构性
低速率语声编码
混合激励线性预测
Keywords
Deep learning
Reconstructive
Low bitrate speech coding
Mixed excitation linear prediction
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Kolmogorov-Arnold网络的混合激励线性预测语声编码改进算法
俞英健
王德清
魏云龙
张龙基
《应用声学》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部