-
题名基于高斯混合模型的感知域音频编码方法
- 1
-
-
作者
吕亚平
高戈
陈怡
张康
-
机构
武汉大学计算机学院国家多媒体软件工程技术研究中心
华中师范大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第10期265-269,共5页
-
基金
国家自然科学基金资助项目(614712710)
-
文摘
传统感知音频编码方案采用心理声学掩蔽降低编码码率,其声道模型+信号激励的方式难以同时实现高质量的中低码率语音和音频信号编码。为此,提出一种基于高斯混合模型的感知域音频编码方法,利用Gammatone滤波器组模拟人耳听觉系统,采用多路复用掩蔽模型替换降低包络脉冲的数量,对结构化模型进行拟合,使用高斯-牛顿算法对听觉包络进行高斯混合模型参数的拟合,将高斯混合模型参数替代音频信号特征。实验结果表明,与基于稀疏包络表示重构的音频编码方法相比,该方法的主观测试高0.5分-0.8分,客观测试高5分-10分,解码得到的语音和大部分音乐信号都能还原到原始音频信号,可用于实现高质量的中低码率语音和音频编码。
-
关键词
人耳听觉系统
感知域音频编码
高斯混合模型
Gammatone滤波器组
高斯-牛顿算法
-
Keywords
human auditory system
perceptual domain audio coding
Gaussian Mixture Model(GMM)
Gammatone filter bank
Gauss-Newton algorithm
-
分类号
TN912
[电子电信—通信与信息系统]
-