三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的...三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。展开更多
该文提出了一种基于偏最小二乘回归(Partial Least Squares Regression,PLSR)的与头相关传递函数(Head Related Transfer Function,HRTF)的个人化方法。通过对HRTF进行预处理和主元分析,并对人体参数进行筛选,只要相对简单的人体参数测...该文提出了一种基于偏最小二乘回归(Partial Least Squares Regression,PLSR)的与头相关传递函数(Head Related Transfer Function,HRTF)的个人化方法。通过对HRTF进行预处理和主元分析,并对人体参数进行筛选,只要相对简单的人体参数测量,就可利用PLSR得到特定人的HRTF。客观误差分析和主观声音定位测试结果表明估计的HRTF与实际测量的HRTF之间不仅均方误差较小,而且感知区别不大;同时由PLSR估计的个人化HRTF在水平面上的主观测试定位准确率明显优于非个人化HRTF,也优于由最小二乘回归(Least Squares Regression,LSR)估计的个人化HRTF。展开更多
与头相关传递函数(Head—related Transfer Functions:HRTFs)的准确、有效建模对于空间听觉的分析研究以及虚拟听觉空间的生成起着关键的作用。本文通过应用新型的面向多目标参数优化的遗传算法(Genetic Algorithm:GA)进行了 HRTFs共用...与头相关传递函数(Head—related Transfer Functions:HRTFs)的准确、有效建模对于空间听觉的分析研究以及虚拟听觉空间的生成起着关键的作用。本文通过应用新型的面向多目标参数优化的遗传算法(Genetic Algorithm:GA)进行了 HRTFs共用声学极点的极零点模型(Common-Acoustical—Pole and Zero:CAPZ)逼近。实验结果表明,GA较改进的Prony设计方法获得了更优的效果。展开更多
采用主成分分析方法提取头相关传输函数(head-ralated transfer function,HRTF)的个性化系数,计算了影响HRTF的人体参数的拉普拉斯得分,并联合Pearson相关系数提取出对HRTF影响显著的关键人体参数;构建了径向基函数(radial basis functi...采用主成分分析方法提取头相关传输函数(head-ralated transfer function,HRTF)的个性化系数,计算了影响HRTF的人体参数的拉普拉斯得分,并联合Pearson相关系数提取出对HRTF影响显著的关键人体参数;构建了径向基函数(radial basis function,RBF)神经网络,学习关键人体参数到头相关传输函数个性化系数的非线性映射模型,利用简单的人体参数测量估计出待测者的个性化头相关传输函数.通过实验仿真与偏最小二乘回归(partial least squares regression,PLSR)法比较可知。展开更多
文摘三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。
基金This work was supported by National Natural Science Foundation of China(No.1037 4031)and Natural Science Foundation of the South China University of Technology(No.123-E4050600).
文摘该文提出了一种基于偏最小二乘回归(Partial Least Squares Regression,PLSR)的与头相关传递函数(Head Related Transfer Function,HRTF)的个人化方法。通过对HRTF进行预处理和主元分析,并对人体参数进行筛选,只要相对简单的人体参数测量,就可利用PLSR得到特定人的HRTF。客观误差分析和主观声音定位测试结果表明估计的HRTF与实际测量的HRTF之间不仅均方误差较小,而且感知区别不大;同时由PLSR估计的个人化HRTF在水平面上的主观测试定位准确率明显优于非个人化HRTF,也优于由最小二乘回归(Least Squares Regression,LSR)估计的个人化HRTF。
文摘与头相关传递函数(Head—related Transfer Functions:HRTFs)的准确、有效建模对于空间听觉的分析研究以及虚拟听觉空间的生成起着关键的作用。本文通过应用新型的面向多目标参数优化的遗传算法(Genetic Algorithm:GA)进行了 HRTFs共用声学极点的极零点模型(Common-Acoustical—Pole and Zero:CAPZ)逼近。实验结果表明,GA较改进的Prony设计方法获得了更优的效果。
文摘采用主成分分析方法提取头相关传输函数(head-ralated transfer function,HRTF)的个性化系数,计算了影响HRTF的人体参数的拉普拉斯得分,并联合Pearson相关系数提取出对HRTF影响显著的关键人体参数;构建了径向基函数(radial basis function,RBF)神经网络,学习关键人体参数到头相关传输函数个性化系数的非线性映射模型,利用简单的人体参数测量估计出待测者的个性化头相关传输函数.通过实验仿真与偏最小二乘回归(partial least squares regression,PLSR)法比较可知。