采用主成分分析方法提取头相关传输函数(head-ralated transfer function,HRTF)的个性化系数,计算了影响HRTF的人体参数的拉普拉斯得分,并联合Pearson相关系数提取出对HRTF影响显著的关键人体参数;构建了径向基函数(radial basis functi...采用主成分分析方法提取头相关传输函数(head-ralated transfer function,HRTF)的个性化系数,计算了影响HRTF的人体参数的拉普拉斯得分,并联合Pearson相关系数提取出对HRTF影响显著的关键人体参数;构建了径向基函数(radial basis function,RBF)神经网络,学习关键人体参数到头相关传输函数个性化系数的非线性映射模型,利用简单的人体参数测量估计出待测者的个性化头相关传输函数.通过实验仿真与偏最小二乘回归(partial least squares regression,PLSR)法比较可知。展开更多
耳廓旋转角的测量结果与头部初始位置有关,不同的耳廓旋转角测量方法可能影响个性化头相关传输函数(HRTF)的仰角分布特性.文中分别采用面部垂直参考面和法兰克福水平参考面测量并比较了60名受试者的耳廓旋转角,发现两种方法所得均值相差...耳廓旋转角的测量结果与头部初始位置有关,不同的耳廓旋转角测量方法可能影响个性化头相关传输函数(HRTF)的仰角分布特性.文中分别采用面部垂直参考面和法兰克福水平参考面测量并比较了60名受试者的耳廓旋转角,发现两种方法所得均值相差5°左右.为了分析耳廓旋转角对个性化HRTF空间分布的影响,将一个左耳廓在同一个椭球上按5°间隔旋转,得到耳廓旋转角分别为16°、11°和6°的3个计算模型.然后,用快速多极边界元方法(FM-BEM)计算分析了3个耦合模型的HRTF数据.结果表明:不同耳廓旋转角条件下,HRTF的耳廓高频谷点的频率差异可以达到约1.0 k Hz,某些角度的谷点幅度差异可达到约10 d B.最后,用空间坐标变换方法定制不同耳廓旋转角的个性化HRTF,结果表明,定制HRTF的耳廓谷点频率和幅度与直接通过数值计算的HRTF基本吻合,证明个性化耳廓旋转角定制方法有效.展开更多
针对如何快速获取不同个体的头相关传输函数(Head-related transfer function,HRTF)(即个人化)这一关键问题,本文从生理结构的相似性和相关性出发,提出了一种基于主成分分析、多元线性回归的HRTF数据库匹配方法,并分别将匹配结果和由KE...针对如何快速获取不同个体的头相关传输函数(Head-related transfer function,HRTF)(即个人化)这一关键问题,本文从生理结构的相似性和相关性出发,提出了一种基于主成分分析、多元线性回归的HRTF数据库匹配方法,并分别将匹配结果和由KEMAR测量得到的数据用于实现双耳可听化,再进行主观听音实验。结果表明,利用数据库匹配得到的HRTF可以有效地提高声源定位精度和降低前后混淆率。展开更多
个性化的头相关传输函数(Head Related Transfer Function,HRTF)对于虚拟听觉技术的实现至关重要。然而在具体的应用过程中,测量每一位受试者的个性化HRTF较为繁琐,为此文章提出一种基于加权弹性网络回归的算法,只需获取受试者的生理参...个性化的头相关传输函数(Head Related Transfer Function,HRTF)对于虚拟听觉技术的实现至关重要。然而在具体的应用过程中,测量每一位受试者的个性化HRTF较为繁琐,为此文章提出一种基于加权弹性网络回归的算法,只需获取受试者的生理参数即可获得HRTF的个性化幅度响应。首先通过数据库中的受试者数据,根据生理参数与幅度的相关性计算获得生理参数的权值,并将权值加入到同时含有1范数和2范数的弹性网络回归中,以此来获取新受试者的生理参数稀疏系数;最后将所得稀疏系数与数据库中的HRTF幅度结合就可以得到新受试者的个性化幅度响应。结果表明,文中方法对于个性化HRTF幅度的合成有较好的效果,尤其是在中低频段内准确度较高。展开更多
个性化三维(three-dimensional,3D)头部模型在头相关传输函数(head-related transfer function,HRTF)和虚拟听觉重放中有着重要应用。光学扫描是获取3D头部模型的常用方法,但不同光学扫描方式的误差及其对HRTF的影响尚不明确。文章以自...个性化三维(three-dimensional,3D)头部模型在头相关传输函数(head-related transfer function,HRTF)和虚拟听觉重放中有着重要应用。光学扫描是获取3D头部模型的常用方法,但不同光学扫描方式的误差及其对HRTF的影响尚不明确。文章以自主设计的3D头部模型为参照模型MO(基准),并将3D打印制作的模型作为扫描对象。选取三款代表性光学扫描设备(手持式红色激光扫描仪HandySCAN 300、手持式白光发光二极管扫描仪Reeyee Pro 2X、红外激光iPhone12手机)扫描得到对应的模型M_(H),M_(R)和M_(I)。为评价新采集模型曲面精度,对比了模型间图形偏差的色阶图和偏差距离均方根(root mean square,RMS),进一步分析模型精度对HRTF数据的影响,对比了模型间的HRTF谱误差。结果表明,图形偏差主要集中在耳廓局部细节,HRTF谱误差主要出现在高频。相较而言,模型M_(H)与M_(O)最为接近,曲面误差基本在±0.40 mm以内,超过3.0 dB的HRTF谱误差仅出现在8 kHz以上的频段,且这种误差只在少数空间方向中观察到。模型M_(R)和M_(I)相比于M_(O)的曲面误差分别达到约−0.90~1.90 mm和−1.20~3.20 mm,8 kHz以上HRTF谱误差在大多数方向均超过3.0 dB。相关研究为3D头部扫描方式选用提供了参考依据。展开更多
个性化的头相关传输函数(head-related transfer function,HRTF)可以有效改善空间音频质量。针对个性化HRTF难以精确获得的问题,提出了一种基于层级集成的个性化空间音频生成方法。该方法通过三个模型逐层建立个性化HRTF中的定位信息。...个性化的头相关传输函数(head-related transfer function,HRTF)可以有效改善空间音频质量。针对个性化HRTF难以精确获得的问题,提出了一种基于层级集成的个性化空间音频生成方法。该方法通过三个模型逐层建立个性化HRTF中的定位信息。首先,采用高斯混合模型建立用户无关的共用模型。然后,采用自编码器获得与用户有关的HRTF的隐表示,利用深度神经网络在人体生理参数与HRTF的隐表示之间建立非线性映射,得到用户有关的个性化模型。为了尽可能恢复个性化HRTF细节信息,对上述模型降维过程中的残差进行线性建模,得到残差模型。对于目标用户,任意空间位置处的个性化的HRTF可以通过集成三个层次下的模型获得,用于生成三维空间音频。最终,实验结果表明,提出的算法可以有效降低HRTF频谱损失,提升对个性化HRTF的预测性能。展开更多
为了研究声学头模上不同的头部官能结构对头相关传输函数(Head-Related Transfer Function,HRTF)及录音听感上的影响,对具有不同官能结构的头模进行HRTF测量和对比分析,得出头部不同官能结构对HRTF的影响。进一步的主观评价实验也验证...为了研究声学头模上不同的头部官能结构对头相关传输函数(Head-Related Transfer Function,HRTF)及录音听感上的影响,对具有不同官能结构的头模进行HRTF测量和对比分析,得出头部不同官能结构对HRTF的影响。进一步的主观评价实验也验证了不同的头部官能结构对于声源定位的影响程度不同这一结论。其中,耳廓对声源定位的影响较大,是不可缺少的一个结构,而有无鼻子、头发等其他细节官能结构对声源定位产生的影响则要弱得多,同时这些头部官能结构对听感上的影响与声源类型和入射方向的关系十分密切。展开更多
三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的...三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。展开更多
文摘采用主成分分析方法提取头相关传输函数(head-ralated transfer function,HRTF)的个性化系数,计算了影响HRTF的人体参数的拉普拉斯得分,并联合Pearson相关系数提取出对HRTF影响显著的关键人体参数;构建了径向基函数(radial basis function,RBF)神经网络,学习关键人体参数到头相关传输函数个性化系数的非线性映射模型,利用简单的人体参数测量估计出待测者的个性化头相关传输函数.通过实验仿真与偏最小二乘回归(partial least squares regression,PLSR)法比较可知。
文摘耳廓旋转角的测量结果与头部初始位置有关,不同的耳廓旋转角测量方法可能影响个性化头相关传输函数(HRTF)的仰角分布特性.文中分别采用面部垂直参考面和法兰克福水平参考面测量并比较了60名受试者的耳廓旋转角,发现两种方法所得均值相差5°左右.为了分析耳廓旋转角对个性化HRTF空间分布的影响,将一个左耳廓在同一个椭球上按5°间隔旋转,得到耳廓旋转角分别为16°、11°和6°的3个计算模型.然后,用快速多极边界元方法(FM-BEM)计算分析了3个耦合模型的HRTF数据.结果表明:不同耳廓旋转角条件下,HRTF的耳廓高频谷点的频率差异可以达到约1.0 k Hz,某些角度的谷点幅度差异可达到约10 d B.最后,用空间坐标变换方法定制不同耳廓旋转角的个性化HRTF,结果表明,定制HRTF的耳廓谷点频率和幅度与直接通过数值计算的HRTF基本吻合,证明个性化耳廓旋转角定制方法有效.
基金This work was supported by National Natural Science Foundation of China(No.1037 4031)and Natural Science Foundation of the South China University of Technology(No.123-E4050600).
文摘针对如何快速获取不同个体的头相关传输函数(Head-related transfer function,HRTF)(即个人化)这一关键问题,本文从生理结构的相似性和相关性出发,提出了一种基于主成分分析、多元线性回归的HRTF数据库匹配方法,并分别将匹配结果和由KEMAR测量得到的数据用于实现双耳可听化,再进行主观听音实验。结果表明,利用数据库匹配得到的HRTF可以有效地提高声源定位精度和降低前后混淆率。
文摘个性化的头相关传输函数(Head Related Transfer Function,HRTF)对于虚拟听觉技术的实现至关重要。然而在具体的应用过程中,测量每一位受试者的个性化HRTF较为繁琐,为此文章提出一种基于加权弹性网络回归的算法,只需获取受试者的生理参数即可获得HRTF的个性化幅度响应。首先通过数据库中的受试者数据,根据生理参数与幅度的相关性计算获得生理参数的权值,并将权值加入到同时含有1范数和2范数的弹性网络回归中,以此来获取新受试者的生理参数稀疏系数;最后将所得稀疏系数与数据库中的HRTF幅度结合就可以得到新受试者的个性化幅度响应。结果表明,文中方法对于个性化HRTF幅度的合成有较好的效果,尤其是在中低频段内准确度较高。
文摘个性化三维(three-dimensional,3D)头部模型在头相关传输函数(head-related transfer function,HRTF)和虚拟听觉重放中有着重要应用。光学扫描是获取3D头部模型的常用方法,但不同光学扫描方式的误差及其对HRTF的影响尚不明确。文章以自主设计的3D头部模型为参照模型MO(基准),并将3D打印制作的模型作为扫描对象。选取三款代表性光学扫描设备(手持式红色激光扫描仪HandySCAN 300、手持式白光发光二极管扫描仪Reeyee Pro 2X、红外激光iPhone12手机)扫描得到对应的模型M_(H),M_(R)和M_(I)。为评价新采集模型曲面精度,对比了模型间图形偏差的色阶图和偏差距离均方根(root mean square,RMS),进一步分析模型精度对HRTF数据的影响,对比了模型间的HRTF谱误差。结果表明,图形偏差主要集中在耳廓局部细节,HRTF谱误差主要出现在高频。相较而言,模型M_(H)与M_(O)最为接近,曲面误差基本在±0.40 mm以内,超过3.0 dB的HRTF谱误差仅出现在8 kHz以上的频段,且这种误差只在少数空间方向中观察到。模型M_(R)和M_(I)相比于M_(O)的曲面误差分别达到约−0.90~1.90 mm和−1.20~3.20 mm,8 kHz以上HRTF谱误差在大多数方向均超过3.0 dB。相关研究为3D头部扫描方式选用提供了参考依据。
文摘个性化的头相关传输函数(head-related transfer function,HRTF)可以有效改善空间音频质量。针对个性化HRTF难以精确获得的问题,提出了一种基于层级集成的个性化空间音频生成方法。该方法通过三个模型逐层建立个性化HRTF中的定位信息。首先,采用高斯混合模型建立用户无关的共用模型。然后,采用自编码器获得与用户有关的HRTF的隐表示,利用深度神经网络在人体生理参数与HRTF的隐表示之间建立非线性映射,得到用户有关的个性化模型。为了尽可能恢复个性化HRTF细节信息,对上述模型降维过程中的残差进行线性建模,得到残差模型。对于目标用户,任意空间位置处的个性化的HRTF可以通过集成三个层次下的模型获得,用于生成三维空间音频。最终,实验结果表明,提出的算法可以有效降低HRTF频谱损失,提升对个性化HRTF的预测性能。
文摘为了研究声学头模上不同的头部官能结构对头相关传输函数(Head-Related Transfer Function,HRTF)及录音听感上的影响,对具有不同官能结构的头模进行HRTF测量和对比分析,得出头部不同官能结构对HRTF的影响。进一步的主观评价实验也验证了不同的头部官能结构对于声源定位的影响程度不同这一结论。其中,耳廓对声源定位的影响较大,是不可缺少的一个结构,而有无鼻子、头发等其他细节官能结构对声源定位产生的影响则要弱得多,同时这些头部官能结构对听感上的影响与声源类型和入射方向的关系十分密切。
文摘三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。