期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于计算听觉场景分析的改进清音分离方法 被引量:3
1
作者 王雨 林家骏 +1 位作者 袁文浩 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第2期212-217,共6页
基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减... 基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减的改进清音分离方法。改进方法在剔除了浊音块后,通过基于距离加权的残余噪声估计算法得到每个清音单元中所包含的噪声能量,对每个清音单元进行谱减算法并标记,进一步剔除残余噪声单元,提取出清音信号。实验结果证明:与传统清音分离方法相比,改进方法对时变性残余噪声能量的估计结果更加精确,更能提高清音分离的有效性。 展开更多
关键词 清音分离 计算听觉场景分析 谱减 残余噪声估计
在线阅读 下载PDF
一种基于计算听觉场景分析的语音增强算法 被引量:2
2
作者 张卫强 郭璁 +4 位作者 张乔 康健 何亮 刘加 Johnson Michael T 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第8期663-669,共7页
选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETS... 选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETSI算法的基础上,结合计算听觉场景分析技术,提出一种新的算法,将维纳滤波器参数估计由原本的Mel域变换到Gammatone域,并进一步利用理想率掩蔽估计对带噪信号进行信噪分离,抑制脉冲噪声.该算法在TIMIT语音库上进行了实验,结果证明,与原算法相比,提出的新算法使听觉质量在低信噪比下提升较大,脉冲噪声抑制亦明显.在低信噪比的情况下,后端语音识别系统的识别率得到提升. 展开更多
关键词 语音增强 计算听觉场景分析 Gammatone滤波器 理想率掩蔽
在线阅读 下载PDF
基于计算听觉场景分析的语音增强改进算法 被引量:2
3
作者 王雨 林家骏 袁文浩 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第5期617-621,共5页
针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪... 针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。 展开更多
关键词 语音增强 计算听觉场景分析 语音有效能量 信道互相关 二值掩码
在线阅读 下载PDF
基于计算听觉场景分析的混合语音分离 被引量:2
4
作者 张磊 刘继芳 项学智 《计算机工程》 CAS CSCD 北大核心 2010年第14期24-25,31,共3页
基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分... 基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。 展开更多
关键词 计算听觉场景分析 起始和结束时间 片段
在线阅读 下载PDF
基于计算听觉场景分析的内燃机噪声源分离方法 被引量:1
5
作者 钱思冲 向阳 +3 位作者 李恒 李胜杨 施雨骁 李瑞 《内燃机学报》 EI CAS CSCD 北大核心 2015年第1期63-70,共8页
为识别在时频域均混叠严重的内燃机燃烧噪声与活塞敲击噪声,提出并实现了基于计算听觉场景分析的内燃机噪声源分离算法.首先,对内燃机进行铅覆盖,只裸露待测部分,通过相关性分析寻找最佳测点位置,保证为分离算法提供更有效输入;其次,利... 为识别在时频域均混叠严重的内燃机燃烧噪声与活塞敲击噪声,提出并实现了基于计算听觉场景分析的内燃机噪声源分离算法.首先,对内燃机进行铅覆盖,只裸露待测部分,通过相关性分析寻找最佳测点位置,保证为分离算法提供更有效输入;其次,利用一阶差分麦克风阵列技术对实测信号进行处理,利用由独立分量分析与二值掩膜组成的时频分解过程对混合信号进行初步划分,分解过程不断迭代直至满足终止条件;最后,合并同源信号得到各分离分量,通过将分量与缸盖表面和活塞敲击处振动信号进行对比,验证分离结果的正确性.结果表明:新算法能有效分离内燃机燃烧噪声与活塞敲击噪声,且性能稳定,计算量小. 展开更多
关键词 内燃机 计算听觉场景分析 噪声源分离 独立分量分析 铅覆盖
在线阅读 下载PDF
基于计算听觉场景分析的语音混叠信号分离 被引量:1
6
作者 王珊 许刚 《计算机工程》 CAS CSCD 北大核心 2007年第18期211-213,共3页
基于计算听觉场景原理,提出了一种混叠语音信号分离算法模型,对两个说话者的混叠声音进行分离。该模型对低频区和高频区的分离分别采用了不同方法,避免了因采用同样方法处理低频高频区而导致对高频段语音不能很好分离的结果。实验结果表... 基于计算听觉场景原理,提出了一种混叠语音信号分离算法模型,对两个说话者的混叠声音进行分离。该模型对低频区和高频区的分离分别采用了不同方法,避免了因采用同样方法处理低频高频区而导致对高频段语音不能很好分离的结果。实验结果表明,该模型具有很好的应用效果。 展开更多
关键词 计算听觉场景分析 语音分离 基音估计 幅度调制
在线阅读 下载PDF
计算听觉场景分析介绍 被引量:1
7
作者 邱伟 黄秀轩 《高技术通讯》 EI CAS CSCD 2002年第1期106-110,共5页
介绍了计算听觉场景分析的研究内容、理论依据、归类线索及意义 ,并以听觉的两大类型 (数据驱动及图式驱动 )为框架较详细地阐述了计算听觉场景分析系统的主要结构及研究进展 。
关键词 计算听觉场景分析 听觉模型 声源分离 数据驱动 图式驱动 声音识别
在线阅读 下载PDF
基于计算听觉场景分析的混合语音信号分离算法研究 被引量:6
8
作者 屈俊玲 李鸿燕 《计算机应用研究》 CSCD 北大核心 2014年第12期3822-3824,共3页
人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊... 人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊语音信号分离算法。在白噪声、鸡尾酒会噪声等六种噪声干扰条件下,通过仿真实验结果表明,相比于传统的谱减法,语音分离算法的输出信噪比平均提高了7.47 d B,并有效抑制了干扰噪声,改善了分离效果。 展开更多
关键词 语音分离 计算听觉场景分析 基音 分段 听觉
在线阅读 下载PDF
基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究 被引量:2
9
作者 关勇 李鹏 +1 位作者 刘文举 徐波 《自动化学报》 EI CSCD 北大核心 2009年第4期410-416,共7页
传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition,ASR)系统的鲁棒性问题.本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis,CASA)和语者模型信息的混合语音分离系统.该系统在CASA框架... 传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition,ASR)系统的鲁棒性问题.本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis,CASA)和语者模型信息的混合语音分离系统.该系统在CASA框架下,利用语者模型信息和因大子最大矢量量化(Factorial-max vector quantization,MAXVQ)方法进行实值掩码估计,实现了两语者混合语音中有效地分离出目标说话人语音的目标,从而为ASR系统提供了鲁棒的识别前端.在语音分离挑战(Speech separation challenge,SSC)数据集上的评估表明,相比基线系统,本文所提出的系统的语音识别正确率提高了15.68%,相关的实验结果也验证了本文提出的多语者识别和实值掩码估计的有效性. 展开更多
关键词 计算听觉场景分析 语音分离 鲁棒语音识别 因子最大矢量量化 语者识别
在线阅读 下载PDF
基于计算听觉场景分析的说话人转换检测 被引量:1
10
作者 杨登舟 刘加 夏善红 《计算机工程》 CAS CSCD 北大核心 2018年第2期316-321,共6页
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的... 在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的浊、清音边界,实现对零散清、浊音子段的拼接。利用贝叶斯信息准则判决语音子段间的疑似转换点,并运用音高特征做区间验证。实验结果表明,该方法在平均语音子段时长为1.34 s的极短语音条件下,可使说话人转换检测的等错率降至23.2%,F1值达到70%。 展开更多
关键词 说话人转换检测 计算听觉场景分析 伽马通能量倒谱系数 音高 贝叶斯信息准则
在线阅读 下载PDF
基于计算听觉场景分析的单声道浊音分离 被引量:3
11
作者 张丽娜 张二华 江军亮 《计算机工程与科学》 CSCD 北大核心 2019年第7期1266-1272,共7页
针对单声道语音分离中浊音分离的问题,提出了一种准确估计基音周期的方法。首先,以语音的短时平稳性和基音周期的连续性等为线索,利用语音信号的倒谱峰值构成基音周期谱图,并自动提取基音周期轨迹。然后,利用谐波频率为基音频率整数倍... 针对单声道语音分离中浊音分离的问题,提出了一种准确估计基音周期的方法。首先,以语音的短时平稳性和基音周期的连续性等为线索,利用语音信号的倒谱峰值构成基音周期谱图,并自动提取基音周期轨迹。然后,利用谐波频率为基音频率整数倍的性质来拾取各次谐波的频谱。最后,通过傅里叶逆变换对浊音进行重构。实验结果表明,该方法能准确提取基音周期轨迹,有效分离浊音信号。 展开更多
关键词 计算听觉场景分析 语音分离 基音周期轨迹 浊音
在线阅读 下载PDF
机器人听觉定位跟踪声源的研究与进展 被引量:15
12
作者 李从清 孙立新 +1 位作者 戴士杰 李洙梁 《燕山大学学报》 CAS 2009年第3期199-205,共7页
从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基... 从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基于麦克风阵列的声源定位系统,盲波束形成技术是未来进一步研究内容。而基于人耳听觉机理的声源定位系统,运用计算听觉场景分析建立声源定位模型将是未来热点研究内容。 展开更多
关键词 机器人听觉 声源定位 麦克风阵列 计算听觉场景分析
在线阅读 下载PDF
基于深度学习语音分离技术的研究现状与进展 被引量:74
13
作者 刘文举 聂帅 +1 位作者 梁山 张学良 《自动化学报》 EI CSCD 北大核心 2016年第6期819-833,共15页
现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入... 现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望. 展开更多
关键词 神经网络 语音分离 计算听觉场景分析 机器学习
在线阅读 下载PDF
语音分离技术的研究现状与展望 被引量:10
14
作者 李从清 孙立新 +1 位作者 龙东 任晓光 《声学技术》 CSCD 北大核心 2008年第5期779-787,共9页
从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动... 从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动型,特点是信息由低级向高级和由高级向低级结合的双向流动。最后指出信息双向互流的混合语音分离模式将是未来计算听觉场景分析研究的主要模式;基于听觉和视觉的结合来改善语音分离效果的研究将是未来研究方向之一。此外,盲源分离的欠完全问题,非线性混叠信号的可分离性、非平稳混叠信号的盲分离问题都将需要进一步研究;基于CASA和BSS联合进行语音分离将是未来研究的热点。 展开更多
关键词 语音分离 听觉场景分析 计算听觉场景分析 盲源分离
在线阅读 下载PDF
基于改进基音跟踪算法的单通道语音分离 被引量:4
15
作者 王雨 林家骏 +1 位作者 袁文浩 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第3期338-344,共7页
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取... 基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。 展开更多
关键词 语音分离 计算听觉场景分析 目标源估计 基音跟踪
在线阅读 下载PDF
基于多基音跟踪的单声道混合语音分离 被引量:1
16
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《计算机应用研究》 CSCD 北大核心 2008年第6期1660-1662,共3页
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信... 针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。 展开更多
关键词 计算听觉场景分析 多基音跟踪 语音分离
在线阅读 下载PDF
一种改进的单声道混合语音分离方法
17
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《自动化学报》 EI CSCD 北大核心 2009年第8期1087-1093,共7页
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替... 在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法,该方法在几乎不降低原方法分离性能的前提下,大大节约了算法运行所需的时间和资源消耗。 展开更多
关键词 语音分离 语音客观质量评估 计算听觉场景分析 信噪比 时域包络
在线阅读 下载PDF
一种基于上升缘与下降缘的语音分割方法
18
作者 郑荔平 《计算机工程与应用》 CSCD 2012年第5期127-130,共4页
听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一个听觉场景分解成多个片断。实现基于上升缘和下降缘分析的语音分割系统需检测上升缘与下降缘,通过匹配... 听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一个听觉场景分解成多个片断。实现基于上升缘和下降缘分析的语音分割系统需检测上升缘与下降缘,通过匹配对应的上升缘与下降缘的波前来生成语音片断,将这些片断重构成语音流。 展开更多
关键词 语音分割 事件检测 多尺度分析 上升缘 下降缘 计算听觉场景分析
在线阅读 下载PDF
基于掩蔽估计与优化的单通道语音增强算法 被引量:9
19
作者 葛宛营 张天骐 《计算机应用》 CSCD 北大核心 2019年第10期3065-3070,共6页
单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针... 单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针对此问题,提出一种基于计算听觉场景分析(CASA)的时频掩蔽估计与优化算法。首先,通过直接判决(DD)算法估计先验信噪比(SNR)并计算初始掩蔽;其次,利用噪声与带噪语音在Gammatone频带内的互相关(ICC)系数来计算噪声的存在概率,结合带噪语音能量谱得到新的噪声估计,减少原估计噪声中的过估成分;然后,利用优化算法对初始掩蔽进行迭代处理以减少其中因噪声过估而存在的误差并增加其中的目标语音成分,在满足条件后停止迭代并得到新的掩蔽;最后,利用新的掩蔽合成增强语音。实验结果表明在不同的背景噪声下,相比优化前,新的掩蔽使增强语音获得了较高的主观语音质量(PESQ)和语音可懂度(STOI)值,提升了语音听感与可懂度。 展开更多
关键词 计算听觉场景分析 语音增强 时频掩蔽 噪声估计 掩蔽优化 语音可懂度
在线阅读 下载PDF
基于CASA的噪声环境下的话者辨认
20
作者 李冬冬 唐建 +1 位作者 李然军 李辉 《小型微型计算机系统》 CSCD 北大核心 2016年第5期1107-1111,共5页
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码... 传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高. 展开更多
关键词 计算听觉场景分析 Gammatone频率倒谱系数(GFCC) 理想二值掩码(IBM) 阈值
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部