期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
一种采用振荡器神经网络的CASA计算模型语音分离算法 被引量:3
1
作者 胡光锐 虞晓 茅晓泉 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第11期1640-1644,共5页
基于听觉现象分析 (CASA)模型的基本原理 ,在仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA改进模型语音分离算法结构 .文中利用一个实例说明了新算法的具体实现步骤 .讨论了新算法机构中语音听觉外围处理部分和... 基于听觉现象分析 (CASA)模型的基本原理 ,在仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA改进模型语音分离算法结构 .文中利用一个实例说明了新算法的具体实现步骤 .讨论了新算法机构中语音听觉外围处理部分和分割神经网络处理部分 .通过上述两个部分的处理可以将输入混合语音信号在时频域上分割为若干有听觉感知意义的语音听觉感知成分分段 Segments,以便于新算法后续处理部分中语音 Segments的聚类和分离重构输出处理 ,最终完成语音分离任务 . 展开更多
关键词 语音分离 听觉现象分析 振荡器神经网络 听觉感知成分分段 casa模型 语音识别
在线阅读 下载PDF
基于CASA的噪声环境下的话者辨认
2
作者 李冬冬 唐建 +1 位作者 李然军 李辉 《小型微型计算机系统》 CSCD 北大核心 2016年第5期1107-1111,共5页
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码... 传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高. 展开更多
关键词 计算听觉场景分析 Gammatone频率倒谱系数(GFCC) 理想二值掩码(IBM) 阈值
在线阅读 下载PDF
基于深度学习语音分离技术的研究现状与进展 被引量:74
3
作者 刘文举 聂帅 +1 位作者 梁山 张学良 《自动化学报》 EI CSCD 北大核心 2016年第6期819-833,共15页
现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入... 现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望. 展开更多
关键词 神经网络 语音分离 计算听觉场景分析 机器学习
在线阅读 下载PDF
语音分离技术的研究现状与展望 被引量:10
4
作者 李从清 孙立新 +1 位作者 龙东 任晓光 《声学技术》 CSCD 北大核心 2008年第5期779-787,共9页
从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动... 从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动型,特点是信息由低级向高级和由高级向低级结合的双向流动。最后指出信息双向互流的混合语音分离模式将是未来计算听觉场景分析研究的主要模式;基于听觉和视觉的结合来改善语音分离效果的研究将是未来研究方向之一。此外,盲源分离的欠完全问题,非线性混叠信号的可分离性、非平稳混叠信号的盲分离问题都将需要进一步研究;基于CASA和BSS联合进行语音分离将是未来研究的热点。 展开更多
关键词 语音分离 听觉场景分析 计算听觉场景分析 盲源分离
在线阅读 下载PDF
机器人听觉定位跟踪声源的研究与进展 被引量:15
5
作者 李从清 孙立新 +1 位作者 戴士杰 李洙梁 《燕山大学学报》 CAS 2009年第3期199-205,共7页
从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基... 从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基于麦克风阵列的声源定位系统,盲波束形成技术是未来进一步研究内容。而基于人耳听觉机理的声源定位系统,运用计算听觉场景分析建立声源定位模型将是未来热点研究内容。 展开更多
关键词 机器人听觉 声源定位 麦克风阵列 计算听觉场景分析
在线阅读 下载PDF
基于改进基音跟踪算法的单通道语音分离 被引量:4
6
作者 王雨 林家骏 +1 位作者 袁文浩 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第3期338-344,共7页
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取... 基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。 展开更多
关键词 语音分离 计算听觉场景分析 目标源估计 基音跟踪
在线阅读 下载PDF
基于计算听觉场景分析的混合语音分离 被引量:2
7
作者 张磊 刘继芳 项学智 《计算机工程》 CAS CSCD 北大核心 2010年第14期24-25,31,共3页
基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分... 基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。 展开更多
关键词 计算听觉场景分析 起始和结束时间 片段
在线阅读 下载PDF
基于过零点双耳时间差的运动声源定位 被引量:3
8
作者 李冰 夏秀渝 +1 位作者 申庆超 周宁 《计算机工程与应用》 CSCD 2012年第9期127-130,共4页
人耳听觉定位的一个主要因素是ITD。在传统的计算声场景分析方法中,对ITD的估计采用对双耳神经发放率做互相关求得。但该方法具有计算量大和抗噪声能力弱两大缺陷,给实现运动声源实时定位带来了巨大瓶颈。对较新的过零时间差(ZCTD)方法... 人耳听觉定位的一个主要因素是ITD。在传统的计算声场景分析方法中,对ITD的估计采用对双耳神经发放率做互相关求得。但该方法具有计算量大和抗噪声能力弱两大缺陷,给实现运动声源实时定位带来了巨大瓶颈。对较新的过零时间差(ZCTD)方法进行了改进,采用Teager能量算子(TEO)提取语音包络截取可靠语音段估计ITD,避免了ZCTD方法中用信噪比的估值提取可靠ITD的繁琐步骤,能够更快速、准确地估计ITD,具有较强的抗噪声能力。将该方法运用到运动声源定位上,提出了基于过零点双耳时间差的运动声源定位模型,通过仿真实验验证了其实现运动声源实时定位的可行性。 展开更多
关键词 计算声场景分析 运动声源定位 过零点 TEAGER能量算子 双耳时间差
在线阅读 下载PDF
一种基于计算听觉场景分析的语音增强算法 被引量:2
9
作者 张卫强 郭璁 +4 位作者 张乔 康健 何亮 刘加 Johnson Michael T 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第8期663-669,共7页
选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETS... 选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETSI算法的基础上,结合计算听觉场景分析技术,提出一种新的算法,将维纳滤波器参数估计由原本的Mel域变换到Gammatone域,并进一步利用理想率掩蔽估计对带噪信号进行信噪分离,抑制脉冲噪声.该算法在TIMIT语音库上进行了实验,结果证明,与原算法相比,提出的新算法使听觉质量在低信噪比下提升较大,脉冲噪声抑制亦明显.在低信噪比的情况下,后端语音识别系统的识别率得到提升. 展开更多
关键词 语音增强 计算听觉场景分析 Gammatone滤波器 理想率掩蔽
在线阅读 下载PDF
基于计算听觉场景分析的改进清音分离方法 被引量:3
10
作者 王雨 林家骏 +1 位作者 袁文浩 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第2期212-217,共6页
基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减... 基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减的改进清音分离方法。改进方法在剔除了浊音块后,通过基于距离加权的残余噪声估计算法得到每个清音单元中所包含的噪声能量,对每个清音单元进行谱减算法并标记,进一步剔除残余噪声单元,提取出清音信号。实验结果证明:与传统清音分离方法相比,改进方法对时变性残余噪声能量的估计结果更加精确,更能提高清音分离的有效性。 展开更多
关键词 清音分离 计算听觉场景分析 谱减 残余噪声估计
在线阅读 下载PDF
基于多基音跟踪的单声道混合语音分离 被引量:1
11
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《计算机应用研究》 CSCD 北大核心 2008年第6期1660-1662,共3页
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信... 针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。 展开更多
关键词 计算听觉场景分析 多基音跟踪 语音分离
在线阅读 下载PDF
采用聚类神经网络与分离输出语音重构的语音分离算法 被引量:1
12
作者 虞晓 胡光锐 徐雄 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第6期748-751,共4页
基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分... 基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segments的聚类 。 展开更多
关键词 语音分离 聚类神经网络 casa 算法 语音重构
在线阅读 下载PDF
基于计算听觉场景分析的语音增强改进算法 被引量:2
13
作者 王雨 林家骏 袁文浩 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第5期617-621,共5页
针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪... 针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。 展开更多
关键词 语音增强 计算听觉场景分析 语音有效能量 信道互相关 二值掩码
在线阅读 下载PDF
基于计算听觉场景分析的内燃机噪声源分离方法 被引量:1
14
作者 钱思冲 向阳 +3 位作者 李恒 李胜杨 施雨骁 李瑞 《内燃机学报》 EI CAS CSCD 北大核心 2015年第1期63-70,共8页
为识别在时频域均混叠严重的内燃机燃烧噪声与活塞敲击噪声,提出并实现了基于计算听觉场景分析的内燃机噪声源分离算法.首先,对内燃机进行铅覆盖,只裸露待测部分,通过相关性分析寻找最佳测点位置,保证为分离算法提供更有效输入;其次,利... 为识别在时频域均混叠严重的内燃机燃烧噪声与活塞敲击噪声,提出并实现了基于计算听觉场景分析的内燃机噪声源分离算法.首先,对内燃机进行铅覆盖,只裸露待测部分,通过相关性分析寻找最佳测点位置,保证为分离算法提供更有效输入;其次,利用一阶差分麦克风阵列技术对实测信号进行处理,利用由独立分量分析与二值掩膜组成的时频分解过程对混合信号进行初步划分,分解过程不断迭代直至满足终止条件;最后,合并同源信号得到各分离分量,通过将分量与缸盖表面和活塞敲击处振动信号进行对比,验证分离结果的正确性.结果表明:新算法能有效分离内燃机燃烧噪声与活塞敲击噪声,且性能稳定,计算量小. 展开更多
关键词 内燃机 计算听觉场景分析 噪声源分离 独立分量分析 铅覆盖
在线阅读 下载PDF
基于计算听觉场景分析的语音混叠信号分离 被引量:1
15
作者 王珊 许刚 《计算机工程》 CAS CSCD 北大核心 2007年第18期211-213,共3页
基于计算听觉场景原理,提出了一种混叠语音信号分离算法模型,对两个说话者的混叠声音进行分离。该模型对低频区和高频区的分离分别采用了不同方法,避免了因采用同样方法处理低频高频区而导致对高频段语音不能很好分离的结果。实验结果表... 基于计算听觉场景原理,提出了一种混叠语音信号分离算法模型,对两个说话者的混叠声音进行分离。该模型对低频区和高频区的分离分别采用了不同方法,避免了因采用同样方法处理低频高频区而导致对高频段语音不能很好分离的结果。实验结果表明,该模型具有很好的应用效果。 展开更多
关键词 计算听觉场景分析 语音分离 基音估计 幅度调制
在线阅读 下载PDF
计算听觉场景分析介绍 被引量:1
16
作者 邱伟 黄秀轩 《高技术通讯》 EI CAS CSCD 2002年第1期106-110,共5页
介绍了计算听觉场景分析的研究内容、理论依据、归类线索及意义 ,并以听觉的两大类型 (数据驱动及图式驱动 )为框架较详细地阐述了计算听觉场景分析系统的主要结构及研究进展 。
关键词 计算听觉场景分析 听觉模型 声源分离 数据驱动 图式驱动 声音识别
在线阅读 下载PDF
基于计算听觉场景分析的语音盲分离方法 被引量:1
17
作者 王卫华 黄凤岗 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2008年第4期395-399,共5页
人耳具有提取感兴趣的声音、屏蔽噪声以及定位的功能.利用人耳听觉机理的听觉场景分析技术是语音信号处理的有力工具.提出了一种新的基于听觉场景分析的盲分离方法,可以对多个源信号混合而成的2个传感器信号进行分离.耳间时间差(IT... 人耳具有提取感兴趣的声音、屏蔽噪声以及定位的功能.利用人耳听觉机理的听觉场景分析技术是语音信号处理的有力工具.提出了一种新的基于听觉场景分析的盲分离方法,可以对多个源信号混合而成的2个传感器信号进行分离.耳间时间差(ITD)和强度差(ⅡD)包含信号源的位置信息.通过听觉外周模型对混合信号进行处理,得到各个频率通道的ITD和ⅡD,再对混合信号的频域表示进行聚类,可得到源信号的频域表示.由于ITD和ⅡD分别在高低频段起主要作用,聚类时对高低频段采取了不同的分类准则.仿真实验表明了该方法的有效性. 展开更多
关键词 盲分离 听觉场景分析 听觉定位 聚类
在线阅读 下载PDF
一种改进的单声道混合语音分离方法
18
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《自动化学报》 EI CSCD 北大核心 2009年第8期1087-1093,共7页
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替... 在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法,该方法在几乎不降低原方法分离性能的前提下,大大节约了算法运行所需的时间和资源消耗。 展开更多
关键词 语音分离 语音客观质量评估 计算听觉场景分析 信噪比 时域包络
在线阅读 下载PDF
一种基于上升缘与下降缘的语音分割方法
19
作者 郑荔平 《计算机工程与应用》 CSCD 2012年第5期127-130,共4页
听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一个听觉场景分解成多个片断。实现基于上升缘和下降缘分析的语音分割系统需检测上升缘与下降缘,通过匹配... 听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一个听觉场景分解成多个片断。实现基于上升缘和下降缘分析的语音分割系统需检测上升缘与下降缘,通过匹配对应的上升缘与下降缘的波前来生成语音片断,将这些片断重构成语音流。 展开更多
关键词 语音分割 事件检测 多尺度分析 上升缘 下降缘 计算听觉场景分析
在线阅读 下载PDF
基于计算听觉场景分析的混合语音信号分离算法研究 被引量:6
20
作者 屈俊玲 李鸿燕 《计算机应用研究》 CSCD 北大核心 2014年第12期3822-3824,共3页
人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊... 人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊语音信号分离算法。在白噪声、鸡尾酒会噪声等六种噪声干扰条件下,通过仿真实验结果表明,相比于传统的谱减法,语音分离算法的输出信噪比平均提高了7.47 d B,并有效抑制了干扰噪声,改善了分离效果。 展开更多
关键词 语音分离 计算听觉场景分析 基音 分段 听觉流
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部