检索结果-维普期刊中文期刊服务平台

鸡尾酒会问题与相关听觉模型的研究现状与展望被引量：25: 1; 作者黄雅婷石晶 +1 位作者许家铭徐波《自动化学报》 EI CSCD 北大核心 2019年第2期234-251,共18页; 近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统... 展开更多; 关键词鸡尾酒会问题听觉模型语音分离听觉注意语音识别; 在线阅读下载PDF 职称材料

在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制被引量：4: 2; 作者李量郑英君 +3 位作者吴超黎绢花张畅芯陆灵犀《心理科学进展》 CSSCI CSCD 北大核心 2017年第12期2099-2110,共12页; 在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目... 展开更多; 关键词鸡尾酒会问题信息掩蔽去掩蔽言语识别主观空间分离听觉言语启动视觉言语启动脑网络神经成像; 在线阅读下载PDF 职称材料

“鸡尾酒会”环境中的知觉线索的去掩蔽作用被引量：12: 3; 作者徐李娟黄莹 +2 位作者吴玺宏吴艳红李量《心理科学进展》 CSSCI CSCD 北大核心 2009年第2期261-267,共7页; 在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,... 展开更多; 关键词 “鸡尾酒会”问题知觉线索选择性注意能量掩蔽信息掩蔽; 在线阅读下载PDF 职称材料

多说话人分离与目标说话人提取的研究现状与展望: 4; 作者鲍长春杨雪《数据采集与处理》 CSCD 北大核心 2024年第5期1044-1061,共18页; 语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起... 展开更多; 关键词语音分离鸡尾酒会问题多说话人分离目标说话人提取深度学习; 在线阅读下载PDF 职称材料

自适应多目独立成分分析被引量：4: 5; 作者佘堃蒲红梅 +1 位作者郑方伟周明天《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第1期11-13,共3页; 通过分析LCNN的学习方程,发现Lagrange约束项的物理本质是有监督学习的下降速率,提出了自适应LCNN(ALCNN)算法,避开了病态矩阵的问题,并将学习矩阵和独立成分求解复杂性都降到了O(n)。; 关键词独立成分分析盲源分离系统鸡尾酒会问题; 在线阅读下载PDF 职称材料

一种基于卷积神经网络的端到端语音分离方法被引量：14: 6; 作者范存航刘斌 +2 位作者陶建华温正棋易江燕《信号处理》 CSCD 北大核心 2019年第4期542-548,共7页; 大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方... 展开更多; 关键词说话人独立语音分离鸡尾酒会问题端到端卷积编解码器; 在线阅读下载PDF 职称材料

题名鸡尾酒会问题与相关听觉模型的研究现状与展望被引量：25: 1; 作者黄雅婷石晶许家铭徐波; 机构中国科学院自动化研究所中国科学院大学中国科学院脑科学与智能技术卓越创新中心; 出处《自动化学报》 EI CSCD 北大核心 2019年第2期234-251,共18页; 基金国家自然科学基金(61602479) 中国科学院战略性先导科技专项(XDBS01070000) 北京市科技重大专项(Z181100001518006)资助~~; 文摘近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望.; 关键词鸡尾酒会问题听觉模型语音分离听觉注意语音识别; Keywords Cocktail party problem auditory model speech separation auditory attention speech recognition; 分类号 TN912.34 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制被引量：4: 2; 作者李量郑英君吴超黎绢花张畅芯陆灵犀; 机构北京大学心理与认知科学学院广州医科大学附属脑科医院(广州市惠爱医院) 北京师范大学心理学部华东师范大学教育学部教育康复学系; 出处《心理科学进展》 CSSCI CSCD 北大核心 2017年第12期2099-2110,共12页; 基金国家重大研发计划匹配(北京市科技计划)(课题编号:Z161100002616017)项目支持; 文摘在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目标言语信号的短潜伏期反应,而且强化了线索特异性及非特异性的注意、言语表达、抑制功能和言语运动这四类脑区的活动及其功能连接,从而构成了信息掩蔽环境下知觉线索促进目标言语客体完好化的脑网络基础。; 关键词鸡尾酒会问题信息掩蔽去掩蔽言语识别主观空间分离听觉言语启动视觉言语启动脑网络神经成像; Keywords cocktail-party problem informational masking unmasking speech recognition perceived spatial separation auditory speech priming visual speech priming brain network neuroimaging.; 分类号 B842 [哲学宗教—基础心理学] B845 [哲学宗教—心理学]; 在线阅读下载PDF 职称材料

题名“鸡尾酒会”环境中的知觉线索的去掩蔽作用被引量：12: 3; 作者徐李娟黄莹吴玺宏吴艳红李量; 机构北京大学心理学系北京大学智能科学系北京大学言语和听觉研究中心机器感知与智能重点实验室(教育部); 出处《心理科学进展》 CSSCI CSCD 北大核心 2009年第2期261-267,共7页; 基金国家自然科学基金资助项目(基金号:30711120563 30670704 60535030)。; 文摘在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,信息掩蔽发生在心理层次并受到认知过程的调节。因此,主观空间分离、与目标语句节奏相关的视觉信号以及对目标语句某些特征的熟悉程度等知觉线索都具有去掩蔽作用。考察可减少信息掩蔽的知觉线索的交互作用及其高级认知调节是今后重要的研究内容。; 关键词 “鸡尾酒会”问题知觉线索选择性注意能量掩蔽信息掩蔽; Keywords ＂cocktail-party＂ problem perceptual cues selective attention energetic masking informational masking; 分类号 B842.2 [哲学宗教—基础心理学] B849 [哲学宗教—应用心理学]; 在线阅读下载PDF 职称材料

题名多说话人分离与目标说话人提取的研究现状与展望: 4; 作者鲍长春杨雪; 机构北京工业大学信息科学技术学院语音与音频信息处理研究所; 出处《数据采集与处理》 CSCD 北大核心 2024年第5期1044-1061,共18页; 基金国家自然科学基金(61831019)。; 文摘语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起源于著名的鸡尾酒会问题,旨在从混合信号中分离出说话人的语音信号。近年来,研究人员提出了大量的语音分离方法,显著提升了分离性能。本文对这些语音分离方法进行了系统的归纳和总结。首先,根据目标说话人的辅助信息利用与否,将语音分离方法分为两大类,即多说话人分离与目标说话人提取;其次,从传统到基于深度学习的角度,分别对多说话人分离和目标说话人提取两类方法进行详细介绍;最后,讨论了当前语音分离领域面临的一些挑战,并对未来的研究方向进行展望。; 关键词语音分离鸡尾酒会问题多说话人分离目标说话人提取深度学习; Keywords speech separation cocktail party problem multi-speaker separation target speaker extraction deep learning; 分类号 TN912.3 [电子电信—通信与信息系统] TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名自适应多目独立成分分析被引量：4: 5; 作者佘堃蒲红梅郑方伟周明天; 机构电子科技大学计算机科学与工程学院重庆通信学院第; 出处《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第1期11-13,共3页; 文摘通过分析LCNN的学习方程,发现Lagrange约束项的物理本质是有监督学习的下降速率,提出了自适应LCNN(ALCNN)算法,避开了病态矩阵的问题,并将学习矩阵和独立成分求解复杂性都降到了O(n)。; 关键词独立成分分析盲源分离系统鸡尾酒会问题; Keywords independent component analysis blind source separation cocktail party problem; 分类号 TN911.7 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名一种基于卷积神经网络的端到端语音分离方法被引量：14: 6; 作者范存航刘斌陶建华温正棋易江燕; 机构中国科学院自动化研究所模式识别国家重点实验室中国科学院大学人工智能学院中国科学院脑科学与智能技术卓越创新中心; 出处《信号处理》 CSCD 北大核心 2019年第4期542-548,共7页; 基金国家重点研发计划(2017YFC0820602) 国家自然科学基金(61425017,61831022,61773379,61771472) 中国科学院-法国国家信息与自动化研究所联合研究项目(173211KYSB20170061); 文摘大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。; 关键词说话人独立语音分离鸡尾酒会问题端到端卷积编解码器; Keywords speaker independent speech separation cocktail party problem end-to-end convolution encoder decoder; 分类号 TN912 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	鸡尾酒会问题与相关听觉模型的研究现状与展望	黄雅婷石晶许家铭徐波	《自动化学报》 EI CSCD 北大核心	2019	25	在线阅读下载PDF 职称材料
2	在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制	李量郑英君吴超黎绢花张畅芯陆灵犀	《心理科学进展》 CSSCI CSCD 北大核心	2017	4	在线阅读下载PDF 职称材料
3	“鸡尾酒会”环境中的知觉线索的去掩蔽作用	徐李娟黄莹吴玺宏吴艳红李量	《心理科学进展》 CSSCI CSCD 北大核心	2009	12	在线阅读下载PDF 职称材料
4	多说话人分离与目标说话人提取的研究现状与展望	鲍长春杨雪	《数据采集与处理》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
5	自适应多目独立成分分析	佘堃蒲红梅郑方伟周明天	《电子科技大学学报》 EI CAS CSCD 北大核心	2007	4	在线阅读下载PDF 职称材料
6	一种基于卷积神经网络的端到端语音分离方法	范存航刘斌陶建华温正棋易江燕	《信号处理》 CSCD 北大核心	2019	14	在线阅读下载PDF 职称材料