期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
鸡尾酒会问题与相关听觉模型的研究现状与展望 被引量:25
1
作者 黄雅婷 石晶 +1 位作者 许家铭 徐波 《自动化学报》 EI CSCD 北大核心 2019年第2期234-251,共18页
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统... 近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望. 展开更多
关键词 鸡尾酒会问题 听觉模型 语音分离 听觉注意 语音识别
在线阅读 下载PDF
在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制 被引量:4
2
作者 李量 郑英君 +3 位作者 吴超 黎绢花 张畅芯 陆灵犀 《心理科学进展》 CSSCI CSCD 北大核心 2017年第12期2099-2110,共12页
在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目... 在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目标言语信号的短潜伏期反应,而且强化了线索特异性及非特异性的注意、言语表达、抑制功能和言语运动这四类脑区的活动及其功能连接,从而构成了信息掩蔽环境下知觉线索促进目标言语客体完好化的脑网络基础。 展开更多
关键词 鸡尾酒会问题 信息掩蔽 去掩蔽 言语识别 主观空间分离 听觉言语启动 视觉言语启动 脑网络 神经成像
在线阅读 下载PDF
“鸡尾酒会”环境中的知觉线索的去掩蔽作用 被引量:12
3
作者 徐李娟 黄莹 +2 位作者 吴玺宏 吴艳红 李量 《心理科学进展》 CSSCI CSCD 北大核心 2009年第2期261-267,共7页
在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,... 在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,信息掩蔽发生在心理层次并受到认知过程的调节。因此,主观空间分离、与目标语句节奏相关的视觉信号以及对目标语句某些特征的熟悉程度等知觉线索都具有去掩蔽作用。考察可减少信息掩蔽的知觉线索的交互作用及其高级认知调节是今后重要的研究内容。 展开更多
关键词 鸡尾酒会问题 知觉线索 选择性注意 能量掩蔽 信息掩蔽
在线阅读 下载PDF
多说话人分离与目标说话人提取的研究现状与展望
4
作者 鲍长春 杨雪 《数据采集与处理》 CSCD 北大核心 2024年第5期1044-1061,共18页
语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起... 语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起源于著名的鸡尾酒会问题,旨在从混合信号中分离出说话人的语音信号。近年来,研究人员提出了大量的语音分离方法,显著提升了分离性能。本文对这些语音分离方法进行了系统的归纳和总结。首先,根据目标说话人的辅助信息利用与否,将语音分离方法分为两大类,即多说话人分离与目标说话人提取;其次,从传统到基于深度学习的角度,分别对多说话人分离和目标说话人提取两类方法进行详细介绍;最后,讨论了当前语音分离领域面临的一些挑战,并对未来的研究方向进行展望。 展开更多
关键词 语音分离 鸡尾酒会问题 多说话人分离 目标说话人提取 深度学习
在线阅读 下载PDF
自适应多目独立成分分析 被引量:4
5
作者 佘堃 蒲红梅 +1 位作者 郑方伟 周明天 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第1期11-13,共3页
通过分析LCNN的学习方程,发现Lagrange约束项的物理本质是有监督学习的下降速率,提出了自适应LCNN(ALCNN)算法,避开了病态矩阵的问题,并将学习矩阵和独立成分求解复杂性都降到了O(n)。
关键词 独立成分分析 盲源分离系统 鸡尾酒会问题
在线阅读 下载PDF
一种基于卷积神经网络的端到端语音分离方法 被引量:14
6
作者 范存航 刘斌 +2 位作者 陶建华 温正棋 易江燕 《信号处理》 CSCD 北大核心 2019年第4期542-548,共7页
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方... 大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。 展开更多
关键词 说话人独立语音分离 鸡尾酒会问题 端到端 卷积编解码器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部