期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
鸡尾酒会问题与相关听觉模型的研究现状与展望
被引量:
25
1
作者
黄雅婷
石晶
+1 位作者
许家铭
徐波
《自动化学报》
EI
CSCD
北大核心
2019年第2期234-251,共18页
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统...
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望.
展开更多
关键词
鸡尾酒会问题
听觉模型
语音分离
听觉注意
语音识别
在线阅读
下载PDF
职称材料
在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制
被引量:
4
2
作者
李量
郑英君
+3 位作者
吴超
黎绢花
张畅芯
陆灵犀
《心理科学进展》
CSSCI
CSCD
北大核心
2017年第12期2099-2110,共12页
在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目...
在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目标言语信号的短潜伏期反应,而且强化了线索特异性及非特异性的注意、言语表达、抑制功能和言语运动这四类脑区的活动及其功能连接,从而构成了信息掩蔽环境下知觉线索促进目标言语客体完好化的脑网络基础。
展开更多
关键词
鸡尾酒会问题
信息掩蔽
去掩蔽
言语识别
主观空间分离
听觉言语启动
视觉言语启动
脑网络
神经成像
在线阅读
下载PDF
职称材料
“鸡尾酒会”环境中的知觉线索的去掩蔽作用
被引量:
12
3
作者
徐李娟
黄莹
+2 位作者
吴玺宏
吴艳红
李量
《心理科学进展》
CSSCI
CSCD
北大核心
2009年第2期261-267,共7页
在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,...
在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,信息掩蔽发生在心理层次并受到认知过程的调节。因此,主观空间分离、与目标语句节奏相关的视觉信号以及对目标语句某些特征的熟悉程度等知觉线索都具有去掩蔽作用。考察可减少信息掩蔽的知觉线索的交互作用及其高级认知调节是今后重要的研究内容。
展开更多
关键词
“
鸡尾酒会
”
问题
知觉线索
选择性注意
能量掩蔽
信息掩蔽
在线阅读
下载PDF
职称材料
多说话人分离与目标说话人提取的研究现状与展望
4
作者
鲍长春
杨雪
《数据采集与处理》
CSCD
北大核心
2024年第5期1044-1061,共18页
语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起...
语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起源于著名的鸡尾酒会问题,旨在从混合信号中分离出说话人的语音信号。近年来,研究人员提出了大量的语音分离方法,显著提升了分离性能。本文对这些语音分离方法进行了系统的归纳和总结。首先,根据目标说话人的辅助信息利用与否,将语音分离方法分为两大类,即多说话人分离与目标说话人提取;其次,从传统到基于深度学习的角度,分别对多说话人分离和目标说话人提取两类方法进行详细介绍;最后,讨论了当前语音分离领域面临的一些挑战,并对未来的研究方向进行展望。
展开更多
关键词
语音分离
鸡尾酒会问题
多说话人分离
目标说话人提取
深度学习
在线阅读
下载PDF
职称材料
自适应多目独立成分分析
被引量:
4
5
作者
佘堃
蒲红梅
+1 位作者
郑方伟
周明天
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2007年第1期11-13,共3页
通过分析LCNN的学习方程,发现Lagrange约束项的物理本质是有监督学习的下降速率,提出了自适应LCNN(ALCNN)算法,避开了病态矩阵的问题,并将学习矩阵和独立成分求解复杂性都降到了O(n)。
关键词
独立成分分析
盲源分离系统
鸡尾酒会问题
在线阅读
下载PDF
职称材料
一种基于卷积神经网络的端到端语音分离方法
被引量:
14
6
作者
范存航
刘斌
+2 位作者
陶建华
温正棋
易江燕
《信号处理》
CSCD
北大核心
2019年第4期542-548,共7页
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方...
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。
展开更多
关键词
说话人独立语音分离
鸡尾酒会问题
端到端
卷积编解码器
在线阅读
下载PDF
职称材料
题名
鸡尾酒会问题与相关听觉模型的研究现状与展望
被引量:
25
1
作者
黄雅婷
石晶
许家铭
徐波
机构
中国科学院自动化研究所
中国科学院大学
中国科学院脑科学与智能技术卓越创新中心
出处
《自动化学报》
EI
CSCD
北大核心
2019年第2期234-251,共18页
基金
国家自然科学基金(61602479)
中国科学院战略性先导科技专项(XDBS01070000)
北京市科技重大专项(Z181100001518006)资助~~
文摘
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望.
关键词
鸡尾酒会问题
听觉模型
语音分离
听觉注意
语音识别
Keywords
Cocktail party problem
auditory model
speech separation
auditory attention
speech recognition
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制
被引量:
4
2
作者
李量
郑英君
吴超
黎绢花
张畅芯
陆灵犀
机构
北京大学心理与认知科学学院
广州医科大学附属脑科医院(广州市惠爱医院)
北京师范大学心理学部
华东师范大学教育学部教育康复学系
出处
《心理科学进展》
CSSCI
CSCD
北大核心
2017年第12期2099-2110,共12页
基金
国家重大研发计划匹配(北京市科技计划)(课题编号:Z161100002616017)项目支持
文摘
在有多人说话的嘈杂环境下,听者如何利用知觉线索来强化对目标言语的识别?为解答这一鸡尾酒会问题,研究者用脑成像的方法来考察相应的脑网络机制。研究表明,听者对与目标言语某个特征相关联的去掩蔽线索的利用,不但能促进听觉皮层对目标言语信号的短潜伏期反应,而且强化了线索特异性及非特异性的注意、言语表达、抑制功能和言语运动这四类脑区的活动及其功能连接,从而构成了信息掩蔽环境下知觉线索促进目标言语客体完好化的脑网络基础。
关键词
鸡尾酒会问题
信息掩蔽
去掩蔽
言语识别
主观空间分离
听觉言语启动
视觉言语启动
脑网络
神经成像
Keywords
cocktail-party problem
informational masking
unmasking
speech recognition
perceived spatial separation
auditory speech priming
visual speech priming
brain network
neuroimaging.
分类号
B842 [哲学宗教—基础心理学]
B845 [哲学宗教—心理学]
在线阅读
下载PDF
职称材料
题名
“鸡尾酒会”环境中的知觉线索的去掩蔽作用
被引量:
12
3
作者
徐李娟
黄莹
吴玺宏
吴艳红
李量
机构
北京大学心理学系
北京大学智能科学系
北京大学言语和听觉研究中心
机器感知与智能重点实验室(教育部)
出处
《心理科学进展》
CSSCI
CSCD
北大核心
2009年第2期261-267,共7页
基金
国家自然科学基金资助项目(基金号:30711120563
30670704
60535030)。
文摘
在有多人同时说话的嘈杂环境中,为什么具有正常听力的人能在一定的程度上听懂目标语句?研究这个著名的"鸡尾酒会"问题的一个新进展是将干扰言语的作用区分出了能量掩蔽和信息掩蔽两种成分。与发生在外周系统的能量掩蔽不同,信息掩蔽发生在心理层次并受到认知过程的调节。因此,主观空间分离、与目标语句节奏相关的视觉信号以及对目标语句某些特征的熟悉程度等知觉线索都具有去掩蔽作用。考察可减少信息掩蔽的知觉线索的交互作用及其高级认知调节是今后重要的研究内容。
关键词
“
鸡尾酒会
”
问题
知觉线索
选择性注意
能量掩蔽
信息掩蔽
Keywords
"cocktail-party" problem
perceptual cues
selective attention
energetic masking
informational masking
分类号
B842.2 [哲学宗教—基础心理学]
B849 [哲学宗教—应用心理学]
在线阅读
下载PDF
职称材料
题名
多说话人分离与目标说话人提取的研究现状与展望
4
作者
鲍长春
杨雪
机构
北京工业大学信息科学技术学院语音与音频信息处理研究所
出处
《数据采集与处理》
CSCD
北大核心
2024年第5期1044-1061,共18页
基金
国家自然科学基金(61831019)。
文摘
语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起源于著名的鸡尾酒会问题,旨在从混合信号中分离出说话人的语音信号。近年来,研究人员提出了大量的语音分离方法,显著提升了分离性能。本文对这些语音分离方法进行了系统的归纳和总结。首先,根据目标说话人的辅助信息利用与否,将语音分离方法分为两大类,即多说话人分离与目标说话人提取;其次,从传统到基于深度学习的角度,分别对多说话人分离和目标说话人提取两类方法进行详细介绍;最后,讨论了当前语音分离领域面临的一些挑战,并对未来的研究方向进行展望。
关键词
语音分离
鸡尾酒会问题
多说话人分离
目标说话人提取
深度学习
Keywords
speech separation
cocktail party problem
multi-speaker separation
target speaker extraction
deep learning
分类号
TN912.3 [电子电信—通信与信息系统]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
自适应多目独立成分分析
被引量:
4
5
作者
佘堃
蒲红梅
郑方伟
周明天
机构
电子科技大学计算机科学与工程学院
重庆通信学院第
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2007年第1期11-13,共3页
文摘
通过分析LCNN的学习方程,发现Lagrange约束项的物理本质是有监督学习的下降速率,提出了自适应LCNN(ALCNN)算法,避开了病态矩阵的问题,并将学习矩阵和独立成分求解复杂性都降到了O(n)。
关键词
独立成分分析
盲源分离系统
鸡尾酒会问题
Keywords
independent component analysis
blind source separation
cocktail party problem
分类号
TN911.7 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一种基于卷积神经网络的端到端语音分离方法
被引量:
14
6
作者
范存航
刘斌
陶建华
温正棋
易江燕
机构
中国科学院自动化研究所模式识别国家重点实验室
中国科学院大学人工智能学院
中国科学院脑科学与智能技术卓越创新中心
出处
《信号处理》
CSCD
北大核心
2019年第4期542-548,共7页
基金
国家重点研发计划(2017YFC0820602)
国家自然科学基金(61425017,61831022,61773379,61771472)
中国科学院-法国国家信息与自动化研究所联合研究项目(173211KYSB20170061)
文摘
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。
关键词
说话人独立语音分离
鸡尾酒会问题
端到端
卷积编解码器
Keywords
speaker independent speech separation
cocktail party problem
end-to-end
convolution encoder decoder
分类号
TN912 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
鸡尾酒会问题与相关听觉模型的研究现状与展望
黄雅婷
石晶
许家铭
徐波
《自动化学报》
EI
CSCD
北大核心
2019
25
在线阅读
下载PDF
职称材料
2
在鸡尾酒会场景下利用去掩蔽知觉线索提高言语识别的脑网络机制
李量
郑英君
吴超
黎绢花
张畅芯
陆灵犀
《心理科学进展》
CSSCI
CSCD
北大核心
2017
4
在线阅读
下载PDF
职称材料
3
“鸡尾酒会”环境中的知觉线索的去掩蔽作用
徐李娟
黄莹
吴玺宏
吴艳红
李量
《心理科学进展》
CSSCI
CSCD
北大核心
2009
12
在线阅读
下载PDF
职称材料
4
多说话人分离与目标说话人提取的研究现状与展望
鲍长春
杨雪
《数据采集与处理》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
5
自适应多目独立成分分析
佘堃
蒲红梅
郑方伟
周明天
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2007
4
在线阅读
下载PDF
职称材料
6
一种基于卷积神经网络的端到端语音分离方法
范存航
刘斌
陶建华
温正棋
易江燕
《信号处理》
CSCD
北大核心
2019
14
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部