题名 一种改进的语音质量感知评估算法
1
作者
黄石磊
刘轶
程刚
机构
北京大学信息科学技术学院
深港产学研基地智能媒体和语音实验室
出处
《计算机工程》
CAS
CSCD
2012年第18期19-21,25,共4页
基金
深圳基础研究基金资助重点项目"面向互联网的智能语音搜索和监控关键技术的研究"(JC201005260245A)
文摘
为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静音具有不同的特性。实验结果表明,该算法能在窄带语音上提高PESQ得分与主观平均意见分的相关性。
关键词
语音 质量 评估
平均意见分
语音 质量 客观 评估
语音 质量 感知评估
语音 编码
清浊静音分类
Keywords
speech quality evaluation; Mean Opinion Score(MOS); objective evaluation of speech quality; Perceptual Evaluation of Speech Quality(PESQ); speech coding; Unvoiced/Voiced/Silence(UVS) classification
分类号
TN912.3
[电子电信—通信与信息系统]
题名 一种改进的单声道混合语音分离方法
2
作者
李鹏
关勇
刘文举
徐波
机构
中国科学院自动化研究所数字内容技术研究中心
中国科学院自动化研究所模式识别围家重点实验室
出处
《自动化学报》
EI
CSCD
北大核心
2009年第8期1087-1093,共7页
基金
国家重点基础研究发展规划(973计划)(2004CB318105)
国家高科技研究发展计划(863计划)(2006AA010103,2006AA01Z194)资助~~
文摘
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法,该方法在几乎不降低原方法分离性能的前提下,大大节约了算法运行所需的时间和资源消耗。
关键词
语音 分离
语音客观质量评估
计算听觉场景分析
信噪比
时域包络
Keywords
Speech separation, objective quality assessment of speech, computational auditory scene analysis, signal to noise ratio (SNR), temporal envelope
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
题名 浅海信道调频水声语音通信方法比较
被引量:4
3
作者
李剑汶
王小阳
童峰
机构
厦门大学水声通信与海洋信息技术教育部重点实验室
出处
《舰船科学技术》
北大核心
2017年第1期127-131,共5页
基金
国家自然科学基金资助项目(11274259
11574258)
文摘
水声语音通信在海洋工程、海洋科考、水下搜救等领域具有广泛应用。与单边带通信、数字编码调制通信相比,调频水声语音通信具有实现简单方便、抗幅度衰落性能好的特点,但浅海水声信道具有的复杂多径效应及噪声严重影响其获得的语音音质,容易出现语音含混、语义难辨等问题。本文通过浅海不同距离、不同多径信道下的海试实验比较了采用非线性解调法和正交解调法的调频语音通信性能,并通过客观语音质量评估PESQ(Perceptual evaluation of speech quality)方法对调频水声语音通信音质进行量化评估。
关键词
水声语音 通信
调频
非线性解调法
正交解调法
客观 语音 质量 评估
Keywords
underwater acoustic speeeh eommunication
FM
nonlinear demodulation method
orthogonal demodulation method
PESQ
分类号
TN929.3
[电子电信—通信与信息系统]
题名 基于图神经网络的多通道语音增强
4
作者
宁振杰
闫坤
陈海贞
韦焯淇
机构
桂林电子科技大学信息与通信学院
出处
《计算机工程与设计》
2025年第10期2945-2951,共7页
基金
国家自然科学基金项目(62101147)
广西自然科学基金项目(桂科2020GXNSFAA159146)
+1 种基金
广西创新驱动发展专项基金项目(桂科AA21077008)
教育部重点实验室基金项目(CRKL190108)。
文摘
多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩阵的图卷积网络(automatic adjacency matrix-returning graph convolutional network,AAMR-GCN),通过图自编码器(graph auto-encoder, GAE)从麦克风阵列捕获的语音信号中学习邻接矩阵,利用图卷积网络(graph convolutional network,GCN)和多层感知器(multilayer perceptron,MLP)实现语音增强。在多通道的语音增强任务中,AAMR-GCN在客观语音质量评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两个指标上均优于几种先进方法。
关键词
多通道语音 增强
自动邻接矩阵返回的图卷积网络
图自编码器
多层感知器
麦克风阵列
客观 语音 质量 评估
短时客观 可懂度
Keywords
multi-channel speech enhancement
graph convolutional network with auto-returned adjacency matrix
graph auto-encoder
multilayer perceptron
microphone array
objective speech quality assessment
short-time objective intelligibility
分类号
TP391
[自动化与计算机技术]