期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于巴克谱的语音质量评估算法研究 被引量:2
1
作者 包晓刚 胡剑凌 徐盛 《数据采集与处理》 CSCD 2004年第1期16-20,共5页
提出了一种语音主观质量的客观评估算法 ,该算法在巴克谱的基础上计算原始语音与重建语音之间的失真度 ,并考虑了弱音帧与噪声帧的存在对语音质量评估的影响。文中同时给出了结合巴克谱失真和弱音与噪声帧比率的语音质量评估公式 ,并将... 提出了一种语音主观质量的客观评估算法 ,该算法在巴克谱的基础上计算原始语音与重建语音之间的失真度 ,并考虑了弱音帧与噪声帧的存在对语音质量评估的影响。文中同时给出了结合巴克谱失真和弱音与噪声帧比率的语音质量评估公式 ,并将计算结果与平均意见分 (MOS)进行了比较。数值实验表明 ,本文提出的增强型巴克谱失真测度 (IBSD)与 MOS之间具有很强的相关性 ,能客观地评价出语音信号的主观质量 ,适用于各种语音编码、语音通信系统。 展开更多
关键词 语音编码 语音通信系统 语音质量评估算法 巴克谱 语音信号处理
在线阅读 下载PDF
基于失匹配负波潜伏期优化的语音增强研究
2
作者 吉陈果 贾海蓉 +1 位作者 裴意静 段淑斐 《计算机工程与科学》 北大核心 2025年第3期524-533,共10页
针对现有语音增强算法和评价指标出现的失配问题,将脑电成分评估语音指标与损失函数相结合,有效提升了语音增强算法的性能。首先,验证脑电成分失匹配负波的潜伏期可以作为语音的客观评价指标,以此提出失匹配负波的潜伏期函数,并将其与... 针对现有语音增强算法和评价指标出现的失配问题,将脑电成分评估语音指标与损失函数相结合,有效提升了语音增强算法的性能。首先,验证脑电成分失匹配负波的潜伏期可以作为语音的客观评价指标,以此提出失匹配负波的潜伏期函数,并将其与信噪比联系,从而解决当前语音增强领域常用评价指标无法直接作为损失函数来优化语音增强算法的问题。其次,将潜伏期函数与传统神经网络中的学习目标进行联合训练,通过训练不断优化潜伏期函数。最后,将潜伏期函数应用到生成对抗网络的鉴别器损失函数中,结合Conformer能够有效捕捉长期依赖关系,同时在时间和频率维度上提取局部特征。实验结果显示,利用脑电成分评估的语音客观度量指标来优化神经网络能够有效改善语音的特性,从语音的增强质量、可懂度和失真程度方面均验证了所提算法的有效性。 展开更多
关键词 语音增强 失匹配负波 语音质量评估 生成对抗网络
在线阅读 下载PDF
一种改进的语音质量感知评估算法
3
作者 黄石磊 刘轶 程刚 《计算机工程》 CAS CSCD 2012年第18期19-21,25,共4页
为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静... 为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静音具有不同的特性。实验结果表明,该算法能在窄带语音上提高PESQ得分与主观平均意见分的相关性。 展开更多
关键词 语音质量评估 平均意见分 语音质量客观评估 语音质量感知评估 语音编码 清浊静音分类
在线阅读 下载PDF
基于特征融合的通信语音干扰效果客观评估 被引量:4
4
作者 林云 徐怀韬 +2 位作者 王森 张思成 庄龙 《通信学报》 EI CSCD 北大核心 2023年第3期105-116,共12页
针对通信语音干扰效果客观评估问题,提出了基于多测度与多模态融合的2种评估方法。首先,利用端点检测算法以及动态时间弯折算法对受扰语音数据进行预处理。然后,提取数据中的语音内容并与标准语音进行测度计算得到5种测度,将5种测度融... 针对通信语音干扰效果客观评估问题,提出了基于多测度与多模态融合的2种评估方法。首先,利用端点检测算法以及动态时间弯折算法对受扰语音数据进行预处理。然后,提取数据中的语音内容并与标准语音进行测度计算得到5种测度,将5种测度融合后利用随机森林模型进行质量等级评估。最后,结合多模态融合技术,设计了基于残差结构的神经网络模型,融合受扰语音数据的图域、测度域特征并进行质量等级评估。实验结果表明,2种方法的评估准确率均达到了90%以上。其中,多模态评估方法与现有的研究方法相比,准确率提升了约3.269%,证明所提方法具有更优的性能。 展开更多
关键词 语音质量评估 语音信号处理 多模态融合 深度神经网络
在线阅读 下载PDF
一种语音信号重建算法 被引量:1
5
作者 田绪安 徐一兵 朱敏 《现代电子技术》 2008年第11期167-169,共3页
为了减轻因信包丢失而造成的语音失真,提出了一种基于双边线性预测的信包丢失隐藏算法。这种方法利用丢失信包的前一信包或邻接信包(在后一信包可获得的情况下)预测丢失信包,通过线性加权双边线性预测的样点获得最终的重建信号,使用重... 为了减轻因信包丢失而造成的语音失真,提出了一种基于双边线性预测的信包丢失隐藏算法。这种方法利用丢失信包的前一信包或邻接信包(在后一信包可获得的情况下)预测丢失信包,通过线性加权双边线性预测的样点获得最终的重建信号,使用重叠相加和幅度调整操作平滑重建信号和真实信号之间的边界。经过非正式试听和ITU-T P.862协议所推荐的PESQ算法测试,该算法的重建语音信号质量与其他四种流行重建算法相比,有了较为明显的改善。 展开更多
关键词 IP语音 信包丢失隐藏 双边线性预测 语音质量评估
在线阅读 下载PDF
浅海信道调频水声语音通信方法比较 被引量:4
6
作者 李剑汶 王小阳 童峰 《舰船科学技术》 北大核心 2017年第1期127-131,共5页
水声语音通信在海洋工程、海洋科考、水下搜救等领域具有广泛应用。与单边带通信、数字编码调制通信相比,调频水声语音通信具有实现简单方便、抗幅度衰落性能好的特点,但浅海水声信道具有的复杂多径效应及噪声严重影响其获得的语音音质... 水声语音通信在海洋工程、海洋科考、水下搜救等领域具有广泛应用。与单边带通信、数字编码调制通信相比,调频水声语音通信具有实现简单方便、抗幅度衰落性能好的特点,但浅海水声信道具有的复杂多径效应及噪声严重影响其获得的语音音质,容易出现语音含混、语义难辨等问题。本文通过浅海不同距离、不同多径信道下的海试实验比较了采用非线性解调法和正交解调法的调频语音通信性能,并通过客观语音质量评估PESQ(Perceptual evaluation of speech quality)方法对调频水声语音通信音质进行量化评估。 展开更多
关键词 水声语音通信 调频 非线性解调法 正交解调法 客观语音质量评估
在线阅读 下载PDF
一种改进的单声道混合语音分离方法
7
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《自动化学报》 EI CSCD 北大核心 2009年第8期1087-1093,共7页
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替... 在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法,该方法在几乎不降低原方法分离性能的前提下,大大节约了算法运行所需的时间和资源消耗。 展开更多
关键词 语音分离 语音客观质量评估 计算听觉场景分析 信噪比 时域包络
在线阅读 下载PDF
高分辨率掩蔽感知模型的语音增强
8
作者 徐静波 于洪涛 冉崇森 《数据采集与处理》 CSCD 北大核心 2005年第4期428-431,共4页
给出一种有效的噪声压缩算法,提供了高分辨率的掩蔽感知模型,并对K a lm an滤波模型进行了改进。算法通过计算噪声掩蔽参数,可以适时更新数据参数,压缩信号噪声。实验表明,本文算法没有延迟,语音质量感知评估(Perceptua l eva luation o... 给出一种有效的噪声压缩算法,提供了高分辨率的掩蔽感知模型,并对K a lm an滤波模型进行了改进。算法通过计算噪声掩蔽参数,可以适时更新数据参数,压缩信号噪声。实验表明,本文算法没有延迟,语音质量感知评估(Perceptua l eva luation of speech qua lity scores,PESQ)值高,对窄带及宽带信号噪声的压缩均有满意效果。 展开更多
关键词 噪声压缩 掩蔽感知模型 Kalman滤波模型 语音质量感知评估
在线阅读 下载PDF
基于改进的SOM网络模型的VoI PQoS应用研究 被引量:1
9
作者 杨诗琴 须文波 孙俊 《计算机工程与应用》 CSCD 北大核心 2008年第1期107-109,125,共4页
VoIP的服务质量(QoS,Quality of Service)评估可以采用一系列可度量的参数来描述:业务可用性、吞吐量、延迟、抖动、分组丢失率等。现有的感知语音质量评价(PESQ)很难对不同环境下的网络结构进行实时和恰当的语音等级质量分类。为了能... VoIP的服务质量(QoS,Quality of Service)评估可以采用一系列可度量的参数来描述:业务可用性、吞吐量、延迟、抖动、分组丢失率等。现有的感知语音质量评价(PESQ)很难对不同环境下的网络结构进行实时和恰当的语音等级质量分类。为了能够综合考虑几种QoS相关因素,在给出改进的自组织映射神经网络模型(ESOMNN)的基础上,利用ESOM能够对高维输入数据有效分类的特点,提出了将端到端延迟、丢包率、抖动、语音编码以及测试系统标识作为ESOMNN的输入数据,在对采样数据进行训练后可自动完成语音质量评价和映射,并能根据得到的实时变量有效地评价包含多种相关因素的QoS级别。 展开更多
关键词 服务质量映射 网络语音 感知语音质量评估 自组织映射神经网络模型 扩展自组织神经网络模型
在线阅读 下载PDF
基于双边线性预测的信包丢失隐藏算法 被引量:1
10
作者 谢青松 魏维 罗凯 《信号处理》 CSCD 北大核心 2008年第2期320-323,共4页
本文提出了一种基于双边线性预测的信包丢失隐藏算法。该方法利用丢失信包的前一信包或邻接信包(在后一信包可获得的情况下)预测丢失信包。线性加权双边线性预测的样点获得最终的重建信号。使用重叠相加和幅度调整操作平滑重建信号和真... 本文提出了一种基于双边线性预测的信包丢失隐藏算法。该方法利用丢失信包的前一信包或邻接信包(在后一信包可获得的情况下)预测丢失信包。线性加权双边线性预测的样点获得最终的重建信号。使用重叠相加和幅度调整操作平滑重建信号和真实信号之间的边界。经过非正式试听和ITU-T P.862协议所推荐的PESQ算法测试,本文建议算法的重建语音信号质量,与其他四种流行重建算法相比有了较为明显的改善。 展开更多
关键词 基于IP语音(VoIP) 信包丢失隐藏(PLC) 基于双边线性预测的重建 语音质量的感知评估(PESQ)
在线阅读 下载PDF
Mapping methods for output-based objective speech quality assessment using data mining 被引量:2
11
作者 王晶 赵胜辉 +1 位作者 谢湘 匡镜明 《Journal of Central South University》 SCIE EI CAS 2014年第5期1919-1926,共8页
Objective speech quality is difficult to be measured without the input reference speech.Mapping methods using data mining are investigated and designed to improve the output-based speech quality assessment algorithm.T... Objective speech quality is difficult to be measured without the input reference speech.Mapping methods using data mining are investigated and designed to improve the output-based speech quality assessment algorithm.The degraded speech is firstly separated into three classes(unvoiced,voiced and silence),and then the consistency measurement between the degraded speech signal and the pre-trained reference model for each class is calculated and mapped to an objective speech quality score using data mining.Fuzzy Gaussian mixture model(GMM)is used to generate the artificial reference model trained on perceptual linear predictive(PLP)features.The mean opinion score(MOS)mapping methods including multivariate non-linear regression(MNLR),fuzzy neural network(FNN)and support vector regression(SVR)are designed and compared with the standard ITU-T P.563 method.Experimental results show that the assessment methods with data mining perform better than ITU-T P.563.Moreover,FNN and SVR are more efficient than MNLR,and FNN performs best with 14.50% increase in the correlation coefficient and 32.76% decrease in the root-mean-square MOS error. 展开更多
关键词 objective speech quality data mining multivariate non-linear regression fuzzy neural network support vector regression
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部