期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
说话人验证中基于语音质量的自适应损失函数研究
1
作者 王佳龙 陈奕豪 +2 位作者 许敏强 何亮 方磊 《小型微型计算机系统》 北大核心 2025年第7期1585-1589,共5页
说话人验证任务中模型性能与语音质量有关,但目前研究并未关注语音质量的高低对模型能力的影响,因此本文提出了一种基于语音数据质量的自适应损失函数的方法.首先本文观察到说话人特征的模长与语音质量存在正相关性;其次根据说话人特征... 说话人验证任务中模型性能与语音质量有关,但目前研究并未关注语音质量的高低对模型能力的影响,因此本文提出了一种基于语音数据质量的自适应损失函数的方法.首先本文观察到说话人特征的模长与语音质量存在正相关性;其次根据说话人特征模长,本文提出了一种新型损失函数(AMGsoftmax),通过更加关注高质量大模长的样本,实现自适应调整不同质量数据的损失函数,从而提升模型识别能力.实验结果表明,AMGsoftmax与常用的AMsoftmax损失函数相比,在VoxCeleb1-O数据集上,等误识率(EER)相对降低了9.69%;在VoxSRC21-val数据集上,EER相对降低了7.38%. 展开更多
关键词 说话人验证 语音质量 损失函数
在线阅读 下载PDF
天波超视距雷达回波边缘效应抑制处理方法 被引量:1
2
作者 韩彦明 余陈钢 +1 位作者 夏新仁 祝志勇 《现代雷达》 CSCD 北大核心 2021年第11期30-33,共4页
天波超视距雷达在探测目标时,由于距离和方位分辨率低,在探测波位边缘,目标距离或方位单元会在短时间内不变化,这种现象被称为回波边缘效应,会直接影响目标跟踪处理和目标航迹运动趋势的判别。文中设计了一种基于保护波束的回波边缘效... 天波超视距雷达在探测目标时,由于距离和方位分辨率低,在探测波位边缘,目标距离或方位单元会在短时间内不变化,这种现象被称为回波边缘效应,会直接影响目标跟踪处理和目标航迹运动趋势的判别。文中设计了一种基于保护波束的回波边缘效应抑制处理方法,通过对保护子波束内回波进行数据处理后,消除了因边缘效应产生的目标位置不准确的现象,航迹跨波位跟踪的能力得到较大提高,从而提升了航迹跟踪连续性。 展开更多
关键词 超视距雷达 回波边缘效应 保护子波束
在线阅读 下载PDF
基于谱减与自适应子带对数能熵积的端点检测 被引量:4
3
作者 张洪德 韩鑫怡 +1 位作者 柳林 柳扬 《兵器装备工程学报》 CSCD 北大核心 2022年第2期267-273,共7页
针对低信噪比环境下语音端点检测准确率低、鲁棒性差,提出了一种将谱减降噪和自适应子带对数能熵积相结合的语音端点检测算法。首先利用改进的多窗谱估计谱减法提升语音信号质量,再以自适应子带对数能熵积这一新的语音特征参数为阈值,... 针对低信噪比环境下语音端点检测准确率低、鲁棒性差,提出了一种将谱减降噪和自适应子带对数能熵积相结合的语音端点检测算法。首先利用改进的多窗谱估计谱减法提升语音信号质量,再以自适应子带对数能熵积这一新的语音特征参数为阈值,使用动态阈值双门限检测法进行语音端点检测。实验结果表明,该算法针对低信噪比语音信号具有更好的准确性和鲁棒性。 展开更多
关键词 语音端点检测 子带对数能量 子带谱熵 多窗谱估计谱减法 双门限检测
在线阅读 下载PDF
基于WDGAN-div的语音增强方法 被引量:4
4
作者 韩鑫怡 张洪德 +1 位作者 柳林 柳扬 《电子测量技术》 北大核心 2021年第21期64-70,共7页
针对在低信噪比环境下传统语音增强方法适应性差和增强效果不理想的问题,提出一种基于Wasserstein散度的深度生成对抗网络的语音增强方法。该方法以5个生成器和1个判别器为基础组成深度生成对抗网络,利用5个生成器进行5次增强处理,有效... 针对在低信噪比环境下传统语音增强方法适应性差和增强效果不理想的问题,提出一种基于Wasserstein散度的深度生成对抗网络的语音增强方法。该方法以5个生成器和1个判别器为基础组成深度生成对抗网络,利用5个生成器进行5次增强处理,有效提高对抗网络在低信噪比条件下的增强效果,使用Wasserstein散度优化网络训练,改善传统GAN网络训练过程中存在的训练不稳定等问题,提高深度生成对抗网络训练的稳定性。在低信噪比环境下该方法相比于传统语音增强方法噪声适应性和增强效果都有明显提升。实验结果表明,与原始带噪语音相比,增强语音的分段信噪比平均提高6.1 dB,语音质量感知评估测度和短时客观可懂度分别平均提升28.9%和10.6%。 展开更多
关键词 语音增强 生成对抗网络 深度学习 卷积神经网络 Wasserstein散度
在线阅读 下载PDF
基于自监督预训练和有监督微调的伪造语音检测方法 被引量:2
5
作者 夏翔 方磊 +1 位作者 方四安 柳林 《计算机应用》 CSCD 北大核心 2023年第S01期263-268,共6页
随着深度学习技术的发展,合成语音的质量和听感与真实自然语音越来越难以区分,这严重威胁了基于声纹识别相关应用的可靠性和安全性。现有研究从特征提取和后端二分类器两个维度上提出了各种方法用于伪造语音检测,取得了优异的效果。然而... 随着深度学习技术的发展,合成语音的质量和听感与真实自然语音越来越难以区分,这严重威胁了基于声纹识别相关应用的可靠性和安全性。现有研究从特征提取和后端二分类器两个维度上提出了各种方法用于伪造语音检测,取得了优异的效果。然而,当模型面对未知的伪造类型数据时,模型检测准确率急剧下降,特别是对于跨数据集评估测试场景。受到自监督学习框架在多种语音识别下游任务成功经验的启发,提出一种基于预训练和微调结合的伪造语音检测框架。预训练使用无标签数据学习通用的语音表征,之后利用有标签的真实伪造语音数据集来微调整个网络参数,达到区分真实自然音和伪造语音的目的。该方法在ASVspoof 2019逻辑攻击数据集上的联合检测代价函数值为0.0061,等错误率(EER)值为0.19%,同时在ASVspoof 2015和Fake or Real跨数据集评测上也展现了良好的泛化能力。 展开更多
关键词 反欺骗 伪造语音检测 自监督 预训练 泛化能力
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部