期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多阶GMM-Res Net融合在语音伪造检测中的研究
1
作者
曹明明
雷震春
+1 位作者
杨印根
周勇
《信息安全学报》
2025年第2期116-126,共11页
近年来,自动说话人识别技术取得了显著进步,但同时也容易受到合成或转换语音的伪造攻击,语音伪造检测系统致力于解决这一问题。本文根据不同阶数GMM中高斯分量之间的相关性和ResNet模型中不同层次残差块输出的特征信息,提出了一种多阶GM...
近年来,自动说话人识别技术取得了显著进步,但同时也容易受到合成或转换语音的伪造攻击,语音伪造检测系统致力于解决这一问题。本文根据不同阶数GMM中高斯分量之间的相关性和ResNet模型中不同层次残差块输出的特征信息,提出了一种多阶GMM-ResNet融合模型进行语音伪造检测。该模型主要包含两部分:多阶对数高斯概率(Log Gaussian Probability, LGP)特征融合和多尺度特征聚合ResNet(Multi-Scale Feature Aggregation ResNet, MFA-ResNet)。GMM描述了语音特征在其空间的分布情况,不同阶数的GMM则具有不同描述能力来形成对特征分布的平滑近似。此外,根据不同阶数GMM计算出来的LGP特征也就在不同阶上捕获语音信息。多阶LGP特征融合将基于不同阶数的GMM得到的三种不同阶LGP特征进行加权融合,从而促进不同阶LGP特征之间的信息交换。另一方面,神经网络模型中第一层或中间层获得的特征信息对于分类任务也是非常有用的。基于这一经验, MFA-ResNet模块通过对每个ResNet块输出的特征进行聚合,充分融合网络内不同层级的特征信息,从而提高网络的特征提取能力。在ASVspoof 2019逻辑访问场景下, LFCC+多阶GMM-ResNet融合系统的min t-DCF和EER分别为0.0353和1.16%,比基线系统LFCC+GMM分别相对降低了83.3%和85.7%。在ASVspoof2021逻辑访问场景下,LFCC+多阶GMM-ResNet融合系统的min t-DCF和EER分别为0.2459和2.50%,比基线系统LFCC+GMM分别相对降低了57.3%和87.1%,比基线系统LFCC+LCNN分别相对降低了28.6%和73.0%。与目前最先进模型相比,本文模型也非常具有竞争力。
展开更多
关键词
多阶
GMM-ResNet
融合
多阶对数高斯概率特征融合
多尺度
特征
聚合
语音伪造检测
在线阅读
下载PDF
职称材料
题名
多阶GMM-Res Net融合在语音伪造检测中的研究
1
作者
曹明明
雷震春
杨印根
周勇
机构
江西师范大学计算机信息工程学院
出处
《信息安全学报》
2025年第2期116-126,共11页
基金
国家自然科学基金(No.62067004)
江西省教育厅科学技术研究项目(No.GJJ2200331)资助。
文摘
近年来,自动说话人识别技术取得了显著进步,但同时也容易受到合成或转换语音的伪造攻击,语音伪造检测系统致力于解决这一问题。本文根据不同阶数GMM中高斯分量之间的相关性和ResNet模型中不同层次残差块输出的特征信息,提出了一种多阶GMM-ResNet融合模型进行语音伪造检测。该模型主要包含两部分:多阶对数高斯概率(Log Gaussian Probability, LGP)特征融合和多尺度特征聚合ResNet(Multi-Scale Feature Aggregation ResNet, MFA-ResNet)。GMM描述了语音特征在其空间的分布情况,不同阶数的GMM则具有不同描述能力来形成对特征分布的平滑近似。此外,根据不同阶数GMM计算出来的LGP特征也就在不同阶上捕获语音信息。多阶LGP特征融合将基于不同阶数的GMM得到的三种不同阶LGP特征进行加权融合,从而促进不同阶LGP特征之间的信息交换。另一方面,神经网络模型中第一层或中间层获得的特征信息对于分类任务也是非常有用的。基于这一经验, MFA-ResNet模块通过对每个ResNet块输出的特征进行聚合,充分融合网络内不同层级的特征信息,从而提高网络的特征提取能力。在ASVspoof 2019逻辑访问场景下, LFCC+多阶GMM-ResNet融合系统的min t-DCF和EER分别为0.0353和1.16%,比基线系统LFCC+GMM分别相对降低了83.3%和85.7%。在ASVspoof2021逻辑访问场景下,LFCC+多阶GMM-ResNet融合系统的min t-DCF和EER分别为0.2459和2.50%,比基线系统LFCC+GMM分别相对降低了57.3%和87.1%,比基线系统LFCC+LCNN分别相对降低了28.6%和73.0%。与目前最先进模型相比,本文模型也非常具有竞争力。
关键词
多阶
GMM-ResNet
融合
多阶对数高斯概率特征融合
多尺度
特征
聚合
语音伪造检测
Keywords
multi-order GMM-ResNet fusion
multi-order log-gaussian probability feature fusion
multi-scale feature aggregation
speech deepfake detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多阶GMM-Res Net融合在语音伪造检测中的研究
曹明明
雷震春
杨印根
周勇
《信息安全学报》
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部