期刊文献+
共找到94篇文章
< 1 2 5 >
每页显示 20 50 100
基于多层次特征图谱的高压并联电抗器声纹识别模型研究
1
作者 王果 贺建山 +2 位作者 闵永智 何怡刚 郝大宇 《高电压技术》 北大核心 2025年第6期3030-3042,I0036-I0037,共15页
在高压并联电抗器声纹在线监测领域,针对长时间序列特性的电抗器声信号复杂度高、数据维度大、能量分散导致声纹识别模型信息利用率低、鲁棒性和识别率不高的问题,提出了一种基于多层次特征图谱的改进ConvNeXt-T网络声纹识别模型。首先... 在高压并联电抗器声纹在线监测领域,针对长时间序列特性的电抗器声信号复杂度高、数据维度大、能量分散导致声纹识别模型信息利用率低、鲁棒性和识别率不高的问题,提出了一种基于多层次特征图谱的改进ConvNeXt-T网络声纹识别模型。首先,声信号通过点对称变换和类Gram矩阵图形化的细化频谱转换为时域、频域特征图谱,基于电抗器声纹特性提出50 Hz Gammatone滤波器组生成能量特征图谱;然后引入轻量级CA注意力机制,作为特征图谱自适应融合模块对ConvNeXt-T网络的输入侧进行改进;最后,结合实测数据验证了模型的优越性,结果表明所提模型在测试集上的平均识别准确率达97.82%,较单域图谱提升3.14%,较FCN、RsNet、ApR-IDRSN等对比模型提升6.51%,同时该模型在高斯白噪声、人声和鸟叫声环境中表现出最佳的抗噪性。该模型综合运用高维度多域特征提取方法和图形化降维表征方法,能显著提高特征丰富度和信息利用率。 展开更多
关键词 高压并联电抗器 声纹识别 特征图谱 ConvNeXt-T网络 抗噪性
在线阅读 下载PDF
基于声纹识别的永磁同步电机运行状态监测
2
作者 丁惜瀛 付直刚 马少华 《沈阳工业大学学报》 北大核心 2025年第2期145-151,共7页
【目的】在传统永磁电机故障监测领域,接触式信号虽被广泛使用,但通常只能反映电机的单一运行状态且信息量不足,难以识别永磁同步电机的全面运行状态。为丰富信息量,需要额外增加传感器,但这不仅增加了系统的复杂性,还提高了实际应用难... 【目的】在传统永磁电机故障监测领域,接触式信号虽被广泛使用,但通常只能反映电机的单一运行状态且信息量不足,难以识别永磁同步电机的全面运行状态。为丰富信息量,需要额外增加传感器,但这不仅增加了系统的复杂性,还提高了实际应用难度。因此,提高永磁电机状态监测的精度与便捷性成为重要的研究目标。随着智能化监测技术的发展,非接触式信号的应用越来越受到关注。永磁电机运行时产生的音频信号包含了丰富的状态信息,为故障诊断提供了新的方向。相较于接触式信号,音频信号能实时反映由故障引起的电机振动、噪声等特征,有较大的研究价值。然而这类信号易受环境噪声的干扰,导致信号质量差、特征信息不清晰,不利于永磁同步电机的状态监测。针对上述问题,提出了一种基于声纹识别的永磁同步电机深度学习模型,旨在通过深度学习技术高效地监测和诊断电机运行状态。【方法】采用小波去噪算法减少噪声干扰,提升信号质量,进而提升信噪比,确保模型能够更清晰地提取梅尔谱特征,为故障识别和分类奠定基础。然而,直接使用卷积神经网络提取梅尔谱特征可能会削弱特征间的关联性,影响故障识别的精度。引入空间注意力机制,通过加权增强特征的空间位置相关性,使模型关注最关键的部分,提高特征提取的有效性。为提升模型的识别准确率,对梅尔谱特征进行归一化处理,并采用AAM-softmax损失函数。该函数通过强化类间约束,提高模型在不同类别之间的区分能力,进而提升识别精度和泛化能力并优化训练过程,使模型更好地适应不同工况。【结果】仿真测试结果表明,所提出的模型在训练集上表现出色,能够准确识别电机的不同运行状态,并在测试集上展现出较强的泛化能力。实验结果证实,基于深度学习的声纹识别方法能够有效监测永磁电机的多种运行状态,准确度较高且实用性较强。【结论】基于声纹识别的永磁同步电机深度学习模型能够有效去除噪声并提取关键特征。通过引入空间注意力机制和AAM-softmax损失函数,显著提升了模型的识别精度和泛化能力。该模型具有广阔的发展前景,可广泛应用于永磁电机的状态监测与故障诊断,推动电机智能化维护技术的发展。 展开更多
关键词 电机监测 声纹识别 小波去噪 损失函数 空间注意力机制 永磁同步电机
在线阅读 下载PDF
基于GGD-EfficientNet和声纹识别的风力发电机齿轮箱故障诊断
3
作者 廖力达 陈伟克 +3 位作者 罗晓 舒王咏 张芝铭 代军 《太阳能学报》 北大核心 2025年第4期570-578,共9页
针对风力发电机齿轮箱齿轮故障时的噪声提出一种基于分组全局上下文网络(GE-GCNet)与深度可分离卷积(DSCConv)结合的效率神经网络(GGD-EfficientNet)和声纹识别的齿轮箱故障诊断方法。首先通过实验获取齿轮箱故障齿轮的噪声信号,并根据... 针对风力发电机齿轮箱齿轮故障时的噪声提出一种基于分组全局上下文网络(GE-GCNet)与深度可分离卷积(DSCConv)结合的效率神经网络(GGD-EfficientNet)和声纹识别的齿轮箱故障诊断方法。首先通过实验获取齿轮箱故障齿轮的噪声信号,并根据齿轮状态分为6类。然后,使用Log-Mel谱的方法提取噪声信号语谱图。考虑到效率卷积神经网络(EfficientNet)对齿轮故障语谱图特征提取能力不足等缺点,在EfficientNet的基础上,结合分组卷积改进的GE-GCNet和DSCConv,提出一种高性能的齿轮故障诊断模型GGD-EfficientNet。实验表明:所提方法能在齿轮箱故障齿轮语谱图数据集下准确率达到99.7%。所提模型能从数据集中对故障类型进行有效分类,可有效帮助诊断齿轮箱中齿轮故障。 展开更多
关键词 风力发电机 齿轮 故障检测 GGD-EfficientNet 声纹识别
在线阅读 下载PDF
基于声纹识别的变压器故障检测方法
4
作者 李章维 周浩 +1 位作者 郑文皓 陈毅恒 《浙江工业大学学报》 北大核心 2025年第3期293-298,共6页
由于传统的变压器故障检测方法通过专业技术人员根据设备运行声音判断故障类型与故障位置,存在一定的局限性和主观性,因此提出了一种利用变压器声音的纹理特征进行故障诊断的方法。在利用x-vector的基础上,针对变压器故障负样本数据获... 由于传统的变压器故障检测方法通过专业技术人员根据设备运行声音判断故障类型与故障位置,存在一定的局限性和主观性,因此提出了一种利用变压器声音的纹理特征进行故障诊断的方法。在利用x-vector的基础上,针对变压器故障负样本数据获取困难、数据量少的特点,引入抑制过拟合和改善交叉熵损失函数方法,解决内部数据分类不平衡的问题,准确实现变压器的故障识别。 展开更多
关键词 变压器故障 声纹识别 x-vector 交叉熵损失函数
在线阅读 下载PDF
基于改进MFCC-OCSVM和贝叶斯优化BiGRU的GIS异常工况声纹识别算法 被引量:3
5
作者 庄小亮 李乾坤 +3 位作者 刘紫罡 张禄亮 季天瑶 张长虹 《南方电网技术》 北大核心 2025年第1期30-40,共11页
为了准确识别气体绝缘开关柜(gas insulated switchgear,GIS)设备的异常工况,提出了一种基于加权梅尔频率谱系数单类支持向量机(Mel frequency cestrum coefficient-one class support vector machine,MFCC-OCSVM)和贝叶斯优化的门控循... 为了准确识别气体绝缘开关柜(gas insulated switchgear,GIS)设备的异常工况,提出了一种基于加权梅尔频率谱系数单类支持向量机(Mel frequency cestrum coefficient-one class support vector machine,MFCC-OCSVM)和贝叶斯优化的门控循环单元(bidirectional gate recurrent unit,BiGRU)声纹识别算法。首先,利用基于F统计量的MFCC对声纹数据进行加权特征提取,突出重要特征并减弱噪声的影响,然后利用OCSVM对加权后的特征进行异常检测并去除异常值,提高数据质量。为解决样本不平衡问题,采用合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)进行声纹样本的均衡。最后,应用基于贝叶斯优化的BiGRU模型进行声纹识别。以某气体绝缘全封闭组合电器(gas insulated switchgear,GIS)为例,采集了20类不同工况下操纵机构的声音样本,与多种经典分类模型进行对比。结果显示,所提算法取得的最高平均识别准确率达到了92.8%,相比于自适应增强、朴素贝叶斯和线性判别分析算法分别提升了30.1%、14.7%和11.5%。通过消融实验进一步评估和验证了所提算法各个流程对声纹识别的实际效果和性能影响,研究成果可为GIS设备异常工况的声纹识别提供高效技术路线。 展开更多
关键词 GIS设备 梅尔频谱倒谱系数 单类支持向量机 双向门控循环单元 声纹识别 贝叶斯优化
在线阅读 下载PDF
基于融合特征和残差神经网络的10 kV高压断路器机械故障声纹识别方法 被引量:1
6
作者 段梵 李先允 +2 位作者 单光瑞 陈兰杭 杨凯 《高压电器》 北大核心 2025年第3期205-213,共9页
针对传统10 kV高压断路器故障诊断方法过于依赖主观经验、准确率不高、泛化能力差的问题。提出了一种基于声学特征的10 kV高压断路器常见机械故障识别方法。首先,以(ZN63)12/630A型高压户内真空断路器为研究对象,设置常见的8种机械故障... 针对传统10 kV高压断路器故障诊断方法过于依赖主观经验、准确率不高、泛化能力差的问题。提出了一种基于声学特征的10 kV高压断路器常见机械故障识别方法。首先,以(ZN63)12/630A型高压户内真空断路器为研究对象,设置常见的8种机械故障,采集其分合闸时的声音作为检测信号;其次,将采集的故障声纹信号进行预处理,提取故障声纹信号的梅尔倒频谱系数(MFCC)特征、色度特征(chroma features)以及一维平均能量和频谱质心,并利用Fisher比舍弃贡献率低的分量,构成融合特征;最后以提取的融合特征作为诊断依据,构建基于残差神经网络的10 kV断路器机械故障诊断模型。结果表明文中方法对10 kV高压断路器常见的8种机械故障诊断识别准确率为99.99%。可作为当前检测手段的有效补充,提高高压断路器综合检测和潜伏性缺陷识别能力。 展开更多
关键词 10 kV高压断路器 声纹识别 融合特征 残差神经网络 故障诊断
在线阅读 下载PDF
融合数字孪生与声纹识别的矿用机电设备故障诊断技术
7
作者 张荣华 《现代电子技术》 北大核心 2025年第10期52-56,共5页
针对矿用机电设备在复杂工作环境下易发生故障的问题,研究了计算机映射物理实体的数字孪生和故障声纹特征识别技术,提出了一种底层到应用的多架构矿用机电设备智能化故障诊断系统。在所提故障诊断系统的整体架构中,底层构建了包含行为... 针对矿用机电设备在复杂工作环境下易发生故障的问题,研究了计算机映射物理实体的数字孪生和故障声纹特征识别技术,提出了一种底层到应用的多架构矿用机电设备智能化故障诊断系统。在所提故障诊断系统的整体架构中,底层构建了包含行为模型、几何模型、规则模型和物理模型的数字孪生体,以及声纹识别所需的传感器、边缘数据处理等模块;上层则分为数据层、应用层和系统层,用于实现数据处理、模型分析与人机交互等功能。同时,基于数字孪生系统、声纹特征提取算法和极限学习机神经网络等,设计了融合数字孪生与声纹识别的关键算法流程。实验测试结果表明,数字孪生体模拟的物理参数误差较低,故障识别准确率可以达到约90%,能够满足工程应用的需求。 展开更多
关键词 矿用机电设备 数字孪生 声纹识别 故障检测 智能化诊断 特征提取
在线阅读 下载PDF
基于双通道特征的含噪声纹识别方法研究
8
作者 伍雄 陈为真 《计算机应用与软件》 北大核心 2025年第7期205-211,共7页
针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱... 针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱系数特征,结合它们的差分谱构成混合特征,融合成双通道声纹特征(DCVF)。实验结果表明:在纯净语音数据集中,双通道声纹特征可达到99.5%的识别率;在含噪语音数据集下,DCVF的识别效果有明显提升。 展开更多
关键词 声纹识别 梅尔频率倒谱系数 伽马通倒谱系数 特征融合 抗噪性
在线阅读 下载PDF
基于ERes-ECAM的动物声纹识别 被引量:2
9
作者 侯卫民 孙艺菲 刘峻滔 《无线电通信技术》 北大核心 2024年第4期789-798,共10页
声纹识别技术不仅在人类身份验证领域广泛应用,在动物种类识别方面也取得一定进展。现有模型存在特征表达能力不足的问题,同时,在保证性能的前提下,模型的时间复杂度和推理速度有待优化。提出用于发声动物嵌入学习的改进的残差块连接改... 声纹识别技术不仅在人类身份验证领域广泛应用,在动物种类识别方面也取得一定进展。现有模型存在特征表达能力不足的问题,同时,在保证性能的前提下,模型的时间复杂度和推理速度有待优化。提出用于发声动物嵌入学习的改进的残差块连接改进的上下文感知掩蔽(Enhanced Res2block connected Enhanced Context Aware Masking, ERes-ECAM)新型架构,采用了稠密连接的时延神经网络(Densely-connected Time Delay Neural Network, D-TDNN)作为骨干,为了解决模糊不相关噪声问题的同时能够提取更多有效的关键信息,在D-TDNN层中采用多粒度池化方法的改进的上下文感知掩蔽(Enhanced Context Aware Masking, ECAM)模块,前端连接残差模块,通过局部特征融合(Local Feature Fusion, LFF)的方式,将残差块内提取的特征进行融合来提取局部信息,提升了声纹验证系统的准确性和鲁棒性。在Anim-Celeb和Pig-Celeb两个测试集中分别实验,实验结果表明,所提架构的等错误率(Equal Error Rate, EER)分别达到6.88%和7.24%,同时,对动物种类和猪只种类识别准确率达到了93.12%和92.76%。 展开更多
关键词 深度学习 声纹识别 上下文感知掩码 局部特征融合 动物种类识别
在线阅读 下载PDF
基于改进PNCC-SVM的滚动轴承故障声纹识别方法 被引量:1
10
作者 王寅杰 邓艾东 +2 位作者 范永胜 占可 高原 《噪声与振动控制》 CSCD 北大核心 2024年第3期146-151,164,共7页
针对滚动轴承声信号分析信噪比低、易受环境噪声干扰的问题,提出一种基于改进功率归一化倒谱系数(Power-Normalized Cepstral Coefficients,PNCC)和支持向量机(Support Vector Machine,SVM)的滚动轴承故障声纹识别方法。首先对轴承声信... 针对滚动轴承声信号分析信噪比低、易受环境噪声干扰的问题,提出一种基于改进功率归一化倒谱系数(Power-Normalized Cepstral Coefficients,PNCC)和支持向量机(Support Vector Machine,SVM)的滚动轴承故障声纹识别方法。首先对轴承声信号进行预处理;然后提取改进的PNCC并将其作为特征向量;进而根据SVM算法建立声纹识别模型对轴承故障类型进行识别,并测试所提方法在叠加噪声后的识别准确率。结果表明,改进PNCC具有识别准确率高的特点,在噪声干扰下相比原始PNCC识别准确率均值提高13.35%,鲁棒性更强。研究结果可为滚动轴承的声信号特征提取和故障识别应用提供参考。 展开更多
关键词 故障诊断 滚动轴承 声纹识别 鲁棒性 功率归一化倒谱系数 支持向量机
在线阅读 下载PDF
基于DTW-GMM的光纤传感系统声纹识别方法
11
作者 杨佳沛 王宇 +3 位作者 彭广建 白清 刘昕 靳宝全 《电子测量与仪器学报》 CSCD 北大核心 2024年第4期176-186,共11页
为了满足易燃易爆环境的声纹识别需求,设计了直线型萨格奈克干涉光纤声音传感系统,利用维纳滤波算法对语音数据进行了降噪,通过三电平削波法获取了基音周期特征,采用动态时间规整算法筛选了说话人样本,并提取了梅尔频率倒谱系数特征,运... 为了满足易燃易爆环境的声纹识别需求,设计了直线型萨格奈克干涉光纤声音传感系统,利用维纳滤波算法对语音数据进行了降噪,通过三电平削波法获取了基音周期特征,采用动态时间规整算法筛选了说话人样本,并提取了梅尔频率倒谱系数特征,运用高斯混合模型-期望最大化算法开展了声纹识别实验研究,同时探究了光纤声音传感系统的频率响应特性与声纹特征,研究了采集语音幅值对声纹识别结果的影响。实验结果表明,系统可实现300~3500 Hz频率段的声音信号感知,声音幅值从0.9 V降至0.15 V时最大与次大对数似然值之差由35.5降至10.9,识别结果从成功变为失败。重复性实验表明,在10 km的传感光纤上,距声源2 m位置处,传感系统可对400段时长为3~5 s之间的文本无关语音段实现准确检测,且综合识别准确率为94.75%。本系统有望为易燃易爆环境中的设备故障、应急救援、渗漏监测等领域提供声纹识别的解决方案。 展开更多
关键词 光纤传感 萨格奈克干涉 声纹识别 高斯混合模型
在线阅读 下载PDF
基于人工神经网络的电力变压器声纹识别技术 被引量:5
12
作者 李瑞琪 李燕 +1 位作者 杜水婷 王军 《沈阳工业大学学报》 CAS 北大核心 2024年第4期380-387,共8页
针对变压器运行状态声纹识别的应用需求以及BP神经网络识别模型准确率较低等问题,提出了一种改进人工神经网络的变压器声纹识别技术。该技术以变压器声纹信号中的MFCC系数作为模型的输入特征向量,在BOA算法中引入动态权重因子和变异因子... 针对变压器运行状态声纹识别的应用需求以及BP神经网络识别模型准确率较低等问题,提出了一种改进人工神经网络的变压器声纹识别技术。该技术以变压器声纹信号中的MFCC系数作为模型的输入特征向量,在BOA算法中引入动态权重因子和变异因子对BP神经网络权值和阈值进行寻优,开展声纹识别。实验结果表明,利用变压器声纹信号的32维MFCC特征系数可使识别准确率达到90%以上,优化后算法的运算速度比PSO-BP神经网络与BOA-BP神经网络提高了9.24%和8.64%,具有更高的运算效率和识别准确率。 展开更多
关键词 声纹识别 BP神经网络 特征向量 权重因子 动态寻优 模式识别 变异因子 状态检测
在线阅读 下载PDF
基于声纹识别技术的变压器异常状态自动诊断方法 被引量:4
13
作者 吴海涵 李俊妮 +1 位作者 王维佳 孙飞 《中国测试》 CAS 北大核心 2024年第S01期31-37,共7页
为使监测主机在变压器设备发生异常运行时能够发出预警,实现对变压器异常状态的精准诊断,设计基于声纹识别技术的变压器异常状态自动诊断方法。按照声纹识别技术应用原理,提取变压器异常运转情况下的时域特征、频域特征与梅尔倒谱特征,... 为使监测主机在变压器设备发生异常运行时能够发出预警,实现对变压器异常状态的精准诊断,设计基于声纹识别技术的变压器异常状态自动诊断方法。按照声纹识别技术应用原理,提取变压器异常运转情况下的时域特征、频域特征与梅尔倒谱特征,根据变压器指标权重的赋值结果,计算频率复杂度参量的取值范围,联合相关变量指标,求解频谱能量分布指数表达式,完成基于声纹识别技术的变压器异常状态自动诊断方法的设计。对比实验结果表明,在上述诊断方法作用下,变压器出现异常运行状态时,电压有效值始终不会超过预设警戒值,二者差值也始终小于5.0V,符合及时预警并精准诊断的实际应用需求。 展开更多
关键词 声纹识别 变压器诊断 异常状态 运转特征 频率复杂度 相运行电压
在线阅读 下载PDF
声纹识别技术支持下自然保护地鸟类多样性节律特征及监测有效性研究——以黄龙自然保护区为例 被引量:2
14
作者 许晓青 余楚萌 +1 位作者 徐荣林 刘颂 《园林》 2024年第4期11-18,共8页
生物多样性是人类赖以生存和社会可持续发展的基础,是地球生命共同体的血脉和根基。声纹识别技术正在成为辅助生物多样性监测的重要手段,由于声纹数据采集的特征及计算性生物声学的发展,声学技术在物种鉴别、种群研究、环境成因研究方... 生物多样性是人类赖以生存和社会可持续发展的基础,是地球生命共同体的血脉和根基。声纹识别技术正在成为辅助生物多样性监测的重要手段,由于声纹数据采集的特征及计算性生物声学的发展,声学技术在物种鉴别、种群研究、环境成因研究方面正表现出优势。以黄龙自然保护区为例,以指示性物种鸟类的鸣声为对象,通过保护区中较高人为影响(黄龙景区)和较低人为影响(张家沟)这两个区域的被动式监测,采集了6303 min声音数据。通过经典声学指数计算、人工智能物种识别与样线调查相结合的方法,研究得出:(1)人工智能技术下鸟类多样性及鸣声时间分布特征;(2)声纹识别技术较之于传统调查方法更具有效性;(3)声学指数计算对环境的响应程度与有效性辨析。研究试验性地对数据进行了分析阐释,以黄龙自然保护区为例作为方法的探索,为此类保护地保护管理提供借鉴。 展开更多
关键词 声纹识别 鸟类多样性 自然保护地 声景 保护管理
在线阅读 下载PDF
基于特征融合与注意力机制的鸟类声纹识别方法 被引量:2
15
作者 潘齐炜 程吉祥 +2 位作者 田甜 吴丹 曾蕊 《声学技术》 CSCD 北大核心 2024年第5期686-695,共10页
鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方... 鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方法。首先,在特征提取时分别获取梅尔频率倒谱系数和功率正则化倒谱系数,其次利用均值和方差归一化处理将两种特征融合得到新型融合特征参数MPFC;然后,以ResNet-50为主干网络在其残差模块中引入轻量化坐标注意力机制得到改进网络模型—坐标注意力残差网络;最后,将融合特征分别输入到坐标注意力残差网络(residual coordinate attention net, ResCA),ResNet-50、ResNeSt-50、DenseNet-121和EfficientNet-B0并在两个数据集Birdsdata和BirdCLEF上进行对比实验。实验结果表明,融合特征比单一特征有更好的表征能力,能够提高一定识别率,改进网络也具有较好的识别效果。 展开更多
关键词 鸟类声纹识别 特征融合 梅尔频率倒谱系数 功率正则化倒谱系
在线阅读 下载PDF
生成式与对比式耦合的声纹识别自监督预训练方法 被引量:1
16
作者 蒋世炜 钱宇华 +1 位作者 原之安 梁新彦 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1847-1853,共7页
当前,自监督学习技术已成为缓解声纹识别任务有标签训练数据不足问题的主要手段.然而,相关研究目前仅注重学习样本的全局特征,忽略了对样本局部特征的学习.为了解决该问题,本文提出了一种耦合生成式建模和对比式建模的声纹识别自监督框... 当前,自监督学习技术已成为缓解声纹识别任务有标签训练数据不足问题的主要手段.然而,相关研究目前仅注重学习样本的全局特征,忽略了对样本局部特征的学习.为了解决该问题,本文提出了一种耦合生成式建模和对比式建模的声纹识别自监督框架.该框架不仅保留了对比式建模对所学全局特征的约束,同时引入了生成式建模对所学局部特征的约束,使得特征提取模型学习到更具判别性的特征.基于此框架,本文提出了一种新的声纹识别自监督学习方法DINO-MFM.实验结果表明,DINO-MFM比其他自监督方法具有更好的性能表现,相较于对比式方法DINO,等错率下降了6.4%. 展开更多
关键词 声纹识别 说话人识别 自监督学习 生成式学习 对比式学习
在线阅读 下载PDF
基于分治方法的声纹识别系统模型反演
17
作者 张骏飞 张雄伟 孙蒙 《信息安全研究》 CSCD 北大核心 2024年第2期130-138,共9页
模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及... 模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及误差,采用分治法的思想逐层反演,并通过循环一致性的有效监督,成功重构与说话人身份一致的反演样本;另外,由于语音的特殊性,模型特征层已包含丰富的说话人信息,进一步减弱语义信息相似后,改进的方法显著提高了反演样本的识别准确率,表明反演所得语谱图中已含有有效表示说话人身份的信息.实验结果证明了模型反演在语谱图上的可行性,突出了提取此类语音特征信息的深度网络模型所带来的隐私信息泄露风险. 展开更多
关键词 模型反演 神经网络 声纹识别 语谱图 信息安全
在线阅读 下载PDF
基于改进MFCC和VQ的变压器声纹识别模型 被引量:92
18
作者 王丰华 王邵菁 +2 位作者 陈颂 袁国刚 张君 《中国电机工程学报》 EI CSCD 北大核心 2017年第5期1535-1542,共8页
为准确地获取变压器的噪声特性,该文提出了一种基于改进梅尔频率倒谱系数和矢量量化算法的变压器声纹识别模型。首先对变压器噪声信号进行分帧和加窗处理,然后综合运用加权处理法和主成分分析法对现有的MFCC特征向量提取算法进行改进,... 为准确地获取变压器的噪声特性,该文提出了一种基于改进梅尔频率倒谱系数和矢量量化算法的变压器声纹识别模型。首先对变压器噪声信号进行分帧和加窗处理,然后综合运用加权处理法和主成分分析法对现有的MFCC特征向量提取算法进行改进,进而基于VQ算法对变压器噪声信号进行识别。以某10k V变压器为对象进行空载试验,对不同铁芯松动下的噪声信号进行测试。计算结果表明,改进后的MFCC特征向量提取算法具有识别效率高和计算速度快的特点,所得到的MFCC特征向量能准确反映不同铁芯压紧程度下的变压器噪声特征,且基于VQ算法的识别结果与预设铁芯工况吻合良好。研究结果可为变压器结构优化设计及噪声治理提供依据。 展开更多
关键词 变压器 梅尔频谱倒谱系数 声纹识别 矢量量化 主成分分析 噪声
在线阅读 下载PDF
声纹识别技术及其应用现状 被引量:54
19
作者 郑方 李蓝天 +1 位作者 张慧 艾斯卡尔.肉孜 《信息安全研究》 2016年第1期44-57,共14页
随着信息技术的快速发展,如何准确认证一个人的身份、保护个人隐私和保障信息安全,成为当前亟需解决的问题.与传统身份认证方式相比,生物特征识别身份认证技术在使用过程中具有不会丢失、被盗或遗忘的特性;其不但快捷、方便,而且准确、... 随着信息技术的快速发展,如何准确认证一个人的身份、保护个人隐私和保障信息安全,成为当前亟需解决的问题.与传统身份认证方式相比,生物特征识别身份认证技术在使用过程中具有不会丢失、被盗或遗忘的特性;其不但快捷、方便,而且准确、可靠.声纹识别作为当前最热门的生物特征识别技术之一,在远程认证等应用领域中具有独特优势,受到了越来越多的关注.以声纹识别技术及其应用现状为主线,将依次介绍声纹识别的基本概念、发展历程、应用现状及其行业标准化现状;综述声纹识别所面临的各类问题及其解决方案;最后对声纹识别技术以及应用的发展前景进行展望. 展开更多
关键词 生物特征识别 身份认证 声纹识别 发展历程 技术应用
在线阅读 下载PDF
基于深度循环网络的声纹识别方法研究及应用 被引量:29
20
作者 余玲飞 刘强 《计算机应用研究》 CSCD 北大核心 2019年第1期153-158,共6页
声纹识别是当前热门的生物特征识别技术之一,能够通过说话人的语音识别其身份。针对声纹识别技术进行了研究,提出了一种基于卷积神经网络(CNN)和深度循环网络(RNN)的声纹识别方案CDRNN。CDRNN结合了CNN和RNN的优势,可用于移动终端声纹... 声纹识别是当前热门的生物特征识别技术之一,能够通过说话人的语音识别其身份。针对声纹识别技术进行了研究,提出了一种基于卷积神经网络(CNN)和深度循环网络(RNN)的声纹识别方案CDRNN。CDRNN结合了CNN和RNN的优势,可用于移动终端声纹识别。CDRNN将说话者的原始语音信息经过一系列的处理并生成一张二维语谱图,利用CNN长于处理图像的优势从语谱图中提取语音信号的个性特征,这些个性特征再输入到deep RNN中完成声纹识别,从而确定说话者的身份。实验结果表明了CDRNN方案能够获得比GMMUBM等其他方案更好的识别准确率。 展开更多
关键词 声纹识别 深度循环网络 卷积神经网络 语谱图
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部