检索结果-维普期刊中文期刊服务平台

基于声音信号的转辙机故障诊断研究被引量：1: 1; 作者梁续继戴胜华《铁道标准设计》北大核心 2025年第2期183-190,共8页; 铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会... 展开更多; 关键词转辙机故障诊断声音信号特征提取 wav2vec2.0 MFCC 语谱图; 在线阅读下载PDF 职称材料

多层次通道融合语音情感识别方法: 2; 作者张丽敏李扬 +1 位作者蔡浩燕浩《计算机科学与探索》北大核心 2025年第8期2219-2228,共10页; 语音情感识别是机器情感认知能力的关键,对于提高人机交互质量至关重要。然而,现有研究多聚焦于浅层特征的分析,忽略了多特征融合的优势,同时数据样本量有限,影响了模型的泛化能力,导致语音情感识别准确率不够理想。为了进一步提高语音... 展开更多; 关键词语音情感识别多层次通道融合 wav2vec 2.0 卷积神经网络(CNN); 在线阅读下载PDF 职称材料

基于Wav2vec2.0与语境情感信息补偿的对话语音情感识别被引量：4: 3; 作者曹荣贺吴晓龙 +4 位作者冯畅郑方徐明星哈妮克孜·伊拉洪艾斯卡尔·艾木都拉《信号处理》 CSCD 北大核心 2023年第4期698-707,共10页; 情感在人际交互中扮演着重要的角色。在日常对话中,一些语句往往存在情感色彩较弱、情感类别复杂、模糊性高等现象,使对话语音情感识别成为一项具有挑战性的任务。针对该问题,现有很多工作通过对全局对话进行情感信息检索,将全局情感信... 展开更多; 关键词情感识别二元对话情感补偿 wav2vec2.0; 在线阅读下载PDF 职称材料

基于Wav2vec2.0神经网络的轨道交通钢轨损伤压电阵列超声导波定位方法被引量：2: 4; 作者刘思昊钱鲁斌 +1 位作者梅曜华邢宇辉《城市轨道交通研究》北大核心 2023年第6期101-105,110,共6页; 鉴于普通超声波检测方法无法实现对轨道交通钢轨的长距离检测,基于超声导波的SHM(结构健康监测)技术难以从响应信号中提取损伤特征而影响损伤定位精度,提出了一种基于Wav2vec2.0神经网络的压电阵列超声导波定位方法对轨道交通钢轨损伤... 展开更多; 关键词轨道交通钢轨损伤压电阵列超声导波定位方法 wav2vec2.0神经网络; 在线阅读下载PDF 职称材料

基于Wav2Vec2.0特征融合与联合损失的深度伪造语音检测方法: 5; 作者陈飞飞郭海燕 +2 位作者郭延民葛子瑞陆华庆《信号处理》 2025年第9期1547-1557,共11页; 语音预训练模型Wav2Vec2.0能够通过多个隐藏层提取丰富的多层嵌入特征,在深度伪造语音检测任务中表现出良好的性能。将Wav2Vec2.0各层特征进行融合,是进一步挖掘语音数据深层次表示的有效途径,而改进Wav2Vec2.0各层特征的融合方式则有... 展开更多; 关键词深度伪造语音检测 wav2vec2.0 特征融合联合损失; 在线阅读下载PDF 职称材料

题名基于声音信号的转辙机故障诊断研究被引量：1: 1; 作者梁续继戴胜华; 机构北京交通大学电子信息工程学院; 出处《铁道标准设计》北大核心 2025年第2期183-190,共8页; 基金国家自然科学基金项目(61833001)。; 文摘铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会影响声音信号的常见机械故障。然后,根据声音诊断在特征提取方面的不同路线,采用3种技术方案。端到端方案通过wav2vec2.0语音识别框架直接进行训练和识别;特征矩阵方案提取声音信号的梅尔倒谱系数(MFCC),通过主成分分析(PCA)得到固定尺寸的特征矩阵,由多分类支持向量机(SVM)进行故障分类;声音图像化方案生成声音信号的语谱图,同时建立卷积神经网络VGG16的轻量化改进模型,将语谱图输入至该模型中进行训练和识别。实验结果表明,3种技术方案均能有效地对包括正常工作和6种故障类型的7种工作状态实现诊断,准确率分别为99.8%、94.2%和96.6%。验证了基于声音进行转辙机故障诊断的3种技术方案的可行性,并体现了语音领域技术在转辙机故障诊断中的应用价值。; 关键词转辙机故障诊断声音信号特征提取 wav2vec2.0 MFCC 语谱图; Keywords point machine fault diagnosis sound signal feature extraction wav2vec2.0 MFCC spectrogram; 分类号 U284 [交通运输工程—交通信息工程及控制]; 在线阅读下载PDF 职称材料

题名多层次通道融合语音情感识别方法: 2; 作者张丽敏李扬蔡浩燕浩; 机构西安外国语大学人工智能与语言认知神经科学重点实验室; 出处《计算机科学与探索》北大核心 2025年第8期2219-2228,共10页; 基金陕西省社会科学基金(2022K014)。; 文摘语音情感识别是机器情感认知能力的关键,对于提高人机交互质量至关重要。然而,现有研究多聚焦于浅层特征的分析,忽略了多特征融合的优势,同时数据样本量有限,影响了模型的泛化能力,导致语音情感识别准确率不够理想。为了进一步提高语音情感识别的准确率,提出一种基于数据增强和多层次通道融合的语音情感识别方法。将原始语音加入高斯白噪声、音高转换和混合处理三种方法进行数据增强,提高模型的鲁棒性。提出一种基于wav2vec 2.0模型和CNN模型的多层次并行通道网络结构。其中,第一个通道采用wav2vec 2.0模型作为主干网络,学习语音数据的深层表征,再经过两层卷积的CNN模型进行计算;第二个通道提取语音情感浅层特征作为输入,采用五层卷积的CNN模型学习语音数据的浅层表征,更全面地分析语音数据的深层表征和浅层表征。将两个通道输出的表征进行融合,形成深浅结合的多层次语音情感特征体系。所提出的模型在RAVDESS和CASIA数据集上分别进行测试,准确率达到94.38%和98.75%,实验结果验证了所提方法的有效性。; 关键词语音情感识别多层次通道融合 wav2vec 2.0 卷积神经网络(CNN); Keywords speech emotion recognition multi-level channel fusion wav2vec 2.0 convolutional neural network(CNN); 分类号 TN912.34 [电子电信—通信与信息系统] TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于Wav2vec2.0与语境情感信息补偿的对话语音情感识别被引量：4: 3; 作者曹荣贺吴晓龙冯畅郑方徐明星哈妮克孜·伊拉洪艾斯卡尔·艾木都拉; 机构新疆大学信息科学与工程学院清华大学北京国家信息科学与技术研究中心; 出处《信号处理》 CSCD 北大核心 2023年第4期698-707,共10页; 文摘情感在人际交互中扮演着重要的角色。在日常对话中,一些语句往往存在情感色彩较弱、情感类别复杂、模糊性高等现象,使对话语音情感识别成为一项具有挑战性的任务。针对该问题,现有很多工作通过对全局对话进行情感信息检索,将全局情感信息用于预测。然而,当对话中前后的话语情感变化较大时,不加选择的引入前文情感信息容易给当前预测带来干扰。本文提出了基于Wav2vec2.0与语境情感信息补偿的方法,旨在从前文中选择与当前话语最相关的情感信息作为补偿。首先通过语境信息补偿模块从历史对话中选择可能对当前话语情感影响最大的话语的韵律信息,利用长短时记忆网络将韵律信息构建为语境情感信息补偿表征。然后,利用预训练模型Wav2vec2.0提取当前话语的嵌入表征,将嵌入表征与语境表征融合用于情感识别。本方法在IEMOCAP数据集上的识别性能为69.0%(WA),显著超过了基线模型。; 关键词情感识别二元对话情感补偿 wav2vec2.0; Keywords emotion recognition binary dialogue emotion compensation wav2vec2.0; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于Wav2vec2.0神经网络的轨道交通钢轨损伤压电阵列超声导波定位方法被引量：2: 4; 作者刘思昊钱鲁斌梅曜华邢宇辉; 机构上海工程技术大学城市轨道交通学院; 出处《城市轨道交通研究》北大核心 2023年第6期101-105,110,共6页; 基金国家自然科学基金项目(12004240)。; 文摘鉴于普通超声波检测方法无法实现对轨道交通钢轨的长距离检测,基于超声导波的SHM(结构健康监测)技术难以从响应信号中提取损伤特征而影响损伤定位精度,提出了一种基于Wav2vec2.0神经网络的压电阵列超声导波定位方法对轨道交通钢轨损伤进行定位。基于压电阵列超声导波数据的特点,对该方法进行了简要介绍。搭建了钢轨损伤的超声导波检测系统,并利用该系统进行数据集的采集。采用ABAQUS有限元软件建立钢轨损伤超声导波检测三维有限元模型,并利用该模型进行数据集的采集。利用小波信号处理方法对超声导波试验信号进行重构,以达到信号去噪的目的;在仿真信号中加入随机噪声,将叠加随机噪声后的超声导波仿真信号作为补充数据集;通过计算模型中钢轨损伤定位的准确率和误差对模型的性能进行评估。结果表明,当迭代轮次达到第120次时,训练样本的准确率达到100%。利用基于Wav2vec 2.0神经网络的压电阵列超声导波定位方法可实现轨道交通钢轨损伤的准确定位。; 关键词轨道交通钢轨损伤压电阵列超声导波定位方法 wav2vec2.0神经网络; Keywords rail transit rail damage piezoelectric array ultrasonic locating method wav2vec2.0 neural network; 分类号 U213.43 [交通运输工程—道路与铁道工程]; 在线阅读下载PDF 职称材料

题名基于Wav2Vec2.0特征融合与联合损失的深度伪造语音检测方法: 5; 作者陈飞飞郭海燕郭延民葛子瑞陆华庆; 机构南京邮电大学通信与信息工程学院; 出处《信号处理》 2025年第9期1547-1557,共11页; 基金国家自然科学基金(62071242)。; 文摘语音预训练模型Wav2Vec2.0能够通过多个隐藏层提取丰富的多层嵌入特征,在深度伪造语音检测任务中表现出良好的性能。将Wav2Vec2.0各层特征进行融合,是进一步挖掘语音数据深层次表示的有效途径,而改进Wav2Vec2.0各层特征的融合方式则有望进一步提升深度伪造语音检测性能。鉴于此,本文基于Wav2Vec2.0深度伪造语音检测架构,提出引入卷积注意力模块(Convolutional Block Attention Module,CBAM)对Wav2Vec2.0各层嵌入特征进行融合,通过结合通道注意力和空间注意力的加权融合方式来自适应地增强关键特征,有效提升模型的特征提取能力。在此基础上,考虑到伪造语音类型复杂多样,不同类型的伪造语音在鉴别难度上可能存在显著差异,为避免模型在处理难鉴别样本时存在的偏倚,同时使得类内特征分布紧凑、类间特征分布疏远。本文提出联合交叉熵损失、中心损失和焦点损失,构造模型的整体损失函数,充分利用各类损失的优势来增强模型在多种伪造语音场景下的判别能力和泛化性能。在ASVspoof 2019 LA、ASVspoof 2021 LA、ASVspoof 2021 DF和CFAD数据集上的实验结果表明,所提出的方法在常用评价指标等错误率(equal error rate,EER)和最小串联检测代价函数(minimum tandem detection cost function,min t-DCF)均表现出色。尤其是在ASVspoof 2021 LA数据集上,相较于AASIST、ECAPA-TDNN、ResNet,以及采用Wav2Vec2.0进行前端特征提取的多种对比方案,本文方法显著优于所有对比方法。; 关键词深度伪造语音检测 wav2vec2.0 特征融合联合损失; Keywords deepfake speech detection wav2vec2.0 feature merging joint loss; 分类号 TN912.3 [电子电信]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于声音信号的转辙机故障诊断研究	梁续继戴胜华	《铁道标准设计》北大核心	2025	1	在线阅读下载PDF 职称材料
2	多层次通道融合语音情感识别方法	张丽敏李扬蔡浩燕浩	《计算机科学与探索》北大核心	2025	0	在线阅读下载PDF 职称材料
3	基于Wav2vec2.0与语境情感信息补偿的对话语音情感识别	曹荣贺吴晓龙冯畅郑方徐明星哈妮克孜·伊拉洪艾斯卡尔·艾木都拉	《信号处理》 CSCD 北大核心	2023	4	在线阅读下载PDF 职称材料
4	基于Wav2vec2.0神经网络的轨道交通钢轨损伤压电阵列超声导波定位方法	刘思昊钱鲁斌梅曜华邢宇辉	《城市轨道交通研究》北大核心	2023	2	在线阅读下载PDF 职称材料
5	基于Wav2Vec2.0特征融合与联合损失的深度伪造语音检测方法	陈飞飞郭海燕郭延民葛子瑞陆华庆	《信号处理》	2025		在线阅读下载PDF 职称材料