期刊文献+
共找到323篇文章
< 1 2 17 >
每页显示 20 50 100
基于改进EfficientNet的煤矸音频分类方法 被引量:1
1
作者 宋庆军 焦守悦 +2 位作者 姜海燕 宋庆辉 郝文超 《工矿自动化》 北大核心 2025年第1期138-144,共7页
针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特... 针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特征。选择EfficientNet-B0作为骨干网络,并对其进行以下改进:将原有的多尺度通道注意力模块换成卷积块注意力模块,得到卷积注意力特征融合(CAFF)模块,通过网络自学习为不同空间位置的特征分配不同的权重信息,生成新的有效特征;在原有的MBConv模块中并行嵌入频域通道注意力(FCA)模块,加强特征图的表达能力,从而提高整个网络的性能。实验结果表明:引入CAFF模块后,模型准确率提升了0.61%,F1得分提升了0.52%,且模型收敛更快,说明CAFF模块有效提升了模型对频谱特征的捕捉能力;引入FCA模块后,准确率提升了0.45%,F1得分提升了0.62%,说明模块的叠加可以进一步提高模型的泛化能力和处理复杂特征的能力;改进EfficientNe模型的准确率为91.90%,标准差为0.108,显著优于同类对比音频分类模型。 展开更多
关键词 综放开采 煤矸识别 音频特征提取 EfficientNet Mel频谱特征 Gammatone倒谱系数 注意力机制
在线阅读 下载PDF
基于声纹脊线化和元学习的变压器故障诊断方法
2
作者 曲朝阳 刘谊豪 +2 位作者 曲楠 姜涛 徐晓宇 《电力系统保护与控制》 北大核心 2025年第13期163-174,共12页
针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(se... 针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(selective encoder, SE)加深时频与形态表征的关联度,提升模型收敛速度。最后,构造元学习网络评估变压器状态,并引入基于OD-Reptile的一阶梯度更新策略,通过内外循环优化机制增强参数泛化性,从而实现少样本、信息干扰条件下的高精度声纹诊断。相较于R-WDCNN、LSTM、CNN等传统深度学习信号诊断方法,该方法在低样本、高噪声环境下(SNR为-12 dB),收敛轮数减少10轮以上。同时,准确率分别提高6.35%,12.1%和16.93%。实验结果显示,所提方法在准确性、抗噪性、鲁棒性以及泛化性方面均有显著提升。 展开更多
关键词 声纹 小样本 脊线化 时频谱图 选择性编码 元学习 故障诊断
在线阅读 下载PDF
基于声谱图和卷积神经网络的磁暴图像识别
3
作者 李鸿宇 孙君嵩 +2 位作者 王丽 杨杰 赵雨馨 《空间科学学报》 北大核心 2025年第4期943-949,共7页
磁暴是一种重要的地磁场扰动类型,影响着通信、电力和航空航天等领域,因此对磁暴识别技术进行研究与创新有助于磁暴信息的应用.基于2010-2023年12个定点地磁观测水平分量分钟值数据,采用声谱图成像技术,运用VGG19卷积神经网络模型开展... 磁暴是一种重要的地磁场扰动类型,影响着通信、电力和航空航天等领域,因此对磁暴识别技术进行研究与创新有助于磁暴信息的应用.基于2010-2023年12个定点地磁观测水平分量分钟值数据,采用声谱图成像技术,运用VGG19卷积神经网络模型开展磁暴日和磁静日人工智能图像分类研究.实验结果显示,模型的准确率为97.41%,精确率为98.00%,召回率为96.80%,模型的预测能力较好,这表明声谱图成像技术在图像识别分类问题中具有较高的实用性,且VGG19卷积神经网络模型用于磁暴日和磁静日地磁分类的可行性较高,研究结果为磁暴预警与监测提供了新的思路. 展开更多
关键词 地磁 磁暴 声谱图 卷积神经网络 图像分类
在线阅读 下载PDF
基于WGAN-div和CNN的毫米波雷达人体动作识别方法
4
作者 李秋生 钟滢洁 《贵州师范大学学报(自然科学版)》 北大核心 2025年第5期23-33,共11页
针对基于毫米波雷达的人体动作识别数据集规模小导致的模型过拟合问题,提出一种基于Wasserstein散度生成对抗网络(WGAN-div)与卷积神经网络(CNN)的联合识别方法。首先,通过搭建毫米波雷达平台采集人体动作的雷达回波数据,经预处理生成... 针对基于毫米波雷达的人体动作识别数据集规模小导致的模型过拟合问题,提出一种基于Wasserstein散度生成对抗网络(WGAN-div)与卷积神经网络(CNN)的联合识别方法。首先,通过搭建毫米波雷达平台采集人体动作的雷达回波数据,经预处理生成微多普勒时频谱图;其次,利用WGAN-div模型学习时频谱图特征分布,生成高质量扩充数据以缓解数据不足;最后,构建浅层CNN模型实现动作分类。实验结果表明,所提方法在6类人体动作识别任务中准确率达98.17%,较深度卷积生成对抗网络(DCGAN)和带梯度惩罚的Wasserstein生成对抗网络(WGAN-gp)分别提升1.67%和0.87%。该方法通过取消Lipschitz约束优化生成质量,有效解决了小样本场景下的识别性能下降问题,为雷达数据增强与动作识别提供了一种新思路。 展开更多
关键词 毫米波雷达 人体动作识别 Wasserstein散度生成对抗网络 卷积神经网络 小样本学习 微多普勒时频谱 雷达数据增强
在线阅读 下载PDF
基于超声信号的金属化膜电容器老化状态评估方法 被引量:1
5
作者 许馨愉 汲胜昌 +2 位作者 郑琳子 闫昕旖 祝令瑜 《电工技术学报》 北大核心 2025年第5期1652-1661,共10页
金属化膜电容器(MFC)是模块化多电平变流器(MMC)中较为薄弱的部件之一,准确地评估其健康状态对柔性直流输电系统的安全稳定运行意义重大。该文对MFC超声信号的局部放电相位分布(PRPD)谱图进行分析,提出一种基于健康指数公式的老化状态... 金属化膜电容器(MFC)是模块化多电平变流器(MMC)中较为薄弱的部件之一,准确地评估其健康状态对柔性直流输电系统的安全稳定运行意义重大。该文对MFC超声信号的局部放电相位分布(PRPD)谱图进行分析,提出一种基于健康指数公式的老化状态评估方法。首先,通过搭建超声监测试验平台采集声信号,分析MFC在老化过程中的失效机理;其次,基于自愈放电和局部放电比例的显著变化,探讨老化对PRPD谱图中放电信号分布的影响;最后在此基础上,构建基于健康指数公式的线性回归模型进行老化状态评估,并通过试验验证所提方法与模型的可行性和有效性。结果表明,与现有方法相比,该方法只需采集超声信号的PRPD谱图信息即可评估MFC当前的老化程度,解决了传统方法会对系统回路造成影响、抗干扰能力弱且监测精度较低的问题,为MMC的状态监测和寿命评估提供了新的手段,并为MFC非电量状态监测方法的研究奠定了基础。 展开更多
关键词 金属化膜电容器 超声法 局部放电相位分布(PRPD)谱图 老化状态评估
在线阅读 下载PDF
基于改进MobileNetV3的笼养蛋鸡声音分类识别方法 被引量:2
6
作者 衡一帆 盛哲雅 +3 位作者 严煜 谷月 周昊博 王树才 《农业机械学报》 北大核心 2025年第4期427-435,共9页
为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋... 为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋声以及鸣唱声,经过声音预处理将一维声音信号转化为三维梅尔频谱图,建立了包括8541幅梅尔频谱图的蛋鸡声音数据集。通过在MobileNetV3中引入高效通道注意力(Efficient channel attention,ECA)模块,提高了笼养蛋鸡声音分类准确率。试验结果表明,MobileNetV3-ECA模型准确率、召回率、精确率以及F1分数分别达到95.25%、95.16%、95.02%、95.08%,相比原始模型分别提高1.99、2.08、2.00、2.04个百分点。通过与分别引入坐标注意力(Coordinate attention,CA)、卷积块注意力模块(Convolutional block attention module,CBAM)的模型对比,引入ECA模块后模型准确率分别提高2.11、2.03个百分点,其他指标同样有更明显的提高。与ShuffleNetV2、DesNet121和EfficientNetV2模型相比,MobileNetV3-ECA准确率分别提高1.99、2.03、2.50个百分点。本文提出的基于MobileNetV3-ECA的蛋鸡声音分类识别方法,能够有效且准确地实现对包括热应激声在内的不同种类蛋鸡声音分类识别,为蛋鸡规模化养殖中的自动化、智能化声音检测提供了算法支持,为禽舍巡检机器人功能优化提供了参考,同时为规模化笼养蛋鸡热应激预警开辟了思路。 展开更多
关键词 笼养蛋鸡 声音分类 MobileNetV3 高效通道注意力 梅尔频谱图 卷积神经网络
在线阅读 下载PDF
基于ASP-SERes2Net的说话人识别算法 被引量:1
7
作者 令晓明 陈鸿雁 +1 位作者 张小玉 张真 《北京工业大学学报》 CAS 北大核心 2025年第1期42-50,共9页
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(squeeze-and-excitation,SE)注意力模块;然后,用注意力统计池化(attention statistics pooling,ASP)代替原来的平均池化;最后,采用附加角裕度的Softmax(additive angular margin Softmax,AAM-Softmax)对说话人身份进行分类。通过实验,将ASP-SERes2Net算法与时延神经网络(time delay neural network,TDNN)、ResNet34和Res2Net进行对比,ASP-SERes2Net算法的最小检测代价函数(minimum detection cost function,MinDCF)值为0.0401,等误率(equal error rate,EER)为0.52%,明显优于其他3个模型。结果表明,ASP-SERes2Net算法性能更优,适合应用于噪声环境下的说话人识别。 展开更多
关键词 说话人识别 梅尔语谱图 Res2Net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax)
在线阅读 下载PDF
基于声音信号的转辙机故障诊断研究 被引量:1
8
作者 梁续继 戴胜华 《铁道标准设计》 北大核心 2025年第2期183-190,共8页
铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会... 铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会影响声音信号的常见机械故障。然后,根据声音诊断在特征提取方面的不同路线,采用3种技术方案。端到端方案通过wav2vec2.0语音识别框架直接进行训练和识别;特征矩阵方案提取声音信号的梅尔倒谱系数(MFCC),通过主成分分析(PCA)得到固定尺寸的特征矩阵,由多分类支持向量机(SVM)进行故障分类;声音图像化方案生成声音信号的语谱图,同时建立卷积神经网络VGG16的轻量化改进模型,将语谱图输入至该模型中进行训练和识别。实验结果表明,3种技术方案均能有效地对包括正常工作和6种故障类型的7种工作状态实现诊断,准确率分别为99.8%、94.2%和96.6%。验证了基于声音进行转辙机故障诊断的3种技术方案的可行性,并体现了语音领域技术在转辙机故障诊断中的应用价值。 展开更多
关键词 转辙机 故障诊断 声音信号 特征提取 wav2vec2.0 MFCC 语谱图
在线阅读 下载PDF
融合动态卷积和注意力机制的多层感知机语音情感识别 被引量:1
9
作者 张雨萌 张欣 +1 位作者 高谋 赵虎林 《计算机科学与探索》 北大核心 2025年第4期1065-1075,共11页
语音情感识别技术通过分析语音信号推断说话者情绪,增强人机交互的自然性和智能性。然而,现有模型往往忽视时频语义信息,影响识别准确性。为此,提出了一种融合动态卷积与注意力机制的多层感知机模型,显著提高了情感识别的准确度及信息... 语音情感识别技术通过分析语音信号推断说话者情绪,增强人机交互的自然性和智能性。然而,现有模型往往忽视时频语义信息,影响识别准确性。为此,提出了一种融合动态卷积与注意力机制的多层感知机模型,显著提高了情感识别的准确度及信息利用效率。将输入的语音信号转化为梅尔频谱图,捕捉信号细节变化,更贴切地反映人类对声音的感知,为后续特征提取奠定了基础。通过词元化处理将梅尔频谱图转化为词元,降低了数据的复杂性。借助动态卷积与分离注意力机制高效提取关键的时频特征。一方面,动态卷积能够适应不同时间和频率上的尺度变化,优化了特征捕捉效率;另一方面,分离注意力机制增强了模型对关键信息的聚焦能力,有效提升了模型对特征的表达能力。结合动态卷积与分离注意力机制的优势,该模型能够更加充分地提取关键声学特征,从而实现了更高效、更精准的情感识别。在RAVDESS、EmoDB和CASIA三个语音情感数据库上的测试显示,模型识别准确率显著优于现有技术,达到86.11%、95.33%和82.92%。这验证了模型在复杂情感识别任务的高效性和准确性,以及动态卷积和注意力机制的有效性。 展开更多
关键词 语音情感识别 梅尔频谱图 多层感知机 动态卷积 注意力机制
在线阅读 下载PDF
指纹图谱技术研究现状及其在固废领域的应用
10
作者 郑志敏 杨金忠 +4 位作者 迭庆杞 王菲 黄瑞潇 杨玉飞 黄启飞 《中国环境科学》 北大核心 2025年第8期4410-4422,共13页
为了解指纹图谱技术研究现状并明确其在固废领域的应用现状与前景,依托Web of Science(WOS)核心数据库对2010~2024年相关文献进行检索和分析.发文量分析得知指纹图谱技术依然保持着较高的研究热度,学科聚类分析得知其应用广泛并且近几... 为了解指纹图谱技术研究现状并明确其在固废领域的应用现状与前景,依托Web of Science(WOS)核心数据库对2010~2024年相关文献进行检索和分析.发文量分析得知指纹图谱技术依然保持着较高的研究热度,学科聚类分析得知其应用广泛并且近几年在环境领域研究热度也较高;关键词聚类发现研究热点集中在4个方面:Recognition(识别)、ChemoInformatics(化学信息学)、Deep Learning(深度学习)以及Model(模型).对固废领域文献进行关键词共现,得知其关于使用指纹图谱技术进行固废管理的研究较少,主要集中在后处理阶段.进行文献调研,对指纹图谱的数据获取技术、特征提取技术、特征呈现形式进行总结,提出固废领域应用新兴技术的可能性以及未来发展展望. 展开更多
关键词 指纹 图谱 固体废物 雷达图 配分曲线 CITESPACE
在线阅读 下载PDF
基于梅尔谱与压缩激励加权量化的语音神经编解码方法
11
作者 周俊佐 易江燕 +2 位作者 陶建华 任勇 汪涛 《计算机研究与发展》 北大核心 2025年第11期2725-2736,共12页
目前,以SoundStream等为代表的端到端语音神经编解码器在重建语音感知质量方面展现了优异性能.然而,这些方法需要大量的卷积计算,从而导致较长的编码时间.为缓解上述问题,提出基于梅尔谱和压缩激励加权量化的神经语音编解码方法.该方法... 目前,以SoundStream等为代表的端到端语音神经编解码器在重建语音感知质量方面展现了优异性能.然而,这些方法需要大量的卷积计算,从而导致较长的编码时间.为缓解上述问题,提出基于梅尔谱和压缩激励加权量化的神经语音编解码方法.该方法旨在保持较高语音感知质量的同时降低计算代价,加快运行速度,从而减少时延.具体而言,采用梅尔谱特征作为输入,借助梅尔谱提取过程中时域压缩的性质,并结合低层卷积编码器以简化运算过程.此外,借鉴压缩激励网络思想,提取了编码器最后一层输出特征各维度的激励权重,将其作为量化器中计算码本距离时压缩特征各维度的权重系数,由此学习特征间的相关性并优化量化性能.在LibriTTS和VCTK数据集上的实验结果表明,该方法显著提升了编码器计算速度,且能在较低比特率时(≤3 Kbps)提升重建语音质量.以比特率1.5 Kbps时为例,编码计算实时率(real-time factor,RTF)最多可提升4.6倍.对于感知质量,以0.75 Kbps为例,短时客观可懂度(shorttime objective intelligibility,STOI)、虚拟语音质量客观评估(virtual speech quality objective listener,VISQOL)等客观指标相较基线平均可提升8.72%.此外,消融实验不仅表明压缩激励权重方法的优化效果与比特率呈反相关,而且发现Relu激活函数相较周期性质激活函数Snake而言,在语音感知质量相当的情况下,能大量加快运行速度. 展开更多
关键词 语音编解码 梅尔谱图 压缩激励网络 残差矢量量化 生成对抗网络
在线阅读 下载PDF
基于层级化分数阶语谱图的帕金森病构音障碍分类
12
作者 薛在发 卢辉斌 +1 位作者 林丽琴 张涛 《中国生物医学工程学报》 北大核心 2025年第1期21-33,共13页
构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病... 构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病分类方法。首先,通过增加角度旋转因子,将构音信号转化为分数阶语谱图以增强从不同角度提取能量信息的能力;其次,将Swin Transformer网络在ImageNet上预训练的参数进行迁移和微调以解决数据量小的弊端;最后,结合层级化结构和基于偏移窗口的自注意力机制扩大感受野和实现多尺度信息融合,从而有效提升帕金森病分类精度。在Database-1(240个样本,由伊斯坦布尔大学医学院神经内科采集)和Database-2(1404个样本,由唐山工人医院和开滦精神卫生中心合作采集)上的验证结果表明,该方法具有良好的稳定性,且在两个数据集上的准确率分别达到了97.80%和98.75%,性能均优于所对比的先进方法。本研究所提出方法为帕金森病构音障碍分析提供了新的视角。 展开更多
关键词 帕金森病 构音障碍 分数阶语谱图 参数迁移 层级化结构
在线阅读 下载PDF
基于DDPM-MBN的井下人员步态识别方法
13
作者 马进昇 宋一轩 +4 位作者 刘家彤 潘红光 郭强 兰北亚 郭秀才 《工矿自动化》 北大核心 2025年第9期60-65,共6页
现有基于毫米波雷达的人员步态识别方法基于小规模数据集进行训练,导致模型泛化能力不足,且难以从复杂的井下环境中提取有效的全局特征与局部特征,造成识别精度较低。针对上述问题,提出了一种基于去噪扩散概率模型(DDPM)-多分支网络(MBN... 现有基于毫米波雷达的人员步态识别方法基于小规模数据集进行训练,导致模型泛化能力不足,且难以从复杂的井下环境中提取有效的全局特征与局部特征,造成识别精度较低。针对上述问题,提出了一种基于去噪扩散概率模型(DDPM)-多分支网络(MBN)的井下人员步态识别方法。采用DDPM对雷达回波转换得到的时频谱图进行去噪与数据增强,有效扩充了井下步态数据量,提升了数据质量;通过MBN的1个全局分支和2个局部分支分别提取步态的全局特征和不同粒度的局部特征,实现了对步态多尺度特征的充分提取,提升了对行走方向和行走速度的识别能力;联合使用Softmax损失与三元组损失,对粗粒度特征(未经降维的2 048维特征)与细粒度特征(经降维后的256维特征)进行协同优化,从而增强了模型的宏观分类能力与特征判别性。实验结果表明,在自建的步态数据集上,DDPM-MBN模型的Rank-1准确率和平均精度均值(mAP)相较于ResNet-50分别提升了8.05%,16.96%;与主流步态识别模型相比,DDPM-MBN模型在Rank-1准确率和m AP指标上均最优,分别为97.91%和95.48%。 展开更多
关键词 人员步态识别 毫米波雷达 去噪扩散概率模型 多分支网络 时频谱图
在线阅读 下载PDF
基于行波时频谱图和改进CNN的变电站直流系统接地故障定位方法 被引量:2
14
作者 海之晨 刘永军 +2 位作者 邵可欣 王弘扬 李宝鹏 《智慧电力》 北大核心 2025年第7期100-107,共8页
提出了一种基于行波时频谱图和改进卷积神经网络的变电站直流系统接地故障定位新方法。首先,对故障行波信号进行分帧、加窗处理,并通过短时傅里叶变换提取信号的时频谱图。随后,将故障行波信号的时频谱图作为样本输入,构建基于卷积神经... 提出了一种基于行波时频谱图和改进卷积神经网络的变电站直流系统接地故障定位新方法。首先,对故障行波信号进行分帧、加窗处理,并通过短时傅里叶变换提取信号的时频谱图。随后,将故障行波信号的时频谱图作为样本输入,构建基于卷积神经网络的故障定位模型,进一步采用麻雀搜索算法优化模型参数,以提升定位精度。最后,通过算例分析评估所提方法的性能。结果表明,与传统故障定位方法相比,该方法收敛性更优、准确率更高。 展开更多
关键词 直流系统 接地故障定位 行波时频谱图 麻雀搜索算法 卷积神经网络
在线阅读 下载PDF
基于YOLOv8n-PEM的低信噪比无人机射频信号识别 被引量:1
15
作者 刘坤 孔令轩 晏行伟 《电光与控制》 北大核心 2025年第4期96-103,共8页
针对当前无人机射频信号识别模型在低信噪比条件下识别准确率较低,且不支持检测信号持续时间、带宽等关键参数的问题,提出了基于YOLOv8n-PEM目标检测模型的无人机射频信号识别方法。该方法首先将原始无人机射频信号做基于离散小波变换... 针对当前无人机射频信号识别模型在低信噪比条件下识别准确率较低,且不支持检测信号持续时间、带宽等关键参数的问题,提出了基于YOLOv8n-PEM目标检测模型的无人机射频信号识别方法。该方法首先将原始无人机射频信号做基于离散小波变换的降采样处理,之后进行短时傅里叶变换提取时频特征,最后利用YOLOv8n-PEM模型完成信号的识别和参数估计。在模型方面,基于部分卷积设计了CPF模块增强对高级时频特征的提取能力,提升模型的鲁棒性,同时引入EMA机制抑制背景噪声对模型推理的干扰。实验结果表明,YOLOv8n-PEM模型在-20~-10 dB低信噪比条件下mAP达到了96.08%,FPS为107帧/s,模型参数量较基础模型减少了38%,具有实际部署价值。 展开更多
关键词 无人机 射频信号识别 YOLOv8 时频图 部分卷积 EMA机制
在线阅读 下载PDF
基于微震信号深度特征学习的岩石破裂类型识别
16
作者 李典泽 许华杰 张勃 《工矿自动化》 北大核心 2025年第3期156-164,共9页
岩石破裂类型识别是实现煤矿冲击地压灾害预测和预警的重要前提。微震是岩石破裂监测的有效手段之一,但常规的微震信号机器学习方法存在特征提取能力有限,以及受噪声影响导致的准确率不高且泛化性较差等问题。针对上述问题,提出了一种... 岩石破裂类型识别是实现煤矿冲击地压灾害预测和预警的重要前提。微震是岩石破裂监测的有效手段之一,但常规的微震信号机器学习方法存在特征提取能力有限,以及受噪声影响导致的准确率不高且泛化性较差等问题。针对上述问题,提出了一种基于微震信号深度特征学习的岩石破裂类型识别方法。首先,通过巴西圆盘劈裂试验和直剪试验分别获取张拉型破裂微震信号和剪切型破裂微震信号,并将其时频谱图、Log-Mel频谱图和梅尔频率倒谱系数合并构造微震信号聚合(MSA)声谱图;然后,通过加入多特征并行密集连接块(MP-DenseBlock)和压缩与激发过渡层(SE-TransLayer)的改进DenseNet(SE-MPDenseNet)对MSA声谱图进行深度特征提取;最后,将提取的特征向量输入至添加Hinge Loss损失函数的改进LightGBM(HBL-LightGBM)进行分类,识别岩石破裂类型。通过真三轴加载试验模拟接近地下工程实际环境中的冲击地压灾害,结果表明,所提方法对于岩石破裂类型识别的准确率达92.12%,且具有较强的特征提取能力和泛化能力。 展开更多
关键词 岩石破裂类型 微震监测 深度学习 机器学习 声谱图
在线阅读 下载PDF
基于蝙蝠谱相关及变换模型的雷达目标超分辨方法研究
17
作者 王博弘 申彪 +1 位作者 穆文星 刘涛 《雷达学报(中英文)》 北大核心 2025年第2期293-308,共16页
传统雷达分辨能力主要利用模糊函数来进行分析,其极限分辨力一般用瑞利限表征。自然界中蝙蝠具有相当敏锐的听觉系统,学者提出谱相关及变换(SCAT)模型对蝙蝠听觉系统建模,探索了蝙蝠的超分辨原理,为突破雷达目标常规(瑞利)分辨力提供了... 传统雷达分辨能力主要利用模糊函数来进行分析,其极限分辨力一般用瑞利限表征。自然界中蝙蝠具有相当敏锐的听觉系统,学者提出谱相关及变换(SCAT)模型对蝙蝠听觉系统建模,探索了蝙蝠的超分辨原理,为突破雷达目标常规(瑞利)分辨力提供了一个可能的途径。为了进一步提高SCAT模型的分辨性能,通过抑制距离像负半轴和原点处多余的波瓣,改进了基向量解卷积法和基带SCAT(BSCT)两种蝙蝠超分辨模型,同时提出可靠分辨力概念及计算方法,统一了SCAT分辨力与瑞利分辨力的衡量标准,对比验证了可靠分辨力概念的合理性以及改进算法的有效性。仿真与实测实验表明,改进超分辨算法均获得了可观的分辨力提升,其中改进基向量解卷积法性能最佳,将原基向量解卷积法的分辨力提高约2 dB,同时将匹配滤波分辨力提高约5 dB。 展开更多
关键词 瑞利分辨力 模糊函数 雷达超分辨 谱相关及变换 可靠分辨力
在线阅读 下载PDF
结合卷积增强窗口注意力的双分支语音增强神经网络
18
作者 张晨辉 原之安 钱宇华 《计算机研究与发展》 北大核心 2025年第4期852-862,共11页
在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频... 在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频经过短时傅里叶变换(STFT)处理后,多数模型仅使用幅值信息,而忽略了相位信息,导致它们未能有效捕获语谱图特征,从而影响了语音增强的效果.基于此设计出一个带有卷积增强窗口注意力的双分支语音增强神经网络.该模型采用U-NET架构,通过双分支结构对音频的幅值和相位信息同时建模;在2个分支之间引入复值计算模块以实现信息交互;在编码器层和解码器层之间的跳跃连接部分采用卷积增强窗口注意力模块,该模块执行基于非重叠窗口的自注意力操作,在捕获局部上下文信息的同时显著降低了语音增强模型的计算复杂度.该模型在公开的Voicebank-Demand数据集上进行测试,与基线模型DCUNET 16和DCUNET20相比,在客观语音质量评估指标PESQ(perceptual evaluation of speech quality)分别提高了0.51和0.47.除了PESQ指标外,其他指标也都有显著的提升.相较于现有的各类语音增强模型,该模型在各项指标上均处于领先水平,尤其是在PESQ得分方面的提升更为显著. 展开更多
关键词 语音增强 双分支网络 语谱图特征 卷积增强窗口注意力 全局信息 局部信息
在线阅读 下载PDF
语谱图在鼻内镜术后语音特征评估中的应用
19
作者 刘雪莱 陈知己 +4 位作者 刘恒鑫 方红雁 胡娅琴 李晓晓 陈红江 《听力学及言语疾病杂志》 北大核心 2025年第2期124-129,共6页
目的探讨鼻内镜术后患者语音特征的客观变化,并分析手术与声道结构变化的关系。方法前瞻性纳入2023年6~12月行鼻内镜手术患者45例,其中鼻中隔偏曲矫正术和/或鼻息肉切除术和/或鼻甲成形术组(G1组)13例,单纯鼻窦开放术组(G2组)11例,鼻窦... 目的探讨鼻内镜术后患者语音特征的客观变化,并分析手术与声道结构变化的关系。方法前瞻性纳入2023年6~12月行鼻内镜手术患者45例,其中鼻中隔偏曲矫正术和/或鼻息肉切除术和/或鼻甲成形术组(G1组)13例,单纯鼻窦开放术组(G2组)11例,鼻窦开放+鼻中隔偏曲矫正术和/或鼻息肉切除术和/或鼻甲成形术组(G3组)21例。三组均在术前和术后1月完善语谱图检测,分析不同声任务(口化元音、鼻化元音及含鼻元音的词组和短句)下的鼻阻力(Refft值)、声学指标共振峰频率(F1~F4)、带宽(bandwidths,B1~B4)、F1振幅与鼻杂音共振峰振幅的差值(A1-P0)及F1振幅与鼻共振峰振幅的差值(A1-P1)。结果各组术后嗓音声学指标无明显改变,Refft值均显著下降,口化元音共振峰变化不明显,但带宽多显著下降。各组术后A1-P1均存在上升趋势,A1-P0均存在下降趋势。其中,G1组A1-P1在发/ma/、/na/、/mi/、/ni/时较术前明显上升;A1-P0在发/ma/、/na/时较术前明显下降;G2组A1-P0在发/ma/、/na/时较术前明显下降;G3组A1-P1在发/mi/、/ni/时较术前明显上升;A1-P0在发/ma/、/na/时较术前明显下降。结论鼻内镜手术会对患者语音产生可测量的影响。语谱图可用于鼻内镜术后发音特征的评估,其中A1-P1对于高元音/i/、A1-P0对于非高元音/a/是更好的测量指标。 展开更多
关键词 鼻内镜手术 语音特征 语谱图
在线阅读 下载PDF
基于集成学习的水下目标被动识别方法
20
作者 汤航 樊书宏 《舰船科学技术》 北大核心 2025年第12期111-116,共6页
对于被动声呐接收到的水声信号,将信号的时域波形转化为时频谱图和梅尔谱图后,可采用神经网络和集成学习的方法,将信号识别转换为图像识别问题。利用多种卷积神经网络对信号谱图进行训练学习,并通过堆叠法(Stacking)将单网络结构作为初... 对于被动声呐接收到的水声信号,将信号的时域波形转化为时频谱图和梅尔谱图后,可采用神经网络和集成学习的方法,将信号识别转换为图像识别问题。利用多种卷积神经网络对信号谱图进行训练学习,并通过堆叠法(Stacking)将单网络结构作为初级学习器构建多网络集成模型,可进一步提高目标识别准确率。利用DeepShips数据集进行目标识别仿真验证,结果表明,多网络集成模型在四分类数据集上的识别准确率可达100%,能够有效提高被动声呐的目标识别能力,对水下目标智能探测和识别具有参考价值。 展开更多
关键词 水下目标识别 梅尔语谱图 集成学习
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部