期刊文献+
共找到331篇文章
< 1 2 17 >
每页显示 20 50 100
Automatic recognition of sonar targets using feature selection in micro-Doppler signature 被引量:2
1
作者 Abbas Saffari Seyed-Hamid Zahiri Mohammad Khishe 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2023年第2期58-71,共14页
Currently,the use of intelligent systems for the automatic recognition of targets in the fields of defence and military has increased significantly.The primary advantage of these systems is that they do not need human... Currently,the use of intelligent systems for the automatic recognition of targets in the fields of defence and military has increased significantly.The primary advantage of these systems is that they do not need human participation in target recognition processes.This paper uses the particle swarm optimization(PSO)algorithm to select the optimal features in the micro-Doppler signature of sonar targets.The microDoppler effect is referred to amplitude/phase modulation on the received signal by rotating parts of a target such as propellers.Since different targets'geometric and physical properties are not the same,their micro-Doppler signature is different.This Inconsistency can be considered a practical issue(especially in the frequency domain)for sonar target recognition.Despite using 128-point fast Fourier transform(FFT)for the feature extraction step,not all extracted features contain helpful information.As a result,PSO selects the most optimum and valuable features.To evaluate the micro-Doppler signature of sonar targets and the effect of feature selection on sonar target recognition,the simplest and most popular machine learning algorithm,k-nearest neighbor(k-NN),is used,which is called k-PSO in this paper because of the use of PSO for feature selection.The parameters measured are the correct recognition rate,reliability rate,and processing time.The simulation results show that k-PSO achieved a 100%correct recognition rate and reliability rate at 19.35 s when using simulated data at a 15 dB signal-tonoise ratio(SNR)angle of 40°.Also,for the experimental dataset obtained from the cavitation tunnel,the correct recognition rate is 98.26%,and the reliability rate is 99.69%at 18.46s.Therefore,the k-PSO has an encouraging performance in automatically recognizing sonar targets when using experimental datasets and for real-world use. 展开更多
关键词 micro-doppler signature Automatic recognition Feature selection K-NN PSO
在线阅读 下载PDF
Modeling simulation and experiment of micro-Doppler signature of precession 被引量:2
2
作者 Hongwei Gao Lianggui Xie Shuliang Wen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2010年第4期544-549,共6页
Spatial precession is a special micro-motion of the spinning-directional target, and the micro-Doppler signature of the cone-shaped target with precession is studied. The micro-motion model of precession is built firs... Spatial precession is a special micro-motion of the spinning-directional target, and the micro-Doppler signature of the cone-shaped target with precession is studied. The micro-motion model of precession is built first, and then the micro-Doppler model is developed based on the proposed concept of micro-motion ma- trix, by which the theoretical formula of micro-Doppler signature of precession is derived. In order to further approach to the actual case, the occlusion effect is firstly considered in micro-Doppler, and the simulated result with occlusion effect is well in accordance with the measured result in microwave anechoic chamber, which suggests that the micro-motion model and micro-Doppler model of precession are both valid. 展开更多
关键词 PRECESSION micro-doppler micro-motion matrix occlusion effect.
在线阅读 下载PDF
Parity recognition of blade number and manoeuvre intention classification algorithm of rotor target based on micro-Doppler features using CNN 被引量:5
3
作者 WANG Wantian TANG Ziyue +1 位作者 CHEN Yichang SUN Yongjian 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第5期884-889,共6页
This paper proposes a parity recognition of blade number and manoeuvre intention classification algorithm of rotor target based on the convolutional neural network(CNN) using micro Doppler features. Firstly, the time-... This paper proposes a parity recognition of blade number and manoeuvre intention classification algorithm of rotor target based on the convolutional neural network(CNN) using micro Doppler features. Firstly, the time-frequency spectrograms are acquired from the radar echo by the short-time Fourier transform.Secondly, based on the obtained spectrograms, a seven-layer CNN architecture is built to recognize the blade-number parity and classify the manoeuvre intention of the rotor target. The constructed architecture contains a leaky rectified linear unit and a dropout layer to accelerate the convergence of the architecture and avoid over-fitting. Finally, the spectrograms of the datasets are divided into three different ratios, i.e., 20%, 33% and 50%,and the cross validation is used to verify the effectiveness of the constructed CNN architecture. Simulation results show that, on the one hand, as the ratio of training data increases, the recognition accuracy of parity and manoeuvre intention is improved at the same signal-to-noise ratio(SNR);on the other hand, the proposed algorithm also has a strong robustness: the accuracy can still reach 90.72% with an SNR of – 6 dB. 展开更多
关键词 micro-doppler convolutional neural network(CNN) parity recognition of blade number manoeuvre intention classification
在线阅读 下载PDF
Parameter estimation for rigid body after micro-Doppler removal based on L-statistics in the radar analysis 被引量:2
4
作者 Yong Wang Jian Kang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2015年第3期457-467,共11页
In traditional inverse synthetic aperture radar (ISAR) imaging of moving targets with rotational parts, the micro-Doppler (m-D) effects caused by the rotational parts influence the quality of the radar images. Rec... In traditional inverse synthetic aperture radar (ISAR) imaging of moving targets with rotational parts, the micro-Doppler (m-D) effects caused by the rotational parts influence the quality of the radar images. Recently, L. Stankovic proposed an m-D removal method based on L-statistics, which has been proved effective and simple. The algorithm can extract the m-D effects according to different behaviors of signals induced by rotational parts and rigid bodies in time-frequency (T-F) domain. However, by removing m-D effects, some useful short time Fourier transform (STFT) samples of rigid bodies are also extracted, which induces the side lobe problem of rigid bodies. A parameter estimation method for rigid bodies after m-D removal is proposed, which can accurately re- cover rigid bodies and avoid the side lobe problem by only using m-D removal. Simulations are given to validate the effectiveness of the proposed method. 展开更多
关键词 parameter estimation L-STATISTICS micro-doppler (m-D) radar imaging.
在线阅读 下载PDF
Micro-Doppler feature extraction of micro-rotor UAV under the background of low SNR 被引量:5
5
作者 HE Weikun SUN Jingbo +1 位作者 ZHANG Xinyun LIU Zhenming 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2022年第6期1127-1139,共13页
Micro-Doppler feature extraction of unmanned aerial vehicles(UAVs)is important for their identification and classification.Noise and the motion state of the UAV are the main factors that may affect feature extraction ... Micro-Doppler feature extraction of unmanned aerial vehicles(UAVs)is important for their identification and classification.Noise and the motion state of the UAV are the main factors that may affect feature extraction and estimation precision of the micro-motion parameters.The spectrum of UAV echoes is reconstructed to strengthen the micro-motion feature and reduce the influence of the noise on the condition of low signal to noise ratio(SNR).Then considering the rotor rate variance of UAV in the complex motion state,the cepstrum method is improved to extract the rotation rate of the UAV,and the blade length can be intensively estimated.The experiment results for the simulation data and measured data show that the reconstruction of the spectrum for the UAV echoes is helpful and the relative mean square root error of the rotating speed and blade length estimated by the proposed method can be improved.However,the computation complexity is higher and the heavier computation burden is required. 展开更多
关键词 micro-rotor unmanned aerial vehicle(UAV) low signal to noise ratio(SNR) micro-doppler feature extraction parameter estimation
在线阅读 下载PDF
Particle swarm optimization for rigid body reconstruction after micro-Doppler removal in radar analysis 被引量:2
6
作者 LI Hongzhi WANG Yong 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第3期488-499,共12页
The rotating micro-motion parts produce micro-Doppler(m-D)effects which severely influence the quality of inverse synthetic aperture radar(ISAR)imaging for complex moving targets.Recently,a method based on short-time ... The rotating micro-motion parts produce micro-Doppler(m-D)effects which severely influence the quality of inverse synthetic aperture radar(ISAR)imaging for complex moving targets.Recently,a method based on short-time Fourier transform(STFT)and L-statistics to remove m-D effects is proposed,which can separate the rigid body parts from interferences introduced by rotating parts.However,during the procedure of removing m-D parts,the useful data of the rigid body parts are also removed together with the m-D interferences.After summing the rest STFT samples,the result will be affected.A novel method is proposed to recover the missing values of the rigid body parts by the particle swarm optimization(PSO)algorithm.For PSO,each particle corresponds to a possible phase estimation of the missing values.The best particle is selected which has the minimal energy of the side lobes according to the best fitness value of particles.The simulation and measured data results demonstrate the effectiveness of the proposed method. 展开更多
关键词 micro-doppler(m-D) inverse synthetic aperture radar(ISAR) L-STATISTICS particle swarm optimization(PSO)
在线阅读 下载PDF
基于WGAN-div和CNN的毫米波雷达人体动作识别方法
7
作者 李秋生 钟滢洁 《贵州师范大学学报(自然科学版)》 北大核心 2025年第5期23-33,共11页
针对基于毫米波雷达的人体动作识别数据集规模小导致的模型过拟合问题,提出一种基于Wasserstein散度生成对抗网络(WGAN-div)与卷积神经网络(CNN)的联合识别方法。首先,通过搭建毫米波雷达平台采集人体动作的雷达回波数据,经预处理生成... 针对基于毫米波雷达的人体动作识别数据集规模小导致的模型过拟合问题,提出一种基于Wasserstein散度生成对抗网络(WGAN-div)与卷积神经网络(CNN)的联合识别方法。首先,通过搭建毫米波雷达平台采集人体动作的雷达回波数据,经预处理生成微多普勒时频谱图;其次,利用WGAN-div模型学习时频谱图特征分布,生成高质量扩充数据以缓解数据不足;最后,构建浅层CNN模型实现动作分类。实验结果表明,所提方法在6类人体动作识别任务中准确率达98.17%,较深度卷积生成对抗网络(DCGAN)和带梯度惩罚的Wasserstein生成对抗网络(WGAN-gp)分别提升1.67%和0.87%。该方法通过取消Lipschitz约束优化生成质量,有效解决了小样本场景下的识别性能下降问题,为雷达数据增强与动作识别提供了一种新思路。 展开更多
关键词 毫米波雷达 人体动作识别 Wasserstein散度生成对抗网络 卷积神经网络 小样本学习 微多普勒时频谱 雷达数据增强
在线阅读 下载PDF
基于改进EfficientNet的煤矸音频分类方法 被引量:1
8
作者 宋庆军 焦守悦 +2 位作者 姜海燕 宋庆辉 郝文超 《工矿自动化》 北大核心 2025年第1期138-144,共7页
针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特... 针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特征。选择EfficientNet-B0作为骨干网络,并对其进行以下改进:将原有的多尺度通道注意力模块换成卷积块注意力模块,得到卷积注意力特征融合(CAFF)模块,通过网络自学习为不同空间位置的特征分配不同的权重信息,生成新的有效特征;在原有的MBConv模块中并行嵌入频域通道注意力(FCA)模块,加强特征图的表达能力,从而提高整个网络的性能。实验结果表明:引入CAFF模块后,模型准确率提升了0.61%,F1得分提升了0.52%,且模型收敛更快,说明CAFF模块有效提升了模型对频谱特征的捕捉能力;引入FCA模块后,准确率提升了0.45%,F1得分提升了0.62%,说明模块的叠加可以进一步提高模型的泛化能力和处理复杂特征的能力;改进EfficientNe模型的准确率为91.90%,标准差为0.108,显著优于同类对比音频分类模型。 展开更多
关键词 综放开采 煤矸识别 音频特征提取 EfficientNet Mel频谱特征 Gammatone倒谱系数 注意力机制
在线阅读 下载PDF
基于声纹脊线化和元学习的变压器故障诊断方法
9
作者 曲朝阳 刘谊豪 +2 位作者 曲楠 姜涛 徐晓宇 《电力系统保护与控制》 北大核心 2025年第13期163-174,共12页
针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(se... 针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(selective encoder, SE)加深时频与形态表征的关联度,提升模型收敛速度。最后,构造元学习网络评估变压器状态,并引入基于OD-Reptile的一阶梯度更新策略,通过内外循环优化机制增强参数泛化性,从而实现少样本、信息干扰条件下的高精度声纹诊断。相较于R-WDCNN、LSTM、CNN等传统深度学习信号诊断方法,该方法在低样本、高噪声环境下(SNR为-12 dB),收敛轮数减少10轮以上。同时,准确率分别提高6.35%,12.1%和16.93%。实验结果显示,所提方法在准确性、抗噪性、鲁棒性以及泛化性方面均有显著提升。 展开更多
关键词 声纹 小样本 脊线化 时频谱图 选择性编码 元学习 故障诊断
在线阅读 下载PDF
基于声谱图和卷积神经网络的磁暴图像识别
10
作者 李鸿宇 孙君嵩 +2 位作者 王丽 杨杰 赵雨馨 《空间科学学报》 北大核心 2025年第4期943-949,共7页
磁暴是一种重要的地磁场扰动类型,影响着通信、电力和航空航天等领域,因此对磁暴识别技术进行研究与创新有助于磁暴信息的应用.基于2010-2023年12个定点地磁观测水平分量分钟值数据,采用声谱图成像技术,运用VGG19卷积神经网络模型开展... 磁暴是一种重要的地磁场扰动类型,影响着通信、电力和航空航天等领域,因此对磁暴识别技术进行研究与创新有助于磁暴信息的应用.基于2010-2023年12个定点地磁观测水平分量分钟值数据,采用声谱图成像技术,运用VGG19卷积神经网络模型开展磁暴日和磁静日人工智能图像分类研究.实验结果显示,模型的准确率为97.41%,精确率为98.00%,召回率为96.80%,模型的预测能力较好,这表明声谱图成像技术在图像识别分类问题中具有较高的实用性,且VGG19卷积神经网络模型用于磁暴日和磁静日地磁分类的可行性较高,研究结果为磁暴预警与监测提供了新的思路. 展开更多
关键词 地磁 磁暴 声谱图 卷积神经网络 图像分类
在线阅读 下载PDF
基于超声信号的金属化膜电容器老化状态评估方法 被引量:1
11
作者 许馨愉 汲胜昌 +2 位作者 郑琳子 闫昕旖 祝令瑜 《电工技术学报》 北大核心 2025年第5期1652-1661,共10页
金属化膜电容器(MFC)是模块化多电平变流器(MMC)中较为薄弱的部件之一,准确地评估其健康状态对柔性直流输电系统的安全稳定运行意义重大。该文对MFC超声信号的局部放电相位分布(PRPD)谱图进行分析,提出一种基于健康指数公式的老化状态... 金属化膜电容器(MFC)是模块化多电平变流器(MMC)中较为薄弱的部件之一,准确地评估其健康状态对柔性直流输电系统的安全稳定运行意义重大。该文对MFC超声信号的局部放电相位分布(PRPD)谱图进行分析,提出一种基于健康指数公式的老化状态评估方法。首先,通过搭建超声监测试验平台采集声信号,分析MFC在老化过程中的失效机理;其次,基于自愈放电和局部放电比例的显著变化,探讨老化对PRPD谱图中放电信号分布的影响;最后在此基础上,构建基于健康指数公式的线性回归模型进行老化状态评估,并通过试验验证所提方法与模型的可行性和有效性。结果表明,与现有方法相比,该方法只需采集超声信号的PRPD谱图信息即可评估MFC当前的老化程度,解决了传统方法会对系统回路造成影响、抗干扰能力弱且监测精度较低的问题,为MMC的状态监测和寿命评估提供了新的手段,并为MFC非电量状态监测方法的研究奠定了基础。 展开更多
关键词 金属化膜电容器 超声法 局部放电相位分布(PRPD)谱图 老化状态评估
在线阅读 下载PDF
基于微震信号深度特征学习的岩石破裂类型识别 被引量:2
12
作者 李典泽 许华杰 张勃 《工矿自动化》 北大核心 2025年第3期156-164,共9页
岩石破裂类型识别是实现煤矿冲击地压灾害预测和预警的重要前提。微震是岩石破裂监测的有效手段之一,但常规的微震信号机器学习方法存在特征提取能力有限,以及受噪声影响导致的准确率不高且泛化性较差等问题。针对上述问题,提出了一种... 岩石破裂类型识别是实现煤矿冲击地压灾害预测和预警的重要前提。微震是岩石破裂监测的有效手段之一,但常规的微震信号机器学习方法存在特征提取能力有限,以及受噪声影响导致的准确率不高且泛化性较差等问题。针对上述问题,提出了一种基于微震信号深度特征学习的岩石破裂类型识别方法。首先,通过巴西圆盘劈裂试验和直剪试验分别获取张拉型破裂微震信号和剪切型破裂微震信号,并将其时频谱图、Log-Mel频谱图和梅尔频率倒谱系数合并构造微震信号聚合(MSA)声谱图;然后,通过加入多特征并行密集连接块(MP-DenseBlock)和压缩与激发过渡层(SE-TransLayer)的改进DenseNet(SE-MPDenseNet)对MSA声谱图进行深度特征提取;最后,将提取的特征向量输入至添加Hinge Loss损失函数的改进LightGBM(HBL-LightGBM)进行分类,识别岩石破裂类型。通过真三轴加载试验模拟接近地下工程实际环境中的冲击地压灾害,结果表明,所提方法对于岩石破裂类型识别的准确率达92.12%,且具有较强的特征提取能力和泛化能力。 展开更多
关键词 岩石破裂类型 微震监测 深度学习 机器学习 声谱图
在线阅读 下载PDF
基于改进MobileNetV3的笼养蛋鸡声音分类识别方法 被引量:2
13
作者 衡一帆 盛哲雅 +3 位作者 严煜 谷月 周昊博 王树才 《农业机械学报》 北大核心 2025年第4期427-435,共9页
为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋... 为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋声以及鸣唱声,经过声音预处理将一维声音信号转化为三维梅尔频谱图,建立了包括8541幅梅尔频谱图的蛋鸡声音数据集。通过在MobileNetV3中引入高效通道注意力(Efficient channel attention,ECA)模块,提高了笼养蛋鸡声音分类准确率。试验结果表明,MobileNetV3-ECA模型准确率、召回率、精确率以及F1分数分别达到95.25%、95.16%、95.02%、95.08%,相比原始模型分别提高1.99、2.08、2.00、2.04个百分点。通过与分别引入坐标注意力(Coordinate attention,CA)、卷积块注意力模块(Convolutional block attention module,CBAM)的模型对比,引入ECA模块后模型准确率分别提高2.11、2.03个百分点,其他指标同样有更明显的提高。与ShuffleNetV2、DesNet121和EfficientNetV2模型相比,MobileNetV3-ECA准确率分别提高1.99、2.03、2.50个百分点。本文提出的基于MobileNetV3-ECA的蛋鸡声音分类识别方法,能够有效且准确地实现对包括热应激声在内的不同种类蛋鸡声音分类识别,为蛋鸡规模化养殖中的自动化、智能化声音检测提供了算法支持,为禽舍巡检机器人功能优化提供了参考,同时为规模化笼养蛋鸡热应激预警开辟了思路。 展开更多
关键词 笼养蛋鸡 声音分类 MobileNetV3 高效通道注意力 梅尔频谱图 卷积神经网络
在线阅读 下载PDF
基于声音信号的转辙机故障诊断研究 被引量:1
14
作者 梁续继 戴胜华 《铁道标准设计》 北大核心 2025年第2期183-190,共8页
铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会... 铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会影响声音信号的常见机械故障。然后,根据声音诊断在特征提取方面的不同路线,采用3种技术方案。端到端方案通过wav2vec2.0语音识别框架直接进行训练和识别;特征矩阵方案提取声音信号的梅尔倒谱系数(MFCC),通过主成分分析(PCA)得到固定尺寸的特征矩阵,由多分类支持向量机(SVM)进行故障分类;声音图像化方案生成声音信号的语谱图,同时建立卷积神经网络VGG16的轻量化改进模型,将语谱图输入至该模型中进行训练和识别。实验结果表明,3种技术方案均能有效地对包括正常工作和6种故障类型的7种工作状态实现诊断,准确率分别为99.8%、94.2%和96.6%。验证了基于声音进行转辙机故障诊断的3种技术方案的可行性,并体现了语音领域技术在转辙机故障诊断中的应用价值。 展开更多
关键词 转辙机 故障诊断 声音信号 特征提取 wav2vec2.0 MFCC 语谱图
在线阅读 下载PDF
融合动态卷积和注意力机制的多层感知机语音情感识别 被引量:1
15
作者 张雨萌 张欣 +1 位作者 高谋 赵虎林 《计算机科学与探索》 北大核心 2025年第4期1065-1075,共11页
语音情感识别技术通过分析语音信号推断说话者情绪,增强人机交互的自然性和智能性。然而,现有模型往往忽视时频语义信息,影响识别准确性。为此,提出了一种融合动态卷积与注意力机制的多层感知机模型,显著提高了情感识别的准确度及信息... 语音情感识别技术通过分析语音信号推断说话者情绪,增强人机交互的自然性和智能性。然而,现有模型往往忽视时频语义信息,影响识别准确性。为此,提出了一种融合动态卷积与注意力机制的多层感知机模型,显著提高了情感识别的准确度及信息利用效率。将输入的语音信号转化为梅尔频谱图,捕捉信号细节变化,更贴切地反映人类对声音的感知,为后续特征提取奠定了基础。通过词元化处理将梅尔频谱图转化为词元,降低了数据的复杂性。借助动态卷积与分离注意力机制高效提取关键的时频特征。一方面,动态卷积能够适应不同时间和频率上的尺度变化,优化了特征捕捉效率;另一方面,分离注意力机制增强了模型对关键信息的聚焦能力,有效提升了模型对特征的表达能力。结合动态卷积与分离注意力机制的优势,该模型能够更加充分地提取关键声学特征,从而实现了更高效、更精准的情感识别。在RAVDESS、EmoDB和CASIA三个语音情感数据库上的测试显示,模型识别准确率显著优于现有技术,达到86.11%、95.33%和82.92%。这验证了模型在复杂情感识别任务的高效性和准确性,以及动态卷积和注意力机制的有效性。 展开更多
关键词 语音情感识别 梅尔频谱图 多层感知机 动态卷积 注意力机制
在线阅读 下载PDF
基于ASP-SERes2Net的说话人识别算法 被引量:1
16
作者 令晓明 陈鸿雁 +1 位作者 张小玉 张真 《北京工业大学学报》 CAS 北大核心 2025年第1期42-50,共9页
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(squeeze-and-excitation,SE)注意力模块;然后,用注意力统计池化(attention statistics pooling,ASP)代替原来的平均池化;最后,采用附加角裕度的Softmax(additive angular margin Softmax,AAM-Softmax)对说话人身份进行分类。通过实验,将ASP-SERes2Net算法与时延神经网络(time delay neural network,TDNN)、ResNet34和Res2Net进行对比,ASP-SERes2Net算法的最小检测代价函数(minimum detection cost function,MinDCF)值为0.0401,等误率(equal error rate,EER)为0.52%,明显优于其他3个模型。结果表明,ASP-SERes2Net算法性能更优,适合应用于噪声环境下的说话人识别。 展开更多
关键词 说话人识别 梅尔语谱图 Res2Net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax)
在线阅读 下载PDF
指纹图谱技术研究现状及其在固废领域的应用
17
作者 郑志敏 杨金忠 +4 位作者 迭庆杞 王菲 黄瑞潇 杨玉飞 黄启飞 《中国环境科学》 北大核心 2025年第8期4410-4422,共13页
为了解指纹图谱技术研究现状并明确其在固废领域的应用现状与前景,依托Web of Science(WOS)核心数据库对2010~2024年相关文献进行检索和分析.发文量分析得知指纹图谱技术依然保持着较高的研究热度,学科聚类分析得知其应用广泛并且近几... 为了解指纹图谱技术研究现状并明确其在固废领域的应用现状与前景,依托Web of Science(WOS)核心数据库对2010~2024年相关文献进行检索和分析.发文量分析得知指纹图谱技术依然保持着较高的研究热度,学科聚类分析得知其应用广泛并且近几年在环境领域研究热度也较高;关键词聚类发现研究热点集中在4个方面:Recognition(识别)、ChemoInformatics(化学信息学)、Deep Learning(深度学习)以及Model(模型).对固废领域文献进行关键词共现,得知其关于使用指纹图谱技术进行固废管理的研究较少,主要集中在后处理阶段.进行文献调研,对指纹图谱的数据获取技术、特征提取技术、特征呈现形式进行总结,提出固废领域应用新兴技术的可能性以及未来发展展望. 展开更多
关键词 指纹 图谱 固体废物 雷达图 配分曲线 CITESPACE
在线阅读 下载PDF
基于层级化分数阶语谱图的帕金森病构音障碍分类
18
作者 薛在发 卢辉斌 +1 位作者 林丽琴 张涛 《中国生物医学工程学报》 北大核心 2025年第1期21-33,共13页
构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病... 构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病分类方法。首先,通过增加角度旋转因子,将构音信号转化为分数阶语谱图以增强从不同角度提取能量信息的能力;其次,将Swin Transformer网络在ImageNet上预训练的参数进行迁移和微调以解决数据量小的弊端;最后,结合层级化结构和基于偏移窗口的自注意力机制扩大感受野和实现多尺度信息融合,从而有效提升帕金森病分类精度。在Database-1(240个样本,由伊斯坦布尔大学医学院神经内科采集)和Database-2(1404个样本,由唐山工人医院和开滦精神卫生中心合作采集)上的验证结果表明,该方法具有良好的稳定性,且在两个数据集上的准确率分别达到了97.80%和98.75%,性能均优于所对比的先进方法。本研究所提出方法为帕金森病构音障碍分析提供了新的视角。 展开更多
关键词 帕金森病 构音障碍 分数阶语谱图 参数迁移 层级化结构
在线阅读 下载PDF
基于梅尔谱与压缩激励加权量化的语音神经编解码方法
19
作者 周俊佐 易江燕 +2 位作者 陶建华 任勇 汪涛 《计算机研究与发展》 北大核心 2025年第11期2725-2736,共12页
目前,以SoundStream等为代表的端到端语音神经编解码器在重建语音感知质量方面展现了优异性能.然而,这些方法需要大量的卷积计算,从而导致较长的编码时间.为缓解上述问题,提出基于梅尔谱和压缩激励加权量化的神经语音编解码方法.该方法... 目前,以SoundStream等为代表的端到端语音神经编解码器在重建语音感知质量方面展现了优异性能.然而,这些方法需要大量的卷积计算,从而导致较长的编码时间.为缓解上述问题,提出基于梅尔谱和压缩激励加权量化的神经语音编解码方法.该方法旨在保持较高语音感知质量的同时降低计算代价,加快运行速度,从而减少时延.具体而言,采用梅尔谱特征作为输入,借助梅尔谱提取过程中时域压缩的性质,并结合低层卷积编码器以简化运算过程.此外,借鉴压缩激励网络思想,提取了编码器最后一层输出特征各维度的激励权重,将其作为量化器中计算码本距离时压缩特征各维度的权重系数,由此学习特征间的相关性并优化量化性能.在LibriTTS和VCTK数据集上的实验结果表明,该方法显著提升了编码器计算速度,且能在较低比特率时(≤3 Kbps)提升重建语音质量.以比特率1.5 Kbps时为例,编码计算实时率(real-time factor,RTF)最多可提升4.6倍.对于感知质量,以0.75 Kbps为例,短时客观可懂度(shorttime objective intelligibility,STOI)、虚拟语音质量客观评估(virtual speech quality objective listener,VISQOL)等客观指标相较基线平均可提升8.72%.此外,消融实验不仅表明压缩激励权重方法的优化效果与比特率呈反相关,而且发现Relu激活函数相较周期性质激活函数Snake而言,在语音感知质量相当的情况下,能大量加快运行速度. 展开更多
关键词 语音编解码 梅尔谱图 压缩激励网络 残差矢量量化 生成对抗网络
在线阅读 下载PDF
基于DDPM-MBN的井下人员步态识别方法
20
作者 马进昇 宋一轩 +4 位作者 刘家彤 潘红光 郭强 兰北亚 郭秀才 《工矿自动化》 北大核心 2025年第9期60-65,共6页
现有基于毫米波雷达的人员步态识别方法基于小规模数据集进行训练,导致模型泛化能力不足,且难以从复杂的井下环境中提取有效的全局特征与局部特征,造成识别精度较低。针对上述问题,提出了一种基于去噪扩散概率模型(DDPM)-多分支网络(MBN... 现有基于毫米波雷达的人员步态识别方法基于小规模数据集进行训练,导致模型泛化能力不足,且难以从复杂的井下环境中提取有效的全局特征与局部特征,造成识别精度较低。针对上述问题,提出了一种基于去噪扩散概率模型(DDPM)-多分支网络(MBN)的井下人员步态识别方法。采用DDPM对雷达回波转换得到的时频谱图进行去噪与数据增强,有效扩充了井下步态数据量,提升了数据质量;通过MBN的1个全局分支和2个局部分支分别提取步态的全局特征和不同粒度的局部特征,实现了对步态多尺度特征的充分提取,提升了对行走方向和行走速度的识别能力;联合使用Softmax损失与三元组损失,对粗粒度特征(未经降维的2 048维特征)与细粒度特征(经降维后的256维特征)进行协同优化,从而增强了模型的宏观分类能力与特征判别性。实验结果表明,在自建的步态数据集上,DDPM-MBN模型的Rank-1准确率和平均精度均值(mAP)相较于ResNet-50分别提升了8.05%,16.96%;与主流步态识别模型相比,DDPM-MBN模型在Rank-1准确率和m AP指标上均最优,分别为97.91%和95.48%。 展开更多
关键词 人员步态识别 毫米波雷达 去噪扩散概率模型 多分支网络 时频谱图
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部