期刊文献+
共找到123篇文章
< 1 2 7 >
每页显示 20 50 100
基于MFCC-IMFCC混合倒谱的托辊轴承故障诊断 被引量:9
1
作者 陶瀚宇 陈换过 +2 位作者 彭程程 高祥冲 杨磊 《机电工程》 CAS 北大核心 2024年第7期1215-1222,共8页
针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了... 针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了托辊轴承故障信息主要分布在中高频区域;然后,为有效保留高频信息,提取了MFCC-IMFCC,以帧级串联的方式组成了混合倒谱特征;最后,将混合倒谱特征输入到双层LSTM模型中进行了训练,建立了托辊轴承故障诊断模型。研究结果表明:针对托辊正常、滚动体故障和偏心旋转故障三种状态,LSTM结合混合倒谱特征的平均识别准确率达到96.72%,相比于单一的MFCC和IMFCC特征,准确率分别提升3.94%和7.41%,凸显了混合倒谱特征在表征托辊轴承故障信息方面的显著优势。 展开更多
关键词 托辊轴承 轴承故障声音信号 高频信息 梅尔倒谱系数 翻转梅尔倒谱系数 混合倒谱系数 长短时记忆网络
在线阅读 下载PDF
基于改进EfficientNet的煤矸音频分类方法
2
作者 宋庆军 焦守悦 +2 位作者 姜海燕 宋庆辉 郝文超 《工矿自动化》 北大核心 2025年第1期138-144,共7页
针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特... 针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特征。选择EfficientNet-B0作为骨干网络,并对其进行以下改进:将原有的多尺度通道注意力模块换成卷积块注意力模块,得到卷积注意力特征融合(CAFF)模块,通过网络自学习为不同空间位置的特征分配不同的权重信息,生成新的有效特征;在原有的MBConv模块中并行嵌入频域通道注意力(FCA)模块,加强特征图的表达能力,从而提高整个网络的性能。实验结果表明:引入CAFF模块后,模型准确率提升了0.61%,F1得分提升了0.52%,且模型收敛更快,说明CAFF模块有效提升了模型对频谱特征的捕捉能力;引入FCA模块后,准确率提升了0.45%,F1得分提升了0.62%,说明模块的叠加可以进一步提高模型的泛化能力和处理复杂特征的能力;改进EfficientNe模型的准确率为91.90%,标准差为0.108,显著优于同类对比音频分类模型。 展开更多
关键词 综放开采 煤矸识别 音频特征提取 EfficientNet mel频谱特征 Gammatone倒谱系数 注意力机制
在线阅读 下载PDF
基于MPDCNN的强噪声环境下船舶电力推进器齿轮箱故障诊断方法
3
作者 尚前明 蒋婉莹 +2 位作者 周毅 王正强 孙钰波 《中国舰船研究》 北大核心 2025年第2期30-38,共9页
[目的]针对旋转机械在实际工作中因噪声干扰而导致的故障诊断性能下降问题,为提高振动信号的故障特征提取质量和故障诊断能力,提出基于Mel-frequency倒谱系数(MFCC)的并行双通道卷积神经网络(PDCNN)故障诊断方法。[方法]利用MFCC提取含... [目的]针对旋转机械在实际工作中因噪声干扰而导致的故障诊断性能下降问题,为提高振动信号的故障特征提取质量和故障诊断能力,提出基于Mel-frequency倒谱系数(MFCC)的并行双通道卷积神经网络(PDCNN)故障诊断方法。[方法]利用MFCC提取含噪声的振动信号特征,同时设计一种新型并行双通道卷积神经网络结构,并利用该网络进一步挖掘数据的全局特征及更深层次的微小特征,从而提高该方法在强噪声环境下的诊断性能。[结果]不同噪声环境下的实验评估结果表明,该方法在强噪声环境下的故障诊断精度高于98%,其抗噪性能和诊断性能均明显优于其他传统方法。[结论]研究成果可为强噪声环境下的齿轮箱故障诊断提供参考。 展开更多
关键词 船舶电力推进 齿轮箱 故障分析 故障诊断 特征提取 梅尔频率倒谱系数 卷积神经网络
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
4
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
基于双向长短时记忆网络和自注意力机制的心音分类
5
作者 卢官明 李齐健 +4 位作者 卢峻禾 戚继荣 赵宇航 王洋 魏金生 《数据采集与处理》 北大核心 2025年第2期456-468,共13页
心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进... 心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进行分帧处理,提取每帧心音信号的梅尔频率倒谱系数(Mel⁃frequency cepstral coefficients,MFCC)特征;将MFCC特征序列输入Bi⁃LSTM网络,利用Bi⁃LSTM网络提取心音信号的时域上下文特征;通过自注意力机制动态调整Bi⁃LSTM网络各时间步输出特征的权重,得到有利于分类的更具鉴别性的心音特征;通过Softmax分类器实现正常/异常心音的分类。在PhysioNet/CinC Challenge 2016心音数据集上对所提出的算法使用10折交叉验证法进行了评估,得到0.9425的灵敏度、0.9437的特异度、0.8367的精度、0.8865的F1得分和0.9434的准确率,优于对比的典型算法。实验结果表明,该算法在无需进行心音分段的基础上就能有效实现异常心音检测,具有潜在的临床应用前景。 展开更多
关键词 心音分类 梅尔频率倒谱系数 双向长短时记忆网络 自注意力机制
在线阅读 下载PDF
特征降维与融合的水声目标识别方法 被引量:2
6
作者 李昊鑫 肖长诗 +2 位作者 元海文 郭玉滨 刘加轩 《哈尔滨工程大学学报》 北大核心 2025年第1期102-110,共9页
为解决水声目标在强噪声环境下识别困难以及特征高维问题,本文提出一种将水声信号进行离散小波变换并提取其低频系数与重组一维梅尔倒谱系数融合的方法,以减少特征维度并弥补信息损失。利用1D-CNN-LSTM神经网络在DeepShip和ShipsEar 2... 为解决水声目标在强噪声环境下识别困难以及特征高维问题,本文提出一种将水声信号进行离散小波变换并提取其低频系数与重组一维梅尔倒谱系数融合的方法,以减少特征维度并弥补信息损失。利用1D-CNN-LSTM神经网络在DeepShip和ShipsEar 2个数据集上进行实验,识别准确率均在99%以上。结果表明:该算法能够有效抑制噪声,具备较强的鲁棒性。将所提算法应用到单船识别,实验结果表明该算法能够有效区分同类型的不同船舶。 展开更多
关键词 水声目标识别 离散小波变换 梅尔倒谱系数 特征融合 联合神经网络 单船识别 深度学习 船舶辐射噪声
在线阅读 下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
7
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 mel倒谱系数 个性信息 mel倒谱系数 频谱分布 语音信号
在线阅读 下载PDF
基于修正Mel频率映射的应力影响下变异语音识别方法 被引量:1
8
作者 马永林 韩纪庆 +1 位作者 张磊 王承发 《计算机工程与应用》 CSCD 北大核心 2002年第20期75-76,91,共3页
文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正... 文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正Mel频率映射的MFCC特征改进了变异语音的识别性能。 展开更多
关键词 修正 mel频率映射 应力 变异语音识别 语音分类器 mel倒谱系数
在线阅读 下载PDF
基于PCA和非线性映射改进的MFCC特征提取方法 被引量:1
9
作者 符恬恬 郑斌琪 +1 位作者 李成娟 夏利杰 《电子测量技术》 北大核心 2025年第10期93-99,共7页
使用传统的梅尔倒谱系数(MFCC)作为特征进行野外目标识别时,由于MFCC对环境干扰较敏感,所以会导致识别率的下降。针对这个问题,提出了使用主成分分析法(PCA)代替MFCC提取过程中使用的离散余弦变换,并且使用非线性函数对梅尔滤波后所获... 使用传统的梅尔倒谱系数(MFCC)作为特征进行野外目标识别时,由于MFCC对环境干扰较敏感,所以会导致识别率的下降。针对这个问题,提出了使用主成分分析法(PCA)代替MFCC提取过程中使用的离散余弦变换,并且使用非线性函数对梅尔滤波后所获得的对数能量进行映射。改进后的MFCC更贴合实际数据、可以增强目标信号所在频段的权重、有着良好的可分性和鲁棒性。经过实验验证,使用PCA和非线性映射改进后的MFCC作为分类特征时,准确率为93.36%,优于传统的MFCC。 展开更多
关键词 目标识别 梅尔倒谱系数 主成分分析 非线性映射
在线阅读 下载PDF
基于音频的高分辨率人脸画像方法
10
作者 秦昊铭 卜凡亮 钟方昊 《科学技术与工程》 北大核心 2025年第13期5515-5526,共12页
现有的语音驱动人脸生成方法在特征提取与生成质量上仍面临挑战,且尚未充分挖掘音频与人脸特征之间的深层关联。为解决这些问题,提出一种结合梅尔频率倒谱系数(Mel frequency cepstral coefficients, MFCC)音频特征提取与第二代样式生... 现有的语音驱动人脸生成方法在特征提取与生成质量上仍面临挑战,且尚未充分挖掘音频与人脸特征之间的深层关联。为解决这些问题,提出一种结合梅尔频率倒谱系数(Mel frequency cepstral coefficients, MFCC)音频特征提取与第二代样式生成对抗网络(style generative adversarial net-works 2,StyleGAN2)图像生成技术的研究方法。在音频处理方面,采用了梅尔频率倒谱系数作为特征提取方法。为了更有效地从音频中提取和传递特征,设计了一种基于ResNet18的残差模块,并融入了SE(squeeze-and-excitation)注意力机制。同时对原残差块中的激活函数进行了优化改进,采用Mish激活函数,旨在减少深层网络中的梯度消失问题,保持特征信息的完整性并提高模型的准确性和泛化能力。采取StyleGAN2模型作为人脸图像的生成模型。实验结果表明,结合了设计的音频处理网络和StyleGAN2的人脸生成模型,在语音驱动的人脸生成任务中展现出了卓越的性能。通过综合评估Fréchet起始距离(Fréchet inception distance, FID)和路径长度等指标,本文方法在语音驱动的人脸生成任务中相较于现有方法,在生成质量上有显著提升,充分证明了所提方法的有效性和优越性。 展开更多
关键词 语音生成人脸 梅尔频率倒谱系数 样式生成对抗网络 注意力机制
在线阅读 下载PDF
基于MFCC⁃CNN的轨道交通车致二次结构噪声信号识别
11
作者 卓文海 刘庆杰 +2 位作者 徐璐 刘博亮 刘文武 《铁道建筑》 北大核心 2025年第4期137-142,共6页
针对背景噪声干扰下轨道交通诱发室内二次结构噪声的识别难题,提出一种基于卷积神经网络(Convolutional Neural Network,CNN)的室内二次结构噪声识别方法。通过梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取噪声信... 针对背景噪声干扰下轨道交通诱发室内二次结构噪声的识别难题,提出一种基于卷积神经网络(Convolutional Neural Network,CNN)的室内二次结构噪声识别方法。通过梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取噪声信号的时域特征,将噪声识别问题转变成图片识别问题。建立二次结构噪声图像库与背景噪声库,设计网络结构,将时域图输入CNN模型,实现噪声信号的分类。设计多组学习率与MFCC维度的对比试验,优化模型分类效果。结果表明:MFCC提取的时频特征中车致二次结构噪声相对连续,各频段能量均匀分布,且高低频段能量分布差异明显;背景噪声能量分布随时间变化而变化;当学习率设置为0.0005、MFCC特征维度为40时,模型分类效果最佳,二次结构噪声的F1分数可达到97.1%;对现场实时采集的数据分类效果良好,说明建立的MFCC‑CNN模型能有效识别列车诱发二次结构噪声信号。 展开更多
关键词 轨道交通 二次结构噪声 卷积神经网络 梅尔倒谱系数 信号识别
在线阅读 下载PDF
基于双通道特征的含噪声纹识别方法研究
12
作者 伍雄 陈为真 《计算机应用与软件》 北大核心 2025年第7期205-211,共7页
针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱... 针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱系数特征,结合它们的差分谱构成混合特征,融合成双通道声纹特征(DCVF)。实验结果表明:在纯净语音数据集中,双通道声纹特征可达到99.5%的识别率;在含噪语音数据集下,DCVF的识别效果有明显提升。 展开更多
关键词 声纹识别 梅尔频率倒谱系数 伽马通倒谱系数 特征融合 抗噪性
在线阅读 下载PDF
基于持续元音多波段倒谱特征的儿童声带小结检测
13
作者 雷简菡 刘阳 +1 位作者 刘伯权 刘恒鑫 《听力学及言语疾病杂志》 北大核心 2025年第4期307-311,共5页
目的提出一种检测儿童声带小结的有效的嗓音声学客观评估方法。方法对48例儿童声带小结患者及40例嗓音正常儿童的持续元音/a/进行多波段倒谱分析,提取各波段的13个梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)(MFCC1~MF... 目的提出一种检测儿童声带小结的有效的嗓音声学客观评估方法。方法对48例儿童声带小结患者及40例嗓音正常儿童的持续元音/a/进行多波段倒谱分析,提取各波段的13个梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)(MFCC1~MFCC13)、5个倒谱峰值[即第一个和第二个倒谱峰值之间的幅度差(difference in amplitude of peaks,DAP)、循环频率差(difference in quefrency of peaks,DQP)、峰值能量(energy of peak,EP)EP1和EP2、峰值之间的倒谱能量(energy between cepstral peaks,EEP)]及6种倒谱距离(D 1~D 6)作为子带特征,通过独立样本t检验对两组声学特征参数进行差异比较,并将具有统计学意义的指标进行受试者工作特征(receiver operating characteristic,ROC)曲线分析。结果声带小结儿童组中的MFCC2、MFCC3、MFCC5、MFCC11、MFCC12、DQP、EP1、EP2特征值均显著高于正常儿童组(P<0.05或P<0.001),MFCC1、MFCC6、MFCC8、MFCC13、EEP均显著低于正常儿童组(P<0.05)。这些特征的ROC曲线分析显示,MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、MFCC13、DQP、EP1、EP2、EEP特征联合检测的ROC曲线下面积为0.98,MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、DQP、EP2参数单独的ROC曲线下面积均大于0.7,均有一定的准确性。其中,MFCC2与MFCC3的ROC曲线下面积分别为0.85、0.87,表明它们对声带小结儿童的嗓音片段具有较高的诊断价值。结论基于持续元音多波段倒谱特征的特定声学参数组合,包括梅尔频率倒谱系数(MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、MFCC13)和倒谱峰值(DQP、EP1、EP2、EEP),展现出较高的敏感性和特异性,尤其是MFCC2和MFCC3,在儿童声带小结相关嗓音障碍的检测中表现出优异的诊断能力。 展开更多
关键词 声带小结 儿童语音障碍 声学特征 梅尔频率倒谱系数
在线阅读 下载PDF
基于梅尔倒谱系数的无人机探测与识别方法
14
作者 聂伟 张中洋 +1 位作者 杨小龙 周牧 《电子与信息学报》 北大核心 2025年第4期1076-1084,共9页
近年来无人机(UAV)数量的剧增,无论是在民用还是军用领域都带来了一定的隐私和安全问题,因此对无人机的管控技术已成为研究热点。当前基于深度学习的射频指纹识别(RFFI)技术虽然在无人机识别上表现优异,但由于模型复杂度高,训练速度慢,... 近年来无人机(UAV)数量的剧增,无论是在民用还是军用领域都带来了一定的隐私和安全问题,因此对无人机的管控技术已成为研究热点。当前基于深度学习的射频指纹识别(RFFI)技术虽然在无人机识别上表现优异,但由于模型复杂度高,训练速度慢,且在不同数据分布下的泛化能力有限,因此在实际应用中存在局限性。该文提出一种基于梅尔频率倒谱系数的无人机识别方法,使用USRP N210采集无人机图传信号,然后提取梅尔倒谱系数(MFCC)作为无人机射频指纹特征,输入门控循环单元(GRU)进行分类识别,最后通过正则化正交匹配追踪算法(ROMP)估计无人机定位参数得到无人机具体位置。试验结果表明无人机的识别准确率可达98%,且GRU模型参数量只有1.6 k,训练时间仅需9 s,显著降低了模型复杂度并提高了训练速度和识别精度,在无人机定位中,其3维定位误差小于1 m。为进一步验证该文所提方法的可行性,对同一厂家同一型号10个无线模块进行不同距离的分类识别,1 m,2 m,3 m和5 m识别结果分别为100%,98%,98%和99%。 展开更多
关键词 无人机 射频指纹识别 深度学习 门控循环单元 梅尔频率倒谱系数
在线阅读 下载PDF
基于声信号的离心泵故障诊断研究 被引量:5
15
作者 陈剑 姜涛 陈品 《电子测量与仪器学报》 CSCD 北大核心 2024年第5期169-177,共9页
各种原因使得工业现场设备状态监测的首选测量信号是声信号时,提出一种基于声信号的设备状态监测方法显得尤为必要。以某型离心泵为依据对象,对现场采集的声信号提取梅尔倒谱系数(MFCC)作为信号的初始特征,然后计算这些MFCC初始特征的... 各种原因使得工业现场设备状态监测的首选测量信号是声信号时,提出一种基于声信号的设备状态监测方法显得尤为必要。以某型离心泵为依据对象,对现场采集的声信号提取梅尔倒谱系数(MFCC)作为信号的初始特征,然后计算这些MFCC初始特征的散布熵(DE)值,并通过主成分分析法(PCA)对矩阵进行降维,从而构造特征矩阵。利用蝙蝠优化算法(BA)对支持向量机(SVM)的惩罚系数与核函数参数进行优化,对离心泵的多种故障工况开展诊断,并与多种诊断方法进行比较。实验结果表明,经过BA优化后的模型在诊断准确率上提高了21.7%;在该模型的基础上利用DE对MFCC提取的信号进行深度挖掘,使模型诊断的准确率提高2.05%。 展开更多
关键词 离心泵故障诊断 声信号 梅尔倒谱散布熵 蝙蝠优化算法 支持向量机
在线阅读 下载PDF
试验环境水下声信号的特征提取方法 被引量:1
16
作者 王红滨 王永乐 +1 位作者 何鸣 薛垚 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第3期489-495,共7页
水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用... 水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用梅尔频谱倒谱系数及线性预测系数处理,两者运用特征加权组合方法得到新的特征矩阵;再应用映射插值算法对特征矩阵进行处理,获得适应神经网络输入的三通道矩阵。本文选取的网络模型为残差神经网络。利用实验室所录制的对河口水库数据集测试表明,本文提出的特征提取方法普遍优于仅利用梅尔频谱倒谱系数或线性预测系数的特征处理方法。利用单频矩形脉冲信号对环境进行深度5分类,准确率平均提升2%。利用线性调频信号对环境进行深度5分类,准确率平均提升2.03%。本文提出的特征提取方法对线性调频信号在深度分类任务下处理的结果要优于单频矩形脉冲信号处理的结果。 展开更多
关键词 环境反演 特征提取 梅尔频谱倒谱系数 线性预测系数 特征加权组合方法 残差神经网络 神经网络 水下声信号
在线阅读 下载PDF
基于脉搏波频域梅尔频率倒谱系数特征的高血压危险分层预测模型 被引量:3
17
作者 齐晨浩 杨晶东 +2 位作者 邱泽浩 尧明慧 燕海霞 《海军军医大学学报》 CAS CSCD 北大核心 2024年第10期1226-1240,共15页
目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transf... 目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transformer 结构提取脉搏波深层特征,并将自注意力机制与选择性内核注意力进行决策融合,提取脉搏波关联特征,并采用Floodings正则化方法间接控制训练损失,防止过拟合发生。针对上海中医药大学附属龙华医院及上海市中西医结合医院提供的527例临床脉诊数据,进行5折交叉验证实验。此外,采用梯度提升决策树算法统计脉搏波频域特征的贡献率排名,分析影响模型分类精度的关键因素,为中医临床辅助诊断提供参考价值。结果 本研究提出的模型分类评估指标准确度、F1值、精确率、召回率和AUC值分别为0.939 6、0.924 9、0.940 9、0.929 5和0.993 4。脉搏波的静态特征、一阶差分和二阶差分系数的贡献率相对均衡,说明高血压危险程度不仅与脉搏波的静态特征相关,也应当考虑脉搏波的动态特征。结论 与典型脉搏波分类模型相比,本研究提出的模型具有较高的分类精度和泛化性能。 展开更多
关键词 高血压 危险分层 梅尔频率倒谱系数 时间卷积网络 TRANSFORMER
在线阅读 下载PDF
砂岩破裂状态声发射梅尔倒谱系数判识方法 被引量:1
18
作者 何学秋 杨菲 +5 位作者 李振雷 李娜 宋大钊 王洪磊 SOBOLEV Aleksei RASSKAZOV Igor 《煤炭学报》 EI CAS CSCD 北大核心 2024年第2期753-766,共14页
岩体结构破裂是严重制约矿山、地铁、隧道等地下空间工程建设及其安全运行的重要因素。实现对岩体结构破裂状态的识别是当下研究的热点与重点之一。为此,开展了不同条件的砂岩加载破坏实验,提取了加载全程的声发射梅尔倒谱系数及其波动... 岩体结构破裂是严重制约矿山、地铁、隧道等地下空间工程建设及其安全运行的重要因素。实现对岩体结构破裂状态的识别是当下研究的热点与重点之一。为此,开展了不同条件的砂岩加载破坏实验,提取了加载全程的声发射梅尔倒谱系数及其波动差,研究了系数及其波动差在砂岩受载破坏全程的变化规律,分析了1号系数(一组声发射梅尔倒谱系数包括12个,1号系数指第1个声发射梅尔倒谱系数)及其波动差与砂岩破裂状态的相关性特征,基于此提出了砂岩破裂状态声发射梅尔倒谱系数判识方法,构建了判识准则并进行判识效果检验。结果表明:随载荷增加,1号系数整体上增大,系数及其离散性在破坏阶段显著增大并表现出显著的规律波动性特征;1号系数波动差具有阶段性变化特征,波动差的大小及其起伏变化可表征砂岩的破裂,波动差整体增大及突增的变化可反映砂岩非稳定变形和峰后破坏阶段的宏观破裂,波动差的突增幅度可反映砂岩破裂程度;声发射梅尔倒谱系数及其波动差对砂岩破裂表现出良好的响应特征,该特征受不同加载条件的影响较小,说明声发射梅尔倒谱系数在反映砂岩破裂上具有适用性;1号系数及其波动差与砂岩破裂状态具有较好相关性,该相关性可分为3个阶段,即1号系数及其波动差在砂岩微破裂阶段分布集中,在临近失稳破坏阶段分布范围急剧增大、整体值升高且出现高异常值,在峰后破坏阶段分布范围进一步增大、整体值更高、高异常值更多;利用1号系数的75%位点值和异常值、1号系数波动差的75%位点值和异常值构建了砂岩破裂状态判识准则,采用三分类模型混淆矩阵对判识准则的效果进行了检验,判识准确度和精准度分别为90.43%、94.45%。该成果可为其他种类煤岩的破裂状态识别提供借鉴,为煤岩失稳监测预警提供参考。 展开更多
关键词 砂岩破裂状态 声发射 梅尔倒谱系数 判识方法
在线阅读 下载PDF
基于多尺度时序感知网络的课堂语音情感识别方法
19
作者 周菊香 刘金生 +2 位作者 甘健侯 吴迪 李子杰 《计算机应用》 CSCD 北大核心 2024年第5期1636-1643,共8页
语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂... 语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂学习状态,从而达到精准施教的目的。针对课堂语音情感识别任务,首先,收集中小学的课堂实录教学视频,提取音频并进行人工切分和标注,构建了包含6类情感的中小学教学语音情感语料库;其次,基于时序卷积网络(TCN)和交叉门控机制(cross-gated mechanism)设计了双路时序卷积通道,以提取多尺度交叉融合特征;最后,采用动态权重融合策略调整不同尺度特征的贡献度,减少非重要特征对识别结果的干扰,进一步增强模型的表征和学习能力。实验结果表明,所提方法在多个公共数据集上优于TIM-Net(Temporal-aware bI-direction Multi-scaleNetwork)、GM-TCNet(Gated Multi-scale Temporal Convolutional Network)和CTL-MTNet(CapsNet and Transfer Learning-based Mixed Task Net)等先进模型,在真实课堂语音情感识别任务上未加权平均召回率(UAR)和加权平均召回率(WAR)分别达90.58%和90.45%。 展开更多
关键词 语音情感识别 课堂语音 时序卷积网络 交叉门控卷积 梅尔频率倒谱系数
在线阅读 下载PDF
基于特征融合与注意力机制的鸟类声纹识别方法 被引量:2
20
作者 潘齐炜 程吉祥 +2 位作者 田甜 吴丹 曾蕊 《声学技术》 CSCD 北大核心 2024年第5期686-695,共10页
鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方... 鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方法。首先,在特征提取时分别获取梅尔频率倒谱系数和功率正则化倒谱系数,其次利用均值和方差归一化处理将两种特征融合得到新型融合特征参数MPFC;然后,以ResNet-50为主干网络在其残差模块中引入轻量化坐标注意力机制得到改进网络模型—坐标注意力残差网络;最后,将融合特征分别输入到坐标注意力残差网络(residual coordinate attention net, ResCA),ResNet-50、ResNeSt-50、DenseNet-121和EfficientNet-B0并在两个数据集Birdsdata和BirdCLEF上进行对比实验。实验结果表明,融合特征比单一特征有更好的表征能力,能够提高一定识别率,改进网络也具有较好的识别效果。 展开更多
关键词 鸟类声纹识别 特征融合 梅尔频率倒谱系数 功率正则化倒谱系
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部