期刊文献+
共找到164篇文章
< 1 2 9 >
每页显示 20 50 100
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
1
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率谱系 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
基于脉搏波频域梅尔频率倒谱系数特征的高血压危险分层预测模型 被引量:3
2
作者 齐晨浩 杨晶东 +2 位作者 邱泽浩 尧明慧 燕海霞 《海军军医大学学报》 CAS CSCD 北大核心 2024年第10期1226-1240,共15页
目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transf... 目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transformer 结构提取脉搏波深层特征,并将自注意力机制与选择性内核注意力进行决策融合,提取脉搏波关联特征,并采用Floodings正则化方法间接控制训练损失,防止过拟合发生。针对上海中医药大学附属龙华医院及上海市中西医结合医院提供的527例临床脉诊数据,进行5折交叉验证实验。此外,采用梯度提升决策树算法统计脉搏波频域特征的贡献率排名,分析影响模型分类精度的关键因素,为中医临床辅助诊断提供参考价值。结果 本研究提出的模型分类评估指标准确度、F1值、精确率、召回率和AUC值分别为0.939 6、0.924 9、0.940 9、0.929 5和0.993 4。脉搏波的静态特征、一阶差分和二阶差分系数的贡献率相对均衡,说明高血压危险程度不仅与脉搏波的静态特征相关,也应当考虑脉搏波的动态特征。结论 与典型脉搏波分类模型相比,本研究提出的模型具有较高的分类精度和泛化性能。 展开更多
关键词 高血压 危险分层 梅尔频率谱系 时间卷积网络 TRANSFORMER
在线阅读 下载PDF
基于梅尔倒谱系数的无人机探测与识别方法
3
作者 聂伟 张中洋 +1 位作者 杨小龙 周牧 《电子与信息学报》 北大核心 2025年第4期1076-1084,共9页
近年来无人机(UAV)数量的剧增,无论是在民用还是军用领域都带来了一定的隐私和安全问题,因此对无人机的管控技术已成为研究热点。当前基于深度学习的射频指纹识别(RFFI)技术虽然在无人机识别上表现优异,但由于模型复杂度高,训练速度慢,... 近年来无人机(UAV)数量的剧增,无论是在民用还是军用领域都带来了一定的隐私和安全问题,因此对无人机的管控技术已成为研究热点。当前基于深度学习的射频指纹识别(RFFI)技术虽然在无人机识别上表现优异,但由于模型复杂度高,训练速度慢,且在不同数据分布下的泛化能力有限,因此在实际应用中存在局限性。该文提出一种基于梅尔频率倒谱系数的无人机识别方法,使用USRP N210采集无人机图传信号,然后提取梅尔倒谱系数(MFCC)作为无人机射频指纹特征,输入门控循环单元(GRU)进行分类识别,最后通过正则化正交匹配追踪算法(ROMP)估计无人机定位参数得到无人机具体位置。试验结果表明无人机的识别准确率可达98%,且GRU模型参数量只有1.6 k,训练时间仅需9 s,显著降低了模型复杂度并提高了训练速度和识别精度,在无人机定位中,其3维定位误差小于1 m。为进一步验证该文所提方法的可行性,对同一厂家同一型号10个无线模块进行不同距离的分类识别,1 m,2 m,3 m和5 m识别结果分别为100%,98%,98%和99%。 展开更多
关键词 无人机 射频指纹识别 深度学习 门控循环单元 梅尔频率谱系
在线阅读 下载PDF
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:6
4
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 MEL频率谱系 多窗频谱估计 滑动平均滤波 谱包络 说话人识别
在线阅读 下载PDF
说话人识别中的Mel特征频率倒谱系数 被引量:13
5
作者 曹辉 徐晨 +1 位作者 赵晓 吴胜举 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第2期203-208,共6页
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向... 目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。 展开更多
关键词 说话人识别 语音特征参 梅尔频率谱系 支持向量机 平均影响值
在线阅读 下载PDF
基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法 被引量:23
6
作者 胡峰松 张璇 《计算机应用》 CSCD 北大核心 2012年第9期2542-2544,共3页
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFC... 为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 展开更多
关键词 说话人识别 梅尔频率谱系 翻转梅尔频率谱系 FISHER准则 高斯混合模型
在线阅读 下载PDF
基于Mel频率倒谱系数和遗传算法的煤矸界面识别研究 被引量:6
7
作者 何爱香 王平建 +1 位作者 魏广芬 张守祥 《工矿自动化》 北大核心 2013年第2期66-71,共6页
针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放... 针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放落过程中产生的声波信号的特征差异进行煤矸识别,采用Mel频率倒谱系数将去噪后的煤矸声波信号变换到频域进行处理,提取出煤矸声波信号的32维特征参数;采用遗传算法优化处理32维特征参数,得到最优参数组合;采用支持向量机和BP神经网络对最优参数进行识别。实验结果表明,该方法能够准确识别出煤矸下落状态。 展开更多
关键词 放顶煤开采 煤矸界面识别 MEL频率谱系 MFCC 遗传算法 支持向量机 BP神经网络
在线阅读 下载PDF
基于梅尔频率倒谱系数与动态时间规整的安卓声纹解锁系统 被引量:11
8
作者 陈锦飞 徐欣 《计算机工程》 CAS CSCD 北大核心 2017年第2期201-205,共5页
安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关... 安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关的声纹模式匹配,并结合安卓NDK技术实现快速声纹识别。实验结果表明,该系统具有较高的解锁成功率和较快的解锁速度,相比数字或图形解锁,声纹解锁安全性更高,用户体验更好。 展开更多
关键词 梅尔频率谱系 动态时间规整 声纹识别 安卓系统 声纹解锁
在线阅读 下载PDF
基于改进小波包去噪与梅尔倒谱系数的低信噪比交通环境声音识别 被引量:14
9
作者 王若平 李仁仁 +2 位作者 陈达亮 王东 房宇 《科学技术与工程》 北大核心 2019年第36期290-295,共6页
随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提... 随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提取;采用支持向量机(SVM)识别模型完成低信噪比交通环境声音识别。实验结果表明,本文提取的去噪方法提高声音事件信噪比的同时保持声音特征,且对噪声有自适应性;改进的MFCC提取方法一定程度上提高了特征参数的抗噪性能。通过对低信噪比交通环境声音去噪和特征参数优化后,其平均识别率比优化前提高了33.34%,并改变了识别率骤降的趋势。 展开更多
关键词 交通环境声音事件 小波包去噪 经验模态分解 梅尔频率谱系 支持向量机
在线阅读 下载PDF
基于翻转梅尔频率倒谱系数的语音变调检测方法 被引量:2
10
作者 林晓丹 邱应强 《计算机应用》 CSCD 北大核心 2019年第12期3510-3514,共5页
语音变调常用于掩盖说话人身份,各种变声软件的出现使得说话人身份伪装变得更加容易。针对现有变调语音检测方法无法判断语音是经过了何种变调操作(升调或降调)的问题,通过分析语音变调在信号频谱,尤其是高频区域留下的痕迹,提出了基于... 语音变调常用于掩盖说话人身份,各种变声软件的出现使得说话人身份伪装变得更加容易。针对现有变调语音检测方法无法判断语音是经过了何种变调操作(升调或降调)的问题,通过分析语音变调在信号频谱,尤其是高频区域留下的痕迹,提出了基于翻转梅尔倒谱系数(IMFCC)统计矩特征的电子变调语音检测方法。首先,提取各语音帧IMFCC及其一阶差分;然后,计算其统计均值;最后,在该统计特征上利用支持向量机(SVM)多分类器的设计来区分原始语音、升调语音和降调语音。在TIMIT和NIST语音集上的实验结果表明,所提方法无论对于原始语音、升调语音还是降调语音都具有良好的检测性能。与MFCC作为特征构造的基线系统相比,所设计的特征的方法明显提高了变调操作的识别率。在较少的训练资源的情况下,所提方法也获得了比基于卷积神经网络(CNN)的框架更好的性能;此外,在不同数据集和不同变调方法上也都取得了较好的泛化性能。 展开更多
关键词 语音变调 翻转梅尔频率 谱系 统计矩 多分类
在线阅读 下载PDF
基于梅尔频率倒谱系数和支持向量机的汽车鸣喇叭声识别 被引量:9
11
作者 陈东 黄智鹏 《科学技术与工程》 北大核心 2021年第11期4486-4491,共6页
使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键。为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭... 使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键。为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭声和交通噪声的二分类器,针对汽车喇叭声的谐波特征分布特点,提取其梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为特征向量,并分析MFCC的梅尔滤波器个数及特征维数对识别效果的影响。实验结果表明,通过增加MFCC特征中梅尔滤波器个数及特征维数可以改善识别效果,信噪比越低越明显。 展开更多
关键词 汽车鸣喇叭声识别 梅尔频率谱系 支持向量机 特征识别
在线阅读 下载PDF
基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测 被引量:11
12
作者 柏顺 颜夕宏 +2 位作者 张生平 陈建飞 张胜 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2021年第2期117-120,共4页
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相... 低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%. 展开更多
关键词 语音端点检测 梅尔频率谱系 短时能量 模糊C均值聚类 低信噪比
在线阅读 下载PDF
Mel频率倒谱系数平滑的耳机均衡 被引量:1
13
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函 MEL频率谱系 平滑 均衡 耳机声重放
在线阅读 下载PDF
基于短时能量和梅尔频率倒谱系数的球磨机工况识别 被引量:3
14
作者 田原 刘琼 《烧结球团》 北大核心 2020年第3期39-43,共5页
针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识别球磨机工作状况的这一问题,提出了1种将时域的短时能量与频域的梅尔频率倒谱系数相组合作为新的磨音信... 针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识别球磨机工作状况的这一问题,提出了1种将时域的短时能量与频域的梅尔频率倒谱系数相组合作为新的磨音信号的特征提取方法。首先,通过分析在不同工作状况下球磨机磨音信号在时频域中表现的特性,提出通过扩展特征参数来改善反映信号特征,并设计相应的时频域组合来提取特征;最后将该方法运用到分类识别隐马尔可夫模型中,并建立球磨机工况识别系统。实验表明,采用该组合的特征提取方法的识别率相对于单个的时域短时能量和频域梅尔频率倒谱系数要高,可以有效地提升球磨机工况系统的识别性能。 展开更多
关键词 球磨机磨音 特征提取 短时能量 梅尔频率谱系 隐马尔可夫模型
在线阅读 下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:18
15
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带谱减法 抗噪幂归一化谱系 MEL频率谱系
在线阅读 下载PDF
基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法 被引量:4
16
作者 王天锐 鲍骞月 秦品乐 《计算机应用》 CSCD 北大核心 2019年第12期3515-3521,共7页
针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加... 针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加窗、离散傅里叶变换、梅尔滤波器转换、离散余弦映射等方法建立梅尔倒谱系数特征模型;然后,将特征模型输入卷积深度网络进行第二次特征提取;最后,借鉴强化学习思想,用Bagging集成算法集成线性判别分析器、支持向量机(SVM)、Softmax回归、XGBoost四个模型,以投票预测的形式对网络输出结果进行预测。实验结果表明,所提方法能够有效提高对环境音的特征提取能力和深层网络在环境音分类上的抗过拟合能力。 展开更多
关键词 环境音分类 梅尔频率谱系 Bagging集成算法 特征提取 深度学习
在线阅读 下载PDF
基于改进GFCC特征参数的广播音频语种识别 被引量:1
17
作者 邵玉斌 陈亮 +1 位作者 龙华 杜庆治 《吉林大学学报(理学版)》 CAS 北大核心 2022年第2期417-424,共8页
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦... 针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法. 展开更多
关键词 广播音频语种识别 能量谱包络 谱提升 改进伽马频率倒谱系数
在线阅读 下载PDF
基于持续元音多波段倒谱特征的儿童声带小结检测
18
作者 雷简菡 刘阳 +1 位作者 刘伯权 刘恒鑫 《听力学及言语疾病杂志》 北大核心 2025年第4期307-311,共5页
目的提出一种检测儿童声带小结的有效的嗓音声学客观评估方法。方法对48例儿童声带小结患者及40例嗓音正常儿童的持续元音/a/进行多波段倒谱分析,提取各波段的13个梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)(MFCC1~MF... 目的提出一种检测儿童声带小结的有效的嗓音声学客观评估方法。方法对48例儿童声带小结患者及40例嗓音正常儿童的持续元音/a/进行多波段倒谱分析,提取各波段的13个梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)(MFCC1~MFCC13)、5个倒谱峰值[即第一个和第二个倒谱峰值之间的幅度差(difference in amplitude of peaks,DAP)、循环频率差(difference in quefrency of peaks,DQP)、峰值能量(energy of peak,EP)EP1和EP2、峰值之间的倒谱能量(energy between cepstral peaks,EEP)]及6种倒谱距离(D 1~D 6)作为子带特征,通过独立样本t检验对两组声学特征参数进行差异比较,并将具有统计学意义的指标进行受试者工作特征(receiver operating characteristic,ROC)曲线分析。结果声带小结儿童组中的MFCC2、MFCC3、MFCC5、MFCC11、MFCC12、DQP、EP1、EP2特征值均显著高于正常儿童组(P<0.05或P<0.001),MFCC1、MFCC6、MFCC8、MFCC13、EEP均显著低于正常儿童组(P<0.05)。这些特征的ROC曲线分析显示,MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、MFCC13、DQP、EP1、EP2、EEP特征联合检测的ROC曲线下面积为0.98,MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、DQP、EP2参数单独的ROC曲线下面积均大于0.7,均有一定的准确性。其中,MFCC2与MFCC3的ROC曲线下面积分别为0.85、0.87,表明它们对声带小结儿童的嗓音片段具有较高的诊断价值。结论基于持续元音多波段倒谱特征的特定声学参数组合,包括梅尔频率倒谱系数(MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、MFCC13)和倒谱峰值(DQP、EP1、EP2、EEP),展现出较高的敏感性和特异性,尤其是MFCC2和MFCC3,在儿童声带小结相关嗓音障碍的检测中表现出优异的诊断能力。 展开更多
关键词 声带小结 儿童语音障碍 声学特征 梅尔频率谱系
在线阅读 下载PDF
基于改进迁移学习的煤矿井下设备音频信号故障诊断方法
19
作者 邱吉尔 王琪 王鹏 《工矿自动化》 北大核心 2025年第2期91-99,共9页
煤矿井下生产运行环境恶劣,其关键设备如瓦斯泵、通风机、采煤机等长期处于启动状态,易产生缺陷性故障。目前端到端音频数据故障诊断方法的模型训练与更新高度依赖于数据标注,尽管可以获取海量原始数据,但这些数据通常未经标注,难以直... 煤矿井下生产运行环境恶劣,其关键设备如瓦斯泵、通风机、采煤机等长期处于启动状态,易产生缺陷性故障。目前端到端音频数据故障诊断方法的模型训练与更新高度依赖于数据标注,尽管可以获取海量原始数据,但这些数据通常未经标注,难以直接用于模型训练,设备运行工况的突变和设备重组等因素可能导致数据分布发生变化,从而引起模型性能下降。针对上述问题,提出了一种基于改进迁移学习的煤矿井下设备音频信号故障诊断方法。首先,对煤矿设备音频信号进行梅尔频率倒谱系数(MFCC)特征提取,捕捉设备运行状态中的关键信息,得到故障特征二维系数图。然后,构建基于改进迁移学习的故障诊断网络模型,以改进最大均值差异,即多核联合最大均值差异作为度量标准,借助伪标签计算联合分布距离,将标签信息通过多重线性映射进行特征匹配,以减少数据分布差异,实现边缘分布和条件分布同时对齐。实验结果表明:所提方法在无标签条件下能够实现高精度的故障诊断,准确率达到96.99%,标准差为0.014;在模型抗噪性能实验中,基于改进迁移学习的故障诊断模型在低信噪比(如10 dB)条件下仍能保持80%的故障诊断准确率,展现出较强的抗噪鲁棒性。 展开更多
关键词 煤矿井下设备 音频信号 故障诊断 迁移学习 梅尔频率谱系 MFCC 最大均值差异 多核联合最大均值差异 源域 目标域
在线阅读 下载PDF
基于小波子带分解的特征参数对语音自动切分的改进 被引量:2
20
作者 秦欢 柴佩琪 陈锴 《计算机应用》 CSCD 北大核心 2005年第6期1345-1346,共2页
采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切... 采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切分效果。 展开更多
关键词 隐马尔可夫模型 语音自动切分 MEL频率谱系 小波子带分解
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部