期刊文献+
共找到95篇文章
< 1 2 5 >
每页显示 20 50 100
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
1
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
基于脉搏波频域梅尔频率倒谱系数特征的高血压危险分层预测模型 被引量:3
2
作者 齐晨浩 杨晶东 +2 位作者 邱泽浩 尧明慧 燕海霞 《海军军医大学学报》 CAS CSCD 北大核心 2024年第10期1226-1240,共15页
目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transf... 目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transformer 结构提取脉搏波深层特征,并将自注意力机制与选择性内核注意力进行决策融合,提取脉搏波关联特征,并采用Floodings正则化方法间接控制训练损失,防止过拟合发生。针对上海中医药大学附属龙华医院及上海市中西医结合医院提供的527例临床脉诊数据,进行5折交叉验证实验。此外,采用梯度提升决策树算法统计脉搏波频域特征的贡献率排名,分析影响模型分类精度的关键因素,为中医临床辅助诊断提供参考价值。结果 本研究提出的模型分类评估指标准确度、F1值、精确率、召回率和AUC值分别为0.939 6、0.924 9、0.940 9、0.929 5和0.993 4。脉搏波的静态特征、一阶差分和二阶差分系数的贡献率相对均衡,说明高血压危险程度不仅与脉搏波的静态特征相关,也应当考虑脉搏波的动态特征。结论 与典型脉搏波分类模型相比,本研究提出的模型具有较高的分类精度和泛化性能。 展开更多
关键词 高血压 危险分层 梅尔频率倒谱系数 时间卷积网络 TRANSFORMER
在线阅读 下载PDF
基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法 被引量:23
3
作者 胡峰松 张璇 《计算机应用》 CSCD 北大核心 2012年第9期2542-2544,共3页
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFC... 为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 展开更多
关键词 说话人识别 梅尔频率倒谱系数 翻转梅尔频率倒谱系数 FISHER准则 高斯混合模型
在线阅读 下载PDF
基于梅尔频率倒谱系数与动态时间规整的安卓声纹解锁系统 被引量:11
4
作者 陈锦飞 徐欣 《计算机工程》 CAS CSCD 北大核心 2017年第2期201-205,共5页
安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关... 安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关的声纹模式匹配,并结合安卓NDK技术实现快速声纹识别。实验结果表明,该系统具有较高的解锁成功率和较快的解锁速度,相比数字或图形解锁,声纹解锁安全性更高,用户体验更好。 展开更多
关键词 梅尔频率倒谱系数 动态时间规整 声纹识别 安卓系统 声纹解锁
在线阅读 下载PDF
基于梅尔频率倒谱系数和支持向量机的汽车鸣喇叭声识别 被引量:9
5
作者 陈东 黄智鹏 《科学技术与工程》 北大核心 2021年第11期4486-4491,共6页
使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键。为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭... 使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键。为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭声和交通噪声的二分类器,针对汽车喇叭声的谐波特征分布特点,提取其梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为特征向量,并分析MFCC的梅尔滤波器个数及特征维数对识别效果的影响。实验结果表明,通过增加MFCC特征中梅尔滤波器个数及特征维数可以改善识别效果,信噪比越低越明显。 展开更多
关键词 汽车鸣喇叭声识别 梅尔频率倒谱系数 支持向量机 特征识别
在线阅读 下载PDF
基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测 被引量:11
6
作者 柏顺 颜夕宏 +2 位作者 张生平 陈建飞 张胜 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2021年第2期117-120,共4页
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相... 低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%. 展开更多
关键词 语音端点检测 梅尔频率倒谱系数 短时能量 模糊C均值聚类 低信噪比
在线阅读 下载PDF
基于短时能量和梅尔频率倒谱系数的球磨机工况识别 被引量:3
7
作者 田原 刘琼 《烧结球团》 北大核心 2020年第3期39-43,共5页
针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识别球磨机工作状况的这一问题,提出了1种将时域的短时能量与频域的梅尔频率倒谱系数相组合作为新的磨音信... 针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识别球磨机工作状况的这一问题,提出了1种将时域的短时能量与频域的梅尔频率倒谱系数相组合作为新的磨音信号的特征提取方法。首先,通过分析在不同工作状况下球磨机磨音信号在时频域中表现的特性,提出通过扩展特征参数来改善反映信号特征,并设计相应的时频域组合来提取特征;最后将该方法运用到分类识别隐马尔可夫模型中,并建立球磨机工况识别系统。实验表明,采用该组合的特征提取方法的识别率相对于单个的时域短时能量和频域梅尔频率倒谱系数要高,可以有效地提升球磨机工况系统的识别性能。 展开更多
关键词 球磨机磨音 特征提取 短时能量 梅尔频率倒谱系数 隐马尔可夫模型
在线阅读 下载PDF
基于梅尔倒谱系数的无人机探测与识别方法
8
作者 聂伟 张中洋 +1 位作者 杨小龙 周牧 《电子与信息学报》 北大核心 2025年第4期1076-1084,共9页
近年来无人机(UAV)数量的剧增,无论是在民用还是军用领域都带来了一定的隐私和安全问题,因此对无人机的管控技术已成为研究热点。当前基于深度学习的射频指纹识别(RFFI)技术虽然在无人机识别上表现优异,但由于模型复杂度高,训练速度慢,... 近年来无人机(UAV)数量的剧增,无论是在民用还是军用领域都带来了一定的隐私和安全问题,因此对无人机的管控技术已成为研究热点。当前基于深度学习的射频指纹识别(RFFI)技术虽然在无人机识别上表现优异,但由于模型复杂度高,训练速度慢,且在不同数据分布下的泛化能力有限,因此在实际应用中存在局限性。该文提出一种基于梅尔频率倒谱系数的无人机识别方法,使用USRP N210采集无人机图传信号,然后提取梅尔倒谱系数(MFCC)作为无人机射频指纹特征,输入门控循环单元(GRU)进行分类识别,最后通过正则化正交匹配追踪算法(ROMP)估计无人机定位参数得到无人机具体位置。试验结果表明无人机的识别准确率可达98%,且GRU模型参数量只有1.6 k,训练时间仅需9 s,显著降低了模型复杂度并提高了训练速度和识别精度,在无人机定位中,其3维定位误差小于1 m。为进一步验证该文所提方法的可行性,对同一厂家同一型号10个无线模块进行不同距离的分类识别,1 m,2 m,3 m和5 m识别结果分别为100%,98%,98%和99%。 展开更多
关键词 无人机 射频指纹识别 深度学习 门控循环单元 梅尔频率倒谱系数
在线阅读 下载PDF
说话人识别中的Mel特征频率倒谱系数 被引量:13
9
作者 曹辉 徐晨 +1 位作者 赵晓 吴胜举 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第2期203-208,共6页
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向... 目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。 展开更多
关键词 说话人识别 语音特征参 梅尔频率倒谱系数 支持向量机 平均影响值
在线阅读 下载PDF
基于改进小波包去噪与梅尔倒谱系数的低信噪比交通环境声音识别 被引量:14
10
作者 王若平 李仁仁 +2 位作者 陈达亮 王东 房宇 《科学技术与工程》 北大核心 2019年第36期290-295,共6页
随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提... 随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提取;采用支持向量机(SVM)识别模型完成低信噪比交通环境声音识别。实验结果表明,本文提取的去噪方法提高声音事件信噪比的同时保持声音特征,且对噪声有自适应性;改进的MFCC提取方法一定程度上提高了特征参数的抗噪性能。通过对低信噪比交通环境声音去噪和特征参数优化后,其平均识别率比优化前提高了33.34%,并改变了识别率骤降的趋势。 展开更多
关键词 交通环境声音事件 小波包去噪 经验模态分解 梅尔频率倒谱系数 支持向量机
在线阅读 下载PDF
基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法 被引量:4
11
作者 王天锐 鲍骞月 秦品乐 《计算机应用》 CSCD 北大核心 2019年第12期3515-3521,共7页
针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加... 针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加窗、离散傅里叶变换、梅尔滤波器转换、离散余弦映射等方法建立梅尔倒谱系数特征模型;然后,将特征模型输入卷积深度网络进行第二次特征提取;最后,借鉴强化学习思想,用Bagging集成算法集成线性判别分析器、支持向量机(SVM)、Softmax回归、XGBoost四个模型,以投票预测的形式对网络输出结果进行预测。实验结果表明,所提方法能够有效提高对环境音的特征提取能力和深层网络在环境音分类上的抗过拟合能力。 展开更多
关键词 环境音分类 梅尔频率倒谱系数 Bagging集成算法 特征提取 深度学习
在线阅读 下载PDF
基于持续元音多波段倒谱特征的儿童声带小结检测
12
作者 雷简菡 刘阳 +1 位作者 刘伯权 刘恒鑫 《听力学及言语疾病杂志》 北大核心 2025年第4期307-311,共5页
目的提出一种检测儿童声带小结的有效的嗓音声学客观评估方法。方法对48例儿童声带小结患者及40例嗓音正常儿童的持续元音/a/进行多波段倒谱分析,提取各波段的13个梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)(MFCC1~MF... 目的提出一种检测儿童声带小结的有效的嗓音声学客观评估方法。方法对48例儿童声带小结患者及40例嗓音正常儿童的持续元音/a/进行多波段倒谱分析,提取各波段的13个梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)(MFCC1~MFCC13)、5个倒谱峰值[即第一个和第二个倒谱峰值之间的幅度差(difference in amplitude of peaks,DAP)、循环频率差(difference in quefrency of peaks,DQP)、峰值能量(energy of peak,EP)EP1和EP2、峰值之间的倒谱能量(energy between cepstral peaks,EEP)]及6种倒谱距离(D 1~D 6)作为子带特征,通过独立样本t检验对两组声学特征参数进行差异比较,并将具有统计学意义的指标进行受试者工作特征(receiver operating characteristic,ROC)曲线分析。结果声带小结儿童组中的MFCC2、MFCC3、MFCC5、MFCC11、MFCC12、DQP、EP1、EP2特征值均显著高于正常儿童组(P<0.05或P<0.001),MFCC1、MFCC6、MFCC8、MFCC13、EEP均显著低于正常儿童组(P<0.05)。这些特征的ROC曲线分析显示,MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、MFCC13、DQP、EP1、EP2、EEP特征联合检测的ROC曲线下面积为0.98,MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、DQP、EP2参数单独的ROC曲线下面积均大于0.7,均有一定的准确性。其中,MFCC2与MFCC3的ROC曲线下面积分别为0.85、0.87,表明它们对声带小结儿童的嗓音片段具有较高的诊断价值。结论基于持续元音多波段倒谱特征的特定声学参数组合,包括梅尔频率倒谱系数(MFCC1、MFCC2、MFCC3、MFCC5、MFCC6、MFCC8、MFCC11、MFCC12、MFCC13)和倒谱峰值(DQP、EP1、EP2、EEP),展现出较高的敏感性和特异性,尤其是MFCC2和MFCC3,在儿童声带小结相关嗓音障碍的检测中表现出优异的诊断能力。 展开更多
关键词 声带小结 儿童语音障碍 声学特征 梅尔频率倒谱系数
在线阅读 下载PDF
带式输送机关键音频数据识别研究 被引量:2
13
作者 吴启航 李军霞 +2 位作者 刘少伟 秦志祥 张伟 《煤炭工程》 北大核心 2024年第5期145-151,共7页
针对带式输送机音频数据中存在大量冗余的问题,提出了一种基于改进蜜獾算法(IHBA)优化支持向量机(SVM)的带式输送机关键音频数据识别方法。提取音频数据的梅尔频率倒谱系数作为特征;采用Tent混沌映射增加种群多样性,引入新的密度因子和... 针对带式输送机音频数据中存在大量冗余的问题,提出了一种基于改进蜜獾算法(IHBA)优化支持向量机(SVM)的带式输送机关键音频数据识别方法。提取音频数据的梅尔频率倒谱系数作为特征;采用Tent混沌映射增加种群多样性,引入新的密度因子和黄金正弦机制来克服蜜獾算法(HBA)易陷入局部最优、收敛速度慢及寻优精度低等缺陷,并通过标准测试函数的仿真实验,验证了IHBA性能。采用IHBA优化SVM的参数,将梅尔频率倒谱系数特征输入IHBA-SVM模型中进行识别。结果表明,IHBA-SVM模型能够有效提高带式输送机关键音频数据的识别率。 展开更多
关键词 带式输送机 音频 梅尔频率倒谱系数 改进蜜獾算法 支持向量机
在线阅读 下载PDF
基于MPDCNN的强噪声环境下船舶电力推进器齿轮箱故障诊断方法
14
作者 尚前明 蒋婉莹 +2 位作者 周毅 王正强 孙钰波 《中国舰船研究》 北大核心 2025年第2期30-38,共9页
[目的]针对旋转机械在实际工作中因噪声干扰而导致的故障诊断性能下降问题,为提高振动信号的故障特征提取质量和故障诊断能力,提出基于Mel-frequency倒谱系数(MFCC)的并行双通道卷积神经网络(PDCNN)故障诊断方法。[方法]利用MFCC提取含... [目的]针对旋转机械在实际工作中因噪声干扰而导致的故障诊断性能下降问题,为提高振动信号的故障特征提取质量和故障诊断能力,提出基于Mel-frequency倒谱系数(MFCC)的并行双通道卷积神经网络(PDCNN)故障诊断方法。[方法]利用MFCC提取含噪声的振动信号特征,同时设计一种新型并行双通道卷积神经网络结构,并利用该网络进一步挖掘数据的全局特征及更深层次的微小特征,从而提高该方法在强噪声环境下的诊断性能。[结果]不同噪声环境下的实验评估结果表明,该方法在强噪声环境下的故障诊断精度高于98%,其抗噪性能和诊断性能均明显优于其他传统方法。[结论]研究成果可为强噪声环境下的齿轮箱故障诊断提供参考。 展开更多
关键词 船舶电力推进 齿轮箱 故障分析 故障诊断 特征提取 梅尔频率倒谱系数 卷积神经网络
在线阅读 下载PDF
基于双向长短时记忆网络和自注意力机制的心音分类
15
作者 卢官明 李齐健 +4 位作者 卢峻禾 戚继荣 赵宇航 王洋 魏金生 《数据采集与处理》 北大核心 2025年第2期456-468,共13页
心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进... 心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进行分帧处理,提取每帧心音信号的梅尔频率倒谱系数(Mel⁃frequency cepstral coefficients,MFCC)特征;将MFCC特征序列输入Bi⁃LSTM网络,利用Bi⁃LSTM网络提取心音信号的时域上下文特征;通过自注意力机制动态调整Bi⁃LSTM网络各时间步输出特征的权重,得到有利于分类的更具鉴别性的心音特征;通过Softmax分类器实现正常/异常心音的分类。在PhysioNet/CinC Challenge 2016心音数据集上对所提出的算法使用10折交叉验证法进行了评估,得到0.9425的灵敏度、0.9437的特异度、0.8367的精度、0.8865的F1得分和0.9434的准确率,优于对比的典型算法。实验结果表明,该算法在无需进行心音分段的基础上就能有效实现异常心音检测,具有潜在的临床应用前景。 展开更多
关键词 心音分类 梅尔频率倒谱系数 双向长短时记忆网络 自注意力机制
在线阅读 下载PDF
基于语音信号时频特征融合的帕金森病检测方法 被引量:1
16
作者 王晨哲 季薇 +1 位作者 郑慧芬 李云 《郑州大学学报(理学版)》 CAS 北大核心 2025年第1期53-60,共8页
发音障碍是帕金森病的早期症状之一。近年来,基于语音信号的帕金森病检测的研究大多采用梅尔刻度下的相关语音特征与深度神经网络模型相结合的方法。然而,现有的模型无法充分关注语音信号的全局时序信息,且梅尔刻度特征在准确表征帕金... 发音障碍是帕金森病的早期症状之一。近年来,基于语音信号的帕金森病检测的研究大多采用梅尔刻度下的相关语音特征与深度神经网络模型相结合的方法。然而,现有的模型无法充分关注语音信号的全局时序信息,且梅尔刻度特征在准确表征帕金森病的病理信息方面效果有限。为此,提出了一种基于语音时频特征融合的帕金森病检测方法。首先,提取语音的梅尔频率倒谱系数,并将其作为模型的输入。接着,在已有的S-vectors模型中引入Conformer编码器模块,以提取语音的时域全局特征。最后,将与帕金森病语音检测相关的频域全局特征嵌入时域特征中进行时频信息融合,以实现帕金森病语音检测。在公开帕金森病语音数据集和自采语音数据集上验证了方法的有效性。 展开更多
关键词 帕金森病 梅尔频率倒谱系数 S-vectors CONFORMER 时频特征融合
在线阅读 下载PDF
羊咳嗽声的特征参数提取与识别方法 被引量:25
17
作者 宣传忠 武佩 +3 位作者 张丽娜 马彦华 张永安 邬娟 《农业机械学报》 EI CAS CSCD 北大核心 2016年第3期342-348,共7页
为在设施圈养羊只产生呼吸道疾病的初期,通过监测其咳嗽声进行疾病预警和健康状况诊断,以内蒙古地区广泛推广的杜泊羊为例,对杜泊羊的咳嗽声信号进行自动采集和计算机识别,在不增加羊咳嗽声特征参数维数的前提下,提出一种改进的梅尔频... 为在设施圈养羊只产生呼吸道疾病的初期,通过监测其咳嗽声进行疾病预警和健康状况诊断,以内蒙古地区广泛推广的杜泊羊为例,对杜泊羊的咳嗽声信号进行自动采集和计算机识别,在不增加羊咳嗽声特征参数维数的前提下,提出一种改进的梅尔频率倒谱系数(MFCC),试验结果表明,该参数和短时能量、过零率组合的14维特征参数,经过羊咳嗽声隐马尔可夫模型(HMM)识别系统,其识别率、误识别率和总识别率分别达到了86.23%、7.17%和88.43%,该组合特征参数经主成分分析可降到9维,而通过BP神经网络改善的HMM咳嗽声识别系统,对咳嗽声的识别率、误识别率和总识别率分别达到了92.54%、5.37%和95.04%,满足了杜泊羊咳嗽声识别的要求。 展开更多
关键词 杜泊羊 咳嗽声 特征参提取 梅尔频率倒谱系数 隐马尔可夫模型
在线阅读 下载PDF
MFCC中的基音频率信息对说话人识别系统性能的影响 被引量:11
18
作者 陆伟 戴蓓蒨 +1 位作者 李辉 刘青松 《中国科学技术大学学报》 CAS CSCD 北大核心 2009年第8期859-863,884,共6页
目前对MFCC的应用与研究,一般忽略了基音频率对MFCC的影响.分析发现,基音频率会影响MFCC对声道特性的准确描述,进而影响说话人识别系统的性能;由此提出了一种基于平滑幅度谱的SMFCC(smoothing MFCC),在YOHO说话人识别数据库上的实验表明... 目前对MFCC的应用与研究,一般忽略了基音频率对MFCC的影响.分析发现,基音频率会影响MFCC对声道特性的准确描述,进而影响说话人识别系统的性能;由此提出了一种基于平滑幅度谱的SMFCC(smoothing MFCC),在YOHO说话人识别数据库上的实验表明,SMFCC性能在整体上优于MFCC,而在女性说话人数据集上性能提高尤其明显,并且具有更好的时间鲁棒性. 展开更多
关键词 说话人识别 梅尔频率倒谱系数 基音频率 谱包络
在线阅读 下载PDF
基于音频的高分辨率人脸画像方法
19
作者 秦昊铭 卜凡亮 钟方昊 《科学技术与工程》 北大核心 2025年第13期5515-5526,共12页
现有的语音驱动人脸生成方法在特征提取与生成质量上仍面临挑战,且尚未充分挖掘音频与人脸特征之间的深层关联。为解决这些问题,提出一种结合梅尔频率倒谱系数(Mel frequency cepstral coefficients, MFCC)音频特征提取与第二代样式生... 现有的语音驱动人脸生成方法在特征提取与生成质量上仍面临挑战,且尚未充分挖掘音频与人脸特征之间的深层关联。为解决这些问题,提出一种结合梅尔频率倒谱系数(Mel frequency cepstral coefficients, MFCC)音频特征提取与第二代样式生成对抗网络(style generative adversarial net-works 2,StyleGAN2)图像生成技术的研究方法。在音频处理方面,采用了梅尔频率倒谱系数作为特征提取方法。为了更有效地从音频中提取和传递特征,设计了一种基于ResNet18的残差模块,并融入了SE(squeeze-and-excitation)注意力机制。同时对原残差块中的激活函数进行了优化改进,采用Mish激活函数,旨在减少深层网络中的梯度消失问题,保持特征信息的完整性并提高模型的准确性和泛化能力。采取StyleGAN2模型作为人脸图像的生成模型。实验结果表明,结合了设计的音频处理网络和StyleGAN2的人脸生成模型,在语音驱动的人脸生成任务中展现出了卓越的性能。通过综合评估Fréchet起始距离(Fréchet inception distance, FID)和路径长度等指标,本文方法在语音驱动的人脸生成任务中相较于现有方法,在生成质量上有显著提升,充分证明了所提方法的有效性和优越性。 展开更多
关键词 语音生成人脸 梅尔频率倒谱系数 样式生成对抗网络 注意力机制
在线阅读 下载PDF
融合韵律与动态倒谱特征的语音疲劳度检测 被引量:3
20
作者 吴礼福 徐行 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期709-714,共6页
通过语音实现疲劳度检测具有操作简单、无创伤和实时性等优点.为了提高语音疲劳度检测的性能,将韵律特征与动态倒谱特征相融合,采用高斯混合模型作为分类器进行语音疲劳度检测.分别考察了梅尔频率倒谱系数、滑动差分倒谱特征以及韵律特... 通过语音实现疲劳度检测具有操作简单、无创伤和实时性等优点.为了提高语音疲劳度检测的性能,将韵律特征与动态倒谱特征相融合,采用高斯混合模型作为分类器进行语音疲劳度检测.分别考察了梅尔频率倒谱系数、滑动差分倒谱特征以及韵律特征的检测性能.实验结果表明,在单特征时,梅尔频率倒谱系数比滑动差分倒谱特征和韵律特征的检测性能好,对于融合特征,检测性能均比单特征好,将三个特征融合后,检测正确率可达91%. 展开更多
关键词 疲劳度 梅尔频率倒谱系数 滑动差分 高斯混合模型
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部