期刊文献+
共找到245篇文章
< 1 2 13 >
每页显示 20 50 100
基于改进EfficientNet的煤矸音频分类方法
1
作者 宋庆军 焦守悦 +2 位作者 姜海燕 宋庆辉 郝文超 《工矿自动化》 北大核心 2025年第1期138-144,共7页
针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特... 针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特征。选择EfficientNet-B0作为骨干网络,并对其进行以下改进:将原有的多尺度通道注意力模块换成卷积块注意力模块,得到卷积注意力特征融合(CAFF)模块,通过网络自学习为不同空间位置的特征分配不同的权重信息,生成新的有效特征;在原有的MBConv模块中并行嵌入频域通道注意力(FCA)模块,加强特征图的表达能力,从而提高整个网络的性能。实验结果表明:引入CAFF模块后,模型准确率提升了0.61%,F1得分提升了0.52%,且模型收敛更快,说明CAFF模块有效提升了模型对频谱特征的捕捉能力;引入FCA模块后,准确率提升了0.45%,F1得分提升了0.62%,说明模块的叠加可以进一步提高模型的泛化能力和处理复杂特征的能力;改进EfficientNe模型的准确率为91.90%,标准差为0.108,显著优于同类对比音频分类模型。 展开更多
关键词 综放开采 煤矸识别 音频特征提取 EfficientNet Mel频谱特征 Gammatone倒谱系数 注意力机制
在线阅读 下载PDF
基于声音信号的转辙机故障诊断研究
2
作者 梁续继 戴胜华 《铁道标准设计》 北大核心 2025年第2期183-190,共8页
铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会... 铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会影响声音信号的常见机械故障。然后,根据声音诊断在特征提取方面的不同路线,采用3种技术方案。端到端方案通过wav2vec2.0语音识别框架直接进行训练和识别;特征矩阵方案提取声音信号的梅尔倒谱系数(MFCC),通过主成分分析(PCA)得到固定尺寸的特征矩阵,由多分类支持向量机(SVM)进行故障分类;声音图像化方案生成声音信号的语谱图,同时建立卷积神经网络VGG16的轻量化改进模型,将语谱图输入至该模型中进行训练和识别。实验结果表明,3种技术方案均能有效地对包括正常工作和6种故障类型的7种工作状态实现诊断,准确率分别为99.8%、94.2%和96.6%。验证了基于声音进行转辙机故障诊断的3种技术方案的可行性,并体现了语音领域技术在转辙机故障诊断中的应用价值。 展开更多
关键词 转辙机 故障诊断 声音信号 特征提取 wav2vec2.0 MFCC 语谱图
在线阅读 下载PDF
基于微震信号深度特征学习的岩石破裂类型识别
3
作者 李典泽 许华杰 张勃 《工矿自动化》 北大核心 2025年第3期156-164,共9页
岩石破裂类型识别是实现煤矿冲击地压灾害预测和预警的重要前提。微震是岩石破裂监测的有效手段之一,但常规的微震信号机器学习方法存在特征提取能力有限,以及受噪声影响导致的准确率不高且泛化性较差等问题。针对上述问题,提出了一种... 岩石破裂类型识别是实现煤矿冲击地压灾害预测和预警的重要前提。微震是岩石破裂监测的有效手段之一,但常规的微震信号机器学习方法存在特征提取能力有限,以及受噪声影响导致的准确率不高且泛化性较差等问题。针对上述问题,提出了一种基于微震信号深度特征学习的岩石破裂类型识别方法。首先,通过巴西圆盘劈裂试验和直剪试验分别获取张拉型破裂微震信号和剪切型破裂微震信号,并将其时频谱图、Log-Mel频谱图和梅尔频率倒谱系数合并构造微震信号聚合(MSA)声谱图;然后,通过加入多特征并行密集连接块(MP-DenseBlock)和压缩与激发过渡层(SE-TransLayer)的改进DenseNet(SE-MPDenseNet)对MSA声谱图进行深度特征提取;最后,将提取的特征向量输入至添加Hinge Loss损失函数的改进LightGBM(HBL-LightGBM)进行分类,识别岩石破裂类型。通过真三轴加载试验模拟接近地下工程实际环境中的冲击地压灾害,结果表明,所提方法对于岩石破裂类型识别的准确率达92.12%,且具有较强的特征提取能力和泛化能力。 展开更多
关键词 岩石破裂类型 微震监测 深度学习 机器学习 声谱图
在线阅读 下载PDF
基于蝙蝠谱相关及变换模型的雷达目标超分辨方法研究
4
作者 王博弘 申彪 +1 位作者 穆文星 刘涛 《雷达学报(中英文)》 北大核心 2025年第2期293-308,共16页
传统雷达分辨能力主要利用模糊函数来进行分析,其极限分辨力一般用瑞利限表征。自然界中蝙蝠具有相当敏锐的听觉系统,学者提出谱相关及变换(SCAT)模型对蝙蝠听觉系统建模,探索了蝙蝠的超分辨原理,为突破雷达目标常规(瑞利)分辨力提供了... 传统雷达分辨能力主要利用模糊函数来进行分析,其极限分辨力一般用瑞利限表征。自然界中蝙蝠具有相当敏锐的听觉系统,学者提出谱相关及变换(SCAT)模型对蝙蝠听觉系统建模,探索了蝙蝠的超分辨原理,为突破雷达目标常规(瑞利)分辨力提供了一个可能的途径。为了进一步提高SCAT模型的分辨性能,通过抑制距离像负半轴和原点处多余的波瓣,改进了基向量解卷积法和基带SCAT(BSCT)两种蝙蝠超分辨模型,同时提出可靠分辨力概念及计算方法,统一了SCAT分辨力与瑞利分辨力的衡量标准,对比验证了可靠分辨力概念的合理性以及改进算法的有效性。仿真与实测实验表明,改进超分辨算法均获得了可观的分辨力提升,其中改进基向量解卷积法性能最佳,将原基向量解卷积法的分辨力提高约2 dB,同时将匹配滤波分辨力提高约5 dB。 展开更多
关键词 瑞利分辨力 模糊函数 雷达超分辨 谱相关及变换 可靠分辨力
在线阅读 下载PDF
基于数据增强的多输出分类旋转机械复合故障诊断
5
作者 毛荣珍 米洁 +1 位作者 甄真 周海龙 《北京信息科技大学学报(自然科学版)》 2025年第1期94-102,共9页
针对旋转机械复合故障诊断技术特征提取效果不佳、准确率较低且泛化能力不足的问题,提出了一种基于复合故障数据增强的多输出卷积神经网络(convolutional neural network,CNN)复合故障诊断模型。首先,为解决复合故障数据匮乏问题,利用... 针对旋转机械复合故障诊断技术特征提取效果不佳、准确率较低且泛化能力不足的问题,提出了一种基于复合故障数据增强的多输出卷积神经网络(convolutional neural network,CNN)复合故障诊断模型。首先,为解决复合故障数据匮乏问题,利用实验或现场采集的单故障数据,通过组合拟合生成复合故障数据,提出一种使用单故障数据拟合复合故障数据的方法;其次,将拟合后的复合故障数据与单故障数据一同进行数据预处理,并用于多输出CNN复合故障诊断模型的训练;最后,将训练后的模型用于实际工况数据,实现复合故障的解耦与诊断。使用东南大学数据集和里约热内卢联邦大学数据集验证了所提模型的有效性和可行性。实验结果表明,该模型能够提升特征提取效果,实现复合故障解耦、输出故障类型,提升了复合故障诊断准确率。 展开更多
关键词 旋转机械 复合故障诊断 梅尔频谱 卷积神经网络 数据增强
在线阅读 下载PDF
基于跨用户语音域适应网络的抑郁症检测
6
作者 吴伟 马龙华 赵祥红 《电子科技》 2025年第1期88-94,共7页
由于抑郁症的检测方式主观性较强,因此使用用户语音诊断抑郁症已成为一种较具有潜力的辅助方式,但不同用户的语音信号存在差异。文中提出了一个跨用户语音域适应网络(Cross User Audio Domain Adaptation Network,CUADAN)来检测抑郁症... 由于抑郁症的检测方式主观性较强,因此使用用户语音诊断抑郁症已成为一种较具有潜力的辅助方式,但不同用户的语音信号存在差异。文中提出了一个跨用户语音域适应网络(Cross User Audio Domain Adaptation Network,CUADAN)来检测抑郁症。从语音中提取可视化的梅尔频谱,利用CUADAN模型的特征提取器从梅尔频谱中获取更深层次的抑郁特征。由于源域和目标域中包含不同健康用户和抑郁用户的语音特征,因此利用CUADAN模型的域分类器在不同用户数据之间进行域适应,从而通过已有分类器对未知用户进行检测。实验结果表明,CUADAN模型的抑郁症检测准确率更高,其平均准确率达到81.0±2.4%。因此,CUADAN模型可以有效削弱不同用户语音之间的差异性,提高跨用户抑郁症检测的准确率。 展开更多
关键词 域适应 抑郁症检测 CUADAN 语音 跨用户 梅尔频谱 特征提取 削弱差异性
在线阅读 下载PDF
基于ViT-集成学习的音乐情感识别研究
7
作者 吴丹 王仁武 周杰 《信息技术》 2025年第1期47-55,共9页
针对常规机器学习与深度学习方法对音乐情感识别准确率低的问题,提出一种采用视觉转换器(Vision Transformer,简称ViT)做特征提取器,使用集成学习方法做分类器的短音乐情感分类模型。构造经过严格质量把关的人工标注的短音乐数据集,将... 针对常规机器学习与深度学习方法对音乐情感识别准确率低的问题,提出一种采用视觉转换器(Vision Transformer,简称ViT)做特征提取器,使用集成学习方法做分类器的短音乐情感分类模型。构造经过严格质量把关的人工标注的短音乐数据集,将短音乐情感分为快乐(Happy)、悲伤(Sad)、愤怒(Angry)和平静(Calm)4类;基于改进的ViT模型提取短音乐的音频图谱特征,使用集成学习的XGBoost、LightGBM等算法进行短音乐情感分类。实验表明,ViT-集成学习模型在测试集上达到了87.5%的准确率,优于文中所测试的其他模型,且模型通用性较强,可以较好地应用在音乐情感识别的下游任务之中。 展开更多
关键词 音乐情感识别 视觉转换器 集成学习 卷积神经网络 语谱图
在线阅读 下载PDF
Research on data diagnosis method of acoustic array sensor device based on spectrogram 被引量:4
8
作者 Xing Lei Hang Ji +3 位作者 Qiang Xu Ting Ye Shengfu Zhang Chengjun Huang 《Global Energy Interconnection》 EI CAS CSCD 2022年第4期418-433,共16页
Acoustic array sensor device for partial discharge detection is widely used in power equipment inspection with the advantages of non-contact and precise positioning compared with partial discharge detection methods su... Acoustic array sensor device for partial discharge detection is widely used in power equipment inspection with the advantages of non-contact and precise positioning compared with partial discharge detection methods such as ultrasonic method and pulse current method.However,due to the sensitivity of the acoustic array sensor and the influence of the equipment operation site interference,the acoustic array sensor device for partial discharge type diagnosis by phase resolved partial discharge(PRPD)map might occasionally presents incorrect results,thus affecting the power equipment operation and maintenance strategy.The acoustic array sensor detection device for power equipment developed in this paper applies the array design model of equal-area multi-arm spiral with machine learning fast fourier transform clean(FFT-CLEAN)sound source localization identification algorithm to avoid the interference factors in the noise acquisition system using a single microphone and conventional beam forming algorithm,improves the spatial resolution of the acoustic array sensor device,and proposes an acoustic array sensor device based on the acoustic spectrogram.The analysis and diagnosis method of discharge type of acoustic array sensor device can effectively reduce the system misjudgment caused by factors such as the resolution of the acoustic imaging device and the time domain pulse of the digital signal,and reduce the false alarm rate of the acoustic array sensor device.The proposed method is tested by selecting power cables as the object,and its effectiveness is proved by laboratory verification and field verification. 展开更多
关键词 Acoustic array sensor device Acoustic spectrogram Partial discharge Power equipment False alarm rate
在线阅读 下载PDF
基于语谱图的管制员疲劳状态检测研究
9
作者 杨昌其 冯筱晴 +1 位作者 张雨萱 蔡子牛 《航空工程进展》 CSCD 2024年第2期49-55,共7页
现阶段利用陆空通话语音对管制员疲劳状态的研究中,大多只考虑了语音在时域或频域的变化,而忽视了疲劳会同时在时域与频域上产生影响。将三种疲劳状态下的陆空通话语音分别转化为可同时反映时域与频域特性的语音频谱图像,利用灰度共生... 现阶段利用陆空通话语音对管制员疲劳状态的研究中,大多只考虑了语音在时域或频域的变化,而忽视了疲劳会同时在时域与频域上产生影响。将三种疲劳状态下的陆空通话语音分别转化为可同时反映时域与频域特性的语音频谱图像,利用灰度共生矩阵提取四维典型的特征参数,对比管制员在不同状态下特征参数的变化情况,构建管制员疲劳检测模型并对输入特征进行检测。结果表明:利用语谱图特征结合传统特征作为输入特征的检测准确率最高,达到95.49%,较单一使用传统特征的检测准确率高出4%;管制员疲劳状态的变化会直观地反映在语谱图上,会对其特征值产生影响,利用这种影响对管制员疲劳状态进行检测,可以得到良好的检测结果。 展开更多
关键词 管制员 疲劳检测 语谱图 灰度共生矩阵 机器学习
在线阅读 下载PDF
基于Mel声谱图与改进SEResNet的鱼类行为识别 被引量:4
10
作者 杨雨欣 于红 +3 位作者 杨宗轶 涂万 张鑫 林远山 《渔业现代化》 CSCD 北大核心 2024年第1期56-63,共8页
养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造... 养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造成特征提取难的问题,采用高分辨率、特征表示较好的Mel声谱图以捕捉鱼类声音的频谱特征。其次针对鱼类声音特征关键信息易丢失的难题,提出在SEResNet模型中融合时序聚合池化层(Temporal Aggregated Pooling,TAP),提取池化区域的最大值和平均值,保留鱼类行为更多细粒度声音特征,提高识别准确率。为验证所提模型的有效性,分别设计了消融试验和模型性能对比试验,试验结果显示:TAP-SEResNet相比SEResNet在不降低检测速度的条件下准确率提升了3.23%;相比PANNS-CNN14、ECAPA-TDNN及MFCC+ResNet等先进声音识别模型,TAP-SEResNet在准确率上分别提升了5.32%、2.80%和1.64%。所提模型有助于养殖过程中对鱼类行为实现精准监测,对精准养殖具有重要的推动作用。 展开更多
关键词 鱼类行为识别 被动水声信号 Mel声谱图 SEResNet
在线阅读 下载PDF
基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法
11
作者 欧阳羽轩 傅骁 +2 位作者 段发阶 王宽 吴靓昕 《光电工程》 CAS CSCD 北大核心 2024年第7期125-138,共14页
中阶梯光谱仪具有交叉色散特征,二维谱图还原是决定其波长测量准确性的关键环节,但是环境变化、加工装调等引起的光斑坐标变化对谱图还原精度造成严重影响。本文提出了一种基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法,首先提... 中阶梯光谱仪具有交叉色散特征,二维谱图还原是决定其波长测量准确性的关键环节,但是环境变化、加工装调等引起的光斑坐标变化对谱图还原精度造成严重影响。本文提出了一种基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法,首先提取校准汞灯光源多波长光斑质心坐标,利用理论像点和实际像点坐标构建系数矩阵,通过最小二乘法估计获得二维像面的平移、缩放、旋转系数,再采用多项式拟合减小残差影响,实现不同波长光斑的图像坐标修正,进而实现波长精确解算。实验结果显示,该算法能有效提高中阶梯光谱仪的谱图还原精度,在模拟较大装调误差条件下,修正后坐标与理想坐标偏差小于0.6个像元,证明了该算法具有较高的精度。 展开更多
关键词 光谱学 光谱仪 二维光谱图 质心提取 谱图还原
在线阅读 下载PDF
合成语声的声学分析及识别特征算法 被引量:1
12
作者 周峻林 胡晓光 +2 位作者 黄子旭 汪旭 付哲宇 《应用声学》 CSCD 北大核心 2024年第1期131-141,共11页
当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法。为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和... 当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法。为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和真实语声的声学特性,设计了一种声学特征均方根角量化语声声强变化程度,结合基频变化率和语声窄带频谱图声学特征进行融合,量化了声学特性差异,聚焦了合成语声中关键声学信息。在神经网络模型中融合输入声学特征,在FoR数据集的验证集上得到了0.6%的等错误率,在测试集上最好结果达到了10.8%的等错误率。该文成功实现了对合成语声的识别,证实了声学特征的有效性和研究方案的可行性,在一定程度上拓宽了合成语声特征设计的研究思路。 展开更多
关键词 声学特征 声强 基频 语声频谱图 神经网络
在线阅读 下载PDF
基于鲁棒纹理特征的环境声音事件检测方法 被引量:1
13
作者 吴婷 刘琼 郭慧茹 《电子器件》 CAS 2024年第2期530-535,共6页
针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特... 针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特征维度过高问题,先利用随机森林算法后结合主成分分析(PCA)算法,提出了RF-PCA降维方法;最后使用支持向量机(SVM)对不同环境的声音进行分类。在公开数据集ESC-10上的仿真实验结果表明,利用所提出的基于鲁棒纹理特征的环境声音事件检测方法所提取的特征对声音分类可达到93.00%的分类效果。 展开更多
关键词 环境声音分类 类伽马声谱图 SHEARLET变换 CBP算法 RF-PCA
在线阅读 下载PDF
基于音频特征的水车室工作状态异常检测 被引量:2
14
作者 曾广栋 魏学锋 +2 位作者 何林 孙长江 张旋 《水电能源科学》 北大核心 2024年第8期168-172,共5页
水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采... 水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采用STFT、Log-Mel、MFCC等方法对音频数据进行了预处理,建立了基于音频数据的异常检测模型,并对溪洛渡水电站水车室工作状态进行了异常检测。结果表明,Log-Mel方法具有有效性。研究结果不仅降低了异常检测的成本,还为水电机组的健康监测提供了参考。 展开更多
关键词 音频数据 水车室 STFT log-mel 梅尔频率倒频谱系数(MFCC) 时域特征 支持向量机
在线阅读 下载PDF
基于非线性语谱图联合判决的语种识别
15
作者 段云 邵玉斌 +1 位作者 龙华 杜庆治 《微电子学与计算机》 2024年第5期99-108,共10页
针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,... 针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,将非线性语谱图按词关联特性进行等间隔拆分,在ResNet网络后端加入联合判决层;输出语音所属语种类型。实验结果表明,所提方法有效改善灰度对数语谱图的缺点,识别性能均高于语谱图及改进特征。联合判决对切分时长为1.0 s的样本语音取得的识别效果最佳,在广播音频数据集中,识别率达到94.25%;在VoxForge公共语料集中,识别率达到98.94%。 展开更多
关键词 语种识别 语谱图 非线性 联合判决 神经网络
在线阅读 下载PDF
基于双线性池化引导特征融合的轴承故障诊断算法
16
作者 陈毅朋 吴飞 周凯东 《航空发动机》 北大核心 2024年第5期145-152,共8页
为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数... 为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数等操作,提高信号处理后的振动谱图质量;对预处理后的信号数据进行傅里叶变换,计算出变换后的幅值和频率数据,并绘制对应的振动谱图;利用通道注意力和空间注意力改进Res2Net网络,提取不同关注点下的视觉特征,并基于双线性池化方法进行多特征融合;利用全连接和softmax函数构建分类头,实现轴承故障分类。结果表明:所提出的方法在凯斯西储大学轴承数据集以及德国Paderborn数据集中的精确率分别为98.22%、97.94%,在轴承故障诊断中,所提算法不仅在理论上融合了自动化控制理论与控制工程原理,而且在实践中验证了其在轴承故障诊断中的有效性,为实现轴承故障的早期预警和智能诊断提供了新的技术途径。 展开更多
关键词 滚动轴承 振动谱图 故障诊断 双线性池化 多特征融合
在线阅读 下载PDF
基于快速傅里叶增强深度网络的树皮种类识别 被引量:1
17
作者 肖恒玉 朱洪前 +1 位作者 杨滨 胡涛 《林业工程学报》 CSCD 北大核心 2024年第4期122-129,共8页
快速且准确的树种识别为生态系统分析提供重要指导,但现有基于深度学习的方法无法满足林场实际作业需求,需要更简化、可部署的模型,为此笔者提出一种基于快速傅里叶增强深度神经网络的双分支网络。在第1个主干分支ResNet34中引入了门控... 快速且准确的树种识别为生态系统分析提供重要指导,但现有基于深度学习的方法无法满足林场实际作业需求,需要更简化、可部署的模型,为此笔者提出一种基于快速傅里叶增强深度神经网络的双分支网络。在第1个主干分支ResNet34中引入了门控通道注意力模块(GCT),以保证使用轻量模型且识别精度稳定;第2个分支利用快速傅里叶变换进行辅助监督,将树皮图像的灰度分布转换为频谱图分析图像纹理,通过辅助监督主干网络学习纹理差异性特征。本方法在3个树皮图像数据集上进行实验,其中,在23类树皮图像数据集中,准确率、预测精度和召回率3项评估指标分别达到了91.01%,89.65%和88.60%。此外,本方法显著减少了模型参数量,与原模型ResNet34相比,减少了33%的权重参数量。结果表明,该方法不仅提高了识别效率,降低了人力资源浪费,而且通过减少模型参数量,便于在各种终端设备上进行部署。 展开更多
关键词 树皮树种识别 图像分类 快速傅里叶变换 傅里叶频谱 注意力机制
在线阅读 下载PDF
基于分治方法的声纹识别系统模型反演
18
作者 张骏飞 张雄伟 孙蒙 《信息安全研究》 CSCD 北大核心 2024年第2期130-138,共9页
模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及... 模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及误差,采用分治法的思想逐层反演,并通过循环一致性的有效监督,成功重构与说话人身份一致的反演样本;另外,由于语音的特殊性,模型特征层已包含丰富的说话人信息,进一步减弱语义信息相似后,改进的方法显著提高了反演样本的识别准确率,表明反演所得语谱图中已含有有效表示说话人身份的信息.实验结果证明了模型反演在语谱图上的可行性,突出了提取此类语音特征信息的深度网络模型所带来的隐私信息泄露风险. 展开更多
关键词 模型反演 神经网络 声纹识别 语谱图 信息安全
在线阅读 下载PDF
干扰背景下基于改进AlexNet的无人机信号识别方法
19
作者 姚志成 张冠华 +2 位作者 王海洋 杨剑 范志良 《电光与控制》 CSCD 北大核心 2024年第6期14-18,80,共6页
复杂电磁环境下非合作无人机图传信号易被干扰覆盖,传统检测手段难以有效识别,为此提出了一种基于改进AlexNet模型的无人机图传信号识别方法。该方法针对干扰覆盖场景下图传信号的时频图像特征,对AlexNet模型进行改进优化,通过拆分卷积... 复杂电磁环境下非合作无人机图传信号易被干扰覆盖,传统检测手段难以有效识别,为此提出了一种基于改进AlexNet模型的无人机图传信号识别方法。该方法针对干扰覆盖场景下图传信号的时频图像特征,对AlexNet模型进行改进优化,通过拆分卷积核、减少全连接层节点数、增加全局平均池化层,在不增加计算复杂度的情况下加深了网络结构,有效提升了图传信号识别能力。在内场微波暗室和外场真实环境中,分别制备了不同干扰强度下的时频图像数据集以训练模型,结果表明,在信干噪比(SINR)为-15 dB时改进AlexNet模型仍可保持90%以上的验证准确率,而且相比于其他CNN模型,可将单位训练时间缩短1 s以上。 展开更多
关键词 电磁干扰 无人机信号识别 时频谱图 AlexNet模型
在线阅读 下载PDF
基于语谱图滤波去噪的语音增强技术研究
20
作者 白燕燕 白帆 +1 位作者 张少哲 韩宗祥 《电声技术》 2024年第2期45-47,共3页
在日常生活通信中,语音起着至关重要的作用。然而,环境噪声污染问题严重影响着语音处理系统的性能。为有效应对噪声干扰问题,可以采用语音增强技术。语谱图作为一种融合了时域和频域优势的工具,能够清晰地揭示语音频谱随时间的变化情况... 在日常生活通信中,语音起着至关重要的作用。然而,环境噪声污染问题严重影响着语音处理系统的性能。为有效应对噪声干扰问题,可以采用语音增强技术。语谱图作为一种融合了时域和频域优势的工具,能够清晰地揭示语音频谱随时间的变化情况。因此,文章基于语谱图进行滤波去噪,旨在提升语音的质量,使其更加清晰可辨。 展开更多
关键词 语音增强 语谱图 时域 频域 滤波
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部