期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
多放大倍率掩码自编码器的乳腺癌图像分类 被引量:1
1
作者 司嘉龙 贾伟 +1 位作者 赵雪芬 高宏娟 《电子测量技术》 北大核心 2025年第10期127-143,共17页
乳腺癌是对妇女健康构成严重威胁的疾病之一。早期诊断对于乳腺癌的治愈至关重要,计算机辅助乳腺癌分类诊断得到了广泛使用。虽然基于掩码自编码器的乳腺癌分类方法能够在乳腺癌病理图像已标注数据缺少的前提下进行模型性能的提升,但是... 乳腺癌是对妇女健康构成严重威胁的疾病之一。早期诊断对于乳腺癌的治愈至关重要,计算机辅助乳腺癌分类诊断得到了广泛使用。虽然基于掩码自编码器的乳腺癌分类方法能够在乳腺癌病理图像已标注数据缺少的前提下进行模型性能的提升,但是现有的基于掩码自编码器的乳腺癌病理图像分类方法没有充分提取和融合不同放大倍率乳腺癌病理图像之间的特征信息。为了解决该问题,提出了一种基于多放大倍率掩码自编码器的乳腺癌病理图像分类方法。该方法在掩码自编码器的基础上结合放大独立和放大特异的优势。首先,设计了规则化噪音掩码模块来避免乳腺癌病理图像重要特征丢失。然后,将不同放大倍率乳腺癌病理图像块组合在一起输入到加入了交叉卷积映射的编码器中提取和融合不同放大倍率图像的特征。最后,在解码器中加入残差交叉注意力机制增强低放大倍率图像下细胞密度及排列顺序和高放大倍率图像下细胞纹理特征的融合。在BreakHis公共数据集上进行实验,与现有分类方法相比,该方法在Top-1 Accuracy、精确率、召回率和F1-Score上至少提高了约2%,说明该方法在良恶性乳腺癌病理图像准确分类方面表现出良好的性能。 展开更多
关键词 乳腺癌病理图像 自监督学习 掩码自编码器 放大独立 放大特异
在线阅读 下载PDF
基于衰落掩码自编码器的分布式光纤声学传感系统用于水域航行安防事件识别
2
作者 于淼 何禹潼 +7 位作者 常天英 崔洪亮 党随虎 夏良平 刘黎明 易子川 潘新建 高庆国 《光子学报》 北大核心 2025年第1期29-42,共14页
提出了一种基于衰落掩码自编码器的分布式光纤声学传感系统水域行船安防事件识别算法。结合衰落原理判断衰落位置,使用改进的衰落掩码策略让掩码自编码器模型学习到更多正确的信号特征,从而更有效地完成事件识别。开展水域实验,采集行... 提出了一种基于衰落掩码自编码器的分布式光纤声学传感系统水域行船安防事件识别算法。结合衰落原理判断衰落位置,使用改进的衰落掩码策略让掩码自编码器模型学习到更多正确的信号特征,从而更有效地完成事件识别。开展水域实验,采集行船安防事件数据,将所提方法与掩码自编码器以及其他模型进行比较。结果表明,衰落掩码自编码器的平均训练准确率为98.34%,比掩码自编码器的增加了4.9%;平均测试准确率为93.01%,比掩码自编码器的增加了6.45%。与其他3种模型相比,衰落掩码自编码器具有更高的训练精度和更快的收敛速度,平均性能指标高出约4.88%~7.62%。结合衰落判别的衰落掩码自编码器模型在稳定性、训练效率和识别准确率方面更具优势,且具有更好的泛化性,适用于水域行船安防事件的识别。 展开更多
关键词 光纤传感器 分布式光纤声学传感 掩码自编码器 水域安防 深度学习
在线阅读 下载PDF
基于掩码自编码器的苹果叶片病害检测方法研究
3
作者 陈承源 王玉琦 +3 位作者 袁梦茹 程云芬 杨凯 韩东杰 《农业与技术》 2025年第20期39-45,共7页
随着全球农业生产规模的扩大,苹果叶片病害的及时检测对提高果品质量和产量至关重要。传统方法依赖人工观察,效率低且易受人为因素影响。为此,本研究提出了一种基于掩码自编码器(MAE)的两阶段病害检测方法,通过自监督学习和迁移学习提... 随着全球农业生产规模的扩大,苹果叶片病害的及时检测对提高果品质量和产量至关重要。传统方法依赖人工观察,效率低且易受人为因素影响。为此,本研究提出了一种基于掩码自编码器(MAE)的两阶段病害检测方法,通过自监督学习和迁移学习提升检测性能。预训练阶段利用无标签数据提取深层特征,微调阶段将预训练的MAE编码器参数迁移到视觉变换器(ViT)模型中,并在带标签数据集上进行微调。实验结果表明,基于MAE预训练的ViT模型准确率可达到98.42%,较无预训练模型提升5.07%。消融实验显示,50%的掩码比例在特征学习与重建损失之间实现了最佳平衡。本研究验证了自监督学习与ViT模型结合在苹果叶片病害检测中的有效性,为智慧农业提供了高效、精准的病害识别方案。 展开更多
关键词 病害检测 掩码自编码器 视觉变换器 迁移学习
在线阅读 下载PDF
改进掩码自编码器的滚动轴承半监督故障诊断 被引量:5
4
作者 陈仁祥 张晓 +2 位作者 张旭 赵玲 夏亮 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第1期26-33,共8页
针对滚动轴承在不同转速条件下数据分布不同以及实际工程应用中标签样本不足导致故障诊断精度低的问题,将领域适配模块融入掩码自编码器(MAE)中,提出了改进掩码自编码器(IMAE)的滚动轴承半监督故障诊断方法。首先,对滚动轴承振动信号进... 针对滚动轴承在不同转速条件下数据分布不同以及实际工程应用中标签样本不足导致故障诊断精度低的问题,将领域适配模块融入掩码自编码器(MAE)中,提出了改进掩码自编码器(IMAE)的滚动轴承半监督故障诊断方法。首先,对滚动轴承振动信号进行连续小波变换(CWT)得到反应信号时频特征的二维时频图,然后对时频图随机掩码,利用无标签样本进行掩码自编码器预训练,获得数据中复杂的内在特征,减少对有标签样本的依赖;其次将领域适配模块引入到预训练后的编码器中,使用少量有标签源域数据对IMAE进行微调,在希尔伯特空间中利用最小化最大均值差异减小因转速不同造成的源域与目标域间数据分布差异;最后在Softmax分类层下实现滚动轴承半监督故障诊断。通过滚动轴承数据集实验验证,所提方法检测精度均达到94%以上,证明了该方法的可行性与有效性。 展开更多
关键词 掩码自编码器 滚动轴承 不同转速 标签样本 半监督故障诊断
在线阅读 下载PDF
改进掩码自编码器的工业缺陷检测方法 被引量:2
5
作者 邓凯丽 魏伟波 潘振宽 《计算机应用》 CSCD 北大核心 2024年第8期2595-2603,共9页
针对目前只需正常样本即可实现缺陷检测的方法存在漏检或过度检测的问题,构建一种改进掩码自编码器与改进Unet结合的方法实现像素级缺陷检测。首先,采用拟合缺陷模块生成缺陷掩码图像及正常图像对应的缺陷图像;其次,对缺陷图像随机掩码... 针对目前只需正常样本即可实现缺陷检测的方法存在漏检或过度检测的问题,构建一种改进掩码自编码器与改进Unet结合的方法实现像素级缺陷检测。首先,采用拟合缺陷模块生成缺陷掩码图像及正常图像对应的缺陷图像;其次,对缺陷图像随机掩码,去除缺陷图像大部分的缺陷信息,激励Transformer结构的自编码器从未掩码的正常区域学习表示并依据上下文修复缺陷图像,为了提高模型对细节的修复能力,设计了新的损失函数;最后,将缺陷图像与修复图像拼接后输入拥有通道方向交叉融合Transformer结构的Unet,实现像素级缺陷检测。实验结果表明,在MVTec AD数据集上,所提方法平均的基于图像的和基于像素的接受者操作特征曲线下的面积值(ROC AUC)分别达到了0.984和0.982,与DRAEM(Discriminatively trained Reconstruction Anomaly Embedding Model)相比分别提高了2.9和3.2个百分点;与CFLOW-AD(Anomaly Detection via Conditional normalizing FLOWs)相比分别提高了3.1和0.8个百分点,证明所提方法具有较高的识别率和检测精度。 展开更多
关键词 缺陷检测 图像修复 掩码自编码器 梯度损失函数 TRANSFORMER Unet
在线阅读 下载PDF
基于掩码自编码器的小样本深度学习道岔故障诊断模型 被引量:9
6
作者 李刚 徐长明 +3 位作者 龚翔 卢佩玲 董贺超 史维利 《中国铁道科学》 EI CAS CSCD 北大核心 2022年第6期175-185,共11页
以车站现场采集到的ZYJ7型交流道岔转辙机所产生真实道岔动作电流曲线数据为依托,提出基于掩码自编码器的小样本深度学习模型,无须进行特征提取,可实现端到端的自监督学习。首先进行数据预处理,将道岔动作电流曲线数据统一为相同的维数... 以车站现场采集到的ZYJ7型交流道岔转辙机所产生真实道岔动作电流曲线数据为依托,提出基于掩码自编码器的小样本深度学习模型,无须进行特征提取,可实现端到端的自监督学习。首先进行数据预处理,将道岔动作电流曲线数据统一为相同的维数;然后通过随机掩码,将具有人工标签的少量故障数据增强为数量足够大的自监督样本集合,并使用自编码器作为正则化约束;最后通过故障诊断网络,诊断出曲线的故障类型和故障位置。在实验室和车站现场对该模型进行验证,结果表明:该模型在小样本数据集上对故障分类的准确性预测可达到98%以上,同时也能快速定位曲线故障发生的位置。 展开更多
关键词 掩码 小样本学习 自编码器 道岔故障诊断 深度学习
在线阅读 下载PDF
掩码重建融合对比学习的自监督医学图像分割
7
作者 肖慈美 降爱莲 +1 位作者 冀伟 高峰 《计算机工程与应用》 北大核心 2025年第15期298-309,共12页
在医学图像分析领域,由于难以获取大规模标注数据,自监督方法应用日益广泛。其中,掩码自编码器在准确捕获感兴趣的区域,并有效控制掩码区域的生成和有效利用方面较为困难。提出了一种掩码重建融合对比学习的自监督医学图像分割方法(mask... 在医学图像分析领域,由于难以获取大规模标注数据,自监督方法应用日益广泛。其中,掩码自编码器在准确捕获感兴趣的区域,并有效控制掩码区域的生成和有效利用方面较为困难。提出了一种掩码重建融合对比学习的自监督医学图像分割方法(mask reconstruction fused with contrastive learning,MRCL),该方法包含对比重建任务、混合卷积特征融合模块和多尺度编码器架构。对比重建任务将对比学习应用到掩码自编码器中,通过学习图像中不同区域的相似性和差异性提高了特征的区分度,并利用对比损失来优化两个随机掩码视图的表示,增强了掩码自编码器对感兴趣区域的捕获能力。同时由于对比学习依赖于强大的数据增强,还可以进一步提高模型的泛化性能。此外,混合卷积特征融合模块通过互补性设计将注意力层和卷积层进行融合,使模型能够有效地提取局部和全局特征;而多尺度编码器架构则将不同尺度的特征图进行融合,提高了模型对多尺度信息的表征能力。实验结果表明,在仅使用20%标注数据的情况下,提出的方法在ACDC、LIDC和ISIC三个公共数据集上的DSC图像分割性能指标分别达到了86.61%、80.19%和87.55%,优于现有的自监督医学图像分割方法。 展开更多
关键词 自监督 医学图像分割 多尺度 对比学习 掩码自编码器
在线阅读 下载PDF
基于自监督掩码光流的人脸微表情识别
8
作者 刘晓宇 谢志华 周志武 《浙江大学学报(理学版)》 北大核心 2025年第1期87-97,共11页
在人脸微表情识别研究领域,现有特征提取方法主要依赖于有监督学习方式,限制了模型在微表情表征中的应用场景和泛化能力。为此,利用掩码自编码器(MAE)技术构建了面向微表情数据集特点的自监督特征编码器,并将其应用于下游微表情识别任务... 在人脸微表情识别研究领域,现有特征提取方法主要依赖于有监督学习方式,限制了模型在微表情表征中的应用场景和泛化能力。为此,利用掩码自编码器(MAE)技术构建了面向微表情数据集特点的自监督特征编码器,并将其应用于下游微表情识别任务,提出了一种基于自监督掩码光流(self-supervised masked optical flow,SMOF)的人脸微表情识别方法。首先,使用微表情数据集中每个顶点帧的左右各两帧与起始帧计算的光流图作为初步输入。然后,使用重采样技术平衡数据集中各类样本。最后,利用增广后的数据集预训练SMOF模型,通过随机掩盖输入图像的局部块,重构缺失块的像素。在下游任务中,使用ViT-Large模型加载已训练好的特征提取器,取得了较好的微表情分类结果。采用留一受试者交叉验证(LOSO)方法,评估了模型在3DB微表情数据集上的性能,未加权F1分数(UF1)和未加权平均召回率(UAR)分别达0.8614和0.8716,优于其他深度学习微表情识别方法。实验结果表明,基于SMOF的微表情识别方法可行且有效,具有较好的可迁移性和扩展性。 展开更多
关键词 自监督学习 掩码自编码器 光流 微表情识别
在线阅读 下载PDF
基于掩码自编码技术的变压器故障声纹诊断方法研究 被引量:9
9
作者 刁冠勋 唐懿颖 +3 位作者 张阳 邵宇鹰 王枭 姜黛琳 《噪声与振动控制》 CSCD 北大核心 2023年第6期142-148,共7页
电力变压器作为电力系统中电能转换与能量传输的核心设备,其可靠运行对电力系统的安全运行有着极为重要的意义。近年来随着边缘计算在电力设备诊断方面的应用不断盛行,受限的硬件算力对算法的计算量提出了新的要求。对此提出一种基于声... 电力变压器作为电力系统中电能转换与能量传输的核心设备,其可靠运行对电力系统的安全运行有着极为重要的意义。近年来随着边缘计算在电力设备诊断方面的应用不断盛行,受限的硬件算力对算法的计算量提出了新的要求。对此提出一种基于声纹识别与掩码自编码技术的变压器故障诊断方法。首先,将采集的变压器辐射声音信号进行梅尔频谱计算和归一化处理得到声纹特征;其次,将声纹特征运用掩码自编码器进行训练,得到可用于对特征降维的编码器;最后,利用卷积神经网络对编码后的变压器声纹特征进行识别和分类。实验结果表明,该方法在掩码比例为40%的时候能达到93.75%故障识别精度,识别准确率高于对比算法。此外,相对于没有采用掩码自编码的分类算法,该方法在提升17.26%准确率的同时,将计算量缩减为不到原来的1%,可有效降低变压器检测的计算量。 展开更多
关键词 故障诊断 声纹识别 掩码 自编码器 变压器
在线阅读 下载PDF
基于掩码建模和对比学习的故障诊断方法 被引量:1
10
作者 程祺珺 杨瑞峰 郭晨霞 《电子测量技术》 北大核心 2024年第22期129-135,共7页
尽管大多数故障诊断研究以图像、音频等作为研究的数据类型,但表格型数据的故障诊断研究仍然具有重要意义。在表格型故障诊断领域,以前的相关工作大多集中在传统的监督学习方法并且对跨工况故障诊断任务的基准评估有所不足。本文介绍一... 尽管大多数故障诊断研究以图像、音频等作为研究的数据类型,但表格型数据的故障诊断研究仍然具有重要意义。在表格型故障诊断领域,以前的相关工作大多集中在传统的监督学习方法并且对跨工况故障诊断任务的基准评估有所不足。本文介绍一种用于表格型数据跨工况故障诊断任务的自监督学习方法,该方法将对比学习思想和表格掩码建模策略应用于以Transformer为骨干的自编码器架构。在凯斯西储大学轴承数据集的诊断实例上的结果显示,本文的方法经过适当微调后可以在目标任务中普遍优于监督学习基线方法的诊断精度。与自监督学习基线方法相比,对比学习策略和表格掩码建模策略的引入分别使得自编码器在3个目标任务中的平均诊断精度提高了0.74%和3.35%。此外,为了验证所提出的方法的合理性,本文进一步分析和讨论了该方法的保真度和效用。 展开更多
关键词 自编码器 故障诊断 表格数据 对比学习 表格掩码建模
在线阅读 下载PDF
基于自监督学习的钛合金金相组织智能识别
11
作者 宋凯 张宗瀚 +3 位作者 余京泰 高帅 王璇 钟秀堃 《天津大学学报(自然科学与工程技术版)》 北大核心 2025年第10期1021-1030,共10页
Ti-6Al-4V(TC4)合金因其优异的性能而成为各行业应用最广泛的钛合金之一.TC4合金的金相组织大致可分为4类:等轴组织、双相组织、魏氏组织、网篮组织,不同组织结构具有显著性能差异.由于锅炉、管道、压力容器等设备长期处于高温、高压等... Ti-6Al-4V(TC4)合金因其优异的性能而成为各行业应用最广泛的钛合金之一.TC4合金的金相组织大致可分为4类:等轴组织、双相组织、魏氏组织、网篮组织,不同组织结构具有显著性能差异.由于锅炉、管道、压力容器等设备长期处于高温、高压等极端工况会导致合金材料的金相组织特征发生变化,进而显著影响TC4合金的强度、韧性、耐腐蚀性、硬度等关键性能指标.为了满足TC4合金金相组织自动高效识别的需求,开发了一种基于掩蔽重建的新型自监督分类模型(MSC-Net),旨在克服常规深度学习模型依赖大型标注数据集的局限性.通过引入掩码重建技术,该模型能在无显式标注的情况下学习金相组织图像的复杂内在特征,并准确区分等轴组织、双相组织、魏氏组织和网篮组织等不同类型.实验结果表明,MSC-Net不仅在实验室数据集中实现了100.0%的识别准确率,且当主流模型(如ResNet和Inception v3)在手持光学显微镜图像数据集的泛化能力仅为60.4%和51.5%时,MSC-Net的准确率竟高达87.6%,展现了MSC-Net卓越的泛化性能.充分证明了本算法能有效迁移到使用便携金相显微镜采集的现场图片中进行无损检测,并能够实时、准确地识别出当前的金相组织类型.这一功能是实现服役过程中组织状态监控的基础,为设备性能评估和预测性健康维护等提供了可靠的技术支持. 展开更多
关键词 无损检测 自监督学习 金相组织 钛合金 掩码自编码器 计算机视觉 模式识别
在线阅读 下载PDF
基于生成对抗网络的SAR解压缩图像重建算法 被引量:1
12
作者 张冰玉 潘志刚 +1 位作者 姚锴 董旭彬 《中国科学院大学学报(中英文)》 北大核心 2025年第5期666-676,共11页
合成孔径雷达(SAR)图像的高倍数压缩处理会导致图像中目标和纹理信息受损,解压缩后的SAR图像会出现细节模糊、目标不易分辨等问题,难以有效反映真实的地物特征。为解决上述问题,基于生成对抗网络(GAN)架构,提出一种新的SAR图像重建算法... 合成孔径雷达(SAR)图像的高倍数压缩处理会导致图像中目标和纹理信息受损,解压缩后的SAR图像会出现细节模糊、目标不易分辨等问题,难以有效反映真实的地物特征。为解决上述问题,基于生成对抗网络(GAN)架构,提出一种新的SAR图像重建算法,该算法基于编解码结构,将卷积神经网络与自注意力机制并行融合作为生成器,设计了简洁高效的ConTransformer,从而得到更丰富的全局特征,有效提升小目标重建效果。针对判别网络,在UNet特征提取器中引入谱归一化,降低模型对输入扰动的敏感程度,从而达到抑制伪影的效果;同时引入预训练掩码机制,加强高层次语义特征提取,提升重建图像的真实性。实验证明该方法所得到的重建图像比Real-ESRGAN等基于GAN的经典方法所得重建结果具有更为清晰的视觉效果,且关键性能指标值更为出色,其中峰值信噪比提升0.57~1.54 dB。 展开更多
关键词 SAR解压缩图像 生成对抗网络 ConTransformer编码器 掩码机制
在线阅读 下载PDF
采用注意力与模板在线更新的可见光-红外目标跟踪网络
13
作者 韩向东 钟傲 +3 位作者 刘冲澳 孙延鑫 张向永 徐淋智 《西安交通大学学报》 北大核心 2025年第8期187-198,共12页
针对当前可见光-红外目标跟踪算法对红外可见光双模态特征交互与目标动态变化建模不足的问题,结合卷积掩码自编码器模型,提出一种基于注意力与模板在线更新的可见光-红外双模态目标跟踪网络。以卷积掩码自编码器模型为骨干网络,通过采... 针对当前可见光-红外目标跟踪算法对红外可见光双模态特征交互与目标动态变化建模不足的问题,结合卷积掩码自编码器模型,提出一种基于注意力与模板在线更新的可见光-红外双模态目标跟踪网络。以卷积掩码自编码器模型为骨干网络,通过采用双嵌入层配合共享权重的骨干网络结构提取可见光与红外特征,深入挖掘可见光与红外数据间的内在联系。通过强化模板与搜索图像的关联性,引入通道空间自注意力机制以增强模板和搜索图像间的交互,来提取模态间可区分的异质互补特征。提出模板在线更新模块,通过在线更新模板与设计模板分数头,利用置信度评分机制融合初始模板的稳定性与在线模板的适应性,解决目标随时间变化导致的模型漂移问题。实验结果表明,所提算法在GTOT和RGBT234公开数据集上的精确率和成功率分别达到93.3%/75.6%和87.2%/63.8%,可在目标不断变化情况下实现精确跟踪。可视化分析表明,所提算法在双模态热力图上可自适应互补,单一模态失效时仍能精准定位目标。 展开更多
关键词 目标跟踪 可见光-红外 注意力机制 模板在线更新 卷积掩码自编码器
在线阅读 下载PDF
基于改进MAE的装甲车辆目标前景遮挡部分补全方法 被引量:2
14
作者 余晓晗 毛绍臣 +2 位作者 綦秀利 王家宝 张所娟 《火力与指挥控制》 CSCD 北大核心 2023年第11期72-80,共9页
无人装备在侦察行动中拍摄的目标图像,往往大面积被前景物体遮挡,严重影响智能目标识别准确率和可靠性。提出了一种基于改进的掩码自编码器(masked autoencoders,MAE)对疑似目标的前景遮挡部分进行补全处理的方法,该方法有效解决了军事... 无人装备在侦察行动中拍摄的目标图像,往往大面积被前景物体遮挡,严重影响智能目标识别准确率和可靠性。提出了一种基于改进的掩码自编码器(masked autoencoders,MAE)对疑似目标的前景遮挡部分进行补全处理的方法,该方法有效解决了军事目标高度融入环境、侦察图像分辨率高、军事训练样本体量不足等实际问题,目标补全结果更准确,在图像语义上也更符合人的认知。通过定量、定性的分析对比实验,验证了该方法的补全效果,展示了其实用价值。 展开更多
关键词 装甲车辆目标 图像补全 掩码自编码器 前景遮挡 目标识别
在线阅读 下载PDF
基于欠完备电压数据的户变关系识别方法
15
作者 杨明 毛一风 +1 位作者 李鹏 欧朱建 《电力自动化设备》 EI CSCD 北大核心 2024年第12期100-107,共8页
当前采集的台区用户数据存在一定比例的缺失,使得传统基于数据驱动的户变关系核查方法难以实际应用。为此,提出一种基于欠完备电压数据的户变关系识别方法。通过掩码自编码器直接从欠完备电压数据中提取特征编码;对特征编码应用参数自... 当前采集的台区用户数据存在一定比例的缺失,使得传统基于数据驱动的户变关系核查方法难以实际应用。为此,提出一种基于欠完备电压数据的户变关系识别方法。通过掩码自编码器直接从欠完备电压数据中提取特征编码;对特征编码应用参数自适应的基于密度的噪声应用空间聚类(DBSCAN)算法进行聚类,实现低压台区户变关系的准确识别。所提方法无须进行缺失数据填充,避免了数据填充误差对特征提取效果的影响。同时,该方法无须人工调参,降低了工程应用难度,提升了低压台区管理自动化水平。算例结果表明,在缺失率达80%的情况下,所提方法的户变关系识别准确率依然可达80%。 展开更多
关键词 低压台区 户变关系识别 缺失数据 掩码自编码器 DBSCAN 参数自适应
在线阅读 下载PDF
超越单一感知的农田害虫检测算法MRA-YOLOX 被引量:3
16
作者 王中天 邹颖波 +1 位作者 吴昌霖 李新 《计算机工程与应用》 CSCD 北大核心 2024年第16期206-216,共11页
目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求。提出一种可以额外预测害虫状态信息的融合MAE和YOLOX算法的高速高精度农... 目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求。提出一种可以额外预测害虫状态信息的融合MAE和YOLOX算法的高速高精度农田害虫检测模型MRA-YOLOX(masked autoencoders and rapid aim detection-exceeding YOLO)。算法构建包含近4万张图片以及5万余标注的数据集TDBFP(target detection dataset be used for farmland pests),TDBFP数据集标注了10种害虫的生长状态、物种类别以及位置,以便更好地把握害虫信息,从而更准确地制定对策。修改YOLOX模型的解耦头及loss,额外输出生长状态,以改进模型预测更多信息;将ECA(efficient channel attention)和SA(shuffle attention)注意力机制进行有机融合,并插入backbone与FPN(feature pyr-amid networks)的连接过程以及FPN的通道堆叠过程,以便能够增强获得全局信息和丰富上下文信息的能力,从而取得比单一注意力机制更好的效果;将MAE中自监督解码器部分插入YOLOX的数据增强部分,扩大感受野,增强识别细粒度,获得超越mixup和mosaic的数据增强效果。实验结果表明,当需要同时感知目标的状态、分类和位置时,MRA-YOLOX相较于原始YOLOX模型对于TDBFP数据集的检测精度mAP@0.5由60.1%上升到88.2%,平均检测准确率提高了18.8个百分点,且检测帧率达到145 FPS,可以用于更复杂的工程实践。 展开更多
关键词 掩码自编码器(mae) 注意力机制 YOLOX 害虫识别 状态检测
在线阅读 下载PDF
基于MacBERT与对抗训练的机器阅读理解模型 被引量:1
17
作者 周昭辰 方清茂 +2 位作者 吴晓红 胡平 何小海 《计算机工程》 CAS CSCD 北大核心 2024年第5期41-50,共10页
机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测... 机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测结果。为了提高模型的泛化能力和鲁棒性,提出一种基于掩码校正的来自Transformer的双向编码器表示(Mac BERT)与对抗训练(AT)的机器阅读理解模型。首先利用Mac BERT对输入的问题和文本进行词嵌入转化为向量表示;然后根据原始样本反向传播的梯度变化在原始词向量上添加微小扰动生成对抗样本;最后将原始样本和对抗样本输入双向长短期记忆(Bi LSTM)网络进一步提取文本的上下文特征,输出预测答案。实验结果表明,该模型在简体中文数据集CMRC2018上的F1值和精准匹配(EM)值分别较基线模型提高了1.39和3.85个百分点,在繁体中文数据集DRCD上的F1值和EM值分别较基线模型提高了1.22和1.71个百分点,在英文数据集SQu ADv1.1上的F1值和EM值分别较基线模型提高了2.86和1.85个百分点,优于已有的大部分机器阅读理解模型,并且在真实问答结果上与基线模型进行对比,结果验证了该模型具有更强的鲁棒性和泛化能力,在输入的问题存在噪声的情况下性能更好。 展开更多
关键词 机器阅读理解 对抗训练 预训练模型 掩码校正的来自Transformer的双向编码器表示 双向长短期记忆网络
在线阅读 下载PDF
基于改进多图卷积网络的液压泵小样本故障诊断 被引量:1
18
作者 郑直 赵文博 +4 位作者 李克 朱占辉 刘彤谣 孙杨 林帅恒 《振动与冲击》 EI CSCD 北大核心 2024年第24期59-67,83,共10页
多图卷积网络模型(multi-graph convolutional network, M-GCN)可将图像转为特征向量,并可利用图卷积操作增强同类节点聚集。由于受到现场空间和经济条件限制,无法有效地采集液压泵充足故障样本,导致小样本问题;当引入M-GCN模型对液压... 多图卷积网络模型(multi-graph convolutional network, M-GCN)可将图像转为特征向量,并可利用图卷积操作增强同类节点聚集。由于受到现场空间和经济条件限制,无法有效地采集液压泵充足故障样本,导致小样本问题;当引入M-GCN模型对液压泵的故障进行诊断时,该模型特征表达存在区分度不足和信息单一等问题。因此,该文提出了一种改进多图卷积网络模型,即MMH-GCN模型。首先,为解决模型特征提取区分度不足问题,引入掩码自编码器(masked autoencoder, MAE)降低编码维度并提取关键图像特征,提升模型的小样本诊断精度;然后,为解决模型特征信息单一问题,引入异构图注意力网络(heterogeneous graph attention network, HAN)提取更丰富和全面的图结构数据特征,以提升模型的小样本诊断精度和效率。通过液压泵实测故障试验验证分析可知,该文所提MMH-GCN模型较原模型具有明显的高效性和优越性,在诊断精度和效率方面分别提升了12.14%和14.63%。 展开更多
关键词 多图卷积网络 掩码自编码器 异构图注意力网络 小样本
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部