期刊文献+
共找到566篇文章
< 1 2 29 >
每页显示 20 50 100
面向数据不平衡的网络入侵检测系统研究综述
1
作者 金志刚 李紫梦 +1 位作者 陈旭阳 刘泽培 《信息网络安全》 北大核心 2025年第8期1240-1253,共14页
基于机器学习的网络入侵检测系统凭借其优秀的特征提取和识别能力成为近年来的研究热点。然而,实际网络中流量数据显著失衡、攻击流量难以捕捉,数据不平衡问题导致模型泛化困难、检测性能受损。为应对数据不平衡问题,文章对网络入侵检... 基于机器学习的网络入侵检测系统凭借其优秀的特征提取和识别能力成为近年来的研究热点。然而,实际网络中流量数据显著失衡、攻击流量难以捕捉,数据不平衡问题导致模型泛化困难、检测性能受损。为应对数据不平衡问题,文章对网络入侵检测领域的相关研究成果进行了整理与分析。首先,介绍入侵检测和数据不平衡的相关概念,并总结常用的数据集与评价指标;然后,从数据和模型两个角度归纳已有方法并分析优缺点;最后,针对现有研究成果所存在的问题进行分析,并展望该领域未来的发展趋势。 展开更多
关键词 网络入侵检测 数据不平衡 数据增强 深度学习
在线阅读 下载PDF
数据不平衡情况下的柴油机故障诊断方法 被引量:3
2
作者 毕凤荣 郭明智 +3 位作者 毕晓阳 汤代杰 沈鹏飞 黄盟 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2024年第8期810-820,共11页
由于强调整体分类的准确率,机器学习方法在数据不平衡情况下的柴油机故障诊断效果不佳.因此,本文提出一种改进合成少数过采样技术(SMOTE)与机器学习技术相结合的故障诊断方法.首先对SMOTE算法进行改进,采用k近邻算法滤除多数类中的噪声... 由于强调整体分类的准确率,机器学习方法在数据不平衡情况下的柴油机故障诊断效果不佳.因此,本文提出一种改进合成少数过采样技术(SMOTE)与机器学习技术相结合的故障诊断方法.首先对SMOTE算法进行改进,采用k近邻算法滤除多数类中的噪声样本,从而减少各种故障类别之间的重叠.同时,使用k-means算法确定少数类稀疏度和采样权重,减轻类内不平衡.然后,使用改进SMOTE算法平衡柴油机故障数据,并利用机器学习方法进行最终故障诊断.在二维数据集上的实验表明,改进SMOTE算法能有效减轻原始数据中存在的类重叠和类内不平衡问题.柴油机故障诊断实验表明,改进SMOTE算法生成的故障样本能更好地模拟原始故障样本,使用改进SMOTE算法能提高故障诊断方法的准确率. 展开更多
关键词 数据不平衡 故障诊断 合成少数过采样技术 柴油机 振动信号
在线阅读 下载PDF
面向数据不平衡的卷积神经网络故障辨识方法 被引量:7
3
作者 吴耀春 赵荣珍 +1 位作者 靳伍银 邢自扬 《振动.测试与诊断》 EI CSCD 北大核心 2022年第2期299-307,408,共10页
针对因不同故障的样本数目不平衡造成卷积神经网络(convolutional neural network,简称CNN)对少数类样本识别准确率偏低的缺陷,采用将一种最小最大化目标函数融入卷积神经网络结构的对策,提出一种适用于故障数据不平衡的最小最大化目标... 针对因不同故障的样本数目不平衡造成卷积神经网络(convolutional neural network,简称CNN)对少数类样本识别准确率偏低的缺陷,采用将一种最小最大化目标函数融入卷积神经网络结构的对策,提出一种适用于故障数据不平衡的最小最大化目标函数卷积神经网络(min-max objective CNN,简称MMOCNN)智能故障模式辨识方法。首先,利用卷积神经网络交替的卷积与池化运算自适应学习振动信号中具有表征信息的敏感特征,并通过全连接层(fully connected layer,简称FC)将学习特征映射到类空间;其次,在类空间构造特征的最小最大化目标函数;最后,将最小最大化目标函数融入到卷积神经网络的损失函数中,在模型训练过程中既考虑分类总体误差最小,同时又要求学习的样本特征保持同类距离小、异类距离大,以实现对数据不平衡故障的有效辨识。用轴承的不平衡数据集分别对本方法和传统卷积神经网络的辨识效果进行实验,结果表明,本方法能够使少数类样本的辨识精度提升20%以上。 展开更多
关键词 智能故障辨识 数据不平衡 卷积神经网络 最小最大化目标函数 旋转机械
在线阅读 下载PDF
旋转设备数据不平衡问题的数据生成方法 被引量:3
4
作者 李洁松 伍星 +1 位作者 刘韬 刘畅 《振动.测试与诊断》 EI CSCD 北大核心 2023年第3期547-554,623,共9页
在旋转设备运行状态监测及故障识别时,采集的样本多为无故障样本,而故障样本较少,这种数据分布的不平衡会严重影响分类器识别的准确性。针对此问题,提出了一种少数样本数据生成方法,即基于傅里叶变换与皮尔逊系数优化的生成对抗神经网络... 在旋转设备运行状态监测及故障识别时,采集的样本多为无故障样本,而故障样本较少,这种数据分布的不平衡会严重影响分类器识别的准确性。针对此问题,提出了一种少数样本数据生成方法,即基于傅里叶变换与皮尔逊系数优化的生成对抗神经网络(Fourier-Pearson generative adversarial networks,简称FP-GAN)模型。通过对故障少数样本的扩充,提高故障诊断训练和识别的准确性。首先,使用傅里叶变化得到信号频域的单边谱,使用GAN网络生成信号频域;其次,通过皮尔逊相关系数对生成的数据进行优化;最后,通过傅里叶逆变换获得更接近真实数据的生成数据。仿真和实验数据验证表明,基于FP-GAN生成的数据样本在时域特征、时域统计特征以及分类器分类结果方面都能较好地与已有实际数据融合,可以对小样本数据进行增强,能有效解决数据不平衡问题。 展开更多
关键词 生成对抗神经网络 单边谱 皮尔逊相关系数 傅里叶逆变换 数据不平衡
在线阅读 下载PDF
一种针对侧信道建模攻击中数据不平衡的新方法 被引量:3
5
作者 汪平 郑梦策 +2 位作者 南杰慧 罗志敏 胡红钢 《密码学报》 CSCD 2021年第4期549-559,共11页
基于机器学习或深度学习的侧信道建模攻击本质上是一个有监督分类问题,而分类标签的依据是泄露模型,我们经常使用的两种泄露模型是汉明重量(Hamming Weight,HW)和汉明距离(Hamming Distance,HD).当使用HW/HD作为采集轨迹的标签时,会出... 基于机器学习或深度学习的侧信道建模攻击本质上是一个有监督分类问题,而分类标签的依据是泄露模型,我们经常使用的两种泄露模型是汉明重量(Hamming Weight,HW)和汉明距离(Hamming Distance,HD).当使用HW/HD作为采集轨迹的标签时,会出现数据不平衡的问题.在本文中,我们首次使用条件生成对抗网络(Conditional Generative Adversarial Network,CGAN)来生成轨迹,通过数据扩张的方法来构建平衡的训练集,从而提升模型的攻击效果.我们选取了三种公开数据集来验证该方法的有效性,包括无防护的AES硬件实现、带有一阶掩码防护的AES软件实现以及带有随机延迟防护的AES软件实现.实验结果表明,由重构的平衡训练集所训练出的模型具有更好的攻击效果,有效地减少了成功攻击所需的轨迹条数,并且在具体分析模型的类别预测比例时,能够正确预测更多的少数类别样本.这也表明优化后的模型学习到了更全面的类别.对比Picek等在2019年的相关工作,我们的方法有了更进一步的提升. 展开更多
关键词 侧信道建模攻击 数据不平衡 生成对抗网络
在线阅读 下载PDF
基于1DMCNNBIGRUSAM的轴承数据不平衡故障诊断 被引量:4
6
作者 李青 李丽君 董增寿 《现代制造工程》 CSCD 北大核心 2022年第12期117-124,共8页
为了改善单一网络模型在轴承数据不平衡情况下特征提取不全面的问题,提出了一种基于多尺度卷积双向门控循环神经网络的轴承故障诊断方法。首先将原始信号作为模型的输入,设计串/并联结构的卷积层提取轴承信号中的多尺度特征;其次在双向... 为了改善单一网络模型在轴承数据不平衡情况下特征提取不全面的问题,提出了一种基于多尺度卷积双向门控循环神经网络的轴承故障诊断方法。首先将原始信号作为模型的输入,设计串/并联结构的卷积层提取轴承信号中的多尺度特征;其次在双向门控循环单元中引入序列注意力机制进一步捕获时间相关特征;最后将Adacost代价敏感函数与软注意力机制结合,替换传统卷积神经网络中的Softmax函数,以解决轴承数据不平衡造成的诊断精度低的问题。通过对德国帕德博恩大学的轴承数据集中设置3组不同比例的不平衡数据集进行实验验证,实验表明所提方法可以更全面地提取出故障特征,提升了模型在不平衡数据集情况下的故障识别率。 展开更多
关键词 滚动轴承 故障诊断 不平衡数据 卷积神经网络 循环神经网络
在线阅读 下载PDF
多源不平衡数据下基于联邦学习的谐波减速器故障诊断方法
7
作者 王玉静 叶柏宏 +2 位作者 康守强 刘连胜 孙宇林 《仪器仪表学报》 北大核心 2025年第6期317-329,共13页
针对工业机器人谐波减速器不同故障类别样本数量不平衡,以及单源信号获取信息往往有限,导致故障诊断准确率不高的问题,提出一种多源不平衡数据下基于联邦学习的谐波减速器故障诊断方法。该方法通过对不同用户的多源信号做小波变换,将一... 针对工业机器人谐波减速器不同故障类别样本数量不平衡,以及单源信号获取信息往往有限,导致故障诊断准确率不高的问题,提出一种多源不平衡数据下基于联邦学习的谐波减速器故障诊断方法。该方法通过对不同用户的多源信号做小波变换,将一维信号转换为二维图像,构建时频图数据集;利用改进的数据增强方法对不平衡数据集进行均衡处理;引入有效的通道注意力机制,并通过可学习的权重加权残差分支的输出,以增强模型对不同输入信号残差信息的适应性和对数据关键特征的提取能力;通过改进的多模态变分自编码器挖掘多源信号之间的互补信息进行特征融合,并采用焦点损失函数作为训练损失函数,使模型能够更关注错分频率较高的类别样本,构建多用户个性化本地模型;服务器端聚合用户端本地模型参数并更新全局模型,通过联邦学习保障用户端本地的孤岛隐私数据,从而对多源不平衡数据下谐波减速器进行故障诊断。通过搭建谐波减速器信号采集实验平台进行验证,所提方法能够有效提取谐波减速器多源不平衡数据的特征并实现信息融合,平均故障诊断准确率为98.8%,性能优于所对比的方法。 展开更多
关键词 数据不平衡 多源信息融合 联邦学习 谐波减速器 故障诊断
在线阅读 下载PDF
面向时序SMART不平衡数据的硬盘故障预测算法
8
作者 李国 侯雪雪 +1 位作者 李静 陈辉 《郑州大学学报(理学版)》 北大核心 2025年第3期19-27,共9页
针对数据存储中心硬盘故障数据稀少造成的故障预测效果不佳的问题,面向自我检测分析与报告技术(self-monitoring analysis and reporting technology,SMART)数据信息的时序特征,提出一种通过数据增强解决不平衡问题的硬盘故障预测算法... 针对数据存储中心硬盘故障数据稀少造成的故障预测效果不佳的问题,面向自我检测分析与报告技术(self-monitoring analysis and reporting technology,SMART)数据信息的时序特征,提出一种通过数据增强解决不平衡问题的硬盘故障预测算法。该算法利用长短期记忆网络改进传统的生成对抗网络,生成包含故障恶化趋势信息的序列段数据,解决了数据集不平衡问题。同时,为进一步提高预测性能,预测模型融合了时序注意力机制和特征注意力机制,挖掘不同SMART特征和时间步对硬盘故障恶化过程的敏感程度。此外,在特征选择阶段结合了多种典型特征选择算法来选取关键特征。在真实硬盘数据集上进行了实验验证,结果表明,所提算法的准确率、召回率和F 1值均有较大提升。 展开更多
关键词 不平衡数据 数据增强 硬盘故障预测 生成对抗网络 注意力机制
在线阅读 下载PDF
基于可解释不平衡数据分类方法的加密货币交易欺诈检测
9
作者 尹裴 蒋文龙 徐岩 《上海理工大学学报》 北大核心 2025年第4期461-470,共10页
鉴于正常和欺诈交易数据在加密货币交易样本中分布极端不平衡,以及交易数据的高维特征和非线性关系,提出了一种用于加密货币交易欺诈检测的可解释不平衡数据分类方法。首先,使用synthetic minority oversampling technique(SMOTE)过采... 鉴于正常和欺诈交易数据在加密货币交易样本中分布极端不平衡,以及交易数据的高维特征和非线性关系,提出了一种用于加密货币交易欺诈检测的可解释不平衡数据分类方法。首先,使用synthetic minority oversampling technique(SMOTE)过采样和对比学习的数据增强策略来平衡数据;接着,引入基于transformer的深度学习模型,学习样本相关性,并通过基于对比损失的预训练和基于贝叶斯优化的微调策略来优化模型,更好地区分正常和欺诈交易的特征分布,提取与欺诈相关的高阶、高维特征;最后,设计基于shapley additive explanations(SHAP)的解释器,结合注意力分数对模型预测进行解释,揭示不同交易特征在欺诈检测中的作用。对比实验结果表明,该模型在召回率方面表现出色,能全面识别加密货币交易中的欺诈活动。同时,在F_(1)值上达到最佳,很好地平衡了准确率和召回率。消融实验验证了所提出的数据平衡和预训练-微调策略的必要性,说明其能有效处理不平衡数据的分类问题。研究不仅丰富了金融欺诈检测的研究体系,还增强了加密货币的交易安全性,促进市场健康发展,维护经济稳定与社会安全。 展开更多
关键词 加密货币 欺诈检测 数据分布极端不平衡 可解释
在线阅读 下载PDF
不平衡数据流的集成分类方法综述 被引量:1
10
作者 朱诗能 韩萌 +3 位作者 杨书蓉 代震龙 杨文艳 丁剑 《计算机工程与应用》 北大核心 2025年第2期59-72,共14页
现实世界的场景中,从数据流中学习会面临着类不平衡的问题,学习算法由于缺少训练数据而无法有效识别少数类样本。为了介绍不平衡数据流集成分类的研究现状和面临的挑战,依据近年来的不平衡数据流集成分类领域文献,从基于加权、选择和投... 现实世界的场景中,从数据流中学习会面临着类不平衡的问题,学习算法由于缺少训练数据而无法有效识别少数类样本。为了介绍不平衡数据流集成分类的研究现状和面临的挑战,依据近年来的不平衡数据流集成分类领域文献,从基于加权、选择和投票的决策规则和基于代价敏感学习、主动学习和增量学习的学习方式的角度详细分析和总结了不平衡数据流的集成方法,并比较了使用相同数据集的算法的性能。针对处理不同类型复杂数据流中的不平问题,从概念漂移、多类、噪声和类重叠四个方面对其集成分类算法进行总结,分析了经典算法的时间复杂度。对动态数据流、缺失信息的数据流、多标签数据流和不确定数据流中不平衡问题的分类挑战提出了下一步的集成策略研究。 展开更多
关键词 不平衡数据 集成分类 决策规则 学习方式 复杂数据
在线阅读 下载PDF
面向不平衡数据的联邦类别增量学习
11
作者 方子希 付晓东 +3 位作者 丁家满 刘骊 彭玮 代飞 《小型微型计算机系统》 北大核心 2025年第9期2121-2129,共9页
联邦增量学习作为一种新兴学习范式,在保护用户隐私的同时利用数据孤岛的知识,有效缓解了由于存储空间有限而导致的灾难性遗忘问题.但现有的联邦增量学习研究忽略了用户数据不平衡对造成全局模型灾难性遗忘及精度降低的影响.针对此问题... 联邦增量学习作为一种新兴学习范式,在保护用户隐私的同时利用数据孤岛的知识,有效缓解了由于存储空间有限而导致的灾难性遗忘问题.但现有的联邦增量学习研究忽略了用户数据不平衡对造成全局模型灾难性遗忘及精度降低的影响.针对此问题,该文提出了一种基于条件生成对抗网络的无数据存储重放再训练方法(ARR).具体来说,用户模型训练分为两个阶段:第1阶段结合条件生成对抗网络生成模拟的历史任务数据和当前任务数据共同训练本地模型;第2阶段则冻结特征提取层,采用平衡采样技术对其他层进行再训练.服务器通过利用条件生成对抗网络生成的所有用户任务数据来优化全局模型.实验结果显示,ARR在不平衡程度逐渐加剧的情况下,全局模型准确率相较于现有的相关方法提高了8.64%~31.03%,有效缓解了灾难性遗忘问题,显著提高了全局模型的最终精度. 展开更多
关键词 联邦增量学习 不平衡数据 条件生成对抗网络 灾难性遗忘 二次训练
在线阅读 下载PDF
面向不平衡数据的木薯叶部病害图像识别方法
12
作者 王丹阳 梁伟红 +1 位作者 李玉萍 黄贵修 《中国农机化学报》 北大核心 2025年第3期101-107,123,共8页
为提高产地环境下木薯叶部病害自动识别的准确性,解决病害图像低对比度和数据长尾分布问题,建立一种深度学习模型SwinTFCC用于木薯叶部病害识别。该模型采用Swin Transformer作为骨干网络,借助Swin Transformer的自注意力机制和层级结... 为提高产地环境下木薯叶部病害自动识别的准确性,解决病害图像低对比度和数据长尾分布问题,建立一种深度学习模型SwinTFCC用于木薯叶部病害识别。该模型采用Swin Transformer作为骨干网络,借助Swin Transformer的自注意力机制和层级结构关注局部与全局特征,使其对复杂背景病害识别具有鲁棒性;将最后一层特征输入特征簇压缩模块,以映射稀疏特征簇为稠密特征簇,减少长尾分布中样本少的类别稀疏特征簇跨越决策边界导致分类错误情况;并采用迁移学习在木薯叶部病害图像数据集上进行训练,以提升木薯叶部病害识别性能。试验结果表明,模型的F 1值达到90.74%,较其他主流模型提升8.04%~19.3%。所采用的方法在小规模不平衡数据集上取得较好效果,验证模型的有效性,为木薯叶部病害自动精准识别提供技术支撑。 展开更多
关键词 木薯叶部 病害识别 图像识别 迁移学习 不平衡数据
在线阅读 下载PDF
不平衡数据集下的数据中心网络流量异常检测
13
作者 王光明 李冬青 蒋从锋 《计算机工程》 北大核心 2025年第8期227-237,共11页
数据中心作为信息化时代的重要基础设施,承载着各类关键信息服务。目前,数据中心是网络攻击的主要攻击目标。为了提高网络安全,提出数据中心网络流量异常检测方法。研究内容包括特征选择、不平衡数据集分类和异常流量检测。首先,提出了... 数据中心作为信息化时代的重要基础设施,承载着各类关键信息服务。目前,数据中心是网络攻击的主要攻击目标。为了提高网络安全,提出数据中心网络流量异常检测方法。研究内容包括特征选择、不平衡数据集分类和异常流量检测。首先,提出了一种处理不平衡数据集的分类方法,通过基于集成的特征选择和混合采样算法提高分类性能;其次,引入基于随机森林(RF)和LightGBM的流量异常检测方法,充分利用它们在处理不平衡数据和噪声抵抗方面的优势。在CSE-CIC-IDS2018公开数据集上进行验证,实验结果表明,所提方法具有较高的精确率和召回率,在15种流量类型中有9种类型的分类精确率都高于90%,并且有13种类型的分类精确率都在74%以上,对提高数据中心安全、保障服务质量和改善网络流量异常检测具有重要意义。 展开更多
关键词 数据中心 网络流量 异常检测 不平衡数据 集成学习
在线阅读 下载PDF
改进生成对抗网络的不平衡数据下轴承故障诊断
14
作者 周建民 夏晓枫 李家辉 《控制工程》 北大核心 2025年第6期1039-1048,共10页
针对滚动轴承实际运行中的故障数据远少于正常数据,从而影响故障诊断模型诊断率的问题,提出了一种数据不平衡情况下的基于改进生成对抗网络(generative adversarial networks,GAN)的滚动轴承故障诊断方法——基于梯度惩罚的Wasserstein... 针对滚动轴承实际运行中的故障数据远少于正常数据,从而影响故障诊断模型诊断率的问题,提出了一种数据不平衡情况下的基于改进生成对抗网络(generative adversarial networks,GAN)的滚动轴承故障诊断方法——基于梯度惩罚的Wasserstein生成对抗网络(Wassserstein generative adversarial networks based on gradient penalty,WGAN-GP)。首先,采用连续小波变换(continuewavelettransform,CWT)将振动信号集转化为二维图像数据集。然后,用Wasserstein距离替代GAN的Jensen-Shannon(JS)散度,再使用梯度惩罚策略在WGAN权值裁剪过程中优化模型,使生成器损失函数的权值在区间中取得均衡,实现故障数据的自动生成,扩充故障数据集。最后,设置了不平衡数据集和数据增强对比实验,结果表明,WGAN-GP在所设置的不同不平衡比例实验下的模型诊断率分别提高了2.29%、1%、2.85%,在数据增强对比实验中的诊断率也高于几何变换增强后的数据和原始数据。 展开更多
关键词 生成对抗网络 深度残差网络 迁移学习 不平衡数据 故障诊断
在线阅读 下载PDF
基于不平衡数据的热轧板凸度质量分类方法研究
15
作者 王晓宇 张欣 +1 位作者 孙杰 陈树宗 《塑性工程学报》 北大核心 2025年第8期107-117,共11页
针对热轧生产过程中板凸度数据分布不平衡,导致传统分类方法在少数类样本识别及分类性能上表现不足问题,提出了一种面向不平衡数据的热轧板凸度质量分类方法。该方法通过局部密度过采样(LDS)对少数类样本进行数据增强,有效提升模型对少... 针对热轧生产过程中板凸度数据分布不平衡,导致传统分类方法在少数类样本识别及分类性能上表现不足问题,提出了一种面向不平衡数据的热轧板凸度质量分类方法。该方法通过局部密度过采样(LDS)对少数类样本进行数据增强,有效提升模型对少数类的识别能力;利用可分解二叉树算法(DBTA)实现复杂多类别问题的高效划分;同时结合Adaboost分类器进一步提高分类的精度和稳定性。实验结果表明,所提方法在评价指标MAUC、G-mean和F1-Macro上分别达到了0.9198、0.9087和0.8739,显著提升了板凸度质量分类的准确性。 展开更多
关键词 质量分类 不平衡数据 局部密度过采样 热轧板凸度
在线阅读 下载PDF
面向不平衡数据的特征子空间增强的异质集成学习
16
作者 陈丽芳 白云 +1 位作者 施永辉 代琪 《计算机工程与科学》 北大核心 2025年第5期940-950,共11页
对于不平衡数据,传统分类器趋向于保证多数类的准确率,而牺牲少数类的准确率,造成算法的整体性能下降。针对这一问题,提出一种面向不平衡数据的特征子空间增强的异质集成学习算法HEL-FSA。首先利用XGBoost算法学习特征的重要性,并选择... 对于不平衡数据,传统分类器趋向于保证多数类的准确率,而牺牲少数类的准确率,造成算法的整体性能下降。针对这一问题,提出一种面向不平衡数据的特征子空间增强的异质集成学习算法HEL-FSA。首先利用XGBoost算法学习特征的重要性,并选择重要的特征,形成数据集的特征子空间;其次使用SMOTE算法在特征子空间中生成新样本,获得更加平衡的训练数据;最后,采用逻辑回归、决策树、多层感知器、支持向量机和XGBoost这5种基模型,并使用if_any算法融合异质基模型。在9个不平衡数据集上的实验结果验证了该算法的可行性,同时,将提出的算法用于宫颈癌风险预测,增强了其对宫颈癌风险的理解和预测能力。 展开更多
关键词 不平衡数据 特征选择 集成学习 合成少数类过采样技术
在线阅读 下载PDF
多判别器生成对抗网络工业不平衡数据建模方法
17
作者 赵佳 杨澜 刘勤学 《计算机集成制造系统》 北大核心 2025年第2期554-566,共13页
为解决工业场景下不平衡数据建模预测精度较低的问题,提出结合多判别器生成对抗网络及反聚类筛选的工业不平衡数据建模方法来增强模型分类预测效果。针对生成对抗网络模型在训练过程中存在模式崩溃,导致生成数据多样性差的问题,基于集... 为解决工业场景下不平衡数据建模预测精度较低的问题,提出结合多判别器生成对抗网络及反聚类筛选的工业不平衡数据建模方法来增强模型分类预测效果。针对生成对抗网络模型在训练过程中存在模式崩溃,导致生成数据多样性差的问题,基于集成思想,使用多判别器框架改进Wasserstein生成对抗网络,增强模型对模式崩溃问题的鲁棒性;针对生成数据存在噪声的问题,集成有序点集识别聚类结构算法和高斯混合模型聚类算法从密度及分布角度对生成数据进行聚类,采用信息熵反向筛选生成数据扩充少数类样本;在电极升降数据集及UCL带钢缺陷数据集上采用XGBOOST、支持向量机、BP神经网络3种分类模型对比原始不平衡数据、随机过采样、SMOTE算法、原始生成对抗网络与所提方法解决不平衡问题后模型的分类预测效果。实验验证了所提方法的优越性。 展开更多
关键词 工业不平衡数据 生成对抗网络 生成数据筛选 信息熵 矿热炉 电极升降 带钢缺陷识别
在线阅读 下载PDF
融合数据平衡与贝叶斯优化的交通事故严重程度预测模型 被引量:4
18
作者 潘义勇 徐翔宇 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第12期69-76,共8页
针对交通事故数据类别不平衡导致的预测精度低问题,融合了过采样技术和贝叶斯网络来改进Catboost算法,以预测交通事故的严重程度。利用PowerSHAP算法筛选出21个关键特征,采用Borderline-SMOTE过采样技术对处于边界的少数类样本进行平衡... 针对交通事故数据类别不平衡导致的预测精度低问题,融合了过采样技术和贝叶斯网络来改进Catboost算法,以预测交通事故的严重程度。利用PowerSHAP算法筛选出21个关键特征,采用Borderline-SMOTE过采样技术对处于边界的少数类样本进行平衡采样;使用贝叶斯优化方法调整Catboost算法的超参数,并基于调优后的Catboost算法建立交通事故严重程度预测模型。通过实例验证表明:改进模型在预测交通事故严重程度方面优于其他分类模型,其准确率、精确率、召回率和F1分数分别为83.03%、87.01%、80.79%和83.50%;与其他参数优化方法相比,贝叶斯优化后的参数性能最高提升了3个百分点以上;Borderline-SMOTE过采样技术在数据占比较小的重伤事故上实现了各项性能评价指标达到88%以上,比其他模型至少提高了3.3%,并且在处理类别不平衡的交通事故严重程度预测方面,Borderline-SMOTE过采样技术的精度更高,优于其他5种数据采样技术。 展开更多
关键词 交通工程 交通事故严重程度 数据不平衡 贝叶斯优化 Catboost
在线阅读 下载PDF
混合特征平衡图注意力网络日志异常检测模型 被引量:3
19
作者 陈旭 张硕 +1 位作者 景永俊 王叔洋 《计算机工程与应用》 北大核心 2025年第1期308-320,共13页
针对现有方法忽略了日志异常数据不平衡和日志特征间的关联性,导致异常检测准确率低的问题。提出一种基于混合特征平衡图注意力网络的日志异常检测模型(HBGATLog)。构建混合日志图构建模块,通过混合特征提取模块提取日志数据的语义信息... 针对现有方法忽略了日志异常数据不平衡和日志特征间的关联性,导致异常检测准确率低的问题。提出一种基于混合特征平衡图注意力网络的日志异常检测模型(HBGATLog)。构建混合日志图构建模块,通过混合特征提取模块提取日志数据的语义信息、日志序列和时间结构,增强日志特征间的关联性,并采用日志图构建模块构建日志图,有效保留空间结构特征。设计平衡日志图生成模块,解决不平衡的日志数据导致检测结果偏向多数类问题。采用图日志异常检测模块进行异常检测。使用BGL、Thunderbird和HDFS三个公共数据集对HBGATLog进行验证,实验结果表明,F1 score分别达到了99.0%、98.7%和98.1%。证明HBGATLog不但能够解决日志数据不平衡问题,充分考虑日志数据特征的关联性,而且有效降低了漏检率。 展开更多
关键词 日志异常检测 日志分析 图神经网络 混合特征提取 数据不平衡
在线阅读 下载PDF
不平衡数据下基于改进门控卷积网络的轴承故障诊断
20
作者 郗昌盛 梁小夏 +3 位作者 田少宁 杨杰 冯国金 甄冬 《噪声与振动控制》 CSCD 北大核心 2024年第4期153-160,共8页
深度学习在滚动轴承故障诊断中具有广泛的应用,然而,现实中的监测数据往往具有不平衡性,这就会对模型的诊断性能产生很大影响。因此,提出一种基于改进门控卷积神经网络(Improved Gated Convolutional Neural Network,IGCNN)的故障诊断方... 深度学习在滚动轴承故障诊断中具有广泛的应用,然而,现实中的监测数据往往具有不平衡性,这就会对模型的诊断性能产生很大影响。因此,提出一种基于改进门控卷积神经网络(Improved Gated Convolutional Neural Network,IGCNN)的故障诊断方法,用于数据不平衡条件下的故障诊断。首先,提出改进门控卷积层以增强特征提取能力,通过批量归一化技术提高模型的泛化能力。然后,使用标签分布感知边界(Label-distribution-aware Margin,LDAM)损失函数提高模型对少数类的敏感度,减小数据不平衡对模型的影响。将所提算法应用在两组故障轴承数据上,在数据不平衡率为20:1的情况下,所提算法仍然可达到92.71%和94.47%的故障识别率,而对比的其他主流深度学习模型在该情况下只有60%~72%的准确率,表明所提方法在数据集严重不平衡情况下具有很强的诊断能力和鲁棒性。 展开更多
关键词 故障诊断 数据不平衡 改进门控卷积神经网络 标签分布感知边界损失函数 滚动轴承
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部