期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向不平衡数据集分类的离散高维空间距离采样和极端随机树算法 被引量:7
1
作者 袁帅 余伟 +1 位作者 余放 李石君 《计算机应用与软件》 北大核心 2020年第7期194-199,211,共7页
针对电网故障诊断数据的类别分布不平衡,即故障类别相对正常类别比值小问题,提出一种基于ADASYN-DHSD-ET(Adaptive Synthetic Sampling of Discrete High-dimensional Spatial Distance Extremely Randomized Trees)的电网故障诊断方法... 针对电网故障诊断数据的类别分布不平衡,即故障类别相对正常类别比值小问题,提出一种基于ADASYN-DHSD-ET(Adaptive Synthetic Sampling of Discrete High-dimensional Spatial Distance Extremely Randomized Trees)的电网故障诊断方法。在采样阶段根据故障类样本的内部分布密度自适应计算合成新样本数量;在合成新样本时,计算离散型数据样本点之间的高维空间距离,使点之间的合成数量与距离成负相关关系,进行合成新样本;在基分类器生成过程中,节点分裂时随机选择特征,巧妙借助极端随机树随机性强方差低的特性解决了噪声数据的影响。实验结果对比传统分类和常用不平衡分类表明,该算法有效地提升了故障类的精度,同时克服了以往别的算法随机过采样导致的正常类精度下降,G-mean值达到82.6%,具有优越的电网故障诊断预测性能。 展开更多
关键词 不平衡数据 电网故障诊断 离散高维空间距离 自适应合成采样 极端随机树 多类分类
在线阅读 下载PDF
基于Stacking集成学习的空管危险源数据分类
2
作者 王洁宁 闫思卿 孙禾 《科学技术与工程》 北大核心 2025年第20期8583-8594,共12页
在现代空管系统中,高效准确地识别和分类危险源文本数据对于保障飞行安全至关重要,空管危险源数据指的是那些可能影响航空安全的潜在因素、条件或事件的信息集合,然而现有的文本分类方法难以应对数据类别多样性和类别不平衡问题。当下... 在现代空管系统中,高效准确地识别和分类危险源文本数据对于保障飞行安全至关重要,空管危险源数据指的是那些可能影响航空安全的潜在因素、条件或事件的信息集合,然而现有的文本分类方法难以应对数据类别多样性和类别不平衡问题。当下迫切需要开发适用于空管系统的高效分类方法,以提高飞行安全水平。针对单一学习器用于空管危险源文本分类存在的类别分布较多,难以捕捉类别数据不平衡时的文本特征导致预测精度下降的问题,提出基于Stacking训练思想的、两次加权的改进集成模型。首先,参考双防机制对危险源和安全隐患完成类别划分;再采用词频-逆文档频率(term frequency-inverse document frequency, TF-IDF)算法提取预处理后的危险源文本特征完成向量化,并利用合成少数类过采样技术(synthetic minority over-sampling technique, SMOTE)和自适应合成过采样算法(adaptive synthetic sampling approach, ADASYN)分别随机生成向量化后的少数类文本,使文本数据集的类别分布趋于平衡;再从基学习器每折交叉验证的F1分数加权和基学习器之间敏感性评估机制动态加权两方面改进Stacking集成模型,提高类别不平衡危险源文本的分类性能。在所构建的数据集上的实验结果表明:相较于SMOTE+改进集成模型,ADASYN+改进集成模型的精确率、召回率和F1分数分别提升0.9、1.1和1.0个百分点,较好地抑制处理多数类别过拟合的问题,实验结果验证了所提算法的有效性。 展开更多
关键词 双防机制 空管危险源 文本分类 自适应合成采样算法(ADASYN) Stacking集成模型
在线阅读 下载PDF
融合状态估计和深度学习的智能电网异常检测模型
3
作者 郑铁军 张宏杰 +1 位作者 王景 王洋 《兰州理工大学学报》 北大核心 2025年第2期143-151,共9页
针对Web攻击和DDoS攻击引发的电力系统中一系列难以检测的网络安全事件问题,提出了一种加权最小二乘法、扩展卡尔曼滤波器与两阶段深度学习异常检测模型相融合的智能电网异常检测方法.该方法采用自适应合成采样算法,解决了电力系统中网... 针对Web攻击和DDoS攻击引发的电力系统中一系列难以检测的网络安全事件问题,提出了一种加权最小二乘法、扩展卡尔曼滤波器与两阶段深度学习异常检测模型相融合的智能电网异常检测方法.该方法采用自适应合成采样算法,解决了电力系统中网络安全数据分布不平衡问题;融合加权最小二乘法和扩展卡尔曼滤波器,借助电力系统中的动态非线性特性,通过精确的状态估计提高了智能电网异常检测的准确性,并使用χ^(2)检验和异常检测指数检测了电力系统中的安全风险;在此基础上,将改进的深度神经网络模型和多重BiLSTM网络模型相结合,对网络安全风险事件进行了分类识别.将该方法在CICIDS2017数据集上进行数值模拟验证.数值仿真结果表明该方法能有效检测出各类攻击,具有更好的异常检测能力,并对网络安全风险事件分类精度提升了3.85%. 展开更多
关键词 智能电网 状态估计 异常检测 自适应合成采样
在线阅读 下载PDF
特征增强的改进LightGBM流量异常检测方法 被引量:3
4
作者 陈万志 赵林 王天元 《电子测量与仪器学报》 CSCD 北大核心 2024年第3期195-207,共13页
针对机器学习在流量异常检测中存在选择特征过于依赖专家经验、原始特征表达能力不足、数据受噪声和离群点影响导致模型鲁棒性差以及处理非平衡海量高维数据时少数异常类检测率低等问题,提出一种特征增强的改进LightGBM(light gradient ... 针对机器学习在流量异常检测中存在选择特征过于依赖专家经验、原始特征表达能力不足、数据受噪声和离群点影响导致模型鲁棒性差以及处理非平衡海量高维数据时少数异常类检测率低等问题,提出一种特征增强的改进LightGBM(light gradient boosting machine)流量异常检测方法。首先,采用隔离森林(isolation forest,iForest)实现异常值处理,并利用异常值处理后的数据训练引入全局平均池化(global average pooling,GAP)的一维卷积去噪自编码器(convolutional denoising autoencoder,CDAE),间接地消除数据中的噪声,得到原始特征的低维增强表达。然后,采用自适应合成采样(adaptive synthetic,ADASYN)对异常值处理后的数据实现数据增强并运用训练完成的CDAE进行特征提取,将得到的低维特征作为LightGBM的输入,训练并进行贝叶斯参数寻优。最后,通过得到的CDAE+LightGBM组合模型实现对异常流量的精准分类。在NSL-KDD数据集上所提方法的五分类准确率和F1分数分别达到了87.80%和87.75%,能够有效提升检测精度,增强未知攻击的检测能力。在CICIDS2017场景数据集上的测试进一步验证了所提方法可行性,且优于与同类型的深度学习算法。 展开更多
关键词 流量异常检测 隔离森林 卷积去噪自编码器 自适应合成采样 LightGBM
在线阅读 下载PDF
融合二次特征提取和自蒸馏的流量异常检测方法 被引量:1
5
作者 陈万志 赵林 王天元 《信息安全研究》 CSCD 北大核心 2024年第12期1082-1090,共9页
针对深度学习模型在处理非平衡的海量高维流量数据时对少数类攻击流量检测率低的问题,提出一种融合二次特征提取和自蒸馏的流量异常检测方法.首先,采用隔离森林(isolation forest,iForest)去除正常类样本中的离群点,训练改进的卷积去噪... 针对深度学习模型在处理非平衡的海量高维流量数据时对少数类攻击流量检测率低的问题,提出一种融合二次特征提取和自蒸馏的流量异常检测方法.首先,采用隔离森林(isolation forest,iForest)去除正常类样本中的离群点,训练改进的卷积去噪编码器(convolutional denoising autoencoder,CDAE),减少数据中噪声和离群点对模型训练时的影响,得到原始特征的低维增强表示.其次,借助ADASYN在去除离群点的数据集上合成少数类攻击样本,解决数据失衡问题.然后,再利用iForest清除生成新样本中的离群点得到新数据集,利用训练好的CDAE对新数据集进行1次特征提取,提取的特征作为基于自蒸馏的ResNet模型输入完成2次特征提取.最后,通过组合训练好的CDAE和ResNet模型实现对异常流量的精准识别.该方法在NSL-KDD数据集上五分类准确率和F1分数最高分别达到91.52%和92.05%.实验结果表明,与现有的方法相比,该方法能够有效提升对少数攻击流量的检测率. 展开更多
关键词 流量异常检测 卷积去噪自编码器 自蒸馏 隔离森林 自适应合成采样
在线阅读 下载PDF
车联网中基于stacking集成学习的攻击检测模型
6
作者 徐会彬 方龙 张莎 《电信科学》 北大核心 2024年第12期38-50,共13页
由于无线网络的开放性,车联网容易受到网络攻击,如拒绝服务、模糊和欺骗攻击。为此,提出融合随机森林(random forest,RF)和梯度提升决策树(gradient boosting decision tree,GBDT)的堆叠(stacking)的入侵检测(RG-IDS)模型。首先,RG-IDS... 由于无线网络的开放性,车联网容易受到网络攻击,如拒绝服务、模糊和欺骗攻击。为此,提出融合随机森林(random forest,RF)和梯度提升决策树(gradient boosting decision tree,GBDT)的堆叠(stacking)的入侵检测(RG-IDS)模型。首先,RG-IDS模型利用自适应合成采样(adaptive synthetic sampling,ADASYN)算法对不平衡类别的数据样本进行近邻采样,进而生成更多同类别的近似样本,形成相对平衡的样本数据。其次,RG-IDS模型利用GBDT评估特征的重要性,并选择具有重要特征的样本数据,建立轻量级分类器。最后,RG-IDS采用基于k折交叉验证的堆叠方法,降低过拟合的概率。将RF、GBDT和LightGBM分类器作为基学习器。采用数据集CICIDS 2017和NSL-KDD对RG-IDS模型进行实验测试。实验结果表明,RG-IDS模型可实现较高的F1值。 展开更多
关键词 车联网 入侵检测 自适应合成采样 梯度提升决策树 堆叠
在线阅读 下载PDF
面向不平衡数据分类的复合SVM算法研究 被引量:23
7
作者 刘东启 陈志坚 +1 位作者 徐银 李飞腾 《计算机应用研究》 CSCD 北大核心 2018年第4期1023-1027,共5页
为了改善传统支持向量机(SVM)对不平衡数据的分类效果,解决分类器对少类样本分类效果较差的问题,提出了一种复合SVM算法。该算法首先通过自适应合成采样(ADASYN)算法与不同错误代价(DEC)算法的结合,改善不平衡数据对超平面造成的偏移;... 为了改善传统支持向量机(SVM)对不平衡数据的分类效果,解决分类器对少类样本分类效果较差的问题,提出了一种复合SVM算法。该算法首先通过自适应合成采样(ADASYN)算法与不同错误代价(DEC)算法的结合,改善不平衡数据对超平面造成的偏移;然后引入一种新的修正算法对预测模型进行修正,提高预测模型对于不同数据特性的适应性。选择UCI数据库中的七组现实世界的不平衡数据集进行测试,实验表明在各个数据集上复合SVM算法性能均优于现有算法或与现有算法相当,分类性能平均提高了2.0%~20.9%,证明了该算法的有效性和鲁棒性。 展开更多
关键词 不平衡数据 支持向量机 自适应合成采样 不同错误代价 修正算法
在线阅读 下载PDF
适用于不平衡数据集分类的改进SVM算法 被引量:8
8
作者 刘东启 陈志坚 +1 位作者 徐银 李飞腾 《传感器与微系统》 CSCD 2018年第3期115-117,122,共4页
在分析了传统支持向量机(SVM)对不平衡数据的学习缺陷后,提出了一种改进SVM算法,采用自适应合成(ADASYN)采样技术对数据集进行部分重采样,增加少类样本的数量;对不同的样本点分配不同的权重,减弱噪声对训练结果的影响;使用基于代价敏感... 在分析了传统支持向量机(SVM)对不平衡数据的学习缺陷后,提出了一种改进SVM算法,采用自适应合成(ADASYN)采样技术对数据集进行部分重采样,增加少类样本的数量;对不同的样本点分配不同的权重,减弱噪声对训练结果的影响;使用基于代价敏感的SVM算法训练,缓解不平衡数据对超平面造成的偏移。选择UCI数据库中的6组不平衡数据集进行测试,实验结果表明:在各个数据集上改进SVM算法的性能优于其他算法,并在少类准确率和多类准确率上取得了很好的平衡。 展开更多
关键词 不平衡数据 支持向量机 自适应合成采样 代价敏感
在线阅读 下载PDF
基于ADASYN与改进残差网络的入侵流量检测识别 被引量:14
9
作者 唐玺博 张立民 钟兆根 《系统工程与电子技术》 EI CSCD 北大核心 2022年第12期3850-3862,共13页
针对现有入侵流量检测模型分类准确率低、小样本特征提取不足等问题,提出了一种基于自适应合成采样和Inception-Resnet模块的改进残差网络算法。该算法能够对不平衡数据集进行采样优化,有效提升模型的小样本特征提取能力。首先,通过对... 针对现有入侵流量检测模型分类准确率低、小样本特征提取不足等问题,提出了一种基于自适应合成采样和Inception-Resnet模块的改进残差网络算法。该算法能够对不平衡数据集进行采样优化,有效提升模型的小样本特征提取能力。首先,通过对不平衡的数据训练集进行过采样改善数据分布,然后对非数据部分进行独热编码处理并与数据部分整合,降低预处理复杂度,最后利用改进残差网络模型进行数据训练,并进行性能评估和算法效能对比。实验结果表明,改进残差网络模型对入侵流量的检测准确率在多分类和二分类情况下分别达到89.40%和91.88%。相比于经典深度学习算法,改进残差网络模型的准确率更高,误报率更低,具备较高的可靠性和工程应用价值。 展开更多
关键词 入侵流量检测 残差神经网络 自适应合成采样 不平衡数据集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部