期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于边缘样本的智能网络入侵检测系统数据污染防御方法 被引量:34
1
作者 刘广睿 张伟哲 李欣洁 《计算机研究与发展》 EI CSCD 北大核心 2022年第10期2348-2361,共14页
人工智能已被广泛应用于网络入侵检测系统.然而由于流量样本存在概念漂移现象,用于恶意流量识别的模型必须频繁更新以适应新的特征分布.更新后模型的有效性依赖新增训练样本的质量,所以防止数据污染尤为重要.然而目前流量样本的污染过... 人工智能已被广泛应用于网络入侵检测系统.然而由于流量样本存在概念漂移现象,用于恶意流量识别的模型必须频繁更新以适应新的特征分布.更新后模型的有效性依赖新增训练样本的质量,所以防止数据污染尤为重要.然而目前流量样本的污染过滤工作仍依赖专家经验,这导致在模型更新过程中存在样本筛选工作量大、模型准确率不稳定、系统易受投毒攻击等问题.现有工作无法在保证模型性能的同时实现污染过滤或模型修复.为解决上述问题,为智能网络入侵检测系统设计了一套支持污染数据过滤的通用模型更新方法.首先设计了EdgeGAN算法,利用模糊测试使生成对抗网络快速拟合模型边缘样本分布.然后通过检查新增训练样本与原模型的MSE值和更新后模型对旧边缘样本的F分数,识别出污染样本子集.通过让模型学习恶意边缘样本,抑制投毒样本对模型的影响,保证模型在中毒后快速复原.最后通过在5种典型智能网络入侵检测系统上的实验测试,验证了提出的更新方法在污染过滤与模型修复上的有效性.对比现有最先进的方法,新方法对投毒样本的检测率平均提升12.50%,对中毒模型的修复效果平均提升6.38%.该方法适用于保护任意常见智能网络入侵检测系统的更新过程,可减少人工样本筛选工作,有效降低了投毒检测与模型修复的代价,对模型的性能和鲁棒性起到保障作用.新方法也可以用于保护其他相似的智能威胁检测模型. 展开更多
关键词 网络入侵检测 数据污染 投毒攻击 生成对抗网络 边缘样本
在线阅读 下载PDF
自适应边缘样本识别的深度聚类算法 被引量:1
2
作者 李俊霞 钱宇华 +1 位作者 马国帅 许皓 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期34-46,共13页
深度神经网络因其强大的非线性映射和特征提取能力被广泛应用于聚类中,然而,现有的大多数深度聚类网络仅仅考虑了样本的特征信息,并未有效利用样本空间位置的分布以及样本间的关联信息.本研究融合了样本的特征信息以及样本间的空间位置... 深度神经网络因其强大的非线性映射和特征提取能力被广泛应用于聚类中,然而,现有的大多数深度聚类网络仅仅考虑了样本的特征信息,并未有效利用样本空间位置的分布以及样本间的关联信息.本研究融合了样本的特征信息以及样本间的空间位置信息和关联关系,提出了自适应边缘样本识别的深度聚类算法(Auto-CB).在使用自编码器学习样本特征表示的同时,通过图神经网络学习样本间的结构信息;然后利用自注意力机制自适应地将样本划分为簇中心样本和边缘样本,并分别使用K-means和多数投票机制对其聚类;在5个数据集上与7个深度聚类以及基于图神经网络的聚类算法进行了性能对比.结果表明,利用簇中心样本与边缘样本之间的潜在关联关系可以有效促进样本的特征表示,并在聚类任务中取得了更好的效果. 展开更多
关键词 深度聚类 图神经网络 关联关系 边缘样本 结构特征
在线阅读 下载PDF
基于边缘增长的协同训练方法
3
作者 刘紫阳 高占宝 李绪隆 《仪器仪表学报》 EI CAS CSCD 北大核心 2018年第3期45-53,共9页
为保证分类器间的差异性,同时提高子分类器自身性能,提出一种新的基于边缘样本增长的半监督集成学习方法——边缘协同森林(M-Co-Forest)。当从未标记样本中选取伪标记样本时,不仅考虑未标记样本的标记置信度,同时考虑未标记样本在已... 为保证分类器间的差异性,同时提高子分类器自身性能,提出一种新的基于边缘样本增长的半监督集成学习方法——边缘协同森林(M-Co-Forest)。当从未标记样本中选取伪标记样本时,不仅考虑未标记样本的标记置信度,同时考虑未标记样本在已标记样本中的位置。只有处于当前分类器训练样本边缘且置信度高于预设阈值的样本才能被赋予伪标签,加入下一轮学习。同时,利用噪音学习理论指导训练过程,当伪标记样本的数量不足以进一步提升分类器性能时,停止迭代。多个UCI数据集和CTG数据上的实验结果表明M-Co-Forest的性能优于对比算法。 展开更多
关键词 半监督学习 协同训练 集成学习 边缘样本
在线阅读 下载PDF
基于边缘函数的修剪随机森林算法
4
作者 曹桃云 《统计与决策》 CSSCI 北大核心 2017年第7期72-74,共3页
对随机森林做修剪的目的就是要把随机森林中重要的分类器找到,使得修剪后得到的子森林不仅具有可解释性,而且能充分利用数据的信息量。文章提出一种新的修剪随机森林方法,基于样本的边缘函数,采用逐步向后算法,得到嵌套子森林,采用1-se... 对随机森林做修剪的目的就是要把随机森林中重要的分类器找到,使得修剪后得到的子森林不仅具有可解释性,而且能充分利用数据的信息量。文章提出一种新的修剪随机森林方法,基于样本的边缘函数,采用逐步向后算法,得到嵌套子森林,采用1-se法则挑选最优子森林。在两份实际数据中和已有随机森林的修剪方法做了对比,结果表明,所提出的方法,在修剪后子森林预测率的分布和子森林中分类器个数的分布,以及选出的解释变量三个指标上均具有优势。 展开更多
关键词 随机森林 修剪 样本边缘函数 嵌套子森林 1-se法则
在线阅读 下载PDF
一种改进的基于密度聚类模糊支持向量机 被引量:7
5
作者 张恒 邹开其 +1 位作者 崔杰 张敏 《计算机工程》 CAS CSCD 北大核心 2009年第5期194-196,共3页
为了提高模糊支持向量机在数据集上的训练效率,提出一种改进的基于密度聚类(DBSCAN)的模糊支持向量机算法。运用DBSCAN算法对原始数据进行预处理,去除对分类贡献小的中心样本,用剩余的边缘样本集合完成模糊支持向量机的训练工作。实验表... 为了提高模糊支持向量机在数据集上的训练效率,提出一种改进的基于密度聚类(DBSCAN)的模糊支持向量机算法。运用DBSCAN算法对原始数据进行预处理,去除对分类贡献小的中心样本,用剩余的边缘样本集合完成模糊支持向量机的训练工作。实验表明,该方法形成的聚类边缘样本较好地保持了原样本的分布情况,在保证分类精度的同时,大大缩短了训练时间,提高了工作效率。 展开更多
关键词 模糊支持向量机 密度聚类 边缘样本
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部