期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于SAE-MSCNN的网络入侵检测
1
作者 王泽辉 郝秦霞 《计算机工程与设计》 北大核心 2025年第10期2858-2865,共8页
针对现有的网络入侵检测方法忽略了流量特征间的关联性对特征选择的重要性,且在数据平衡时未能考虑到低频攻击样本的分布离散性,导致检测性能下降的问题,提出互信息值融合(mutual information value fusion,MIVF)方法来选择与攻击行为... 针对现有的网络入侵检测方法忽略了流量特征间的关联性对特征选择的重要性,且在数据平衡时未能考虑到低频攻击样本的分布离散性,导致检测性能下降的问题,提出互信息值融合(mutual information value fusion,MIVF)方法来选择与攻击行为相关性高且彼此之间关联性低的特征。提出基于DBSCAN改进的SMOTE方法对低频攻击样本按照其密度聚类分布进行过采样;构建SAE-MSCNN分类模型来检验性能。在NSL-KDD和UNSW-NB15数据集上验证,准确率分别达到92.89%和94.85%。结果表明所提方法可以有效地选择特征以及平衡数据,尤其是提高低频攻击的检测准确率。 展开更多
关键词 网络入侵检测 互信息 特征关联 特征选择 密度聚类 过采样 数据平衡
在线阅读 下载PDF
基于蚁群优化聚类算法的DNA序列分类方法 被引量:2
2
作者 梁冰 陈德运 《计算机工程与应用》 CSCD 北大核心 2010年第25期124-126,130,共4页
针对目前聚类算法在分析DNA序列数据时的低效性和分类精度低问题,提出一种基于蚁群优化聚类算法(ACOC)的DNA序列分类方法,在密度函数中加入自适应感应量并应用模拟退火中的α-适应量的冷却策略,采用DNA序列分布特征对DNA序列进行特征提... 针对目前聚类算法在分析DNA序列数据时的低效性和分类精度低问题,提出一种基于蚁群优化聚类算法(ACOC)的DNA序列分类方法,在密度函数中加入自适应感应量并应用模拟退火中的α-适应量的冷却策略,采用DNA序列分布特征对DNA序列进行特征提取,并将pearson相关系数引入蚁群聚类算法作为相似性度量。在EMBL-DNA数据库中4个数据集上进行性能测试,与统计聚类和k-means算法的比较表明,该方法具有一定的时间和精度的优越性,适于解决大规模DNA序列数据分类问题。 展开更多
关键词 DNA序列分析 蚁群聚类算法 分类 特征提取 person相关系数
在线阅读 下载PDF
基于AdaBoost的组合网络流量分类方法 被引量:1
3
作者 赵小欢 夏靖波 +1 位作者 连向磊 李巧丽 《电讯技术》 北大核心 2013年第9期1207-1212,共6页
针对单一分类方法在训练样本不足的情况下对于小样本网络流分类效果差的特点,通过自适应增强(Adaptive Boosting,AdaBoost)算法进行流量分类。算法首先使用CFS(Correlation-based Feature Selection)特征选择方法从大量网络流特征中提... 针对单一分类方法在训练样本不足的情况下对于小样本网络流分类效果差的特点,通过自适应增强(Adaptive Boosting,AdaBoost)算法进行流量分类。算法首先使用CFS(Correlation-based Feature Selection)特征选择方法从大量网络流特征中提取出少量高效的分类特征,在此基础上,通过AdaBoost算法组合决策树、关联规则和贝叶斯等5种单一分类方法实现流量分类。实际网络流量数据测试表明,基于AdaBoost的组合分类方法的准确率在所选的几种算法中是最高的,其能够达到98192%,且相对于单一的分类算法,组合流量分类方法对于小样本网络流的分类效果具有明显提升。 展开更多
关键词 网络流 流量分类 相关特征选择 自适应增强算法 组合分类器
在线阅读 下载PDF
基于遗传算法的结肠癌基因选择与样本分类 被引量:2
4
作者 何爱香 《计算机工程与应用》 CSCD 北大核心 2007年第18期242-245,共4页
提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS... 提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS方法选择优秀基因子集,并存档记录这些子集。根据存档子集中基因被选择的频率选择进一步搜索的候选子集,最后以结合了遗传算法和SVM的GA/SVM从候选基因子集中选择分类特征子集。把这种GA/CFS-GA/SVM方法应用到结肠癌微阵列数据,实验结果及与文献的比较表明了该方法效果良好。 展开更多
关键词 遗传算法 支持向量机 CFS 基因表达谱
在线阅读 下载PDF
一种基于AP-Entropy选择集成的风控模型和算法 被引量:2
5
作者 王茂光 杨行 《计算机科学》 CSCD 北大核心 2021年第S02期71-76,80,共7页
近年来互联网金融网贷领域涌现出了众多的风控问题,对此采用多种特征选择方法预处理风控领域的数据指标,构建了全面的针对企业信用的风控指标体系,采用stacking集成策略研究了基于AP-Entropy的信用风险模型。信用风险模型有两层学习器,... 近年来互联网金融网贷领域涌现出了众多的风控问题,对此采用多种特征选择方法预处理风控领域的数据指标,构建了全面的针对企业信用的风控指标体系,采用stacking集成策略研究了基于AP-Entropy的信用风险模型。信用风险模型有两层学习器,引入选择集成思想,从种类和数量上筛选基学习器。首先,在Logistic回归、反向传播神经网络、AdaBoost等经典机器学习算法中,采用AP聚类算法选出适合企业信用风险的异质学习器作为基学习器;其次,在每次学习器迭代中,利用熵对学习器择优,自动选出F1值最高的基学习器,其中改进基于熵的学习器选择算法,提升了基学习器选择过程的效率,降低了模型的计算成本,模型选取XGBoost作为次级基学习器。实验结果表明,文中提出的模型和其他模型相比具有更好的学习效果和更强的泛化能力。 展开更多
关键词 风控指标体系 stacking集成策略 AP-Entropy信用风险模型 选择集成 AP聚类算法 基于熵的学习器选择算法 XGBoost
在线阅读 下载PDF
一种可扩展半径的RNA二级结构密度聚类算法
6
作者 王常武 王秀芹 +3 位作者 魏真真 王宝文 刘文远 李永强 《小型微型计算机系统》 CSCD 北大核心 2015年第9期1968-1972,共5页
基于自由能模型预测RNA二级结构时,真实结构可能存在于高于最小自由能一定范围内的次优结构集合中.通过对RNA次优结构集合聚类,选取代表性的结构,可以提高RNA二级结构预测的准确率.针对可变密度的RNA二级结构数据集合,提出了一种可扩展... 基于自由能模型预测RNA二级结构时,真实结构可能存在于高于最小自由能一定范围内的次优结构集合中.通过对RNA次优结构集合聚类,选取代表性的结构,可以提高RNA二级结构预测的准确率.针对可变密度的RNA二级结构数据集合,提出了一种可扩展半径的密度聚类算法.算法利用特征选择方法对特征集合进行筛选,选取与聚类相关度较高的特征子集,降低聚类空间的维度.聚类过程,以最大密度对象作为簇的初始聚类中心,根据簇内的密度分布情况和密度变化参数更新簇的半径,直到簇扩展完成.实验表明,该算法可以识别并处理变密度簇,能够有效地聚类RNA二级结构. 展开更多
关键词 RNA二级结构 次优结构 密度聚类算法 特征选择
在线阅读 下载PDF
一种基于特征聚类和评价的轴承寿命预测新方法 被引量:7
7
作者 李海浪 邹益胜 +3 位作者 曾大懿 刘永志 赵市教 宋小欣 《振动与冲击》 EI CSCD 北大核心 2022年第5期141-150,共10页
在预测轴承寿命时,使提取的特征和剩余寿命保持高相关性,并使不同的特征之间保持低相关性,是有利于提升轴承寿命预测精度的。为解决单一的特征评价方法对后者考虑不足的问题,提出了一种基于相关性改进Kmeans聚类算法(correlation-based ... 在预测轴承寿命时,使提取的特征和剩余寿命保持高相关性,并使不同的特征之间保持低相关性,是有利于提升轴承寿命预测精度的。为解决单一的特征评价方法对后者考虑不足的问题,提出了一种基于相关性改进Kmeans聚类算法(correlation-based improved Kmeans cluster algorithm, Corr-Kmeans)和初始聚类中心确定方法,并与特征评价相结合,最终提出一种基于特征聚类和评价的轴承寿命预测新方法。首先利用卷积自编码对频域信息提取初始特征,用Corr-Kmeans对初始特征按相关性进行聚类,使得聚类后的特征类内相关性高,而类间相关性低;其次,使用相关性、单调性和鲁棒性3个指标来综合评价每一类中的特征,按照筛选阈值将得分较高的特征从每一类中分别选出,组成用于训练与预测的特征子集;最后采用LSTM(long short-term memory, LSTM)网络对轴承剩余寿命进行预测。在一个轴承加速寿命试验的公开数据集上使用留一法进行验证,利用对比试验证明了该方法在预测轴承剩余寿命上的有效性。 展开更多
关键词 轴承 寿命预测 相关性改进Kmeans聚类算法(Corr-Kmeans) 聚类 特征评价
在线阅读 下载PDF
基于CFS-GA特征选择算法的中文网页自动分类 被引量:2
8
作者 喻春萍 黄晓霞 《上海海事大学学报》 北大核心 2012年第1期77-81,共5页
为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色... 为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色体进行二进制编码;利用CFS启发值作为GA的适应度函数对个体进行评价;CFS值越大的个体遗传到下一代的概率越大.结合GA的全局搜索特性,该算法可保证所得特征子集是全局最优的.利用weka平台,对搜狗实验室提供的中文网页数据集进行实验.结果表明,该算法能有效降低特征空间的维度、提高分类精度。 展开更多
关键词 中文网页分类 特征选择 基于关联的特征选择算法 遗传算法
在线阅读 下载PDF
基于无监督过滤式指标选择的冬小麦种植区域尺度管理分区算法
9
作者 万青松 罗晓姣 《湖北农业科学》 2023年第4期185-189,共5页
无监督过滤式指标选择(FSCC)对冬小麦种植区域尺度管理有直接影响。以重庆市某区域为研究对象,分析了无监督过滤式指标对冬小麦种植区域尺度管理分区精度的影响。首先,结合聚类算法建立数据样本库,研究冬小麦种植区域空间分布特征,同时... 无监督过滤式指标选择(FSCC)对冬小麦种植区域尺度管理有直接影响。以重庆市某区域为研究对象,分析了无监督过滤式指标对冬小麦种植区域尺度管理分区精度的影响。首先,结合聚类算法建立数据样本库,研究冬小麦种植区域空间分布特征,同时计算区域精度、平均区域精度、区域精度标准差、均方根误差和偏差;然后,选取特征子集,实现数据分区计算。结果表明,无监督过滤式指标对冬小麦种植区域尺度管理分区精度的影响较大。在实现分区管理过程中,需要同时考虑无监督过滤式指标、空间范围、农作物种类和冬小麦种植密度4个因素,通过互相调节,确保分区效果达到最佳,从而提高冬小麦的种植产量。 展开更多
关键词 无监督过滤式指标选择(fscc) 冬小麦 种植区域 尺度管理 算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部