-
题名基于样本重叠与近似马尔可夫毯的特征选择算法
被引量:3
- 1
-
-
作者
王大志
季焱晶
陈彦桦
王洪峰
黄敏
-
机构
东北大学信息科学与工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第3期725-730,共6页
-
基金
国家重点研发计划资助项目(2020YFB1708202)。
-
文摘
随着信息技术的快速发展,数据中的高维特征极大地增加了产生冗余特征的可能性,冗余特征不仅导致搜索空间增大,而且影响了分类的准确率。针对现有的特征选择算法难以解决高维特征选择问题,提出了基于样本重叠与近似马尔可夫毯的特征选择算法(samples overlapping based modified Markov blanket, SOMMB)。该算法首先融合最大信息系数与改进强近似马尔可夫毯去除冗余特征;其次采用样本重叠策略指导前向搜索的过程,选取相关特征。该算法在10个公开数据集上与目前流行的PGVNS、FCBF-MIC、CFS、mRMR、RF、CBFS、ReliefF以及FFSG算法进行对比实验,SOMMB算法的平均准确率为82.519%,对比FFSG获得的最高准确率提升了4.214%,表明SOMMB算法可以提高分类精度。
-
关键词
特征选择
最大信息系数
改进强近似马尔可夫毯
样本重叠
前向搜索
-
Keywords
feature selection
maximal information coefficient
modified strong approximate Markov blanket
samples overlapping
forward search
-
分类号
TP393.04
[自动化与计算机技术—计算机应用技术]
-
-
题名基于交互信息的两阶段特征选择算法
被引量:1
- 2
-
-
作者
刘强
降爱莲
-
机构
太原理工大学信息与计算机学院
-
出处
《计算机工程与设计》
北大核心
2023年第1期125-132,共8页
-
基金
山西省回国留学人员科研基金项目(2017-051)。
-
文摘
针对传统特征选择中只考虑了特征的相关性和冗余性而忽略了特征间交互作用的问题,提出一种基于交互信息的两阶段特征选择算法(SAMBFC)。通过对称不确定性和强近似马尔可夫毯原理进行无关特征和冗余特征的筛选;利用特征间交互增益和基于相关性特征选择算法构建一种特征间互补性评价方法,选取具有交互作用的冗余特征。在9个不同维度的标准数据集上与8种典型算法进行对比实验和分析,其结果表明,SAMBFC算法所选特征的分类性能以及综合表现明显优于其它算法。
-
关键词
特征选择
两阶段
强近似马尔可夫毯
对称不确定性
相关性
冗余性
互补性
-
Keywords
feature selection
two stages
strong approximation Markov blanket
symmetrical uncertainty
correlation
redundancy
complementarity
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-