-
题名基于遗传算法的结肠癌基因选择与样本分类
被引量:2
- 1
-
-
作者
何爱香
-
机构
山东工商学院信息与电子工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第18期242-245,共4页
-
文摘
提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS方法选择优秀基因子集,并存档记录这些子集。根据存档子集中基因被选择的频率选择进一步搜索的候选子集,最后以结合了遗传算法和SVM的GA/SVM从候选基因子集中选择分类特征子集。把这种GA/CFS-GA/SVM方法应用到结肠癌微阵列数据,实验结果及与文献的比较表明了该方法效果良好。
-
关键词
遗传算法
支持向量机
cfs
基因表达谱
-
Keywords
Genetic Algorithms (GA)
Support Vector Machines (SVM)
correlation-based feature selection (cfs)
gene expression profiles
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GBM的特征选择在心脏病预测中的研究
被引量:3
- 2
-
-
作者
刘云龙
周怡君
罗晨
-
机构
东南大学软件学院
东南大学机械工程学院
-
出处
《现代电子技术》
2023年第19期101-106,共6页
-
文摘
心脏病患者的人数逐年增多,死亡率居高不下,因此许多学者对基于机器学习的患病人群识别方法进行了研究,但由于心脏病数据的特征过多,构建的模型参数较多,往往导致训练时间过长。因此提出一种利用梯度提升机算法(GBM)对已有的特征选择算法进行改进,在通过减少特征数量实现缩短训练时间的同时,对心脏病患者的预测准确率也得到了提升。首先,采用遗传算法(GA)和基于相关性的特征选择(CFS)进行特征降维,并选出备选特征子集;其次,提出利用GBM实现对模型预测无关特征的筛除;最后,采用支持向量机(SVM)和K近邻算法(KNN)进行准确率预测。实验表明:当预测模型为SVM时,GBM对GA和CFS的综合评价指标的提升分别达到了9.89%和2.2%;当预测模型为KNN时,GBM对GA和CFS的综合评价指标的提升分别达到了7.7%和2.2%,并且GA+GBM在SVM上的表现最好,达到了84.62%,能够有效地提升医疗诊断的效率。
-
关键词
特征选择
遗传算法
梯度提升机
支持向量机
cfs
KNN
心脏病预测
BOOSTING
-
Keywords
feature selection
GA algorithm
GBM
SVM
cfs
KNN
heart disease prediction
boosting
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于机器学习的混合式特征选择算法
被引量:7
- 3
-
-
作者
雷海锐
高秀峰
刘辉
-
机构
陆军工程大学石家庄校区装备模拟训练中心
中国人民解放军驻五四一三厂军事代表室
-
出处
《电子测量技术》
2018年第16期42-46,共5页
-
文摘
针对CFS算法中优先选择数量较多的特征属性的问题,引入了信息增益比和对称不确定性的改进CFS算法。同时,为了进一步降低特征维数,提高分类效率,提出一种基于filter-wrapper模型的混合式特征选择方法,先采用改进后的CFS算法过滤无关特征;再基于精简子集,采用封装式选择中的序列后向搜索算法,结合决策树选取最优子集。仿真实验表明,采用该方法选择的特征子集具有更好的分类能力,同时发现该方法在不同的分类模型中泛化能力也有着不同的表现。
-
关键词
特征选择
信息增益比
对称不确定性
cfs
决策树
-
Keywords
feature selection
information gain ratio
symmetrical uncertainly
cfs
decision tree
-
分类号
TN91
[电子电信—通信与信息系统]
-