期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
基于基因关联分析的贝叶斯网络疾病样本分类算法
1
作者 李志杰 廖旭红 +1 位作者 李元香 李青蓝 《计算机应用》 CSCD 北大核心 2024年第11期3449-3458,共10页
基因表达数据作为生物学中一种特定类型的大数据,尽管基因表达值都是普通的实数值,但它们的相似性不是基于欧氏距离度量,而是基于基因表达值是否展现同升同降趋势。目前的基因贝叶斯网络以基因表达水平值为节点随机变量,没有体现这种子... 基因表达数据作为生物学中一种特定类型的大数据,尽管基因表达值都是普通的实数值,但它们的相似性不是基于欧氏距离度量,而是基于基因表达值是否展现同升同降趋势。目前的基因贝叶斯网络以基因表达水平值为节点随机变量,没有体现这种子空间模式的相似性。因此,提出基于基因关联分析的贝叶斯网络疾病分类算法(BCGA),从带类标签的疾病样本-基因表达数据中学习贝叶斯网络并预测新疾病样本的分类。首先,将疾病样本离散化过滤以选择基因,并将降维后的基因表达值排序和置换为基因列下标;其次,分解基因列下标序列为长度为2的原子序列集合,而这个集合的频繁原子序列对应一对基因的关联关系;最后,通过基因关联熵度量因果关系,并用于贝叶斯网络结构学习。BCGA的参数学习也变得很容易,基因节点的条件概率分布只要统计该基因的原子序列和父节点基因的原子序列出现频次即可。在多个肿瘤和非肿瘤基因表达数据集上的实验结果表明,相较于已有的同类算法,BCGA的疾病分类准确率明显提高,分析时间有效缩短;另外,BCGA使用基因关联熵代替条件独立性,使用基因原子序列代替基因表达值,可以更好地拟合基因表达数据。 展开更多
关键词 基因表达数据 频繁原子序列 基因关联熵 基因序列贝叶斯网络 疾病分类
在线阅读 下载PDF
考虑样本不平衡的模型无关的基因选择方法 被引量:24
2
作者 李建中 杨昆 +2 位作者 高宏 骆吉洲 郭政 《软件学报》 EI CSCD 北大核心 2006年第7期1485-1493,共9页
在基因表达数据分析中,鉴别基因是后续研究中非常重要的信息基因.有很多研究致力于从基因表达数据中选出信息基因这一挑战性工作,并提出了一些基因选择方法.然而,这些方法(特别是非参数选择方法)都没有考虑不同样本类别中样本大小的不... 在基因表达数据分析中,鉴别基因是后续研究中非常重要的信息基因.有很多研究致力于从基因表达数据中选出信息基因这一挑战性工作,并提出了一些基因选择方法.然而,这些方法(特别是非参数选择方法)都没有考虑不同样本类别中样本大小的不平衡性问题.考虑样本不平衡性和基因选择方法的稳定性,给出一个全新的与数据分布模型无关的基因选择方法.在类内变化小和类间差别大的策略下,选择敏感的度量函数提高方法的鉴别能力,同时,利用类内变化和类间差别的一致性来增加方法的稳定性和适用性.这一方法不但可以应用于两个类别的情况,也可以应用于多个类别的情况.最后,使用两组真实的基因表达数据对所提出的方法进行了验证.实验结果表明,这一方法比其他方法具有更高的有效性和稳健性. 展开更多
关键词 基因选择 基因表达 分类 微阵列
在线阅读 下载PDF
基因表达数据的聚类分析研究进展 被引量:25
3
作者 岳峰 孙亮 +2 位作者 王宽全 王永吉 左旺孟 《自动化学报》 EI CSCD 北大核心 2008年第2期113-120,共8页
基因表达数据的爆炸性增长迫切需求自动、有效的数据分析工具.目前聚类分析己成为分析基因表达数据获取生物学信息的有力工具.为了更好地挖掘基因表达数据,近年来提出了许多改进的传统聚类算法和新聚类算法.本文首先简单介绍了基因表达... 基因表达数据的爆炸性增长迫切需求自动、有效的数据分析工具.目前聚类分析己成为分析基因表达数据获取生物学信息的有力工具.为了更好地挖掘基因表达数据,近年来提出了许多改进的传统聚类算法和新聚类算法.本文首先简单介绍了基因表达数据的获取和表示,之后系统地介绍了近年来应用在基因表达数据分析中的聚类算法.根据聚类目标的不同将算法分为基于基因的聚类、基于样本的聚类和两路聚类,并对每类算法介绍了其生物学的含义及其难点,详细讨论了各种算法的基本原理及优缺点.最后总结了当前的基因表达数据的聚类分析方法,并对发展趋势作了进一步的展望. 展开更多
关键词 DNA微阵列 基因表达数据 聚类分析
在线阅读 下载PDF
基于输出不一致测度的极限学习机集成的基因表达数据分类 被引量:41
4
作者 陆慧娟 安春霖 +2 位作者 马小平 郑恩辉 杨小兵 《计算机学报》 EI CSCD 北大核心 2013年第2期341-348,共8页
选择性集成学习已经成为分析基因表达数据、获取生物学信息的有力工具.为了更好地挖掘基因表达数据,利用极限学习机的集成,克服单个ELM用于数据分类时性能欠稳定的缺点,文中提出了一种基于输出不一致测度的ELM相异性集成算法(D-D-ELM).... 选择性集成学习已经成为分析基因表达数据、获取生物学信息的有力工具.为了更好地挖掘基因表达数据,利用极限学习机的集成,克服单个ELM用于数据分类时性能欠稳定的缺点,文中提出了一种基于输出不一致测度的ELM相异性集成算法(D-D-ELM).算法首先以输出不一致测度为标准对多个ELM模型进行相异性判断,其次根据ELM的平均分类精度剔除掉相应的模型,最后对筛选后的分类模型用多数投票法进行集成.算法被运用到Breast、Leukemia、Colon、Heart基因表达数据上,并通过理论和实验得到验证.实验结果的统计学分析表明D-D-ELM能够以更少的模型数量达到较稳定的分类精度. 展开更多
关键词 极限学习机 基因表达数据 集成算法 输出不一致测度 分类
在线阅读 下载PDF
基于模糊c-均值聚类的微阵列基因表达数据分析 被引量:8
5
作者 宫改云 毛用才 +1 位作者 高新波 刘三阳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第2期291-295,共5页
微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种... 微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种有用工具. 展开更多
关键词 模糊C-均值聚类 微阵列基因表达数据 差异基因表达 微阵列DNA芯片
在线阅读 下载PDF
基于加权极限学习机的肿瘤基因表达谱数据分类 被引量:4
6
作者 姜琳颖 余东海 石鑫 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第6期798-803,共6页
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个... 基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能. 展开更多
关键词 基因 表达谱数据 加权极限学习机 不平衡性 肿瘤分类
在线阅读 下载PDF
微阵列数据癌症分类问题中的基因选择 被引量:20
7
作者 张丽娟 李舟军 《计算机研究与发展》 EI CSCD 北大核心 2009年第5期794-802,共9页
微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来... 微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因.这一识别过程称为基因选择.基因选择在统计模式识别、机器学习和数据挖掘领域已得到广泛研究.介绍基因选择问题所涉及到的相关背景知识和基本概念;全面地回顾统计学、机器学习和数据挖掘领域对基因选择问题的解决方法;通过实验展示了几种典型算法在微阵列数据上的性能;指出当前存在的问题和未来的研究方向. 展开更多
关键词 基因选择 微阵列数据 癌症分类 属性相关性 相关性度量
在线阅读 下载PDF
两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类的比较研究 被引量:4
8
作者 金志超 陆健 +3 位作者 吴骋 高青斌 孙亚林 贺佳 《中国卫生统计》 CSCD 北大核心 2009年第5期450-454,458,共6页
目的比较两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类分析的效果,比较不同差异基因选取方法对分类结果的影响。方法利用NCI60等4个肿瘤基因表达数据库,通过4种不同方法选取差异表达基因,在此基础上,用两种基于偏最小二... 目的比较两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类分析的效果,比较不同差异基因选取方法对分类结果的影响。方法利用NCI60等4个肿瘤基因表达数据库,通过4种不同方法选取差异表达基因,在此基础上,用两种基于偏最小二乘的方法行多分类分析。一是偏最小二乘线性判别,首先运用偏最小二乘法行降维,再利用降维得到的成分作为输入变量作线性判别分析;二是偏最小二乘判别分析,利用偏最小二乘回归直接进行分类。分类效果采用留一法和10倍交叉验证法进行评价。结果偏最小二乘判别分析的分类效果略优于偏最小二乘降维后的线性判别。以变量重要性指标选取差异表达基因时分类效果较好,其次是SAM法。结论在对肿瘤基因表达数据行多分类分析时,偏最小二乘法既是一种高效的降维方法,也是一种实用的分类方法。 展开更多
关键词 肿瘤基因表达数据 偏最小二乘法 多分类
在线阅读 下载PDF
嵌入代价敏感的极限学习机相异性集成的基因表达数据分类 被引量:7
9
作者 安春霖 陆慧娟 +1 位作者 魏莎莎 杨小兵 《计算机科学》 CSCD 北大核心 2014年第12期211-215,共5页
极限学习机的相异性集成算法(Dissimilarity Based Ensemble of Extreme Learning Machine,D-ELM)在基因表达数据分类中能够得到较稳定的分类效果,然而这种分类算法是基于分类精度的,当所给样本的误分类代价不相等时,不能直接实现代价... 极限学习机的相异性集成算法(Dissimilarity Based Ensemble of Extreme Learning Machine,D-ELM)在基因表达数据分类中能够得到较稳定的分类效果,然而这种分类算法是基于分类精度的,当所给样本的误分类代价不相等时,不能直接实现代价敏感分类过程中的最小平均误分类代价的要求。通过在分类过程中引入概率估计以及误分类代价和拒识代价重新构造分类结果,提出了基于相异性集成极限学习机的代价敏感算法(CS-D-ELM)。该算法被运用到基因表达数据集上,得到了较好的分类效果。 展开更多
关键词 极限学习机 相异性集成 代价敏感 基因表达数据 分类
在线阅读 下载PDF
基于改进稀疏非负矩阵分解方法的乳腺癌微阵列表达数据分析 被引量:6
10
作者 孔薇 王娟 牟晓阳 《安徽医科大学学报》 CAS 北大核心 2013年第7期725-729,共5页
目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负... 目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负矩阵的输入矩阵,进行双向聚类进一步筛选出81个与乳腺癌密切相关的显著基因,最后通过cytoscape对81个与乳腺癌密切相关的显著基因构建生物过程结构图。结果筛选出与乳腺癌相关的基因、可能相关的基因以及这些基因参与的生物过程之间的关系。结论改进稀疏非负矩阵分解与现存的其他非负矩阵分解算法相比具有聚类效果好、稳定性强且迭代次数少的优点,适合于乳腺癌差异表达基因的提取。 展开更多
关键词 乳腺癌 非负矩阵分解 基因表达谱数据
在线阅读 下载PDF
一种改进的基因表达数据分类方法 被引量:3
11
作者 蔡立军 沈小乔 +1 位作者 林亚平 蒋林波 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第3期79-82,共4页
从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的... 从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的特点,提出了一种改进的基于相关性的递归特征消除算法(简称为C-RFE),消除了数据冗余.实验结果表明,新方法可有效提高分类准确率和特征选取的效率. 展开更多
关键词 基因表达数据分类 SVM KNN 特征选择
在线阅读 下载PDF
分块PCA提取细胞周期调控基因的研究 被引量:2
12
作者 饶妮妮 匡斌 +2 位作者 王成雄 任正隆 陈曦 《中国生物医学工程学报》 CAS CSCD 北大核心 2008年第2期255-259,264,共6页
用主成分分析(PCA)方法处理基因表达微阵列数据能够实现基因选择、基因表达模式提取、基因分类等,有其独特的优点。然而,PCA方法却存在容易丢失重要信息的弱点。为了克服这一方法的弱点,提出分块PCA,并以此为基础形成一种提取细胞周期... 用主成分分析(PCA)方法处理基因表达微阵列数据能够实现基因选择、基因表达模式提取、基因分类等,有其独特的优点。然而,PCA方法却存在容易丢失重要信息的弱点。为了克服这一方法的弱点,提出分块PCA,并以此为基础形成一种提取细胞周期调控基因的新方法。通过理论分析和对酵母微阵列数据的仿真实验研究,表明这种方法可行、有效,能够全面地提取出隐含在方差较小变量中的细胞周期调控基因,并能够给予实验结果较好的生物意义解释,在微阵列数据处理中具有应用前景。 展开更多
关键词 主成分分析(PCA) 分块PCA 微阵列数据 细胞周期调控基因
在线阅读 下载PDF
基因芯片表达谱数据的预处理分析 被引量:7
13
作者 吴斌 沈自尹 《中国生物化学与分子生物学报》 CAS CSCD 北大核心 2006年第4期272-277,共6页
基因芯片数据的预处理是一个十分关键的步骤,通过数据过滤获取需要的数据、数据转换满足正态分布的分析要求、缺失值的估计弥补不完整的数据、数据归一化纠正系统误差等处理为后续分析工作做准备,预处理分析的重要性并不亚于基因芯片的... 基因芯片数据的预处理是一个十分关键的步骤,通过数据过滤获取需要的数据、数据转换满足正态分布的分析要求、缺失值的估计弥补不完整的数据、数据归一化纠正系统误差等处理为后续分析工作做准备,预处理分析的重要性并不亚于基因芯片的后续分析,它将直接影响后续分析是否能得到预期的结果.本文重点综述了cDNA芯片的数据预处理,简要地概述寡核苷酸芯片的数据预处理. 展开更多
关键词 基因表达谱 数据预处理 CDNA芯片
在线阅读 下载PDF
癌症基因分类的Laplace谱方法 被引量:2
14
作者 王年 庄振华 +2 位作者 范益政 李学俊 王继 《电子学报》 EI CAS CSCD 北大核心 2011年第7期1594-1597,共4页
本文尝试着将图的Laplace谱理论应用于癌症基因表达谱数据的分类上.计算出训练集中每个类的均值作为类中心,选出与类中心欧式距离最小的若干样本用laplace矩阵构造完全图,记为代表该类的标准图.用待测样本依次替换标准图中所有的点,将... 本文尝试着将图的Laplace谱理论应用于癌症基因表达谱数据的分类上.计算出训练集中每个类的均值作为类中心,选出与类中心欧式距离最小的若干样本用laplace矩阵构造完全图,记为代表该类的标准图.用待测样本依次替换标准图中所有的点,将生成的新图与标准图进行特征点匹配,并计算匹配点数总和.将待测样本划分为总匹配点数最多的那个类.通过对白血病两个亚型(ALL与AML)与结肠癌数据进行留一法实验,验证了本文方法的有效性. 展开更多
关键词 分类 基因表达谱数据 LAPLACE谱
在线阅读 下载PDF
基于网络成分分析的阿尔茨海默症靶基因动态表达研究 被引量:3
15
作者 孔薇 崔地博 牟晓阳 《中国生物医学工程学报》 CAS CSCD 北大核心 2013年第4期418-425,共8页
解析转录因子与靶基因之间相互调节的关系并构建转录调控网络,对研究阿尔茨海默症(AD)的致病机理、早期诊断及制药等具有重要意义。网络成分分析(NCA)是一种能够动态预测转录因子活性并表现其影响关系的方法。本研究利用转录因子对靶基... 解析转录因子与靶基因之间相互调节的关系并构建转录调控网络,对研究阿尔茨海默症(AD)的致病机理、早期诊断及制药等具有重要意义。网络成分分析(NCA)是一种能够动态预测转录因子活性并表现其影响关系的方法。本研究利用转录因子对靶基因的调控作用,及基因在AD不同病程中表达的先验知识和生物数据,通过预处理AD基因表达数据,选择出10个转录因子和85个靶基因进行网络成分分析,并利用162条调控关系构建AD基因调控网络,形成和展示了转录因子对靶基因的动态调控关系和作用。通过动态预测转录因子活性及构建网络图,发现转录因子在AD疾病的不同程度的活性有明显变化趋势,其调控的靶基因变化符合AD的病理特征。如靶基因NONO在转录因子ANAPC5的调控下,表达值由3 126上升至4 508,而靶基因YWHAZ表达值由6 000下降到接近于0。该研究为AD致病机理探寻、早期诊断和相应的分子生物学实验,提供了新的思路和依据。 展开更多
关键词 阿尔茨海默症 网络成分分析 转录因子 动态网络结构
在线阅读 下载PDF
基因表达数据在邻域关系中的特征选择 被引量:3
16
作者 陈玉明 吴克寿 李向军 《智能系统学报》 CSCD 北大核心 2014年第2期210-213,共4页
基因特征选择是基因表达数据分析中的一种重要方法。粗糙集是一种处理不确定性、不一致性、不精确性数据的有效分类工具,其特点是保持基因表达数据集的分类能力不变,进行基因特征选择。为了避免传统粗糙集特征选择方法所必需的离散化过... 基因特征选择是基因表达数据分析中的一种重要方法。粗糙集是一种处理不确定性、不一致性、不精确性数据的有效分类工具,其特点是保持基因表达数据集的分类能力不变,进行基因特征选择。为了避免传统粗糙集特征选择方法所必需的离散化过程带来的信息损失,将邻域粗糙集特征选择方法应用于基因的特征选取,提出了基于邻域粗糙集的基因选择方法。该方法从所有特征出发,根据特征重要度逐步删除冗余的特征,最后得到关键特征组进行分类研究。在2个标准的基因表达数据集上进行特征选取,并进行了分类实验,实验结果表明该方法是有效可行的。 展开更多
关键词 粗糙集 邻域关系 基因表达数据 特征选择 分类
在线阅读 下载PDF
支持向量机在基因表达数据分类中的应用研究 被引量:7
17
作者 武振宇 李康 《中国卫生统计》 CSCD 北大核心 2007年第1期8-11,共4页
目的探讨支持向量机在基因表达数据分类研究中的应用条件和效果。方法使用支持向量机软件包,通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在含有大量无差异表达基因情况下对分类产生的影响。结果对四种疾病的真... 目的探讨支持向量机在基因表达数据分类研究中的应用条件和效果。方法使用支持向量机软件包,通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在含有大量无差异表达基因情况下对分类产生的影响。结果对四种疾病的真实基因表达数据的分类取得了良好的效果,模拟试验则显示了支持向量机对分类具有较高的准确性,但随无差异基因数量的增加其分类效果呈明显下降的趋势;在类间分离一定的情况下,差异表达基因数目较多、基因之间具有较高的相关性时,更容易获得好的分类效果。结论支持向量机在解决小样本、非线性及高维问题中表现出许多潜在的优势,可以有效地用于分析基因表达数据的分类问题。 展开更多
关键词 支持向量机 基因表达数据 分类研究 模拟试验
在线阅读 下载PDF
基于DNA微阵列基因表达数据的分类方法研究 被引量:1
18
作者 朱婵 邹先霞 许龙飞 《计算机工程与应用》 CSCD 北大核心 2005年第6期171-174,共4页
介绍了目前几种基于DNA微阵列基因表达数据的分类方法。分别阐述了递归分割法、构建森林法以及信息融合方法的算法思想,对每种方法进行了深入描述,并对它们进行了分析和比较。最后对基于基因表达微阵列数据的分类技术进行了展望。
关键词 微阵列数据 基因表达 分类
在线阅读 下载PDF
基于层级规则树的跨平台基因表达数据分类 被引量:3
19
作者 蔡瑞初 侯永杰 郝志峰 《计算机工程》 CAS CSCD 北大核心 2019年第7期26-31,共6页
基因检测技术运用至今已积累大量来自不同平台的数据,针对传统数据分类模式难以在不同平台间进行有效迁移的问题,提出一种基于层级规则树的基因表达数据分类算法k-HRT。设计数据转换与规则预筛选策略,实现算法的快速挖掘,以解决由跨平... 基因检测技术运用至今已积累大量来自不同平台的数据,针对传统数据分类模式难以在不同平台间进行有效迁移的问题,提出一种基于层级规则树的基因表达数据分类算法k-HRT。设计数据转换与规则预筛选策略,实现算法的快速挖掘,以解决由跨平台特性所带来的大规模数据问题。在真实基因表达数据集上的实验结果表明,相对k-TSP算法、SVM-RFE算法,k-HRT算法能够有效提高分类精度。 展开更多
关键词 数据分类 跨平台 规则学习 特征选择 基因表达数据
在线阅读 下载PDF
改进的多类支持向量机递归特征消除在癌症多分类中的应用 被引量:10
20
作者 黄晓娟 张莉 《计算机应用》 CSCD 北大核心 2015年第10期2798-2802,共5页
为处理癌症多分类问题,已经提出了多类支持向量机递归特征消除(MSVM-RFE)方法,但该方法考虑的是所有子分类器的权重融合,忽略了各子分类器自身挑选特征的能力。为提高多分类问题的识别率,提出了一种改进的多类支持向量机递归特征消除(MM... 为处理癌症多分类问题,已经提出了多类支持向量机递归特征消除(MSVM-RFE)方法,但该方法考虑的是所有子分类器的权重融合,忽略了各子分类器自身挑选特征的能力。为提高多分类问题的识别率,提出了一种改进的多类支持向量机递归特征消除(MMSVM-RFE)方法。所提方法利用一对多策略把多类问题化解为多个两类问题,每个两类问题均采用支持向量机递归特征消除来逐渐剔除掉冗余特征,得到一个特征子集;然后将得到的多个特征子集合并得到最终的特征子集;最后用SVM分类器对获得的特征子集进行建模。在3个基因数据集上的实验结果表明,改进的算法整体识别率提高了大约2%,单个类别的精度有大幅度提升甚至100%。与随机森林、k近邻分类器以及主成分分析(PCA)降维方法的比较均验证了所提算法的优势。 展开更多
关键词 支持向量机 特征选择 递归特征消除 癌症分类 基因数据
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部