期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于相交邻域粗糙集的基因微阵列数据分类 被引量:4
1
作者 孟军 李锐 郝涵 《计算机科学》 CSCD 北大核心 2015年第6期37-40,66,共5页
在对基因微阵列数据的特征选择和分类的研究中,粗糙集理论是一个可以消除冗余基因的有效工具。但是传统的粗糙集模型不能很好地处理连续型数值数据,而离散化方法可能会导致信息的丢失。为此,提出了一种基于相交邻域粗糙集模型的属性约... 在对基因微阵列数据的特征选择和分类的研究中,粗糙集理论是一个可以消除冗余基因的有效工具。但是传统的粗糙集模型不能很好地处理连续型数值数据,而离散化方法可能会导致信息的丢失。为此,提出了一种基于相交邻域粗糙集模型的属性约简算法,即将传统粗糙集中的距离邻域扩展为相交邻域,采用基于集合的方式来定义近似,以此构建粗糙集模型。在癌症数据集上进行实验,结果表明基于集合近似和相交邻域的粗糙集模型可以取得较好的分类效果,并且通过对选择出的基因进行GO术语分析,进一步证明了该模型的有效性。 展开更多
关键词 粗糙集 相交邻域 基因微阵列数据
在线阅读 下载PDF
基于BTLBOGSA与CNN的基因微阵列数据分类模型
2
作者 赵晚昭 谢聪 《广西科学》 CAS 北大核心 2022年第2期260-268,共9页
针对现有基因微阵列数据分类中存在的数据维度高、容易发生过拟合的问题,提出了基于BTLBOGSA(Binary TLBOGSA)与卷积神经网络(Convolutional Neural Network,CNN)的基因微阵列数据分类模型(BTLBOGSA-CNN)。该模型首先针对基因微阵列数... 针对现有基因微阵列数据分类中存在的数据维度高、容易发生过拟合的问题,提出了基于BTLBOGSA(Binary TLBOGSA)与卷积神经网络(Convolutional Neural Network,CNN)的基因微阵列数据分类模型(BTLBOGSA-CNN)。该模型首先针对基因微阵列数据分类时存在的数据维度高的问题,利用新的编码策略,将连续搜索空间转换为二元搜索空间,结合教与学优化(Teaching-Learning-Based Optimization,TLBO)算法的二元变体与引力搜索算法(Gravitational Search Algorithm,GSA)的各自特点,基于BTLBOGSA方法从基因微阵列数据集中选择具有高鉴别性的基因;然后针对基因微阵列数据分类易发生过拟合问题的现象,利用卷积神经网络进行基因微阵列数据的分类。利用公开的基因微阵列数据集进行仿真实验,从TLBO算法与GSA结合的有效性、BTLBOGSA与CNN结合的有效性、BTLBOGSA-CNN与其他已有分类模型相比的有效性3个方面进行对比分析,结果表明,BTLBOGSA-CNN模型可以在较少的特征基因下取得较高的分类精度,具有较高的可行性和有效性。 展开更多
关键词 基因微阵列数据分类 教与学优化算法 引力搜索算法 特征选择 卷积神经网络
在线阅读 下载PDF
粒计算在基因微阵列数据特征选择中的应用
3
作者 王俊 祁云嵩 韩利 《科学技术与工程》 2009年第6期1424-1427,1455,共5页
对于许多模式识别问题来说,特征选择是一个非常重要的数据预处理技术,这对于维数高,而样本又相对较小的微阵列数据来说更是如此。提出一种将粒计算与传统的SVM-RFE算法相结合的特征选择算法。这种算法能够有效地去除大部分与分类无关的... 对于许多模式识别问题来说,特征选择是一个非常重要的数据预处理技术,这对于维数高,而样本又相对较小的微阵列数据来说更是如此。提出一种将粒计算与传统的SVM-RFE算法相结合的特征选择算法。这种算法能够有效地去除大部分与分类无关的基因;并且能够搜索到基因数量相对较少而分类能力相对较强的信息基因子集。 展开更多
关键词 微阵列基因表达数据 特征选择 粒计算 SVM-RFE算法
在线阅读 下载PDF
基于模糊c-均值聚类的微阵列基因表达数据分析 被引量:8
4
作者 宫改云 毛用才 +1 位作者 高新波 刘三阳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第2期291-295,共5页
微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种... 微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种有用工具. 展开更多
关键词 模糊C-均值聚类 微阵列基因表达数据 差异基因表达 微阵列DNA芯片
在线阅读 下载PDF
微阵列数据中一种改进Bagging决策树算法的研究
5
作者 刘青 李海峰 袁科 《计算机工程与科学》 CSCD 2005年第6期78-80,共3页
针对基因微阵列数据具有高维度、小样本等独特的特点,本文研究并实现了旨在降低计算时间和提高精确度的Bagging决策树。本文提出了一个能极大地降低计算时间、同时对精确度影响不大的属性离散化过程,接着以一种新的类分布置信度的方式... 针对基因微阵列数据具有高维度、小样本等独特的特点,本文研究并实现了旨在降低计算时间和提高精确度的Bagging决策树。本文提出了一个能极大地降低计算时间、同时对精确度影响不大的属性离散化过程,接着以一种新的类分布置信度的方式构造决策树,该方法在最终的Bagging组合方面有一定的优势。结合上述方法的Bagging决策树算法在基因微阵列数据集分类上取得了良好的效果。 展开更多
关键词 Bagging决策树 基因微阵列数据 类分布置信度 中值离散化
在线阅读 下载PDF
基于非负矩阵分解的大脑不同区域基因表达数据分析 被引量:1
6
作者 孔薇 陶伟杰 牟晓阳 《中国生物医学工程学报》 CAS CSCD 北大核心 2012年第6期875-881,共7页
基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因... 基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因,聚类过程中利用共表型相关性系数(CCC)选取聚类数k的值,得到最优的聚类数目。针对基因表达数据噪声高、信息变量隐藏难分析的困难,考虑AD的发生发展与许多大脑功能区域密切相关的特性,提出将nsNMF分别应用于AD患者的大脑海马区、内嗅区皮质、颞中回及视觉皮层区的基因表达数据中,共提取3 800个显著基因,其中包括确定与AD致病机理有关联的10个致病基因,并进行了生物学分析,得到了AD相关的细胞凋亡、代谢及炎症反应等生物过程,显示nsNMF方法及大脑多区域数据集的联合分析能更全面地探寻AD信号传导关系及基因调控方式。 展开更多
关键词 微阵列基因表达数据 非负矩阵分解 阿尔茨海默病
在线阅读 下载PDF
基于FCBF特征选择和集成优化学习的基因表达数据分类算法 被引量:6
7
作者 马超 《计算机应用研究》 CSCD 北大核心 2019年第10期2986-2991,共6页
针对微阵列基因表达数据高维小样本、高冗余且高噪声的问题,提出一种基于FCBF特征选择和集成优化学习的分类算法FICS-EKELM。首先使用快速关联过滤方法FCBF滤除部分不相关特征和噪声,找出与类别相关性较高的特征集合;其次,运用抽样技术... 针对微阵列基因表达数据高维小样本、高冗余且高噪声的问题,提出一种基于FCBF特征选择和集成优化学习的分类算法FICS-EKELM。首先使用快速关联过滤方法FCBF滤除部分不相关特征和噪声,找出与类别相关性较高的特征集合;其次,运用抽样技术生成多个样本子集,在每个训练子集上利用改进乌鸦搜索算法同步实现最优特征子集选择和核极限学习机KELM分类器参数优化;然后基于基分类器构建集成分类模型对目标数据进行分类识别;此外运用多核平台多线程并行方式进一步提高算法计算效率。在六组基因数据集上的实验结果表明,该算法不仅能用较少特征基因达到较优的分类效果,并且分类结果显著高于已有和相似方法,是一种有效的高维数据分类方法。 展开更多
关键词 特征选择 集成学习 微阵列基因表达数据 乌鸦搜索算法 核极限学习机
在线阅读 下载PDF
基于大脑不同区域的阿尔茨海默症基因表达数据分析 被引量:2
8
作者 孔薇 牟晓阳 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第6期994-997,1002,共5页
提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚... 提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚类且只能将某个基因聚类到某一类的缺陷,改进的FastICA方法能够对基因表达数据进行快速有效的双向聚类,能够满足同一个基因可能参与不同信号传导通路的生物特性.同时考虑到人脑中海马区、内嗅皮质区、颞中回及视觉皮层区均与学习与记忆功能密切相关,将算法对多个脑区域进行基因表达调控综合分析.结果表明,大量炎症反应是AD致病的重要因素之一. 展开更多
关键词 微阵列基因表达数据 阿尔茨海默症 独立成分分析 基因调控网络
在线阅读 下载PDF
结合近邻传播聚类的选择性集成分类方法 被引量:12
9
作者 孟军 张晶 +2 位作者 姜丁菱 何馨宇 李丽双 《计算机研究与发展》 EI CSCD 北大核心 2018年第5期986-993,共8页
从海量的基因微阵列数据中提取出有价值的信息是生物信息学的研究热点.基因微阵列数据具有高维度、小样本和高冗余的特性.因此,提出一种基于相交邻域粗糙集的基因选择方法,挑选出关键基因用于对微阵列数据进行分类.首先利用pathway知识... 从海量的基因微阵列数据中提取出有价值的信息是生物信息学的研究热点.基因微阵列数据具有高维度、小样本和高冗余的特性.因此,提出一种基于相交邻域粗糙集的基因选择方法,挑选出关键基因用于对微阵列数据进行分类.首先利用pathway知识进行基因初步选择,每个pathway单元对应一个基因子集,然后采用基于粗糙集的属性约简方法筛选出无冗余的关键基因.由于pathway知识单元的数量较多,对应生成大量的基分类器,为了进一步提高基分类器之间的差异性和集成的效率,对基分类器进行选择是十分必要的.近邻传播聚类不需要提前设定聚簇数量和起始点并且可以更快速、精确地进行聚类.因此,使用近邻传播聚类方法对基分类器进行分组,产生差异性较大的聚簇,再从每个簇中选择一个分类器构建集成分类器.在拟南芥的生物和非生物胁迫响应相关的微阵列数据集上的实验结果表明:在准确率方面,提出的方法与现有的集成方法相比最多可以提高12%. 展开更多
关键词 选择性集成 近邻传播 通路 相交邻域 基因微阵列数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部