期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于改进标记传播算法的基因表达谱数据分析
1
作者 王年 葛芳 +1 位作者 王俊生 唐俊 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第7期2237-2243,共7页
针对原始标记传播算法迭代次数过多和阈值选取的不确定性等问题,提出一种改进的标记传播算法,并将其应用于基因表达谱数据分析。首先将高维基因表达谱数据表示为权值矩阵,同时定义一个表示样本类别属性的标记序列,并将其中少量样本标记... 针对原始标记传播算法迭代次数过多和阈值选取的不确定性等问题,提出一种改进的标记传播算法,并将其应用于基因表达谱数据分析。首先将高维基因表达谱数据表示为权值矩阵,同时定义一个表示样本类别属性的标记序列,并将其中少量样本标记为已知;然后利用根据Gauss-Seidel迭代算法推导出的迭代公式更新标记序列,并证明标记序列的解的收敛性;最后采用正负标记的方式,根据标记序列各分量的符号差异实现数据类别的划分。通过白血病和结肠癌数据集实验,证明了本文方法的有效性。 展开更多
关键词 半监督学习 权值矩阵 标记传播 基因表达谱数据
在线阅读 下载PDF
综合ChIP-chip数据、基因敲除数据和表达谱数据重构基因调控网络 被引量:6
2
作者 江丽华 李亦学 刘琪 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2010年第9期996-1005,共10页
揭示生物体内在的调控机制是生物信息学的一项重要研究内容.各种高通量生物数据的涌现,为从基因组的尺度上重构基因调控网络提供了可能.由于单数据源仅能提供关于调控关系的片面信息且存在噪声,因此整合多种生物学数据的方法有望得到可... 揭示生物体内在的调控机制是生物信息学的一项重要研究内容.各种高通量生物数据的涌现,为从基因组的尺度上重构基因调控网络提供了可能.由于单数据源仅能提供关于调控关系的片面信息且存在噪声,因此整合多种生物学数据的方法有望得到可靠性较高的调控网络.提出了一种综合ChIP-chip数据、knock out(敲除)数据和各种条件下的表达谱数据来推断调控关系的新方法.ChIP-chip数据和knock out数据能分别提供转录因子和目标基因对关系的直接物理结合和功能关系的证据,这两类数据的整合有望获得较高的识别准确率.但这两类数据的重合性通常较低,基于共调控的基因通常具有较高的表达相似性这一假设,在一定程度上降低了这两类数据重合性较低所带来的影响.算法所识别的大部分调控关系都被YEASTRACT,高质量ChIP-chip数据和文献所验证,从而证明了该方法在调控关系的预测上具有较高的准确性.与其他方法的比较,也表明了该方法具有较高的预测性能. 展开更多
关键词 基因调控网络 ChIP-chip数据 KNOCK out(敲除)数据 基因表达谱数据
在线阅读 下载PDF
基于ICASSO的乳腺癌基因表达数据可靠特征提取
3
作者 孔薇 黄晨曦 牟晓阳 《安徽医科大学学报》 CAS 北大核心 2013年第10期1252-1255,共4页
运用独立成分分析(ICA)方法对乳腺癌基因表达谱数据进行特征提取,并采用聚类及可视化的可靠性评估方法(ICASSO)对所提取的独立成分(IC)进行评估和综合可得到与疾病更加密切相关的显著基因。结果显示,通过与乳腺癌发病的相关性分析,选取... 运用独立成分分析(ICA)方法对乳腺癌基因表达谱数据进行特征提取,并采用聚类及可视化的可靠性评估方法(ICASSO)对所提取的独立成分(IC)进行评估和综合可得到与疾病更加密切相关的显著基因。结果显示,通过与乳腺癌发病的相关性分析,选取显著性高的IC分析发现,其100个特征基因当中,经分子生物学实验验证与乳腺癌发病密切相关的基因有35个,在此基础上通过从基因调控网络的角度分析这些特征基因所参与的生物过程,进一步证实了部分生物过程也与乳腺癌发病密切相关。 展开更多
关键词 乳腺癌 基因表达谱数据 独立成分分析 独立成分 可靠性估计
在线阅读 下载PDF
基于改进稀疏非负矩阵分解方法的乳腺癌微阵列表达数据分析 被引量:6
4
作者 孔薇 王娟 牟晓阳 《安徽医科大学学报》 CAS 北大核心 2013年第7期725-729,共5页
目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负... 目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负矩阵的输入矩阵,进行双向聚类进一步筛选出81个与乳腺癌密切相关的显著基因,最后通过cytoscape对81个与乳腺癌密切相关的显著基因构建生物过程结构图。结果筛选出与乳腺癌相关的基因、可能相关的基因以及这些基因参与的生物过程之间的关系。结论改进稀疏非负矩阵分解与现存的其他非负矩阵分解算法相比具有聚类效果好、稳定性强且迭代次数少的优点,适合于乳腺癌差异表达基因的提取。 展开更多
关键词 乳腺癌 非负矩阵分解 基因表达谱数据
在线阅读 下载PDF
癌症基因分类的Laplace谱方法 被引量:2
5
作者 王年 庄振华 +2 位作者 范益政 李学俊 王继 《电子学报》 EI CAS CSCD 北大核心 2011年第7期1594-1597,共4页
本文尝试着将图的Laplace谱理论应用于癌症基因表达谱数据的分类上.计算出训练集中每个类的均值作为类中心,选出与类中心欧式距离最小的若干样本用laplace矩阵构造完全图,记为代表该类的标准图.用待测样本依次替换标准图中所有的点,将... 本文尝试着将图的Laplace谱理论应用于癌症基因表达谱数据的分类上.计算出训练集中每个类的均值作为类中心,选出与类中心欧式距离最小的若干样本用laplace矩阵构造完全图,记为代表该类的标准图.用待测样本依次替换标准图中所有的点,将生成的新图与标准图进行特征点匹配,并计算匹配点数总和.将待测样本划分为总匹配点数最多的那个类.通过对白血病两个亚型(ALL与AML)与结肠癌数据进行留一法实验,验证了本文方法的有效性. 展开更多
关键词 分类 基因表达谱数据 LAPLACE
在线阅读 下载PDF
基于模糊粗糙集的肿瘤分类特征基因选取 被引量:11
6
作者 徐菲菲 苗夺谦 魏莱 《计算机科学》 CSCD 北大核心 2009年第3期196-200,共5页
依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类别的一组特征基因。粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因。由于基因表达... 依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类别的一组特征基因。粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因。由于基因表达谱数据集的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,尝试将模糊粗糙集应用于特征基因的选取,提出了基于互信息的模糊粗糙集属性约简算法,运用于基因表达谱数据集的基因选取。然后分别采用KNN和C5.0分类器进行特征基因分类性能进行检验。以急性白血病亚型(leukemia Microarray)和直肠癌(colon Microarray)分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性。 展开更多
关键词 基因表达谱数据 特征选取 粗糙集 模糊粗糙集 互信息
在线阅读 下载PDF
一种基于互信息的模糊粗糙分类特征基因快速选取方法 被引量:6
7
作者 徐菲菲 魏莱 +1 位作者 杜海洲 王文欢 《计算机科学》 CSCD 北大核心 2013年第7期216-221,235,共7页
依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的... 依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的特征基因的分类精度造成一定影响。因此,曾提出基于互信息的模糊粗糙集基因表达谱数据集特征基因的选取算法。然而,该算法计算代价较高,当所选取的基因数较多时难以实现。为此,对该算法进行了改进,从最大相关性和最重要性(最小冗余)两方面对互信息进行了近似替代计算,大大降低了算法的复杂度,提高了算法的效率。以急性白血病亚型(leukemia)、直肠癌(colon)和乳腺癌(Breast)分类特征基因选取为例进行实验,然后分别采用1NN和SVM分类器进行特征基因分类精度检验,结果证实了新方法的可行性和有效性。 展开更多
关键词 特征选取 模糊粗糙集 互信息 基因表达谱数据
在线阅读 下载PDF
基于聚类和微粒群优化的基因选择方法 被引量:10
8
作者 刘金勇 郑恩辉 陆慧娟 《数据采集与处理》 CSCD 北大核心 2014年第1期83-89,共7页
在高维的基因表达谱数据中,只有少量基因对分类诊断其作用,而且还存在大量冗余的与癌症分类诊断无关的噪声基因,这些都会导致分类性能的下降。通过基因选择选取与分类紧密关联的基因,不仅能够剔除与疾病无关的基因,减少机器学习算法的... 在高维的基因表达谱数据中,只有少量基因对分类诊断其作用,而且还存在大量冗余的与癌症分类诊断无关的噪声基因,这些都会导致分类性能的下降。通过基因选择选取与分类紧密关联的基因,不仅能够剔除与疾病无关的基因,减少机器学习算法的时间复杂度和空间复杂度,提高分类的正确率,而且选出的特征基因可以作为肿瘤基因诊断和肿瘤药物治疗靶标确定的依据,降低后期生物学分析成本。本文提出一种基于聚类和粒子群算法(Particle swarm optimization,PSO)的基因选择方法,在PSO算法进行搜索之前,先对基因进行聚类,并对聚类结果进行选择,将被选中的簇的中心作为PSO的初始值,每个被选中的簇作为一个搜索空间,并利用极限学习机(Extreme learning machine,ELM)的分类精度作为特征选择的适应评价标准。该算法不仅有效地利用了聚类算法对基因进行初步归并的能力,也利用了PSO算法的全局优化能力,克服了传统PSO算法早熟、局部收敛速度慢的缺点,因此它能够高效地完成最优基因子集的确定,同时提高癌症分类正确率。 展开更多
关键词 基因表达谱数据 基因选择 微粒群优化 极限学习机
在线阅读 下载PDF
基于双正交非负矩阵三因式的肿瘤识别 被引量:1
9
作者 谭青青 王年 +1 位作者 苏亮亮 方正文 《安徽大学学报(自然科学版)》 CAS 北大核心 2015年第6期29-36,共8页
基因表达谱数据分析已经逐渐成为疾病诊断和分类的常规步骤.目前人们对NMF(nonnegative matrix factorization)的大多数研究都专注于二因式分解.论文另辟蹊径,对BONMTF(bi-orthogonal nonnegative matrix tri-factorization)算法进行了... 基因表达谱数据分析已经逐渐成为疾病诊断和分类的常规步骤.目前人们对NMF(nonnegative matrix factorization)的大多数研究都专注于二因式分解.论文另辟蹊径,对BONMTF(bi-orthogonal nonnegative matrix tri-factorization)算法进行了系统化的分析,利用此算法得到表征样本属性的矩阵,并将其应用于基因表达谱数据分析,提高了样本识别率.实验采用4组具有代表性的肿瘤基因表达谱数据,其结果证明了论文方法针对不同数据集的识别率都比传统方法有所提高,具有一定的可行性及应用前景. 展开更多
关键词 三因式分解 双正交非负矩阵 肿瘤识别 基因表达谱数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部