期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于模糊c-均值聚类的微阵列基因表达数据分析 被引量:8
1
作者 宫改云 毛用才 +1 位作者 高新波 刘三阳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第2期291-295,共5页
微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种... 微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种有用工具. 展开更多
关键词 模糊C-均值聚类 微阵列基因表达数据 差异基因表达 微阵列DNA芯片
在线阅读 下载PDF
聚类算法在基因表达数据分析中的应用 被引量:4
2
作者 朱婵 许龙飞 《华侨大学学报(自然科学版)》 CAS 北大核心 2005年第1期7-10,共4页
聚类算法在基因表达数据的分析处理中得到日益广泛的应用 .文中对几种典型的聚类算法进行描述 ,对各算法在基因表达数据处理中的特点 ,进行评价并提出改进的策略 .最后 ,指出聚类算法在生物信息学应用中的发展趋势 .
关键词 生物信息学 基因表达数据 聚类算法
在线阅读 下载PDF
最小支撑树算法在基因表达数据聚类分析中的应用 被引量:1
3
作者 张焕萍 王惠南 宋晓峰 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2007年第2期171-175,共5页
聚类分析已成为对基因表达数据进行挖掘以提取生物医学信息的主要方法。本文提出了基于图论的最小支撑树(Minimum spanning tree,MST)聚类算法,用MST表示多维基因表达数据,可将数据的聚类转换为对最小支撑树的分割,相对于传统聚类方法,... 聚类分析已成为对基因表达数据进行挖掘以提取生物医学信息的主要方法。本文提出了基于图论的最小支撑树(Minimum spanning tree,MST)聚类算法,用MST表示多维基因表达数据,可将数据的聚类转换为对最小支撑树的分割,相对于传统聚类方法,最小支撑树算法具有形象直观、对一些准则函数能产生全局最优解等优点;将MST算法分别与Memetic algorithm及人工免疫算法(Artificial immune network,aiNet)相结合,则产生更优化的聚类结果。对酵母基因表达数据的实验结果表明,最小支撑树聚类算法是一种有效的基因表达数据的聚类方法。 展开更多
关键词 最小支撑树 基因表达数据 聚类分析 DNA微阵列
在线阅读 下载PDF
基于非负矩阵分解的大脑不同区域基因表达数据分析 被引量:1
4
作者 孔薇 陶伟杰 牟晓阳 《中国生物医学工程学报》 CAS CSCD 北大核心 2012年第6期875-881,共7页
基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因... 基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因,聚类过程中利用共表型相关性系数(CCC)选取聚类数k的值,得到最优的聚类数目。针对基因表达数据噪声高、信息变量隐藏难分析的困难,考虑AD的发生发展与许多大脑功能区域密切相关的特性,提出将nsNMF分别应用于AD患者的大脑海马区、内嗅区皮质、颞中回及视觉皮层区的基因表达数据中,共提取3 800个显著基因,其中包括确定与AD致病机理有关联的10个致病基因,并进行了生物学分析,得到了AD相关的细胞凋亡、代谢及炎症反应等生物过程,显示nsNMF方法及大脑多区域数据集的联合分析能更全面地探寻AD信号传导关系及基因调控方式。 展开更多
关键词 微阵列基因表达数据 非负矩阵分解 阿尔茨海默病
在线阅读 下载PDF
基于稀疏类别保留投影的基因表达数据降维方法 被引量:4
5
作者 王文俊 《电子学报》 EI CAS CSCD 北大核心 2016年第4期873-877,共5页
针对基因表达数据高维小样本特性所带来的维数灾难问题,结合回归和类别保留投影方法,提出一种新的基因表达数据降维方法,叫稀疏类别保留投影.相比类别保留投影,能有效避免类别保留投影在基因表达数据降维上存在的矩阵奇异和过拟合问题.... 针对基因表达数据高维小样本特性所带来的维数灾难问题,结合回归和类别保留投影方法,提出一种新的基因表达数据降维方法,叫稀疏类别保留投影.相比类别保留投影,能有效避免类别保留投影在基因表达数据降维上存在的矩阵奇异和过拟合问题.通过对真实基因表达数据进行数据可视化和分类识别,验证了方法的有效性. 展开更多
关键词 基因表达数据 高维小样本 类别保留投影 回归
在线阅读 下载PDF
基于类别保留投影的基因表达数据特征提取新方法 被引量:2
6
作者 王文俊 《电子学报》 EI CAS CSCD 北大核心 2012年第2期358-364,共7页
从两两样本的类别关系出发,提出一种新的线性鉴别特征提取方法,叫做类别保留投影.相比经典的fisher线性鉴别分析方法,类别保留投影具有最优子空间维数不受样本类别数限制、计算复杂度低的优点.通过对真实基因表达数据进行样本分类识别,... 从两两样本的类别关系出发,提出一种新的线性鉴别特征提取方法,叫做类别保留投影.相比经典的fisher线性鉴别分析方法,类别保留投影具有最优子空间维数不受样本类别数限制、计算复杂度低的优点.通过对真实基因表达数据进行样本分类识别,证实了本文方法的有效性.并将类别保留投影方法推广到非线性空间,提出核类别保留投影,用于解决非线性特征提取问题,对基因表达数据的实验验证了方法的可行性. 展开更多
关键词 特征提取 FISHER线性鉴别分析 小样本 基因表达数据
在线阅读 下载PDF
基于大脑不同区域的阿尔茨海默症基因表达数据分析 被引量:2
7
作者 孔薇 牟晓阳 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第6期994-997,1002,共5页
提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚... 提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚类且只能将某个基因聚类到某一类的缺陷,改进的FastICA方法能够对基因表达数据进行快速有效的双向聚类,能够满足同一个基因可能参与不同信号传导通路的生物特性.同时考虑到人脑中海马区、内嗅皮质区、颞中回及视觉皮层区均与学习与记忆功能密切相关,将算法对多个脑区域进行基因表达调控综合分析.结果表明,大量炎症反应是AD致病的重要因素之一. 展开更多
关键词 微阵列基因表达数据 阿尔茨海默症 独立成分分析 基因调控网络
在线阅读 下载PDF
一种基于线性流形的基因表达数据的聚类方法
8
作者 黎刚果 王正志 +2 位作者 王广云 倪青山 强波 《国防科技大学学报》 EI CAS CSCD 北大核心 2010年第4期150-156,共7页
由于基因表达数据的稀疏性和噪声性,传统聚类算法对其聚类时不能取得好的效果。针对这一问题,一种新的线性流形方法被提出,它的基本思想是搜索数据集中的线流形聚类,再将其中某些线流形聚类融合构造高维流形聚类。该算法将切向距离和法... 由于基因表达数据的稀疏性和噪声性,传统聚类算法对其聚类时不能取得好的效果。针对这一问题,一种新的线性流形方法被提出,它的基本思想是搜索数据集中的线流形聚类,再将其中某些线流形聚类融合构造高维流形聚类。该算法将切向距离和法向距离作为线性流形的距离度量,运用空间近邻信息,采用聚类基因的平均表达水平作为转移向量,提高了聚类的准确度。实验结果表明,该算法的聚类准确性优于其它聚类算法,并且对带有噪声的数据可以保持较高的聚类准确度;在对Hela基因表达数据聚类时,算法得到了具有显著生物学意义的聚类。这些都说明提出的算法对基因表达数据聚类的适用性和有效性。 展开更多
关键词 基因表达数据 线性流形 子空间聚类 线流形
在线阅读 下载PDF
基于类别保留投影的基因表达数据降维方法
9
作者 王文俊 张军英 杨利英 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2009年第6期153-157,共5页
针对基因表达数据的高维小样本问题,提出一种新的线性降维方法。该方法采用保局投影,结合样本的类别信息,将基因表达数据投影到特征子空间。与主分量分析方法寻找最大方差方向不同,类别保留投影方法旨在寻找能够反映样本类别结构的特征... 针对基因表达数据的高维小样本问题,提出一种新的线性降维方法。该方法采用保局投影,结合样本的类别信息,将基因表达数据投影到特征子空间。与主分量分析方法寻找最大方差方向不同,类别保留投影方法旨在寻找能够反映样本类别结构的特征子空间。采用该方法进行数据降维的同时能使样本按照类别属性进行聚类。对真实的基因表达数据进行了降维可视化和k均值聚类分析,并与主分量分析方法进行了实验比较,结果表明,类别保留投影方法在实现降维的同时能更好地识别样本的类别特征,从而可视化效果相比主分量分析要好得多,且能得到较好的聚类效果。 展开更多
关键词 基因表达数据 类别保留投影 可视化 聚类分析
在线阅读 下载PDF
基于SOM网络的基因表达数据聚类分析
10
作者 涂晓芝 颜学峰 钱锋 《华东理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第8期992-996,共5页
提出了用自组织映射(SOM)网络对生物信息学中基因表达数据进行聚类分析的方法。用SOM网络对酵母基因表达数据进行聚类。通过对映射结果的分析,表明SOM网络有较高的分类正确率,用于基因表达数据的聚类分析是行之有效的。
关键词 SOM网络 聚类分析 基因表达数据
在线阅读 下载PDF
基于Struts的基因表达数据分析软件的设计与实现
11
作者 徐旭东 郑欣 《微电子学与计算机》 CSCD 北大核心 2006年第z1期51-52,55,共3页
目前基因数据分析软件普遍缺乏数据管理功能、操作复杂,文章提出了基于Struts结构的基因表达数据分析软件的设计方案,设计出整合多种基因信息学软件、易于扩展的基础结构。该软件系统可对基因数据进行有效的管理,它使用R和Biocondutor... 目前基因数据分析软件普遍缺乏数据管理功能、操作复杂,文章提出了基于Struts结构的基因表达数据分析软件的设计方案,设计出整合多种基因信息学软件、易于扩展的基础结构。该软件系统可对基因数据进行有效的管理,它使用R和Biocondutor提供的方法分析基因表达数据,简化用户操作,为用户提供科学、准确和可视化的分析结果。 展开更多
关键词 MVC 基因表达数据 STRUTS
在线阅读 下载PDF
基于谱回归和核空间最近邻的基因表达数据分类 被引量:6
12
作者 于攀 叶俊勇 《电子学报》 EI CAS CSCD 北大核心 2011年第8期1955-1960,共6页
肿瘤基因表达数据是典型的高维小样本数据,直接对其进行识别存在维数灾难,需要对数据进行维数约简.提出了一种基于谱回归分析和核空间最近邻分类器的基因表达数据分类方法,采用谱回归分析得到可有效提取低维鉴别特征的投影矩阵,然后通... 肿瘤基因表达数据是典型的高维小样本数据,直接对其进行识别存在维数灾难,需要对数据进行维数约简.提出了一种基于谱回归分析和核空间最近邻分类器的基因表达数据分类方法,采用谱回归分析得到可有效提取低维鉴别特征的投影矩阵,然后通过投影矩阵对基因表达数据进行维数约简,得到的低维数据用核空间最近邻分类器进行识别.通过在Prostate-Tumor,4-Tumors两种肿瘤数据集上的实验,证明了该方法的有效性;同时证明了核空间最近邻具有比最近邻更好的分类效果. 展开更多
关键词 基因表达数据分类 核空间最近邻 谱回归分析 维数约简
在线阅读 下载PDF
基于最近邻区间的不完整基因表达数据多目标聚类算法 被引量:2
13
作者 常巧珍 曹隽喆 +1 位作者 顾宏 李丹 《大连理工大学学报》 CAS CSCD 北大核心 2021年第4期416-423,共8页
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过... 针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过程,通过将数据集的统计信息与聚类结果共同作为缺失值填补因素,提升不完整基因表达数据的填补准确度及聚类性能.在多个基因表达数据集上的实验结果表明,所提算法得到了更接近真实表达值的填补结果及更紧凑的聚类效果,且聚类结果具有统计显著性. 展开更多
关键词 基因表达数据 缺失值 多目标聚类 最近邻规则
在线阅读 下载PDF
集成特征选择方法在基因表达数据上的应用 被引量:2
14
作者 杜冲 周长银 +1 位作者 李悦 李潇宁 《山东科技大学学报(自然科学版)》 CAS 北大核心 2019年第1期85-90,共6页
基因表达数据的研究是生物医学上的一个重要课题。基于其高维度、小样本的特点,特征选择已经成为数据预处理阶段的关键步骤。单一特征选择方法得到的特征子集可能会有偏差,本研究在特征选择上引入集成学习的思想,构建集成特征选择模型,... 基因表达数据的研究是生物医学上的一个重要课题。基于其高维度、小样本的特点,特征选择已经成为数据预处理阶段的关键步骤。单一特征选择方法得到的特征子集可能会有偏差,本研究在特征选择上引入集成学习的思想,构建集成特征选择模型,并将此模型应用到3个不同的基因表达数据集上。为了评价特征子集的分类预测性能,使用支持向量机作为分类器进行测试。实验结果表明:相对于单一的特征选择方法,集成特征选择能够有效提高分类模型准确度。 展开更多
关键词 基因表达数据 特征选择 集成学习 支持向量机
在线阅读 下载PDF
基于统计检验的基因表达数据特征选取与分类模型 被引量:1
15
作者 周文佳 吕金超 高翔 《数学建模及其应用》 2019年第4期48-53,74,共7页
采用统计检验的方法对基因表达数据的特征选取和冗余去除展开研究,为此提出了相应模型及算法,与已有文献中的模型与算法相比较,该模型所提方法思路直观,易于理解,算法构造简单,且运行效率高.数值实验选取3个两分类基因表达数据集,实验... 采用统计检验的方法对基因表达数据的特征选取和冗余去除展开研究,为此提出了相应模型及算法,与已有文献中的模型与算法相比较,该模型所提方法思路直观,易于理解,算法构造简单,且运行效率高.数值实验选取3个两分类基因表达数据集,实验结果表明该方法对特征选取和冗余去除均有较好的效果.在此基础上,采用类中心距离法对选取的特征基因进行了分类实验,结果进一步表明,本文提出的方法对两分类基因表达数据具有较高的分类精确度. 展开更多
关键词 基因表达数据 特征选取 冗余去除 分布检验 相关性检验
在线阅读 下载PDF
改进的非负矩阵分解在基因表达数据中的应用
16
作者 李巧 孔薇 《信息技术》 2010年第12期1-3,7,共4页
对非负矩阵分解算法的发展历史做了简要综述,并介绍了非负矩阵分解算法的基本原理,及一种改进的非负矩阵分解算法,并将此方法应用于一组阿尔茨海默症微阵列数据的聚类中,将此结果与传统的非负矩阵分解算法进行了比较,证明了算法的有效性。
关键词 非负矩阵分解 基因表达数据 阿尔茨海默症
在线阅读 下载PDF
GEO水稻相关基因表达数据研究现状
17
作者 李嘉平 张先文 陈信波 《湖南农业科学》 2012年第5期4-6,共3页
水稻基因表达数据为深入研究水稻基因的表达调控提供了必要的条件。GEO(Gene Expression Omnibus)数据库目前已经积累了相当数量的水稻基因表达数据,但没有相关的数据统计信息。针对GEO数据库中与水稻相关的平台、样品、系列数据进行了... 水稻基因表达数据为深入研究水稻基因的表达调控提供了必要的条件。GEO(Gene Expression Omnibus)数据库目前已经积累了相当数量的水稻基因表达数据,但没有相关的数据统计信息。针对GEO数据库中与水稻相关的平台、样品、系列数据进行了统计和总结,综述了目前的研究动态,以及未来的发展趋势,为新研究的开展提供了参考。 展开更多
关键词 GEO 水稻 基因表达数据
在线阅读 下载PDF
基于基因表达数据的双聚类分析研究
18
作者 罗德相 李飞龙 欧旭 《河南科技》 2018年第34期23-25,共3页
基因芯片及高通量技术的广泛应用产生了大量的基因表达数据,海量数据蕴涵着非常丰富的生物信息,利用聚类分析可以有效分析蕴含在其中的规律和知识。然而,基因表达数据普遍为高维稀疏矩阵,传统单聚类分析很难寻找到隐藏在海量基因表达数... 基因芯片及高通量技术的广泛应用产生了大量的基因表达数据,海量数据蕴涵着非常丰富的生物信息,利用聚类分析可以有效分析蕴含在其中的规律和知识。然而,基因表达数据普遍为高维稀疏矩阵,传统单聚类分析很难寻找到隐藏在海量基因表达数据的局部有用信息。为了更好地挖掘海量数据中有用的局部信息,人们从思想上提出了有别于传统的聚类算法的双聚类概念,其主要强调在聚类时基因和条件的同时性。 展开更多
关键词 基因芯片 DNA微阵列 基因表达数据 聚类分析 双聚类分析
在线阅读 下载PDF
基于改进标记传播算法的基因表达谱数据分析
19
作者 王年 葛芳 +1 位作者 王俊生 唐俊 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第7期2237-2243,共7页
针对原始标记传播算法迭代次数过多和阈值选取的不确定性等问题,提出一种改进的标记传播算法,并将其应用于基因表达谱数据分析。首先将高维基因表达谱数据表示为权值矩阵,同时定义一个表示样本类别属性的标记序列,并将其中少量样本标记... 针对原始标记传播算法迭代次数过多和阈值选取的不确定性等问题,提出一种改进的标记传播算法,并将其应用于基因表达谱数据分析。首先将高维基因表达谱数据表示为权值矩阵,同时定义一个表示样本类别属性的标记序列,并将其中少量样本标记为已知;然后利用根据Gauss-Seidel迭代算法推导出的迭代公式更新标记序列,并证明标记序列的解的收敛性;最后采用正负标记的方式,根据标记序列各分量的符号差异实现数据类别的划分。通过白血病和结肠癌数据集实验,证明了本文方法的有效性。 展开更多
关键词 半监督学习 权值矩阵 标记传播 基因表达数据
在线阅读 下载PDF
基于基因表达综合数据库芯片的类风湿关节炎生物标志物的筛选与生物信息学分析 被引量:4
20
作者 赵倩倩 尤红俊 +2 位作者 肖丹 黄婧 何岚 《西安交通大学学报(医学版)》 CAS CSCD 北大核心 2020年第4期544-552,共9页
目的对类风湿关节炎(rheumatoid arthritis,RA)基因芯片数据进行生物信息学分析,寻找表达特征基因谱。方法利用GEO2R对基因表达综合数据库中筛选出的RA芯片进行基因差异表达分析,采用DAVID 6.8及R语言进行基因功能注释GO富集分析和KEGG... 目的对类风湿关节炎(rheumatoid arthritis,RA)基因芯片数据进行生物信息学分析,寻找表达特征基因谱。方法利用GEO2R对基因表达综合数据库中筛选出的RA芯片进行基因差异表达分析,采用DAVID 6.8及R语言进行基因功能注释GO富集分析和KEGG通路富集分析,String-db数据库进行蛋白互作分析,并以Cytoscape3.7.1软件获取关键靶基因。结果RA患者膝关节分离出的滑膜组织中1184个基因差异表达具有统计学意义,其中664个表达上调,520个表达下调。差异表达基因被富集到信号转导、质膜和蛋白结合等70个不同的GO子集及细胞因子-细胞因子受体相互作用、破骨细胞分化、类风湿关节炎、Th17细胞分化和IL17信号通路等62个信号通路上。蛋白互作网络分析筛选出19个关键靶基因,包括NKG7、BCL6、SEMA4D、NFIL3、RAC2、MLIP、SEL1L3、GUSBP11、IGLV1-44、IGLJ3、IGLC1、IGKV1OR2-118、IGKV1OR2-108、IGKC、IGHV4-31、IGHV3-23、IGHM、IGHD和CYAT1。结论对基因表达综合数据库中RA的芯片数据分析所筛选出的部分差异表达基因,均涉及影响RA滑膜炎症发生发展的关键环节,可为该疾病的早期诊断或靶向药物的研发提供重要的实验理论依据。 展开更多
关键词 类风湿关节炎 基因表达综合数据 差异表达基因 生物信息学
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部