基因调控网络是基于微阵列基因表达数据,对基因之间表达关系依赖程度的一种仿真或重建。从基因表达数据挖掘基因之间存在的一定程度因果关系,对重构基因调控网络具有十分重要的意义。提出一种基于频繁原子序列关联熵的基因关联分析算法...基因调控网络是基于微阵列基因表达数据,对基因之间表达关系依赖程度的一种仿真或重建。从基因表达数据挖掘基因之间存在的一定程度因果关系,对重构基因调控网络具有十分重要的意义。提出一种基于频繁原子序列关联熵的基因关联分析算法,通过基因关联熵有效识别基因之间的因果关系,并采用启发式搜索策略构建基因关联贝叶斯调控网络(gene association based Bayesian regulatory,GABR)。与基因贝叶斯网络描述基因表达水平值之间依赖关系不同,GABR是一种基因序列贝叶斯网络,基因关联分析对象是生物组织样本的基因表达值排序并置换为基因列下标所形成的序列。算法的优势在于基因变量取值原子序列,该基因为原子序列的结果,基因关联熵以及条件概率分布的计算更符合基因表达数据分析的生物本质特征。ALARM网络模拟数据的实验结果表明,基因关联分析算法性能明显优于同类算法。在酵母菌微阵列基因数据GDS2267和小鼠胚胎基因GSE76118等GEO数据集进行实验,测试结果表明GABR方法重构的基因调控网络具有较高的有效性和鲁棒性。展开更多
癌症是人类健康的第一杀手。随着测序技术的快速发展,积累了海量的癌症基因表达数据,利用计算方法进行致病基因预测成为癌症研究领域新的热点。然而,目前致病基因预测大多基于基因相互作用网络等,很少考虑网络局部连接与基因差异表达间...癌症是人类健康的第一杀手。随着测序技术的快速发展,积累了海量的癌症基因表达数据,利用计算方法进行致病基因预测成为癌症研究领域新的热点。然而,目前致病基因预测大多基于基因相互作用网络等,很少考虑网络局部连接与基因差异表达间的潜在联系。针对上述问题,首先利用患病前后的基因表达差异数据,通过互信息计算基因间的相关性并构建邻接网络,然后设计特征向量模型用于癌症致病基因预测。向量特征包括候选基因及其近邻的差异表达信息。从TCGA,OMIM和GEO等公共数据库获取癌症相关的致病与非致病基因以及患病前后基因差异表达数据进行实验,利用邻接网络中基因及其近邻的差异表达信息进行癌症致病基因预测(Differential Information of Gene and Nearest Neighbor for Cancer Pathogenic Gene Prediction,DICPG)。实验结果表明,DICPG癌症基因分类模型的生物学意义明显,分类精度和AUC等性能指标优于同类方法。展开更多
TIPE(Tumor necrosis factor-alpha-induced protein 8-like)家族是新近报道的免疫和肿瘤调节因子。该家族拥有四个高度同源的成员:TNFAIP8(Tumor necrosis factor-α-induced protein 8),TIPE1(TNFAIP8L1),TIPE2(TNFAIP8L2)和TIPE3(TNF...TIPE(Tumor necrosis factor-alpha-induced protein 8-like)家族是新近报道的免疫和肿瘤调节因子。该家族拥有四个高度同源的成员:TNFAIP8(Tumor necrosis factor-α-induced protein 8),TIPE1(TNFAIP8L1),TIPE2(TNFAIP8L2)和TIPE3(TNFAIP8L3)。它们虽然结构相似,但在组织、器官上的表达不同,在生物学功能及疾病中的作用存在较大的差别。TNFAIP8具有抑制细菌感染与促肿瘤迁移的作用;TIPE2是一种免疫和炎症负调控因子,可抑制某些肿瘤的生长;TIPE1可诱导细胞凋亡具有抑瘤效应;TIPE3可特异性结合磷脂第二信使,促进肿瘤生成。随着研究的深入,TIPE家族在多种疾病的发生发展过程中表现出重要的调控作用,然而其具体生物活性与分子机制有待进一步的研究。展开更多
文摘基因调控网络是基于微阵列基因表达数据,对基因之间表达关系依赖程度的一种仿真或重建。从基因表达数据挖掘基因之间存在的一定程度因果关系,对重构基因调控网络具有十分重要的意义。提出一种基于频繁原子序列关联熵的基因关联分析算法,通过基因关联熵有效识别基因之间的因果关系,并采用启发式搜索策略构建基因关联贝叶斯调控网络(gene association based Bayesian regulatory,GABR)。与基因贝叶斯网络描述基因表达水平值之间依赖关系不同,GABR是一种基因序列贝叶斯网络,基因关联分析对象是生物组织样本的基因表达值排序并置换为基因列下标所形成的序列。算法的优势在于基因变量取值原子序列,该基因为原子序列的结果,基因关联熵以及条件概率分布的计算更符合基因表达数据分析的生物本质特征。ALARM网络模拟数据的实验结果表明,基因关联分析算法性能明显优于同类算法。在酵母菌微阵列基因数据GDS2267和小鼠胚胎基因GSE76118等GEO数据集进行实验,测试结果表明GABR方法重构的基因调控网络具有较高的有效性和鲁棒性。
文摘癌症是人类健康的第一杀手。随着测序技术的快速发展,积累了海量的癌症基因表达数据,利用计算方法进行致病基因预测成为癌症研究领域新的热点。然而,目前致病基因预测大多基于基因相互作用网络等,很少考虑网络局部连接与基因差异表达间的潜在联系。针对上述问题,首先利用患病前后的基因表达差异数据,通过互信息计算基因间的相关性并构建邻接网络,然后设计特征向量模型用于癌症致病基因预测。向量特征包括候选基因及其近邻的差异表达信息。从TCGA,OMIM和GEO等公共数据库获取癌症相关的致病与非致病基因以及患病前后基因差异表达数据进行实验,利用邻接网络中基因及其近邻的差异表达信息进行癌症致病基因预测(Differential Information of Gene and Nearest Neighbor for Cancer Pathogenic Gene Prediction,DICPG)。实验结果表明,DICPG癌症基因分类模型的生物学意义明显,分类精度和AUC等性能指标优于同类方法。
基金National Cancer Institute 5R01CA091792-085R01CA108461-05+2 种基金1R01CA137894-01 and 1R01CA138434-01A209National Institute of Allergy and Infectious Diseases 5R01AI067037-04National Institute of Dental and Craniofacial Research5R01DE017338-03(to ESR)
文摘目的:定位survivin基因启动子中参与卡波西肉瘤相关疱疹病毒(Kaposi’s sarcoma-associated herpesvirus,KSHV)复制转录激活因子(replication and transcription activator,RTA)上调survivin表达的重要元件。方法:构建survivin基因启动子的突变报告质粒,采用萤光素酶报告基因检测和染色质免疫共沉淀技术,定位survivin基因启动子区域能与RTA相互作用的顺式元件。结果:突变GC/Sp1和p53两个结合位点启动子活性几乎完全关闭,p53顺式作用元件对RTA上调survivin基因启动子活性具有协同作用。结论:KSHV RTA能够与survivin基因启动子中的GC/Sp1和p53顺式元件相互作用,特异性地增强survivin基因启动子活性。
文摘TIPE(Tumor necrosis factor-alpha-induced protein 8-like)家族是新近报道的免疫和肿瘤调节因子。该家族拥有四个高度同源的成员:TNFAIP8(Tumor necrosis factor-α-induced protein 8),TIPE1(TNFAIP8L1),TIPE2(TNFAIP8L2)和TIPE3(TNFAIP8L3)。它们虽然结构相似,但在组织、器官上的表达不同,在生物学功能及疾病中的作用存在较大的差别。TNFAIP8具有抑制细菌感染与促肿瘤迁移的作用;TIPE2是一种免疫和炎症负调控因子,可抑制某些肿瘤的生长;TIPE1可诱导细胞凋亡具有抑瘤效应;TIPE3可特异性结合磷脂第二信使,促进肿瘤生成。随着研究的深入,TIPE家族在多种疾病的发生发展过程中表现出重要的调控作用,然而其具体生物活性与分子机制有待进一步的研究。
基金National Cancer Institute(No.5R01CA091792-08 No.5R01CA108461-05+3 种基金 No.1R01CA137894-01 No.1R01CA1384-34-01A209)National Institute of Allergy and Infectious Diseases(No.5R01AI067037-04)National Institute of Dental and Craniofacial Research [No.5R01DE017338-03(to ESR)]