期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
相关数据组卡尔曼滤波分光光度法 被引量:3
1
作者 陈振宁 周定 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1997年第5期97-100,共4页
针对卡尔曼滤波法存在的问题,提出相关数据组卡尔曼滤波法。本方法可减小测量值误差对迭代运算的影响,有效地抑制了滤波数值的发散。以数值模拟体系检验本方法,当误差为±5%时,回收率为95.5%~105%。以PAR为显色... 针对卡尔曼滤波法存在的问题,提出相关数据组卡尔曼滤波法。本方法可减小测量值误差对迭代运算的影响,有效地抑制了滤波数值的发散。以数值模拟体系检验本方法,当误差为±5%时,回收率为95.5%~105%。以PAR为显色剂,对锌、镉、铅三元素进行同时测定,获得了满意的结果。 展开更多
关键词 相关数据组 卡尔曼滤波 分光光度法 化学计量学
在线阅读 下载PDF
低级别胶质瘤多组学数据整合的一致性聚类集成分子分型
2
作者 王彤 杨琪 +6 位作者 田雅昕 贾聪聪 罗艳虹 房瑞玲 余红梅 张岩波 曹红艳 《中国卫生统计》 北大核心 2025年第4期502-509,共8页
目的提出基于一致性聚类集成的多组学数据整合方法(multi-omics data integration with consensus clustering ensemble,MICCE),探讨MICCE方法在低级别胶质瘤(lower-grade gliomas,LGG)分子分型中的应用,识别预后高风险患者,筛选与LGG... 目的提出基于一致性聚类集成的多组学数据整合方法(multi-omics data integration with consensus clustering ensemble,MICCE),探讨MICCE方法在低级别胶质瘤(lower-grade gliomas,LGG)分子分型中的应用,识别预后高风险患者,筛选与LGG进展相关的差异基因以及重要通路。方法采用一致性聚类集成方法集成LGG患者多组学数据整合分型的7种方法(SNF、joint SNF、CIMLR、ConsensusClusterPlus、MoCluster、NEMO、iClusterBayes),得到一致性分型结果,采用Cox回归研究不同分型患者的预后风险;进一步筛选出DEmRNAs(differentially expressed mRNAs),DEmiRNAs(differentially expressed miRNAs)和DMGs(differentially methylated genes),并对差异基因进行GO生物功能注释和KEGG通路分析;最后进行免疫细胞浸润和通路活性分析。结果LGG患者分为预后高危组,中危组和低危组,其中高危组的死亡风险是低危组的7.70倍;筛选出2512个DEmRNAs,14个DEmiRNAs和255个DMGs,包括5个核心基因;将基因联合分析得到的665个重合基因进行GO富集和KEGG富集分析,得到62条GO富集项和52条KEGG富集项;免疫细胞浸润和通路活性分析表明,存在显著差异的2种浸润细胞和4条通路。结论MICCE能够有效识别出LGG预后高风险患者,并发现与LGG进展相关的差异基因和不同亚型的肿瘤相关通路,为LGG的个性化治疗提供重要线索。 展开更多
关键词 聚类集成 数据整合 分子亚型 低级别胶质瘤
在线阅读 下载PDF
基于深度学习的低级别胶质瘤多组学数据整合稳健分型
3
作者 杜港 贾聪聪 +4 位作者 赵鑫 田雅昕 房瑞玲 张岩波 曹红艳 《中国卫生统计》 北大核心 2025年第2期185-190,共6页
目的 多组学数据的高噪稀疏性以及存在异常值,易导致多组学数据整合分型稳健性不足,本研究提出将深度学习中的自编码器与最优化稳健伪极大似然估计器(optimally tuned robust improper maximum likelihood estimator, OTRIMLE)结合的方... 目的 多组学数据的高噪稀疏性以及存在异常值,易导致多组学数据整合分型稳健性不足,本研究提出将深度学习中的自编码器与最优化稳健伪极大似然估计器(optimally tuned robust improper maximum likelihood estimator, OTRIMLE)结合的方法,并将其应用于低级别胶质瘤(lower-grade gliomas, LGG)患者分型。方法 采用自编码器对LGG的miRNA、mRNA和甲基化数据进行非线性降维,串联后采用OTRIMLE方法进行稳健分型。对最终的分型结果,利用Cox比例风险模型分析不同分型的预后风险,使用差异表达分析筛选出DEmiRNAs(differentially expressed miRNAs),DEmRNAs(differentially expressed mRNAs)和DMGs(differentially methylated genes),对DEmiRNAs的靶基因、DEmRNAs和DMGs三者的重合基因进行GO富集分析,最后对不同分型的患者进行免疫细胞浸润与通路活性分析。结果 将LGG患者分为四型,其中分型4患者的死亡风险是分型3患者的5.903倍。筛选出8个DEmiRNAs, 2890个DEmRNAs和46个DMGs,联合分析得到的658个重合基因富集于423条GO生物项。筛选出13条活性存在差异的通路以及4种存在差异的免疫浸润细胞。结论 基于深度学习的OTRIMLE方法对多组学数据高噪稀疏性和存在异常点时具有稳健性,有效实现了LGG患者的稳健分型,并筛选出了具有统计学差异的免疫细胞与通路等,可为LGG后续针对性治疗提供理论依据。 展开更多
关键词 稳健分型 深度学习 数据 低级别胶质瘤
在线阅读 下载PDF
一种面向功能基因挖掘的动物多组学数据集
4
作者 刘洪 窦婧文 +5 位作者 王越 廖勇 刘小磊 李新云 赵书红 付玉华 《农业大数据学报》 2025年第1期96-106,共11页
单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-S... 单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-Seq)和基因组注释信息,有效数据规模为2.8 TB。此外,本数据集还收录了基于深度学习算法得到的基因与表型实体识别数据。总的来说,该多组学数据集可用于农业重要性状的基因发掘和功能验证,能够为跨物种比较研究提供有价值的资源,也可更好地服务于动物经济性状关键基因识别模型构建以及算法研究。 展开更多
关键词 数据 跨物种 功能基因挖掘 个体水平 深度学习
在线阅读 下载PDF
整合多源转录组学数据鉴别哮喘发生上皮细胞的潜在生物标志物
5
作者 谢连华 卢淑娴 +2 位作者 郭芳阳 张弋峰 刘潜 《细胞与分子免疫学杂志》 北大核心 2025年第8期695-705,共11页
目的基于多源转录组学数据的生物信息学分析,挖掘哮喘上皮细胞的潜在生物标志物,并通过哮喘模型的肺组织及其上皮细胞验证潜在靶基因的表达。方法整合基因表达数据集(GEO)数据库中3组哮喘患者和正常对照组上皮细胞的基因表达谱数据,通... 目的基于多源转录组学数据的生物信息学分析,挖掘哮喘上皮细胞的潜在生物标志物,并通过哮喘模型的肺组织及其上皮细胞验证潜在靶基因的表达。方法整合基因表达数据集(GEO)数据库中3组哮喘患者和正常对照组上皮细胞的基因表达谱数据,通过基因差异表达分析和基因共表达网络分析,鉴别与哮喘相关的关键基因及生物学通路。最后,利用哮喘动物模型在肺组织和肺组织上皮细胞验证主要关键基因。结果通过差异基因表达分析,哮喘上皮细胞与正常对照组相比,存在1121个上调基因和1484个下调基因。生物学通路富集分析表明,上调基因主要参与糖基化过程,下调基因主要参与免疫细胞分化过程。基因共表达网络分析发现,糖基化相关通路的模块9与哮喘呈显著正相关,而参与胰岛素等信号通路的模块17与哮喘呈显著负相关。我们发现多肽N-乙酰半乳糖胺转移酶5(GALNT5)、吡咯啉-5-羧酸还原酶-1(PYCR1)和癌胚抗原相关细胞黏附分子5(CEACAM5)基因是模块9的关键基因且在哮喘中显著上调。最后,我们在哮喘肺组织上皮细胞中验证了GALNT5、PYCR1和CEACAM5在模型组中表达均上调。同时,通过构建大鼠哮喘模型,我们进一步证实了这三个基因的蛋白水平在模型组肺组织中也显著上调。结论本研究通过数据整合和实验验证,鉴定出与哮喘疾病发展密切相关的关键基因和生物学通路,这些结果为哮喘的诊断和治疗提供新的理论基础和潜在靶点。 展开更多
关键词 多源转录数据 基因共表达网络 上皮细胞 生物标志物 生物学通路
在线阅读 下载PDF
生命组学大数据安全管理实践 被引量:1
6
作者 王彦青 陈婷婷 +7 位作者 张思思 朱军伟 陈焕新 肖景发 宋述慧 章张 赵文明 鲍一明 《农业大数据学报》 2024年第3期325-332,共8页
生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National... 生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National Genomics Data Center,NGDC)面向我国人口健康和社会可持续发展的重大战略需求,建立了生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘研究体系,形成了一系列数据安全管理的制度和措施。本文聚焦于生命组学大数据全生命周期的安全管理问题,探讨生命组学大数据安全管理框架,全面分析在数据汇交、存储、管理、共享全生命周期中涉及的安全管理内容,并总结了NGDC在生命组学大数据安全管理方面的成效。最后,本文展望了生命组学大数据安全管理的发展方向,包括完善数据分级分类制度、提升数据分级安全管理技术和加强数据异地灾备建设,以期实现生命组学大数据的安全管理与可持续发展。 展开更多
关键词 生命学大数据 数据汇交 数据共享 安全管理
在线阅读 下载PDF
基于生存结局加权多组学数据整合的胶质瘤分子分型
7
作者 贾聪聪 杜港 +5 位作者 赵鑫 师国京 房瑞玲 李治 张岩波 曹红艳 《中国卫生统计》 CSCD 北大核心 2024年第5期644-649,共6页
目的探讨将生存结局加权的多组学数据整合方法survClust应用于胶质瘤(glioma)数据,以识别具有显著分子异质性和预后差异的胶质瘤分子分型。方法采用survClust方法对中国胶质瘤基因数据库(Chinese glioma genome atlas,CGGA)的胶质瘤多... 目的探讨将生存结局加权的多组学数据整合方法survClust应用于胶质瘤(glioma)数据,以识别具有显著分子异质性和预后差异的胶质瘤分子分型。方法采用survClust方法对中国胶质瘤基因数据库(Chinese glioma genome atlas,CGGA)的胶质瘤多组学数据进行结局加权整合分型,并拟合Cox比例风险模型评估不同分型患者预后。对不同分型间的差异表达基因(DEmiRNAs,DEmRNAs,DMGs)进行筛选,对DEmiRNAs靶基因、DEmRNAs、DMGs的重合基因进行GO功能注释;最后对不同分型患者进行免疫浸润分析。结果survClust将胶质瘤患者分为高危组和低危组,高危组患者的死亡风险是低危组的2.931倍。不同分型差异基因的分布存在差异,共筛选出194个DEmiRNAs,3396个DEmRNAs,1230个DMGs。将189个重合基因进行GO功能注释,得到52条差异具有统计学意义的GO生物项。此外,不同分型在B淋巴细胞、CD4+T细胞、CD8+T细胞、中性粒细胞、巨噬细胞和髓样树突状细胞的免疫浸润水平存在统计学差异。结论结局加权整合算法survClust能够有效识别兼具分子异质性和显著预后差异的胶质瘤亚型,同时基于分型结果筛选出的潜在生物标志物将为胶质瘤的个性化治疗提供科学理论依据。 展开更多
关键词 生存结局加权聚类 分子亚型 数据整合 胶质瘤
在线阅读 下载PDF
网络增强核融合方法的改进及其在乳头状肾细胞癌多组学数据整合分子分型中的应用
8
作者 师国京 李灵梅 +6 位作者 魏亿芳 赵鑫 房瑞玲 杨海涛 余红梅 张岩波 曹红艳 《中国卫生统计》 CSCD 北大核心 2024年第3期376-381,共6页
目的针对网络增强的相似网络融合(network enhancement fusion,ne-SNF)方法先融合不同组学网络,再对融合后的网络降噪,忽略了不同组学相似网络噪声对融合网络影响的问题,本文提出了改进的网络增强融合(improved network enhancement fus... 目的针对网络增强的相似网络融合(network enhancement fusion,ne-SNF)方法先融合不同组学网络,再对融合后的网络降噪,忽略了不同组学相似网络噪声对融合网络影响的问题,本文提出了改进的网络增强融合(improved network enhancement fusion,improved ne-SNF)方法,并探讨其在乳头状肾细胞癌(papillary renal cell carcinoma,PRCC)分子分型中的应用,识别PRCC高危患者,筛选重要通路及免疫浸润细胞。方法通过模拟研究评估improved ne-SNF分型性能,并将其用于PRCC多组学数据的整合分型,利用Cox回归模型分析不同分型患者的预后风险;筛选不同分型的差异表达mRNA(DEmRNAs)、miRNA(DEmiRNAs)及差异甲基化基因(DMGs),并对其重合基因进行KEGG通路分析;最后对不同分型患者进行免疫细胞浸润分析。结果模拟研究结果表明improved ne-SNF在不同信号比例和噪声强度下的分型准确性均优于SNF和ne-SNF。improved ne-SNF方法将PRCC患者分为高危组和低危组,高危组患者的死亡风险是低危组的7.727倍;筛选出3511个DEmRNAs,96个DEmiRNAs及3426个DMGs,其联合分析的649个重合基因得到42条有统计学差异的KEGG通路。此外,筛选出3种在不同分型中存在统计学差异的免疫浸润细胞。结论improved ne-SNF分型性能优于SNF和ne-SNF,且能够有效识别PRCC预后高风险患者,并筛选出PRCC重要通路及相关免疫浸润细胞,为PRCC的治疗及预后提供新的思路和参考依据。 展开更多
关键词 改进的网络增强融合 乳头状肾细胞癌 数据整合 分子亚型
在线阅读 下载PDF
多组学数据驱动的机器学习模型在乳腺癌生存及治疗响应预测中的应用 被引量:3
9
作者 章子怡 王棨临 +4 位作者 张俊有 段迎迎 刘家欣 刘赵硕 李春燕 《遗传》 CAS CSCD 北大核心 2024年第10期820-832,共13页
乳腺癌的高度异质性导致其治疗及预后评估较为复杂。治疗方案的选择受到肿瘤亚型、病变分级、基因型等多种因素的影响,因此需要制定个体化治疗策略。患者的预后效果因病情不同而产生显著差异。作为人工智能的一个重要分支,机器学习能高... 乳腺癌的高度异质性导致其治疗及预后评估较为复杂。治疗方案的选择受到肿瘤亚型、病变分级、基因型等多种因素的影响,因此需要制定个体化治疗策略。患者的预后效果因病情不同而产生显著差异。作为人工智能的一个重要分支,机器学习能高效处理海量数据,并实现决策过程的自动化。机器学习方法的引入将为乳腺癌治疗的选择和预后评估提供新的解决方案。在癌症治疗领域,传统方法预测生存与治疗效果往往依赖于单一或少量的生物标志物,难以全面捕捉复杂的生物学过程。机器学习通过分析患者的多组学数据以及它们在疾病发生发展过程中复杂的变化趋势,预测患者的生存和治疗响应效果,从而选择适合的治疗措施,实施早期干预,改善患者的治疗效果。本文首先介绍了常用的机器学习方法,在此基础上分别从评估生存情况和预测治疗效果这两方面展开,详细分析了机器学习在乳腺癌患者生存预测及预后领域中的应用,以期为乳腺癌患者提供精准医疗治疗策略,提高治疗效果和生存质量。 展开更多
关键词 乳腺癌 机器学习 数据整合分析 生存预测 治疗响应
在线阅读 下载PDF
基于多维组学数据的玉米农艺和品质性状预测研究
10
作者 杨静蕾 吴冰杰 +1 位作者 王安洲 肖英杰 《作物学报》 CAS CSCD 北大核心 2024年第2期373-382,共10页
基因组选择是利用覆盖基因组的高密度标记对未知表型进行预测并选择的技术。在植物中,利用该技术可对不同作物性状进行早期选择,保留优势个体,节约田间管理和表型鉴定成本,大大加快育种进程。本研究使用rrBLUP和LASSO两种统计模型,基于... 基因组选择是利用覆盖基因组的高密度标记对未知表型进行预测并选择的技术。在植物中,利用该技术可对不同作物性状进行早期选择,保留优势个体,节约田间管理和表型鉴定成本,大大加快育种进程。本研究使用rrBLUP和LASSO两种统计模型,基于基因组、转录组和代谢组数据对玉米的农艺性状和品质性状进行了基因组预测。研究发现,对于不同组学数据而言,其预测能力高低依次为基因组、转录组、代谢组数据。对于不同性状而言,品质性状的预测能力高于农艺性状。对于rrBLUP和LASSO两种模型而言,基于基因组数据预测时所有性状均是rrBLUP为最优预测模型;基于转录组数据预测时有53种性状是以rrBLUP为最佳预测模型, 2种性状以LASSO为最佳预测模型;基于代谢组数据,有43种性状以rrBLUP为最佳预测模型, 12种性状以LASSO为最佳预测模型。此外,还发现用不同系谱材料进行预测时,热带玉米预测温带玉米,其效果略优于温带玉米预测热带玉米。而对于品质性状,不同系谱间材料的预测精度高于同一系谱内。本研究系统评估了各种组学数据和不同统计模型对玉米农艺及品质性状预测能力的差异,为未来玉米重要性状的基因组育种提供了理论依据。 展开更多
关键词 玉米 农艺和品质性状 基因预测 多维数据
在线阅读 下载PDF
基于组学数据的生物学模块识别方法研究进展
11
作者 刘芝霖 荣志炜 +3 位作者 黄吉科 宋佳丽 俞轶培 侯艳 《中国卫生统计》 CSCD 北大核心 2024年第4期635-640,共6页
组学数据在分子层面上加深了研究者对表型相似疾病的辨别能力及对认识不足疾病的理解,对组学数据的分析能够在疾病的诊断与治疗中发挥至关重要的作用。组学分子间存在复杂的调控关系,过去的研究表明细胞的功能是模块化的^([1]),在疾病... 组学数据在分子层面上加深了研究者对表型相似疾病的辨别能力及对认识不足疾病的理解,对组学数据的分析能够在疾病的诊断与治疗中发挥至关重要的作用。组学分子间存在复杂的调控关系,过去的研究表明细胞的功能是模块化的^([1]),在疾病的实际进展中,关键的调控网络出现异常往往表现为网络中所有分子表达水平都发生变化^([2]),因此表达模式相似的分子很可能存在共调控或功能相关的情况^([3])。 展开更多
关键词 辨别能力 数据 调控网络 表达模式 分子层面 模块化 调控关系 生物学
在线阅读 下载PDF
GSA:组学原始数据归档库 被引量:10
12
作者 张思思 陈婷婷 +4 位作者 朱军伟 周晴 陈旭 王彦青 赵文明 《遗传》 CAS CSCD 北大核心 2018年第11期1044-1047,共4页
生命科学的发展已进入组学大数据时代,然而我国至今尚未形成公共数据库存储体系。为弥补国内空白,组学原始数据归档库(Genome Sequence Archive, GSA, http://bigd.big.ac.cn/gsa)系统遵循国际核苷酸序列数据联盟(International Nucleot... 生命科学的发展已进入组学大数据时代,然而我国至今尚未形成公共数据库存储体系。为弥补国内空白,组学原始数据归档库(Genome Sequence Archive, GSA, http://bigd.big.ac.cn/gsa)系统遵循国际核苷酸序列数据联盟(International Nucleotide Sequence Database Collaboration,INSDC)相关数据库建设标准,广泛收集各类生命组学原始数据。自2015年底上线运行以来,已获得了包括Cell、Nature、PNAS、GPB等30余个国内外期刊的认可,收录的数据量呈显著增长趋势,提供的数据服务受到国内外广大科研人员的认可。GSA有效缓解了当前我国生命组学数据汇交、存储与共享困难的问题,为我国国家生物信息中心的建设奠定了坚实基础。本文对目前GSA数据汇交、审核、发布与管理等机制进行了深入阐述,以方便用户了解GSA的各项功能,提供更高效的数据服务。 展开更多
关键词 学原始数据归档库(GSA) 学大数据 数据汇交 数据共享
在线阅读 下载PDF
云存储中支持数据去重的群组数据持有性证明 被引量:11
13
作者 王宏远 祝烈煌 李龙一佳 《软件学报》 EI CSCD 北大核心 2016年第6期1417-1431,共15页
数据持有性证明(provable data possession,简称PDP)和数据可恢复性证明(proofs of retrievability,简称POR)是客户端用来验证存储在云端服务器上数据完整性的主要技术.近几年,它在学术界和工业界的应用广泛,很多PDP和POR方案相继出现.... 数据持有性证明(provable data possession,简称PDP)和数据可恢复性证明(proofs of retrievability,简称POR)是客户端用来验证存储在云端服务器上数据完整性的主要技术.近几年,它在学术界和工业界的应用广泛,很多PDP和POR方案相继出现.但是由于不同群组的特殊性和独特要求,使得群组PDP/POR方案多样化,并且群组应用中的许多重要功能(例如数据去重)没有被实现.如何构造高效及满足群组特定功能和安全需求的PDP/POR方案,已经引起了人们的广泛关注.给出了一种支持数据去重的群组PDP方案(GPDP),基于矩阵计算和伪随机函数,GPDP可以在支持数据去重的基础上,高效地完成数据持有性证明,并且可以在群组中抵抗恶意方选择成员攻击.在标准模型下证明了GPDP的安全性,并且在百度云平台上实现了GPDP的原型系统.为了评估方案的性能,使用了10GB的数据量进行实验和分析,结果表明:GPDP方案在达到群组中数据去重的目标的基础上,可以高效地保证抵抗选择攻击和数据持有性,即:预处理效率高于私有验证方案,而验证效率高于公开验证方案(与私有验证效率几乎相同).另外,与其他群组PDP/POR方案相比,GPDP方案将额外存储代价和通信代价都降到了最低. 展开更多
关键词 数据持有性证明 选择攻击 数据去重 云存储 云计算
在线阅读 下载PDF
从多组学数据挖掘结核病关键基因的综合策略 被引量:2
14
作者 张旭 陈冬东 +2 位作者 叶志强 李启明 谢建平 《工程数学学报》 CSCD 北大核心 2018年第5期515-522,共8页
如何确定参与肺结核易感性的相互作用和潜在网络的关键宿主基因是一项非常重要的任务.到目前为止,只有少数宿主基因被发现和证实与结核病有关.本文利用显著性分析及聚类等数学、统计学方法分析了两组和结核病相关的组学数据,发现14个可... 如何确定参与肺结核易感性的相互作用和潜在网络的关键宿主基因是一项非常重要的任务.到目前为止,只有少数宿主基因被发现和证实与结核病有关.本文利用显著性分析及聚类等数学、统计学方法分析了两组和结核病相关的组学数据,发现14个可能性最大的结核病候选易感基因,其全部被文献报道参与各种重要的生物过程,更有五个被报道与结核病有关.这表明通过综合应用多种数学、统计学方法分析组学数据有助于缩小结核疾病相关基因的候选名单. 展开更多
关键词 数据 基因 显著性检验 结核病 聚类
在线阅读 下载PDF
模糊聚类法在动态设计组学数据趋势聚类中的应用 被引量:2
15
作者 王璐 张涛 +3 位作者 刘佳 刘盈君 公晓云 薛付忠 《中国卫生统计》 CSCD 北大核心 2015年第1期2-5,9,共5页
目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的... 目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的不同动态变化趋势,并将其聚为一类;同时,通过设定隶属度阈值我们可以避免对噪声变量的聚类。而对动态基因组表达数据的实例分析表明FCM可以有效地将具有相同表达模式的基因聚类,并且能给出类间关系。结论模糊C-均值聚类可以用于动态组学数据不同动态变化模式的聚类,帮助我们更有效地探索生物信息。 展开更多
关键词 动态数据 模糊C均值聚类
在线阅读 下载PDF
基于可视化图形特征融合的蛋白质组学质谱数据分析 被引量:3
16
作者 孟辉 洪文学 +1 位作者 宋佳霖 王立强 《燕山大学学报》 CAS 2008年第5期451-456,共6页
近年来,对蛋白质组学质谱数据进行模式识别成为癌症诊断的一种新方法,由此发现的新生物标记物已经成功用于多种重大疾病的早期预测。这种方法的两个难点是:如何提取能够明显区分不同类别的特征,如何有效处理谱数据中大量的特征。本文提... 近年来,对蛋白质组学质谱数据进行模式识别成为癌症诊断的一种新方法,由此发现的新生物标记物已经成功用于多种重大疾病的早期预测。这种方法的两个难点是:如何提取能够明显区分不同类别的特征,如何有效处理谱数据中大量的特征。本文提出基于多元图形特征融合的方法对蛋白质组学质谱高维数据进行可视化降维处理。在对质谱数据进行必要的预处理后,选择部分原始特征并将其映射到多元图表示域。通过多层递阶图形特征选择与提取得到最终的多元图癌症诊断模板。采用国际公开卵巢癌高通量数据集进行验证,得到了较好的分类效果。 展开更多
关键词 蛋白质学质谱数据 癌症诊断 预处理 多元图形特征融合
在线阅读 下载PDF
面向多元组关系-集值数据的脱敏方法 被引量:2
17
作者 顾兆军 蔡畅 +1 位作者 刘春波 钟安鸣 《计算机工程与设计》 北大核心 2022年第1期34-42,共9页
对数据发布中传统方法脱敏多元组关系-集值数据可能导致信息泄露以及产生较高信息损失的问题进行研究,提出基于(K,L)-多样性模型的多元组关系-集值数据的脱敏方法PAHI。根据准标识符将多元组数据转换为单元组数据;用信息增益比优化分割... 对数据发布中传统方法脱敏多元组关系-集值数据可能导致信息泄露以及产生较高信息损失的问题进行研究,提出基于(K,L)-多样性模型的多元组关系-集值数据的脱敏方法PAHI。根据准标识符将多元组数据转换为单元组数据;用信息增益比优化分割方法,实现集值数据K-匿名;引入敏感度值建立集值指纹桶,采用敏感度距离优化剩余元组的处理,实现关系-集值数据L-多样性。引入辨识度度量标准和信息熵计算K和L的阈值。安全性分析和实验验证,对比现有的脱敏方法,该方法保证了脱敏后数据安全,降低了时间开销和信息损失,提高了数据的可用性。 展开更多
关键词 数据脱敏 匿名化 (K L)-多样性 关系-集值数据 多元数据
在线阅读 下载PDF
家蚕蚁蚕蛋白质组的质谱鉴定与数据库构建 被引量:2
18
作者 刘艳艳 池旭娟 +4 位作者 谈建中 方向明 阚雪芹 郑必平 平野久 《蚕业科学》 CAS CSCD 北大核心 2008年第4期676-683,共8页
为尝试构建基于质谱分析的家蚕蛋白质组数据库,采用一维电泳-液相色谱-质谱(1DE-LC-MS)技术对家蚕蚁蚕的蛋白质组进行了分析与鉴定。共检索到511个相匹配的候选蛋白质和92个多肽离子片段,鉴定获得了171个无冗余蛋白质组分,分别属于121... 为尝试构建基于质谱分析的家蚕蛋白质组数据库,采用一维电泳-液相色谱-质谱(1DE-LC-MS)技术对家蚕蚁蚕的蛋白质组进行了分析与鉴定。共检索到511个相匹配的候选蛋白质和92个多肽离子片段,鉴定获得了171个无冗余蛋白质组分,分别属于121种蛋白质或蛋白质亚基,其中有36种蛋白质或亚基尚未在家蚕及昆虫的基因与蛋白质数据库中报道;在171个被鉴定的蛋白质组分中,与细胞骨架和蛋白质代谢相关的组分多达64种。结果还表明,1DE-LC-MS技术也适用于从一维凝胶电泳的差异性条带及蛋白质混合样品中分离和鉴定特异蛋白质组分。 展开更多
关键词 家蚕 蚁蚕 蛋白质数据 质谱分析 一维电泳-液相色谱-质谱技术
在线阅读 下载PDF
具有局部和全局注意力机制的图注意力网络学习单样本组学数据表征 被引量:3
19
作者 周丰丰 张金楷 《吉林大学学报(理学版)》 CAS 北大核心 2023年第6期1351-1357,共7页
针对生物组学数据中基因数目远大于样本数目的高维“大p小n”问题,提出一种具有局部和全局注意力机制的图注意力网络GATOr.该模型首先在组学数据上利用Pearson相关系数计算特征之间的相关性,构建组学数据的单样本网络;然后提出一种结合... 针对生物组学数据中基因数目远大于样本数目的高维“大p小n”问题,提出一种具有局部和全局注意力机制的图注意力网络GATOr.该模型首先在组学数据上利用Pearson相关系数计算特征之间的相关性,构建组学数据的单样本网络;然后提出一种结合局部和全局注意力机制的图注意力网络从单样本网络中学习基于图的组学特征表示,从而将组学数据的高维特性转化为低维表示.实验结果表明,GATOr与其他传统分类算法相比,在分类任务的准确率及其他指标上均取得了较优性能. 展开更多
关键词 数据 单样本网络 注意力机制 图注意力网络
在线阅读 下载PDF
组播分组数据源鉴别综述 被引量:2
20
作者 陈慧 熊光泽 刘璟 《计算机科学》 CSCD 北大核心 2004年第5期27-30,共4页
对组播分组数据源鉴别领域的现有研究成果进行了系统的分类和总结,指出了它们各自存在的优缺点;提出了一个公开问题——分组Hash有向图鉴别问题;指出了该领域的一些可能发展方向。
关键词 播分数据 Hash有向图 播安全 MAC码 Hash链 数字签名算法
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部