LncRNA-疾病关联预测的计算方法是解决传统生物学实验昂贵且费时的有效途径,其中基于机器学习的计算方法是当前研究热点,但其存在着未充分考虑lncRNA-疾病关联矩阵的局部结构和全局结构的问题.因此,本文提出了一种lncRNA与疾病潜在关联...LncRNA-疾病关联预测的计算方法是解决传统生物学实验昂贵且费时的有效途径,其中基于机器学习的计算方法是当前研究热点,但其存在着未充分考虑lncRNA-疾病关联矩阵的局部结构和全局结构的问题.因此,本文提出了一种lncRNA与疾病潜在关联的多层线性投影预测方法(MLPLDA:Multi-layer linear projection for predicting lncRNA-disease association).MLPLDA利用组合加权整合lncRNA和疾病的两种相似性,然后用WKNKN重构原始的lncRNA-疾病关联矩阵,最后使用堆叠层策略的多层线性投影进行lncRNA-疾病关联预测.在留一和五折交叉验证实验中,MLPLDA获得的AUC分别是0.8807和0.8563±0.0045,体现了其可靠的性能.在3种疾病(肺癌,乳腺癌和骨肉瘤)的案例研究中,MLPLDA能够有效预测与3种疾病有关系的lncRNA.展开更多
基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型...基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计,以期缓解关联数据稀疏和PU问题的影响。然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,与目前流行的基因-疾病关联预测方法相比,所提出的模型在查全率和查准率上均有显著提高,同时也能解决关联预测中常见的冷启动问题。展开更多
文摘LncRNA-疾病关联预测的计算方法是解决传统生物学实验昂贵且费时的有效途径,其中基于机器学习的计算方法是当前研究热点,但其存在着未充分考虑lncRNA-疾病关联矩阵的局部结构和全局结构的问题.因此,本文提出了一种lncRNA与疾病潜在关联的多层线性投影预测方法(MLPLDA:Multi-layer linear projection for predicting lncRNA-disease association).MLPLDA利用组合加权整合lncRNA和疾病的两种相似性,然后用WKNKN重构原始的lncRNA-疾病关联矩阵,最后使用堆叠层策略的多层线性投影进行lncRNA-疾病关联预测.在留一和五折交叉验证实验中,MLPLDA获得的AUC分别是0.8807和0.8563±0.0045,体现了其可靠的性能.在3种疾病(肺癌,乳腺癌和骨肉瘤)的案例研究中,MLPLDA能够有效预测与3种疾病有关系的lncRNA.
文摘基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计,以期缓解关联数据稀疏和PU问题的影响。然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,与目前流行的基因-疾病关联预测方法相比,所提出的模型在查全率和查准率上均有显著提高,同时也能解决关联预测中常见的冷启动问题。