期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于机器学习方法对人类基因组DNA双链断裂位点进行识别
1
作者 董碧宇 刘国庆 《中国生物化学与分子生物学报》 CAS CSCD 北大核心 2023年第8期1153-1167,共15页
DNA双链断裂(double-strand break,DSB)是细胞中一种严重的DNA损伤形式,与包括癌症、重组异常、神经元发育异常在内的多种基因组不稳定性疾病密切相关。由于成本和技术门槛的限制,高通量测序技术绘制的高分辨率DSB图谱十分有限,这阻碍... DNA双链断裂(double-strand break,DSB)是细胞中一种严重的DNA损伤形式,与包括癌症、重组异常、神经元发育异常在内的多种基因组不稳定性疾病密切相关。由于成本和技术门槛的限制,高通量测序技术绘制的高分辨率DSB图谱十分有限,这阻碍了我们对不同物种基因组中DSB情况的认知。据此,我们建立了以随机森林(RF)、支持向量机(SVM)和逻辑回归(LR)三种分类器为基础算法的分类预测模型,对人类上皮细胞基因组DSB位点进行预测。除了之前预测研究中常用到的表观特征和DNA形状特征外,我们发现DNA序列特征(k-mer频数、GC含量、GC-偏移和互信息)也能表征DSB位点。同时,在考虑DNA物理性质、化学位移和自相关信息后,预测结果得到有效提高。将上述所有特征合并后进行预测,得到了较好的分类预测结果,其中逻辑回归(LR)的分类预测性能是最佳(AUC=0.97),与以往的预测结果相当(AUC=0.964)。另外,通过特征递增搜索方法,得到由294个特征组成的最优特征集,对应的AUC值达到0.974。 展开更多
关键词 双链断裂 分类预测 化学位移 DNA物理性质 自相关
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部