期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于基因组标记对绵羊品种分类的机器学习方法研究
1
作者 乔利英 王万年 +4 位作者 张莉 庞志旭 张思颖 李一凡 刘文忠 《畜牧兽医学报》 北大核心 2025年第5期2157-2167,共11页
旨在评估基于基因组标记的机器学习(machine learning,ML)算法在品种分类中的有效性,检验不同ML算法在绵羊品种分类中的应用效果如何。本研究采用2种方式对10个绵羊品种进行单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点选... 旨在评估基于基因组标记的机器学习(machine learning,ML)算法在品种分类中的有效性,检验不同ML算法在绵羊品种分类中的应用效果如何。本研究采用2种方式对10个绵羊品种进行单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点选择,第一种利用群体间分化指数(fixation index,FST)进行选择,第二种方式是在FST的基础上使用Boruta特征选择算法对SNPs位点进一步筛选。采用K-近邻、支持向量机(support vector machines,SVM)和自适应增强(adaptive boosting,AdaBoost)等8种不同类别的ML算法对绵羊品种进行分类,采用准确性评估不同SNPs选择方式和不同ML算法在品种鉴定中的差异,鉴定绵羊品种分类的最佳组合方式。本研究采用的数据中既有遗传关系较远的品种,也有遗传相似的品种,保证了后续分析的可靠性。根据前1%的筛选标准,FST分析每次筛选出5361个SNPs位点,Boruta算法最终保留(328±11.7)个SNPs位点用于ML品种分类,且在多次迭代后,被标记为“确认”的SNPs位点得分稳定高于阴影特征和被标记的其他两类SNPs位点。Boruta算法保留的SNPs位点数远低于FST分析。在使用ML模型进行品种分类时,大多数模型的准确性均高于0.9。其中,经过Boruta算法选择SNPs位点之后使用SVM模型进行品种分类准确性最高(0.953),AdaBoost表现也同样优秀(0.947),仅使用FST选择SNPs位点之后使用NB模型分类效果最差(0.601)。除NB外,其余模型接收者操作特征曲线下面积均接近于1。无论使用哪种SNPs选择方式均具有较强的区分能力,使用Boruta算法后效果略好。根据上述结果表明,ML方法的实施有效提高了品种分类的准确性,在绵羊品种鉴定中有良好的应用潜力。 展开更多
关键词 机器学习 品种分类 基因组标记 绵羊 准确性
在线阅读 下载PDF
基于元共祖的基因组联合育种模拟研究 被引量:1
2
作者 庞志旭 张洪志 +3 位作者 乔利英 王万年 潘洋洋 刘文忠 《畜牧兽医学报》 CAS CSCD 北大核心 2022年第7期2172-2181,共10页
旨在将整合元共祖的一步法(single-step genomic best linear unbiased prediction with metafounders,MF-SSGBLUP)应用到基因组联合育种中,并与其他经典基因组选择方法进行比较分析。本研究使用QMSim软件模拟3个系谱相互独立的奶牛群体... 旨在将整合元共祖的一步法(single-step genomic best linear unbiased prediction with metafounders,MF-SSGBLUP)应用到基因组联合育种中,并与其他经典基因组选择方法进行比较分析。本研究使用QMSim软件模拟3个系谱相互独立的奶牛群体;分别使用广义最小二乘法(generalized least squares,GLS)和原始方法(naive,NAI)估计不同群体间的祖先关系矩阵Γ;将MF-SSGBLUP、SSGBLUP和BLUP用于3个模拟群体的联合育种,评估各方法在遗传参数和育种值估计方面的差异。在不同遗传力下,GLS所得的Γ矩阵在对角线元素上略低于NAI法,在非对角线元素上没有明显差异,且基因组关系矩阵与基于元共祖构建的亲缘关系矩阵对角线元素相关系数(0.750~0.775)高于基因组关系矩阵与传统的亲缘关系矩阵相关系数(0.508~0.572)。MF-SSGBLUP遗传力估计值(0.138、0.140、0.297和0.298)与当代群体遗传力(0.107和0.296)的偏差小于其余两种方法(0.145、0.173、0.273和0.340),且MF-SSGBLUP估计育种值准确性(0.888~0.908)高于SSGBLUP法(0.863~0.876)和BLUP法(0.854~0.871)。表明,MF-SSGBLUP的遗传参数估计值无偏性更好,估计育种值准确性更高。根据上述模拟数据结果表明,在联合育种中,整合元共祖的基因组选择方法优于其他经典基因组选择方法。 展开更多
关键词 基因组选择 元共祖 基因组联合育种 一步法 模拟研究
在线阅读 下载PDF
基于多层感知机的绵羊限性性状基因组选择模拟研究 被引量:3
3
作者 王万年 陈思佳 +6 位作者 郜金荣 温中豪 袁梦娇 张洪志 庞志旭 乔利英 刘文忠 《畜牧兽医学报》 CAS CSCD 北大核心 2023年第7期2824-2835,共12页
旨在将多层感知机(multilayer perceptron,MLP)应用于绵羊限性性状基因组选择中,并在多种情况下与其他经典基因组选择方法进行比较分析。本研究利用Qmsim软件模拟2个绵羊群体Pop1和Pop2的表型数据和基因型数据。在MLP中使用人工神经网络... 旨在将多层感知机(multilayer perceptron,MLP)应用于绵羊限性性状基因组选择中,并在多种情况下与其他经典基因组选择方法进行比较分析。本研究利用Qmsim软件模拟2个绵羊群体Pop1和Pop2的表型数据和基因型数据。在MLP中使用人工神经网络(artificial neural network,ANN),线性模型中使用约束性最大似然法(residual maximum likelihood,REML)估计不同群体的遗传参数。利用Python语言自编MLP模型,利用DMU软件实现最佳线性无偏预测(best linear unbiased prediction,BLUP)、基因组最佳线性无偏预测(genomic BLUP)和一步法(single-step GBLUP,SSGBLUP)模型,评估不同情况下各方法遗传力(heritability,h^(2))和育种值估计方面的差异。各情况下,MLP和SSGBLUP均显著(P<0.05)优于GBLUP和BLUP。在3种情况下MLP的h^(2)估值与SSGBLUP差异不显著:h^(2)为0.05,标记数为10K且QTL数为100时的Pop2群体;h^(2)为0.2,QTL数为500的两个标记数下Pop1群体和QTL数为100且标记数为50K时Pop2群体;h^(2)为0.5且QTL数为100时,标记数10K下Pop1群体和标记数50K下Pop2群体;除上述情况之外,MLP的h^(2)估计结果均显著(P<0.05)优于SSGBLUP、GBLUP和BLUP。在不同h^(2)初值下,QTL数和标记数变化时,Pop1和Pop2群体中MLP的h^(2)估值与当代群体h^(2)的差值小于SSGBLUP、GBLUP和BLUP;SSGBLUP和GBLUP法在不同标记数下遗传参数估计结果差别较大,MLP差别较小。在各情况下,MLP基因组估计育种值(genomic estimated breeding value,GEBV)的准确性均为最高。h^(2)初值为0.05时,MLP在标记数为10K时GEBV准确性略高于SSGBLUP在标记数为50K时的预测准确性。在h^(2)、QTL数和标记数相同的情况下,Pop2群体中各方法的EBV预测准确性较Pop1群体均有提升。根据上述模拟结果表明,在绵羊限性性状基因组选择中,MLP优于其他经典基因组选择方法。 展开更多
关键词 多层感知机 基因组选择 模拟 预测 限性性状
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部