为建立一种可以快速、批量、高效检测中国荷斯坦牛牛奶中β-乳球蛋白含量的方法,采集501份来自西北、华北和华中主要产奶地区的健康中国荷斯坦牛牛奶样本,采用高效液相色谱法测定牛奶样本中β-乳球蛋白的含量,并同步测定和收集牛奶样本...为建立一种可以快速、批量、高效检测中国荷斯坦牛牛奶中β-乳球蛋白含量的方法,采集501份来自西北、华北和华中主要产奶地区的健康中国荷斯坦牛牛奶样本,采用高效液相色谱法测定牛奶样本中β-乳球蛋白的含量,并同步测定和收集牛奶样本中红外光谱数据(mid-infrared spectroscopy,MIRS)。以MIRS为预测变量,β-乳球蛋白含量为因变量,将12种光谱预处理方法进行连续2次的随机组合,并手动选取特征波段,使用偏最小二乘回归(partial least squares regression,PLSR)作为传统机器学习算法,建立预测牛奶中β-乳球蛋白含量的最优预测模型。结果显示:该模型交叉验证集和测试集的RC2和RP2分别为0.812 9、0.768 8,均方根误差RMSEC和RMSEP分别为0.476 2、0.524 9 g/L,性能偏差比(ratio of performance to deviation,RPD)为2.076 6,达到畜禽生产性能的测定要求。试验结果表明,可以利用MIRS建立模型预测中国荷斯坦牛牛奶中的β-乳球蛋白含量。展开更多
文摘为建立一种可以快速、批量、高效检测中国荷斯坦牛牛奶中β-乳球蛋白含量的方法,采集501份来自西北、华北和华中主要产奶地区的健康中国荷斯坦牛牛奶样本,采用高效液相色谱法测定牛奶样本中β-乳球蛋白的含量,并同步测定和收集牛奶样本中红外光谱数据(mid-infrared spectroscopy,MIRS)。以MIRS为预测变量,β-乳球蛋白含量为因变量,将12种光谱预处理方法进行连续2次的随机组合,并手动选取特征波段,使用偏最小二乘回归(partial least squares regression,PLSR)作为传统机器学习算法,建立预测牛奶中β-乳球蛋白含量的最优预测模型。结果显示:该模型交叉验证集和测试集的RC2和RP2分别为0.812 9、0.768 8,均方根误差RMSEC和RMSEP分别为0.476 2、0.524 9 g/L,性能偏差比(ratio of performance to deviation,RPD)为2.076 6,达到畜禽生产性能的测定要求。试验结果表明,可以利用MIRS建立模型预测中国荷斯坦牛牛奶中的β-乳球蛋白含量。
文摘目的基于机器学习算法构建中老年腹膜透析(peritoneal dialysis,PD)患者肌少症发生的预测模型,为肌少症的诊治测量提供参考依据。方法选取2020年5月至2023年10月期间于海军军医大学第一附属医院(上海长海医院)住院治疗的648例中老年PD患者作为研究对象,收集患者临床资料,根据是否发生肌少症分为肌少症组169例和无肌少症组479例。基于机器学习算法,分别采用极限梯度提升树(extreme gradient boosting,XGBoost)和Logistic回归、随机森林(random forest,RF)、支持向量机(support vector machine,SVM)方法构建不同PD患者发生肌少症风险模型,并对模型进行评价比较。结果共采集患者26项指标,单因素与Logistic回归筛选出9项肌少症的影响因素。测试集上验证后的XGBoost、Logistic、RF、SVM模型构建的预测中老年PD患者发生肌少症的曲线下面积(area under the curve,AUC)分别为0.807、0.788、0.804、0.791,准确度分别为0.829、0.813、0.855、0.819,F1分数为0.733、0.659、0.728、0.653。结论基于机器学习算法XGBoost预测模型在敏感性与准确度上优于RF、Logistic、SVM模型,有助于指导临床医务人员识别PD发生肌少症高风险患者,有利于临床尽早制定干预策略。