为解决传统初始地应力场反演方法存在边界条件筛选能力弱、易受数据过拟合干扰以及难以解析多重边界相互作用的问题,提出一种基于LASSO-OLS(least absolute shrinkage and selection operator-ordinary least squares)的两阶段初始地应...为解决传统初始地应力场反演方法存在边界条件筛选能力弱、易受数据过拟合干扰以及难以解析多重边界相互作用的问题,提出一种基于LASSO-OLS(least absolute shrinkage and selection operator-ordinary least squares)的两阶段初始地应力场反演方法。该方法首先通过对候选边界条件应力矩阵和实测应力矩阵进行Frobenius范数标准化处理,消除不同边界条件数据量级差异的影响;然后,利用LASSO回归的L1正则化约束,从候选边界条件的回归系数路径图中筛选关键影响因素,剔除冗余与弱相关项;最后,针对筛选出的核心变量,采用普通最小二乘回归进行无偏估计,构建兼具稀疏性与准确性的地应力场反演模型。研究结果表明:1)在工程应用实例中,借助LASSO回归从11个候选边界条件中筛选出5个关键因素,显著降低模型复杂度;2)模型正则化参数在标准误差内取值,拟合结果能够保持较高的复相关系数(R=0.995 2),表明筛选后的边界条件有效捕捉了初始地应力场特征;3)初始地应力场反演模型通过LASSO回归筛选,在解析多重边界相互作用时表现出较高的稳定性和物理合理性;4)与传统方法相比,该方法能有效避免初始地应力场反演出现过拟合问题,提高反演结果的鲁棒性。展开更多
目的分析宁夏回族自治区儿童青少年近视流行现状、影响因素及不同学段间的差异。方法采用分层整群随机抽样的方法,于2019年9月至12月,在宁夏回族自治区银川市、吴忠市、石嘴山市、固原市和中卫市,随机抽取8所小学、6所初中、6所高中、4...目的分析宁夏回族自治区儿童青少年近视流行现状、影响因素及不同学段间的差异。方法采用分层整群随机抽样的方法,于2019年9月至12月,在宁夏回族自治区银川市、吴忠市、石嘴山市、固原市和中卫市,随机抽取8所小学、6所初中、6所高中、4所大学的学生为研究对象,小学每个年级抽取5个班级,初中至大学每个年级抽取4个班级,以抽取班级的全体学生作为研究对象,共抽取学生14211人,对其进行问卷调查、体格检查和视力测量。不同学段儿童近视的影响因素采用最小绝对收缩和选择算子(LASSO)联合Logistic回归进行分析,选择贝叶斯信息准则(Bayesian information criterion,BIC)最小的模型为最优模型。结果宁夏回族自治区儿童青少年近视检出率为70.3%,女生高于男生,城市高于乡镇,差异均有统计学意义(均为P<0.001);按学段分层后,随着年级的增加,近视检出率随之升高,小学最低,大学最高,不同学段近视检出率差异有统计学意义(P<0.001)。近视影响因素的LASSO-Logistic回归分析表明,城乡、性别、年龄、目前是否配戴眼镜、每日课间操节数、是否积极参加体力活动和过去6个月是否保持规律活动是小学生近视的影响因素(均为P<0.05);性别、目前是否配戴眼镜是初中生和高中生近视的影响因素(均为P<0.05);目前是否配戴眼镜是大学生近视的影响因素(P<0.05)。结论宁夏回族自治区儿童青少年近视检出率高,不同学段儿童青少年近视影响因素差异明显。配戴眼镜是控制近视的保护因素。应根据儿童青少年所处学段开展有针对性的视力相关知识的健康教育,增强其健康保健意识,提高儿童青少年视力。展开更多
This study is intended to explore the chemical differences of Acori Tatarinowii Rhizoma (ATR) samples collected from two habitats, Sichuan and Anhui provinces, China. Gas chromatography-mass spectrometry (GC-MS) w...This study is intended to explore the chemical differences of Acori Tatarinowii Rhizoma (ATR) samples collected from two habitats, Sichuan and Anhui provinces, China. Gas chromatography-mass spectrometry (GC-MS) was applied to establishing the quantitative chemical fingerprints of ATRs. A total of 104 volatile compounds were identified and quantified with the information of mass spectra and retention index (RI). Furthermore, least absolute shrinkage and selection operator (LASSO), a sparse regularization method, combined with subsampling was employed to improve the classification ability of partial least squares-discriminant analysis (PLS-DA). After variable selection by LASSO, three chemical markers,β-elemene, α-selinene and α-asarone, were identified for the discrimination of ATRs from two habitats, and the total classification correct rate was increased from 82.76% to 96.55%. The proposed LASSO-PLS-DA method can serve as an efficient strategy for screening marked chemical components and geo-herbalism research of traditional Chinese medicines.展开更多
【目的】基于代谢组学构建食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)早期风险预警模型,精准识别高风险人群。【方法】纳入84例低级别上皮内瘤变患者,采集基线期血清,根据随访期间是否进展为高级别上皮内瘤变或ESCC分为...【目的】基于代谢组学构建食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)早期风险预警模型,精准识别高风险人群。【方法】纳入84例低级别上皮内瘤变患者,采集基线期血清,根据随访期间是否进展为高级别上皮内瘤变或ESCC分为进展组(N=28)和无进展组(N=56)。采用反相液相色谱和亲水相互作用液相色谱联合高分辨质谱开展非靶向代谢组学分析。结合单变量与多变量分析评估组间代谢特征差异,对差异代谢物进行通路富集分析。将样本按7∶3比例分为训练集与测试集,在训练集中采用单变量逻辑回归联合最小绝对收缩与选择算子回归筛选与病程进展相关的关键代谢物,基于回归系数构建风险预警模型。通过受试者工作特征曲线和曲线下面积(area under the curve,AUC)评估模型性能。【结果】共鉴定10类1431种代谢物,差异代谢物在类固醇激素生物合成、初级胆汁酸合成及亚油酸代谢通路显著富集。最终筛选出18个与病程进展密切相关的关键代谢物,包括甘油-3-磷脂胆碱、棕榈酸、黄尿酸及N-脒基天冬氨酸等。风险预警模型在测试集中表现出良好的预测能力(AUC=0.812)。【结论】基于前瞻性随访队列,识别出多个关键代谢物及代谢通路,构建ESCC早期进展风险的代谢物预警模型。模型具有良好的预测鲁棒性和泛化能力,可为ESCC高风险人群的早期风险评估与干预策略优化提供理论支持。展开更多
文摘为解决传统初始地应力场反演方法存在边界条件筛选能力弱、易受数据过拟合干扰以及难以解析多重边界相互作用的问题,提出一种基于LASSO-OLS(least absolute shrinkage and selection operator-ordinary least squares)的两阶段初始地应力场反演方法。该方法首先通过对候选边界条件应力矩阵和实测应力矩阵进行Frobenius范数标准化处理,消除不同边界条件数据量级差异的影响;然后,利用LASSO回归的L1正则化约束,从候选边界条件的回归系数路径图中筛选关键影响因素,剔除冗余与弱相关项;最后,针对筛选出的核心变量,采用普通最小二乘回归进行无偏估计,构建兼具稀疏性与准确性的地应力场反演模型。研究结果表明:1)在工程应用实例中,借助LASSO回归从11个候选边界条件中筛选出5个关键因素,显著降低模型复杂度;2)模型正则化参数在标准误差内取值,拟合结果能够保持较高的复相关系数(R=0.995 2),表明筛选后的边界条件有效捕捉了初始地应力场特征;3)初始地应力场反演模型通过LASSO回归筛选,在解析多重边界相互作用时表现出较高的稳定性和物理合理性;4)与传统方法相比,该方法能有效避免初始地应力场反演出现过拟合问题,提高反演结果的鲁棒性。
文摘目的分析宁夏回族自治区儿童青少年近视流行现状、影响因素及不同学段间的差异。方法采用分层整群随机抽样的方法,于2019年9月至12月,在宁夏回族自治区银川市、吴忠市、石嘴山市、固原市和中卫市,随机抽取8所小学、6所初中、6所高中、4所大学的学生为研究对象,小学每个年级抽取5个班级,初中至大学每个年级抽取4个班级,以抽取班级的全体学生作为研究对象,共抽取学生14211人,对其进行问卷调查、体格检查和视力测量。不同学段儿童近视的影响因素采用最小绝对收缩和选择算子(LASSO)联合Logistic回归进行分析,选择贝叶斯信息准则(Bayesian information criterion,BIC)最小的模型为最优模型。结果宁夏回族自治区儿童青少年近视检出率为70.3%,女生高于男生,城市高于乡镇,差异均有统计学意义(均为P<0.001);按学段分层后,随着年级的增加,近视检出率随之升高,小学最低,大学最高,不同学段近视检出率差异有统计学意义(P<0.001)。近视影响因素的LASSO-Logistic回归分析表明,城乡、性别、年龄、目前是否配戴眼镜、每日课间操节数、是否积极参加体力活动和过去6个月是否保持规律活动是小学生近视的影响因素(均为P<0.05);性别、目前是否配戴眼镜是初中生和高中生近视的影响因素(均为P<0.05);目前是否配戴眼镜是大学生近视的影响因素(P<0.05)。结论宁夏回族自治区儿童青少年近视检出率高,不同学段儿童青少年近视影响因素差异明显。配戴眼镜是控制近视的保护因素。应根据儿童青少年所处学段开展有针对性的视力相关知识的健康教育,增强其健康保健意识,提高儿童青少年视力。
基金Project(21465016)supported by the National Natural Foundation of China
文摘This study is intended to explore the chemical differences of Acori Tatarinowii Rhizoma (ATR) samples collected from two habitats, Sichuan and Anhui provinces, China. Gas chromatography-mass spectrometry (GC-MS) was applied to establishing the quantitative chemical fingerprints of ATRs. A total of 104 volatile compounds were identified and quantified with the information of mass spectra and retention index (RI). Furthermore, least absolute shrinkage and selection operator (LASSO), a sparse regularization method, combined with subsampling was employed to improve the classification ability of partial least squares-discriminant analysis (PLS-DA). After variable selection by LASSO, three chemical markers,β-elemene, α-selinene and α-asarone, were identified for the discrimination of ATRs from two habitats, and the total classification correct rate was increased from 82.76% to 96.55%. The proposed LASSO-PLS-DA method can serve as an efficient strategy for screening marked chemical components and geo-herbalism research of traditional Chinese medicines.
文摘【目的】基于代谢组学构建食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)早期风险预警模型,精准识别高风险人群。【方法】纳入84例低级别上皮内瘤变患者,采集基线期血清,根据随访期间是否进展为高级别上皮内瘤变或ESCC分为进展组(N=28)和无进展组(N=56)。采用反相液相色谱和亲水相互作用液相色谱联合高分辨质谱开展非靶向代谢组学分析。结合单变量与多变量分析评估组间代谢特征差异,对差异代谢物进行通路富集分析。将样本按7∶3比例分为训练集与测试集,在训练集中采用单变量逻辑回归联合最小绝对收缩与选择算子回归筛选与病程进展相关的关键代谢物,基于回归系数构建风险预警模型。通过受试者工作特征曲线和曲线下面积(area under the curve,AUC)评估模型性能。【结果】共鉴定10类1431种代谢物,差异代谢物在类固醇激素生物合成、初级胆汁酸合成及亚油酸代谢通路显著富集。最终筛选出18个与病程进展密切相关的关键代谢物,包括甘油-3-磷脂胆碱、棕榈酸、黄尿酸及N-脒基天冬氨酸等。风险预警模型在测试集中表现出良好的预测能力(AUC=0.812)。【结论】基于前瞻性随访队列,识别出多个关键代谢物及代谢通路,构建ESCC早期进展风险的代谢物预警模型。模型具有良好的预测鲁棒性和泛化能力,可为ESCC高风险人群的早期风险评估与干预策略优化提供理论支持。