期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
随机森林算法对体检人群糖尿病患病风险的预测价值研究
被引量:
40
1
作者
张占林
孙勇
+7 位作者
妥小青
叶勒丹.马汉
龚政
田恬
陈珍
古丽斯亚.海力力
戴江红
姚华
《中国全科医学》
CAS
北大核心
2019年第9期1021-1026,共6页
背景2017年我国是全世界糖尿病患者人数最多的国家,糖尿病患者人数达到了1.14亿,及早识别糖尿病高危人群并对其进行有效干预,能够降低糖尿病的患病风险。目的探讨随机森林算法在体检人群糖尿病患病风险预测中的应用价值。方法 2016年9月...
背景2017年我国是全世界糖尿病患者人数最多的国家,糖尿病患者人数达到了1.14亿,及早识别糖尿病高危人群并对其进行有效干预,能够降低糖尿病的患病风险。目的探讨随机森林算法在体检人群糖尿病患病风险预测中的应用价值。方法 2016年9月—2017年3月,利用乌鲁木齐市石油新村街道和卡子湾街道社区卫生服务中心35~74岁全民健康体检的数据进行研究,考虑到数据的完整性最终纳入6 727例体检者数据(包含调查问卷、体格测量和实验室检测3部分内容),其中调查问卷内容包括一般人口学资料,体格测量指标包括身高、体质量、腰围等,实验室检测指标包括血液、血糖、血生化等。将数据集按3∶1分为训练集和测试集,在训练集中分别应用多因素Logistic回归和随机森林算法建立糖尿病风险预测模型,用测试集进行模型验证,通过预测一致率和受试者工作特征曲线下面积(AUC)评价模型的预测效能。结果在本次体检的6 727例体检者中,既往糖尿病患者和新检测出糖尿病患者717例,糖尿病患病率为10.7%。糖尿病患者中65岁及以上者占37.1%(266/717),女性占51.0%(366/717),汉族占94.0%(674/717),初中学历者占35.3%(253/717),超重者占48.0%(344/717),从不吸烟者占72.8%(522/717),从不饮酒者占77.0%(552/717)。采用多因素Logistic回归分析在训练集建立糖尿病风险预测模型对测试集进行预测,其灵敏度为0.202,特异度为0.950,预测一致率为0.696,约登指数为0.151,AUC为0.685;采用随机森林算法在训练集建立糖尿病风险预测模型对测试集进行预测,其灵敏度为0.608,特异度为0.953,预测一致率为0.864,约登指数为0.561,AUC为0.702。结论随机森林算法对体检人群的糖尿病患病风险具有较高的预测效能,但是多因素Logistic回归分析对糖尿病影响因素有直观的解释。建议在实际应用中结合两个模型的优点,使其在疾病风险预测中发挥最大的价值。
展开更多
关键词
糖尿病
患病率
随机森林
预测
在线阅读
下载PDF
职称材料
题名
随机森林算法对体检人群糖尿病患病风险的预测价值研究
被引量:
40
1
作者
张占林
孙勇
妥小青
叶勒丹.马汉
龚政
田恬
陈珍
古丽斯亚.海力力
戴江红
姚华
机构
新疆医科大学公共卫生学院
新疆医科大学第一附属医院健康管理中心
新疆医科大学第一附属医院
出处
《中国全科医学》
CAS
北大核心
2019年第9期1021-1026,共6页
基金
新疆维吾尔自治区自然科学基金资助项目(2017D01C425)
文摘
背景2017年我国是全世界糖尿病患者人数最多的国家,糖尿病患者人数达到了1.14亿,及早识别糖尿病高危人群并对其进行有效干预,能够降低糖尿病的患病风险。目的探讨随机森林算法在体检人群糖尿病患病风险预测中的应用价值。方法 2016年9月—2017年3月,利用乌鲁木齐市石油新村街道和卡子湾街道社区卫生服务中心35~74岁全民健康体检的数据进行研究,考虑到数据的完整性最终纳入6 727例体检者数据(包含调查问卷、体格测量和实验室检测3部分内容),其中调查问卷内容包括一般人口学资料,体格测量指标包括身高、体质量、腰围等,实验室检测指标包括血液、血糖、血生化等。将数据集按3∶1分为训练集和测试集,在训练集中分别应用多因素Logistic回归和随机森林算法建立糖尿病风险预测模型,用测试集进行模型验证,通过预测一致率和受试者工作特征曲线下面积(AUC)评价模型的预测效能。结果在本次体检的6 727例体检者中,既往糖尿病患者和新检测出糖尿病患者717例,糖尿病患病率为10.7%。糖尿病患者中65岁及以上者占37.1%(266/717),女性占51.0%(366/717),汉族占94.0%(674/717),初中学历者占35.3%(253/717),超重者占48.0%(344/717),从不吸烟者占72.8%(522/717),从不饮酒者占77.0%(552/717)。采用多因素Logistic回归分析在训练集建立糖尿病风险预测模型对测试集进行预测,其灵敏度为0.202,特异度为0.950,预测一致率为0.696,约登指数为0.151,AUC为0.685;采用随机森林算法在训练集建立糖尿病风险预测模型对测试集进行预测,其灵敏度为0.608,特异度为0.953,预测一致率为0.864,约登指数为0.561,AUC为0.702。结论随机森林算法对体检人群的糖尿病患病风险具有较高的预测效能,但是多因素Logistic回归分析对糖尿病影响因素有直观的解释。建议在实际应用中结合两个模型的优点,使其在疾病风险预测中发挥最大的价值。
关键词
糖尿病
患病率
随机森林
预测
Keywords
Diabetes mellitus
Prevalence
Random forest
Forecasting
分类号
R587.1 [医药卫生—内分泌]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
随机森林算法对体检人群糖尿病患病风险的预测价值研究
张占林
孙勇
妥小青
叶勒丹.马汉
龚政
田恬
陈珍
古丽斯亚.海力力
戴江红
姚华
《中国全科医学》
CAS
北大核心
2019
40
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部