期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于随机森林算法的胰腺癌术后预测模型构建
被引量:
9
1
作者
李承圣
包绮晗
+3 位作者
郝晓燕
潘庆忠
王素珍
石福艳
《吉林大学学报(医学版)》
CAS
CSCD
北大核心
2022年第2期426-435,共10页
目的:通过随机森林算法构建胰腺癌患者术后5年生存情况预测模型,为胰腺癌患者术后预后评估提供指导。方法:利用美国国立癌症研究所监测、流行病学和结果数据库(SEER)收集符合本研究要求的42618条胰腺癌患者及其预后数据,经过数据筛选最...
目的:通过随机森林算法构建胰腺癌患者术后5年生存情况预测模型,为胰腺癌患者术后预后评估提供指导。方法:利用美国国立癌症研究所监测、流行病学和结果数据库(SEER)收集符合本研究要求的42618条胰腺癌患者及其预后数据,经过数据筛选最终纳入4020条患者信息。将研究对象随机分为训练集和测试集,采用χ2检验、多因素Logistic回归分析和随机森林变量重要性排名进行特征变量选择;利用合成少数样本过采样技术(SMOTE)将训练集调整为平衡数据集;基于平衡后数据集利用随机森林算法构建预测模型;利用测试集,基于G-mean指数、灵敏度、特异度和受试者工作特征(ROC)曲线下面积(AUC)4个评价指标,分别与Logistic回归分析、支持向量机、决策树和人工神经网络算法进行比较,对预测模型做出评价。结果:原始训练集中包含2814个样本,其中生存时间≥5年的患者有196例,占比约1/13,是不平衡数据集,经过SMOTE方法调整后获得平衡数据集,二分类样本数量基本达到平衡。最终纳入模型的变量有年龄、种族、肿瘤原发部位、肿瘤分化程度、是否放疗、T分期、N分期、婚姻状况、肿瘤大小和淋巴结阳性比率。基于随机森林算法构建的胰腺癌患者术后预测模型G-mean指数为0.830,AUC为0.833[P<0.05,95%置信区间(CI)(0.784,0.876)],优于Logistic回归分析、支持向量机、决策树和人工神经网络。结论:基于随机森林算法构建的胰腺癌术后预测模型对胰腺癌患者术后5年生存情况的预测性能优于其他常见机器学习方法,能够为临床医生改善胰腺癌患者的预后和生存状况提供依据。
展开更多
关键词
胰腺肿瘤
随机森林算法
预测模型
预后
模型比较
在线阅读
下载PDF
职称材料
题名
基于随机森林算法的胰腺癌术后预测模型构建
被引量:
9
1
作者
李承圣
包绮晗
郝晓燕
潘庆忠
王素珍
石福艳
机构
潍坊
医学院
公共卫生
学院
卫生统计学
教研室
潍坊医学院护理学院内外科教研室
潍坊
医学院
公共卫生
学院
数学
教研室
出处
《吉林大学学报(医学版)》
CAS
CSCD
北大核心
2022年第2期426-435,共10页
基金
国家自然科学基金面上项目(81872719)
国家自然科学基金青年科学基金项目(81803337)。
文摘
目的:通过随机森林算法构建胰腺癌患者术后5年生存情况预测模型,为胰腺癌患者术后预后评估提供指导。方法:利用美国国立癌症研究所监测、流行病学和结果数据库(SEER)收集符合本研究要求的42618条胰腺癌患者及其预后数据,经过数据筛选最终纳入4020条患者信息。将研究对象随机分为训练集和测试集,采用χ2检验、多因素Logistic回归分析和随机森林变量重要性排名进行特征变量选择;利用合成少数样本过采样技术(SMOTE)将训练集调整为平衡数据集;基于平衡后数据集利用随机森林算法构建预测模型;利用测试集,基于G-mean指数、灵敏度、特异度和受试者工作特征(ROC)曲线下面积(AUC)4个评价指标,分别与Logistic回归分析、支持向量机、决策树和人工神经网络算法进行比较,对预测模型做出评价。结果:原始训练集中包含2814个样本,其中生存时间≥5年的患者有196例,占比约1/13,是不平衡数据集,经过SMOTE方法调整后获得平衡数据集,二分类样本数量基本达到平衡。最终纳入模型的变量有年龄、种族、肿瘤原发部位、肿瘤分化程度、是否放疗、T分期、N分期、婚姻状况、肿瘤大小和淋巴结阳性比率。基于随机森林算法构建的胰腺癌患者术后预测模型G-mean指数为0.830,AUC为0.833[P<0.05,95%置信区间(CI)(0.784,0.876)],优于Logistic回归分析、支持向量机、决策树和人工神经网络。结论:基于随机森林算法构建的胰腺癌术后预测模型对胰腺癌患者术后5年生存情况的预测性能优于其他常见机器学习方法,能够为临床医生改善胰腺癌患者的预后和生存状况提供依据。
关键词
胰腺肿瘤
随机森林算法
预测模型
预后
模型比较
Keywords
Pancreatic neoplasms
Random forest algorithm
Prediction model
Prognosis
Model comparison
分类号
R735.9 [医药卫生—肿瘤]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于随机森林算法的胰腺癌术后预测模型构建
李承圣
包绮晗
郝晓燕
潘庆忠
王素珍
石福艳
《吉林大学学报(医学版)》
CAS
CSCD
北大核心
2022
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部