期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
基于CART决策树的分布式数据离群点检测算法 被引量:1
1
作者 朱华 乔勇进 董国钢 《现代电子技术》 北大核心 2024年第16期157-162,共6页
在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环... 在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环境下高效地发现离群点。因此,提出一种基于CART决策树的分布式数据离群点检测算法。在构建CART决策树时,使用类间中心距离作为分裂准则,根据分离类别对训练数据进行分类,从而确定数据的类型。在上述基础上,考虑到离群点的分布模式与其周围数据对象不同,使用空间局部偏离因子(SLDF)对空间内各个数据对象之间的离群程度展开度量,同时在高维空间内展开网格划分,引入SLDF算法检测剩余离群点集,最终实现分布式数据离群点检测。实验结果表明,所提方法的离散点检测错误率在0.010以内,可以更加精准地实现分布式数据离群点检测,具有良好的检测性能。 展开更多
关键词 cart决策树 分布式数据 离群点检测 类间距离 数据分类 空间局部偏离因子
在线阅读 下载PDF
基于CART决策树的110 kV供电区域分布式光伏承载能力测算模型 被引量:1
2
作者 代守乐 李萍 《分布式能源》 2024年第3期82-88,共7页
分布式光伏受天气影响较大,测算110kV供电区域的分布式光伏承载能力,对区域供电来说意义重大。基于此,提出基于分类与回归树(calssification and regression tree,CART)的110kV供电区域分布式光伏承载能力测算模型。该模型以分布式电源... 分布式光伏受天气影响较大,测算110kV供电区域的分布式光伏承载能力,对区域供电来说意义重大。基于此,提出基于分类与回归树(calssification and regression tree,CART)的110kV供电区域分布式光伏承载能力测算模型。该模型以分布式电源输出功率、区域分布式电源发电量占比、局部分布式电源线损增量等数据为基础,利用CART决策树建立110kV供电区域分布式光伏承载能力测算模型,并使用改进鲸鱼优化算法求解测算结果。经实验测试发现,该模型对分布式光伏承载能力的测算精准度较高,可有效测算不同实验区域在不同季节时的分布式光伏承载能力,具有较高的应用价值。 展开更多
关键词 分类与回归树(cart) 110kV供电区域 分布式光伏 承载能力
在线阅读 下载PDF
基于CART回归树模型的变电站施工安全事故分析与预测 被引量:1
3
作者 田浩 卢博 +3 位作者 杨彦东 卜剑冲 邓建新 李东昌 《湘潭大学学报(自然科学版)》 CAS 2024年第1期101-108,共8页
在当前的变电站施工过程中,主要通过数据包络分析过程预测安全事故,忽略了表征信息中的不确定性,导致预测结果的选取受试者工作特征曲线下面积(AUC)值较低.针对这一问题,本研究应用分类回归树(CART)模型,设计了一种新的变电站施工安全... 在当前的变电站施工过程中,主要通过数据包络分析过程预测安全事故,忽略了表征信息中的不确定性,导致预测结果的选取受试者工作特征曲线下面积(AUC)值较低.针对这一问题,本研究应用分类回归树(CART)模型,设计了一种新的变电站施工安全事故分析与预测方法.首先,利用固定型、移动型采集技术相结合的方式,采集变电站施工现场数据,并通过主成分分析算法进行筛选处理.然后,深入分析变电站施工安全事故发生过程,通过基于概率分布的可分性判据,提取施工安全事故前兆特征.最后,利用CART模型构建施工安全事故根节点,再使用支持向量机(SVM)回归算法建立叶节点,形成可用于施工安全事故预测的最优决策树.通过迭代训练多个串联的CART模型实现梯度提升,应用该模型即可得到准确的事故预测结果.实验结果表明:该预测方法灵敏度更高,能够预测出更多的安全事故,并且该预测方法的AUC值高达0.91,具有更高的预测精度. 展开更多
关键词 分类回归树 变电站施工 安全事故 预测 特征分类 支持向量机
在线阅读 下载PDF
高光谱图像植被类型的CART决策树分类 被引量:18
4
作者 董连英 邢立新 +3 位作者 潘军 王静 李丽丽 焦健楠 《吉林大学学报(信息科学版)》 CAS 2013年第1期83-89,共7页
为提高植被分类的精度,在利用高光谱图像提取植被信息时需要考虑训练样本和地形等其他因素的影响。以长白山为研究背景,基于CART(Classification And Regression Tree)算法构建决策树模型,对高光谱图像进行植被分类。由于混合像元的影响... 为提高植被分类的精度,在利用高光谱图像提取植被信息时需要考虑训练样本和地形等其他因素的影响。以长白山为研究背景,基于CART(Classification And Regression Tree)算法构建决策树模型,对高光谱图像进行植被分类。由于混合像元的影响,以采用PPI(Pixel Purity Index)提取的纯净像元作为训练样本,提取植被指数、纹理和地形等分类特征变量。基于这些变量构建CART决策树对植被分类,并将结果与最大似然法分类结果进行比较。结果表明,CART决策树分类法可实现光谱、纹理和地形特征的有效组合,有较好的分类效果。 展开更多
关键词 高光谱 植被分类 端元提取 cart决策树
在线阅读 下载PDF
基于分类回归树(CART)的点焊质量在线监测 被引量:4
5
作者 张宏杰 张鹏贤 陈剑虹 《兰州理工大学学报》 CAS 北大核心 2005年第4期10-14,共5页
电阻点焊过程动态信号蕴含着大量直接或间接反映焊点质量的动态信息.通过对焊接过程电极位移、动态电阻信号的同步采集和分析,从两种信号中提取了12个特征参量建立表征点焊过程的数据集,以焊点接头抗剪强度作为焊点质量评价的指标,利用... 电阻点焊过程动态信号蕴含着大量直接或间接反映焊点质量的动态信息.通过对焊接过程电极位移、动态电阻信号的同步采集和分析,从两种信号中提取了12个特征参量建立表征点焊过程的数据集,以焊点接头抗剪强度作为焊点质量评价的指标,利用分类回归树(CART)数据挖掘方法,将焊接过程监测参量与焊点强度之间复杂的映射模型以十分直观的二叉树形式给出,用一系列监测特征参量的逻辑表达式构成接头强度分类、预测规则,使得接头强度分类和预测过程易于表达、准确率高、分类预测速度快,进而实现对未知样本焊点强度的分类及预测.CART测试结果表明,分类回归树可以较为满意地完成焊点接头强度的分类、预测任务. 展开更多
关键词 分类回归树 点焊 焊接质量 在线监测
在线阅读 下载PDF
基于CART决策树方法的遥感影像分类 被引量:53
6
作者 齐乐 岳彩荣 《林业调查规划》 2011年第2期62-66,共5页
以云南省香格里拉县为研究区域,构建一种基于CART遥感影像的决策树分类方法.对遥感影像采用主成分提取、植被信息提取、纹理信息提取等方法,并结合试验区主要地物类型训练样本,采用Landsat 5 TM影像数据、DEM数据以及遥感处理软件ENVI... 以云南省香格里拉县为研究区域,构建一种基于CART遥感影像的决策树分类方法.对遥感影像采用主成分提取、植被信息提取、纹理信息提取等方法,并结合试验区主要地物类型训练样本,采用Landsat 5 TM影像数据、DEM数据以及遥感处理软件ENVI为平台进行影像分类,并将结果与最大似然分类结果作比较.结果表明,基于CART遥感影像决策树分类精度优于最大似然分类,有较好的分类效果. 展开更多
关键词 cart 决策树分类 遥感影像 植被指数 纹理特征
在线阅读 下载PDF
基于遥感影像不同亮度的CART方法估算不透水率研究 被引量:2
7
作者 李倩 李彩丽 +2 位作者 芮菡艺 郑大鹏 都金康 《水电能源科学》 北大核心 2010年第12期45-48,共4页
以QuickBird影像为辅助数据,基于中巴资源卫星影像研究了不透水率估算方法,改进了传统的基于CART的估算方法,并将中巴资源卫星影像不透水面像元分类,对不同亮度分别使用CART方法估算不透水率。试验结果表明,该方法构建的模型简单合理,... 以QuickBird影像为辅助数据,基于中巴资源卫星影像研究了不透水率估算方法,改进了传统的基于CART的估算方法,并将中巴资源卫星影像不透水面像元分类,对不同亮度分别使用CART方法估算不透水率。试验结果表明,该方法构建的模型简单合理,运算效率高、精度高,可供借鉴。 展开更多
关键词 遥感影像 不同亮度 分类与回归树 估算 不透水率
在线阅读 下载PDF
基于CART算法的多联机压缩机回液故障检测 被引量:10
8
作者 王江宇 陈焕新 +4 位作者 李冠男 刘江岩 胡云鹏 郭梦茹 胡文举 《制冷与空调》 2017年第4期55-60,共6页
近年来,多联机在各类建筑上得到广泛应用。一旦压缩机发生回液故障,将会导致多联机偏离正常工况,能效降低,同时无法保障室内环境的舒适性。长久的回液故障还会导致压缩机部件的机械故障,造成高额的维修费用。因此,本文提出决策树模型检... 近年来,多联机在各类建筑上得到广泛应用。一旦压缩机发生回液故障,将会导致多联机偏离正常工况,能效降低,同时无法保障室内环境的舒适性。长久的回液故障还会导致压缩机部件的机械故障,造成高额的维修费用。因此,本文提出决策树模型检测多联机压缩机回液故障。首先,通过数据集成和剔除缺失值得到齐整数据;其次,通过专家知识和线性相关分析分别选取变量和剔除冗余变量;最后,建立决策树模型检测回液故障。结果表明,决策树模型能够有效地检测出回液故障,而且与专业知识吻合得较好。 展开更多
关键词 多联机 压缩机回液 决策树 故障检测与诊断
在线阅读 下载PDF
基于XGBoost和QRLSTM的新能源出力高精度预测方法
9
作者 汪涛 申少辉 +1 位作者 袁晓鹏 关英宇 《信息技术》 2025年第1期186-190,196,共6页
在开展新能源出力预测阶段,由于新能源自身具有波动性和间歇性,导致预测结果的可靠性难以得到保障。为此,提出基于XGBoost和QRLSTM的新能源出力高精度预测方法。采用极限梯度提升算法(EXtreme Gradient Boosting,XGBoost)建立新能源出... 在开展新能源出力预测阶段,由于新能源自身具有波动性和间歇性,导致预测结果的可靠性难以得到保障。为此,提出基于XGBoost和QRLSTM的新能源出力高精度预测方法。采用极限梯度提升算法(EXtreme Gradient Boosting,XGBoost)建立新能源出力数据的目标函数,利用二阶泰勒展开式对目标函数进行近似处理。结合分位数回归构(Quantile Regression,QR)改进长短期记忆(Long Short Term Memory,LSTM)递归神经网络,构建QRLSTM模型将近似处理后的数据输入至该模型中,通过逻辑门完成新能源出力预测。在测试结果中,实际方法在不同环境条件下对于新能源机组出力情况的预测结果均与实际情况保持较高的拟合度,具有较高的精准度。 展开更多
关键词 cart回归树 XGBoost算法 二阶泰勒 分位数回归构 QRLSTM模型
在线阅读 下载PDF
基于影像特征CART决策树的稀土矿区信息提取与动态监测 被引量:6
10
作者 朱青 林建平 +1 位作者 国佳欣 郭熙 《金属矿山》 CAS 北大核心 2019年第5期161-169,共9页
为准确反映赣南稀土矿区开采状况,以江西省寻乌县为研究区,选用Landsat-8多光谱影像为数据源,通过对均值纹理、裸土指数(Bare Soil Index,BSI)、归一化植被指数(Normalized Difference Vegetation Index,NDVI)3种特征信息进行提取,采用... 为准确反映赣南稀土矿区开采状况,以江西省寻乌县为研究区,选用Landsat-8多光谱影像为数据源,通过对均值纹理、裸土指数(Bare Soil Index,BSI)、归一化植被指数(Normalized Difference Vegetation Index,NDVI)3种特征信息进行提取,采用基于CART(Classification and Regression Trees)决策树的分类方法对研究区稀土矿开采信息进行识别,分类总体精度达到89.43%,其中矿区分类精度达到88%,分类精度相对于基于光谱信息的CART决策树分类和最大似然分类有明显提高。通过对研究区2013—2016年稀土矿开采区域进行遥感动态监测,发现增加的开采区域主要分布于矿权范围内,减少的开采区域在矿权界限内外均有大量分布,减少幅度达41%,说明政府和相关矿权部门对于稀土行业健康有序发展发挥了重要作用。研究表明:基于影像特征CART决策树的分类方法在稀土矿区信息提取与动态监测方面具有一定的可行性。 展开更多
关键词 稀土矿区 遥感监测 cart决策树 纹理特征 裸土指数 遥感影像分类
在线阅读 下载PDF
基于SDAE与CART联合智能算法的通信网络用户满意度分析方法 被引量:1
11
作者 李露 于忠义 李福昌 《信息通信技术》 2020年第2期12-18,共7页
论文提出一种基于栈式降噪自编码器(Stacked Denoising Autoencoder,SDAE)与分类和回归决策树(Classification and Regression Tree,CART)的移动互联网满意度预测方法,此模型能挖掘出用户的满意度与用户的特征和网络特征的关联规则,通... 论文提出一种基于栈式降噪自编码器(Stacked Denoising Autoencoder,SDAE)与分类和回归决策树(Classification and Regression Tree,CART)的移动互联网满意度预测方法,此模型能挖掘出用户的满意度与用户的特征和网络特征的关联规则,通过这种规则能更精准及时地预测到用户满意度的变化,以便运营商针对这种变化提前作出决策。论文所提方法能够挖掘特征间的深层关系,通过SDAE编码样本可以获得影响用户体验的隐含特征,及时发现用户对于网络贬损的真正痛点,为运营商网络建设和运行维护部门制定提升用户的网络感知策略提供依据,从而提升用户体验。 展开更多
关键词 栈式降噪自编码器 分类和回归决策树 人工智能 移动互联网 满意度
在线阅读 下载PDF
基于CART决策树的HEVC帧间CU快速划分算法 被引量:6
12
作者 唐浩漾 王婧 +1 位作者 孙梓巍 段一伟 《西安邮电大学学报》 2019年第1期68-72,共5页
针对高效视频编码(High Efficiency Video Coding,HEVC)帧间编码过程中编码单元(Coding Unit,CU)划分复杂度过高的问题,提出一种基于CART决策树的CU快速划分算法。该算法包括CART决策树建模和CU快速编码算法两部分。首先,将CU划分问题... 针对高效视频编码(High Efficiency Video Coding,HEVC)帧间编码过程中编码单元(Coding Unit,CU)划分复杂度过高的问题,提出一种基于CART决策树的CU快速划分算法。该算法包括CART决策树建模和CU快速编码算法两部分。首先,将CU划分问题归为二分类问题,以当前CU的空间相邻CU的深度划分信息作为最优特征属性,建立CART模型且进行测试评估;然后利用建立的CART模型对当前CU进行快速划分。实验结果表明,在保持编码性能的同时,该算法比HM16.0算法节省43.34%的编码时间,有效地提高了编码效率。 展开更多
关键词 高效视频编码 编码单元划分 分类回归树
在线阅读 下载PDF
基于随机森林模型的城市非法营运车辆识别
13
作者 黄子璇 李桥兴 《电子科技》 2024年第1期66-71,共6页
区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC... 区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC数据的有效字段,采用随机森林算法建立非法营运车辆识别分类器,加入CART(Classification and Regression Tree)分类树模型分类器和二元逻辑回归模型分类器与之对比,并以西南某市高速公路自2022年2月6日~2022年3月8日的ETC指标数据进行实证分析。结果表明,随机森林模型分类器比CART分类树模型分类器和二元逻辑回归模型分类器预测效果更好,其准确性高达98.75%。 展开更多
关键词 非法营运车辆 随机森林模型 cart分类树模型 二元逻辑回归模型 分类算法 机器学习 深度学习 识别算法
在线阅读 下载PDF
基于随机森林模型的烟草销量影响因素分析
14
作者 何雪峰 何厚华 +3 位作者 杨蕾 余耀 蒋梦菲 张涛 《信息技术》 2024年第11期147-153,共7页
烟草行业对市场有较为重要的影响,其销量的影响因素较多,同时烟草销售特征分析相关的研究较少。针对烟草销售的特征对销量的影响,该研究用随机森林模型进行分析,得到18个销售特征对销量是否增长的特征重要性分析。分析发现,在影响销量... 烟草行业对市场有较为重要的影响,其销量的影响因素较多,同时烟草销售特征分析相关的研究较少。针对烟草销售的特征对销量的影响,该研究用随机森林模型进行分析,得到18个销售特征对销量是否增长的特征重要性分析。分析发现,在影响销量是否增长中:香烟的调拨价及其统一批发价、零售指导价格对销量具有较大重要性,分别为16.5%、15.6%、15.5%;而是否中支、雪茄、粗支烟的重要性很低接近0%。在销量最高的部分香烟中,调拨价主要集中在60元~130元。该研究结论有助于指导香烟在适宜的调拨价格区间(60~130)的香烟增加生产或投放而提高销量。 展开更多
关键词 烟草销量 特征分析 调拨价 随机森林 分类与回归树
在线阅读 下载PDF
基于聚类和分类与回归树的地力等级评价研究 被引量:5
15
作者 闫一凡 刘建立 +2 位作者 李晓鹏 张佳宝 赵炳梓 《土壤》 CAS CSCD 北大核心 2014年第4期656-661,共6页
以黄淮海平原粮食主产区河南封丘县为研究区域,利用基于GIS的土壤空间和属性数据库,采用聚类分析和分类与回归树(CART)相结合的方法建立了耕地地力评价模型。研究结果表明,基于聚类分析和CART的地力评价模型准确度为93.56%,较单独使用... 以黄淮海平原粮食主产区河南封丘县为研究区域,利用基于GIS的土壤空间和属性数据库,采用聚类分析和分类与回归树(CART)相结合的方法建立了耕地地力评价模型。研究结果表明,基于聚类分析和CART的地力评价模型准确度为93.56%,较单独使用决策树模型的准确度有明显提高;根据耕地地力分级规则,一等地至五等地分别占全县61 733.3 hm2耕地的28.167%、49.518%、9.389%、5.77%和7.156%;地力等级较高的耕地主要分布于封丘西北部,地力较低的区域主要在东南部,由西北向东南地力呈带状递减趋势。本文的研究结果可为当地中低产田及其障碍因子的解析和农田精准管理提供参考依据。 展开更多
关键词 耕地地力 评价 分类与回归树(cart) 聚类分析 模型
在线阅读 下载PDF
荒漠草原土壤粗质化和养分减少伴随多年生群落转变为一年生群落 被引量:6
16
作者 王磊 宋乃平 +2 位作者 陈林 杨新国 王兴 《草业学报》 CSCD 北大核心 2020年第11期183-189,共7页
为明晰荒漠草原植物群落物种空间分布对土壤环境因子的响应,2018年在宁夏盐池县荒漠草原区域,沿灰钙土内部、边缘和外部生境,基于样线法开展植被和土壤调查及采样,采用多元回归树和冗余分析相结合,探讨植物群落随土壤因子的空间变化特... 为明晰荒漠草原植物群落物种空间分布对土壤环境因子的响应,2018年在宁夏盐池县荒漠草原区域,沿灰钙土内部、边缘和外部生境,基于样线法开展植被和土壤调查及采样,采用多元回归树和冗余分析相结合,探讨植物群落随土壤因子的空间变化特征以及不同群落特征的差异。结果表明,沿灰钙土内部、外部和边缘生境:1)短花针茅+糙隐子草+披针叶黄华群落,苦豆子+白草群落逐渐转变为猪毛蒿+猪毛菜群落。2)土壤粗砂粒、有机碳和全磷含量是群落物种组成空间变化的主要控制因子。3)植物群落高度、盖度和生物量呈显著降低趋势;群落物种多样性呈先增加后减少趋势;植物群落密度呈显著增加趋势。结论:沿灰钙土内部、边缘和外部生境,土壤粗颗粒含量增加,养分含量降低,多年生植物群落转变为一年生植物群落。相对于残存的灰钙土生境植物群落,经历过严重沙化的生境,多年生物种比例、植物多样性和生物量依然较低。 展开更多
关键词 荒漠草原 多元回归树 分类排序 草地恢复
在线阅读 下载PDF
基于决策树和遗传算法的模糊分类系统设计 被引量:2
17
作者 张永 吴晓蓓 +1 位作者 向峥嵘 胡维礼 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第S1期23-26,共4页
提出一种基于决策树初始化和遗传算法优化的模糊分类系统的设计方法.该方法首先采用分类和递归树(CART)算法进行决策树的生长,树的修剪过程简化了初始决策树;然后,把修剪后的决策树转化为模糊模型,利用匹茨堡型实数编码的遗传算法优化... 提出一种基于决策树初始化和遗传算法优化的模糊分类系统的设计方法.该方法首先采用分类和递归树(CART)算法进行决策树的生长,树的修剪过程简化了初始决策树;然后,把修剪后的决策树转化为模糊模型,利用匹茨堡型实数编码的遗传算法优化该模糊模型.为了提高模型的解释性,在遗传算法中利用基于相似性的模型简化方法对模型进行约简.最后利用该方法对Iris问题进行研究,仿真结果验证了该方法的有效性. 展开更多
关键词 模糊分类系统 决策树 分类和递归树算法 遗传算法 解释性
在线阅读 下载PDF
基于林木分级的大兴安岭天然兴安落叶松树高曲线研究 被引量:7
18
作者 董灵波 邵威威 +1 位作者 田栋元 刘兆刚 《北京林业大学学报》 CAS CSCD 北大核心 2023年第5期88-96,共9页
【目的】基于林木分级构建大兴安岭地区兴安落叶松的树高曲线模型,为该地区兴安落叶松的生长规律提供理论依据及森林可持续经营提供技术支撑。【方法】以大兴安岭地区翠岗林场56块固定样地数据为基础,根据单木相对直径(d)把林木分为了... 【目的】基于林木分级构建大兴安岭地区兴安落叶松的树高曲线模型,为该地区兴安落叶松的生长规律提供理论依据及森林可持续经营提供技术支撑。【方法】以大兴安岭地区翠岗林场56块固定样地数据为基础,根据单木相对直径(d)把林木分为了优势木、平均木、被压木3个等级,依据调整决定系数(R^(2)_(adj))最大、均方根误差(RMSE)和赤池信息量(AIC)最小的标准筛选出天然兴安落叶松各等级林木的最优树高曲线基础模型,并进一步评价和比较分位数回归和哑变量回归对兴安落叶松不同等级林木树高曲线模型模拟精度的影响。【结果】天然兴安落叶松树高曲线的最优基础模型均为Wykoff方程;当将林分分级哑变量同时添加在Wykoff方程的参数a和b上时,模型的拟合效果最好,其中兴安落叶松树高曲线模型的调整系数(R^(2)_(adj))、均方根误差(RMSE)和赤池信息量(AIC)分别为0.8588、1.6424和2081.902;兴安落叶松中的不同等级林木对应的最优分位数模型与林分整体无差别,均表现为中位数模型最优(即τ=0.5),其树高曲线的3个统计量则依次为0.8498、1.6938和2211.037。经过比较分析可知,以林木分级为哑变量的树高曲线模型拟合效果最好。【结论】含林木分级哑变量的大兴安岭兴安落叶松的树高曲线模型拟合效果优于基础模型,并且具有较好的预测精度和适应性,能反映不同林木等级下的树高、胸径的生长差异,可以为大兴安岭地区兴安落叶松的经营和生长预估提供理论依据。 展开更多
关键词 林木分级 分位数回归 哑变量 树高曲线
在线阅读 下载PDF
陕西省汉中市农村单纯性收缩期高血压影响因素的分类树研究 被引量:1
19
作者 方士华 颜虹 +5 位作者 党少农 李强 赵亚玲 刘小宁 杨睿海 任勇 《西安交通大学学报(医学版)》 CAS CSCD 北大核心 2013年第3期403-405,415,共4页
目的探索陕西省汉中市农村地区单纯性收缩期高血压(isolated systolic hypertension,ISH)的影响因素,为ISH的预防和控制提供依据和建议。方法以陕西省汉中市农村居民健康调查资料为数据源,采用分类树(CART)分析方法拟合模型,选择适合二... 目的探索陕西省汉中市农村地区单纯性收缩期高血压(isolated systolic hypertension,ISH)的影响因素,为ISH的预防和控制提供依据和建议。方法以陕西省汉中市农村居民健康调查资料为数据源,采用分类树(CART)分析方法拟合模型,选择适合二分类变量的CART算法,并以错分率、正确分类率和ROC曲线等指标评价模型。结果该模型的训练集、验证集和测试集的错分率分别为16.6%、16.8%、14.3%,Root ASE分别为0.357、0.351、0.334,ROC曲线下面积大于0.5,说明模型拟合得较好。该模型首先按年龄将全人群分裂,影响因素按重要性依次为年龄、体质指数、受教育水平、吸烟、家庭月平均收入和多盐。结论 ISH受多因素影响,应针对其影响因素做好一级预防,对不同的高危人群给予针对性的干预策略,降低ISH的发病率,提高农村居民的生活质量。 展开更多
关键词 单纯性收缩期高血压 分类树 影响因素 陕西汉中农村 健康调查
在线阅读 下载PDF
基于分类回归决策树算法的航班延误预测模型 被引量:5
20
作者 王辉 张文杰 +2 位作者 刘杰 陈林烽 李泽南 《中国民航大学学报》 CAS 2022年第3期35-40,共6页
针对民航客机航班延误问题,构建了基于随机森林(random forest)与分类回归决策树(CART,classification and regression tree)算法的航班延误预测模型,利用国内大型机场的真实数据集对模型进行训练,通过与Logistic回归算法,K-近邻回归(KN... 针对民航客机航班延误问题,构建了基于随机森林(random forest)与分类回归决策树(CART,classification and regression tree)算法的航班延误预测模型,利用国内大型机场的真实数据集对模型进行训练,通过与Logistic回归算法,K-近邻回归(KNN,K-nearest neighbor)算法和决策树(decision tree)算法的训练结果对比,从拟合效果可以看出,该方法可以处理高维度数据,泛化能力好,降低了过拟合的可能性,模型的拟合程度R2可以达到0.83。 展开更多
关键词 航班延误 随机森林模型 分类回归决策树(cart)算法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部