期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于CART决策树的分布式数据离群点检测算法 被引量:1
1
作者 朱华 乔勇进 董国钢 《现代电子技术》 北大核心 2024年第16期157-162,共6页
在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环... 在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环境下高效地发现离群点。因此,提出一种基于CART决策树的分布式数据离群点检测算法。在构建CART决策树时,使用类间中心距离作为分裂准则,根据分离类别对训练数据进行分类,从而确定数据的类型。在上述基础上,考虑到离群点的分布模式与其周围数据对象不同,使用空间局部偏离因子(SLDF)对空间内各个数据对象之间的离群程度展开度量,同时在高维空间内展开网格划分,引入SLDF算法检测剩余离群点集,最终实现分布式数据离群点检测。实验结果表明,所提方法的离散点检测错误率在0.010以内,可以更加精准地实现分布式数据离群点检测,具有良好的检测性能。 展开更多
关键词 cart决策树 分布式数据 离群点检测 类间距离 数据分类 空间局部偏离因子
在线阅读 下载PDF
高光谱图像植被类型的CART决策树分类 被引量:18
2
作者 董连英 邢立新 +3 位作者 潘军 王静 李丽丽 焦健楠 《吉林大学学报(信息科学版)》 CAS 2013年第1期83-89,共7页
为提高植被分类的精度,在利用高光谱图像提取植被信息时需要考虑训练样本和地形等其他因素的影响。以长白山为研究背景,基于CART(Classification And Regression Tree)算法构建决策树模型,对高光谱图像进行植被分类。由于混合像元的影响... 为提高植被分类的精度,在利用高光谱图像提取植被信息时需要考虑训练样本和地形等其他因素的影响。以长白山为研究背景,基于CART(Classification And Regression Tree)算法构建决策树模型,对高光谱图像进行植被分类。由于混合像元的影响,以采用PPI(Pixel Purity Index)提取的纯净像元作为训练样本,提取植被指数、纹理和地形等分类特征变量。基于这些变量构建CART决策树对植被分类,并将结果与最大似然法分类结果进行比较。结果表明,CART决策树分类法可实现光谱、纹理和地形特征的有效组合,有较好的分类效果。 展开更多
关键词 高光谱 植被分类 端元提取 cart决策树
在线阅读 下载PDF
基于分类回归决策树算法的航班延误预测模型 被引量:5
3
作者 王辉 张文杰 +2 位作者 刘杰 陈林烽 李泽南 《中国民航大学学报》 CAS 2022年第3期35-40,共6页
针对民航客机航班延误问题,构建了基于随机森林(random forest)与分类回归决策树(CART,classification and regression tree)算法的航班延误预测模型,利用国内大型机场的真实数据集对模型进行训练,通过与Logistic回归算法,K-近邻回归(KN... 针对民航客机航班延误问题,构建了基于随机森林(random forest)与分类回归决策树(CART,classification and regression tree)算法的航班延误预测模型,利用国内大型机场的真实数据集对模型进行训练,通过与Logistic回归算法,K-近邻回归(KNN,K-nearest neighbor)算法和决策树(decision tree)算法的训练结果对比,从拟合效果可以看出,该方法可以处理高维度数据,泛化能力好,降低了过拟合的可能性,模型的拟合程度R2可以达到0.83。 展开更多
关键词 航班延误 随机森林模型 分类回归决策树(cart)算法
在线阅读 下载PDF
基于CART决策树方法的遥感影像分类 被引量:53
4
作者 齐乐 岳彩荣 《林业调查规划》 2011年第2期62-66,共5页
以云南省香格里拉县为研究区域,构建一种基于CART遥感影像的决策树分类方法.对遥感影像采用主成分提取、植被信息提取、纹理信息提取等方法,并结合试验区主要地物类型训练样本,采用Landsat 5 TM影像数据、DEM数据以及遥感处理软件ENVI... 以云南省香格里拉县为研究区域,构建一种基于CART遥感影像的决策树分类方法.对遥感影像采用主成分提取、植被信息提取、纹理信息提取等方法,并结合试验区主要地物类型训练样本,采用Landsat 5 TM影像数据、DEM数据以及遥感处理软件ENVI为平台进行影像分类,并将结果与最大似然分类结果作比较.结果表明,基于CART遥感影像决策树分类精度优于最大似然分类,有较好的分类效果. 展开更多
关键词 cart 决策树分类 遥感影像 植被指数 纹理特征
在线阅读 下载PDF
基于CART决策树的110 kV供电区域分布式光伏承载能力测算模型
5
作者 代守乐 李萍 《分布式能源》 2024年第3期82-88,共7页
分布式光伏受天气影响较大,测算110kV供电区域的分布式光伏承载能力,对区域供电来说意义重大。基于此,提出基于分类与回归树(calssification and regression tree,CART)的110kV供电区域分布式光伏承载能力测算模型。该模型以分布式电源... 分布式光伏受天气影响较大,测算110kV供电区域的分布式光伏承载能力,对区域供电来说意义重大。基于此,提出基于分类与回归树(calssification and regression tree,CART)的110kV供电区域分布式光伏承载能力测算模型。该模型以分布式电源输出功率、区域分布式电源发电量占比、局部分布式电源线损增量等数据为基础,利用CART决策树建立110kV供电区域分布式光伏承载能力测算模型,并使用改进鲸鱼优化算法求解测算结果。经实验测试发现,该模型对分布式光伏承载能力的测算精准度较高,可有效测算不同实验区域在不同季节时的分布式光伏承载能力,具有较高的应用价值。 展开更多
关键词 分类回归树(cart) 110kV供电区域 分布式光伏 承载能力
在线阅读 下载PDF
基于影像特征CART决策树的稀土矿区信息提取与动态监测 被引量:6
6
作者 朱青 林建平 +1 位作者 国佳欣 郭熙 《金属矿山》 CAS 北大核心 2019年第5期161-169,共9页
为准确反映赣南稀土矿区开采状况,以江西省寻乌县为研究区,选用Landsat-8多光谱影像为数据源,通过对均值纹理、裸土指数(Bare Soil Index,BSI)、归一化植被指数(Normalized Difference Vegetation Index,NDVI)3种特征信息进行提取,采用... 为准确反映赣南稀土矿区开采状况,以江西省寻乌县为研究区,选用Landsat-8多光谱影像为数据源,通过对均值纹理、裸土指数(Bare Soil Index,BSI)、归一化植被指数(Normalized Difference Vegetation Index,NDVI)3种特征信息进行提取,采用基于CART(Classification and Regression Trees)决策树的分类方法对研究区稀土矿开采信息进行识别,分类总体精度达到89.43%,其中矿区分类精度达到88%,分类精度相对于基于光谱信息的CART决策树分类和最大似然分类有明显提高。通过对研究区2013—2016年稀土矿开采区域进行遥感动态监测,发现增加的开采区域主要分布于矿权范围内,减少的开采区域在矿权界限内外均有大量分布,减少幅度达41%,说明政府和相关矿权部门对于稀土行业健康有序发展发挥了重要作用。研究表明:基于影像特征CART决策树的分类方法在稀土矿区信息提取与动态监测方面具有一定的可行性。 展开更多
关键词 稀土矿区 遥感监测 cart决策树 纹理特征 裸土指数 遥感影像分类
在线阅读 下载PDF
基于决策树分类的济宁市土壤有机碳遥感反演 被引量:2
7
作者 孙问娟 李新举 《山东农业科学》 2018年第4期133-137,共5页
本研究利用Landsat 8遥感影像数据以及土壤有机碳实测数据,以研究区表层0~20 cm土壤的有机碳含量为研究对象,通过SPSS的多元线性回归分析,建立预测模型:Ysoc=23.448+65.958b1-67.703b4-21.778b7(R2=0.744,P<0.01);进而采用基于ENVI... 本研究利用Landsat 8遥感影像数据以及土壤有机碳实测数据,以研究区表层0~20 cm土壤的有机碳含量为研究对象,通过SPSS的多元线性回归分析,建立预测模型:Ysoc=23.448+65.958b1-67.703b4-21.778b7(R2=0.744,P<0.01);进而采用基于ENVI的波段运算及决策树分类法,获取了济宁市土壤的有机碳含量与分布状况。结果表明:(1)研究区的土壤有机碳含量平均约为12.45 g/kg,处于中等偏下水平,部分地区有机碳含量接近于零,微山县和任城区含量最高;(2)研究区有机碳含量主要集中在12~18 g/kg,面积约为6 165.13 km^2,占研究区土地总面积的59.99%,分布最为广泛,在各个县区均有分布。 展开更多
关键词 土壤有机碳 遥感反演 多元回归分析 决策树分类 济宁市
在线阅读 下载PDF
基于决策树CART算法的虫害预测模型分析 被引量:4
8
作者 韩雨昊 曹丽君 +1 位作者 王友起 张晶晶 《现代化农业》 2022年第1期45-47,共3页
频发的农田虫害给农业生产造成了极大的影响,严重影响了我国的农业经济。虫害的发生受到众多复杂环境气象因子的影响,传统的基于经验预测或是应用数学理论建模预测虫害发生状况等方法准确率低,适应性差。针对以上问题,文章提出了基于CAR... 频发的农田虫害给农业生产造成了极大的影响,严重影响了我国的农业经济。虫害的发生受到众多复杂环境气象因子的影响,传统的基于经验预测或是应用数学理论建模预测虫害发生状况等方法准确率低,适应性差。针对以上问题,文章提出了基于CART算法的虫害模型,使用CART算法结合复杂的环境因子与虫害发生数量建模,用于预测未来虫害发生数量,可为虫害预警提供可靠参考。 展开更多
关键词 决策树 虫害预测 cart回归
在线阅读 下载PDF
基于CART决策树的车辆与行人碰撞中头部损伤风险预测 被引量:1
9
作者 韩勇 罗金镕 +3 位作者 何勇 吴贺 林旭洁 蔡鸿瑜 《汽车安全与节能学报》 CAS CSCD 北大核心 2023年第5期536-543,共8页
为快速预测汽车碰撞行人头部损伤风险,建立了一种基于多刚体系统动力学仿真方法和分类回归决策树(CART)的预测模型。参考欧洲新车评价规程(Euro-NCAP),开发了具有精细化刚度特征的车辆前部结构多体模型;以行人尺寸、初始车辆速度和行人... 为快速预测汽车碰撞行人头部损伤风险,建立了一种基于多刚体系统动力学仿真方法和分类回归决策树(CART)的预测模型。参考欧洲新车评价规程(Euro-NCAP),开发了具有精细化刚度特征的车辆前部结构多体模型;以行人尺寸、初始车辆速度和行人速度、人车碰撞位置、相对角度为变量,通过全因子设计试验方法,建立了4500组多体仿真模型;采用CART模型,挖掘变量与动力学响应参数的关联性。结果表明:车辆初始碰撞速度是影响行人头部动力学响应的关键因素;该模型对于碰撞速度和头部损伤准则(HIC15)值的预测精度分别为87.5%和86.8%,平均预测耗时为42.7ms,两者均具有较高的预测精度和决策能力。该结果可为制定行人头部损伤风险评估实验和损伤防护研究提供理论参考依据。 展开更多
关键词 汽车安全 碰撞事故 头部损伤准则(HIC) 车辆前部结构 决策树预测模型 头部动力学响应 分类回归决策树(cart)
在线阅读 下载PDF
基于聚类和分类与回归树的地力等级评价研究 被引量:5
10
作者 闫一凡 刘建立 +2 位作者 李晓鹏 张佳宝 赵炳梓 《土壤》 CAS CSCD 北大核心 2014年第4期656-661,共6页
以黄淮海平原粮食主产区河南封丘县为研究区域,利用基于GIS的土壤空间和属性数据库,采用聚类分析和分类与回归树(CART)相结合的方法建立了耕地地力评价模型。研究结果表明,基于聚类分析和CART的地力评价模型准确度为93.56%,较单独使用... 以黄淮海平原粮食主产区河南封丘县为研究区域,利用基于GIS的土壤空间和属性数据库,采用聚类分析和分类与回归树(CART)相结合的方法建立了耕地地力评价模型。研究结果表明,基于聚类分析和CART的地力评价模型准确度为93.56%,较单独使用决策树模型的准确度有明显提高;根据耕地地力分级规则,一等地至五等地分别占全县61 733.3 hm2耕地的28.167%、49.518%、9.389%、5.77%和7.156%;地力等级较高的耕地主要分布于封丘西北部,地力较低的区域主要在东南部,由西北向东南地力呈带状递减趋势。本文的研究结果可为当地中低产田及其障碍因子的解析和农田精准管理提供参考依据。 展开更多
关键词 耕地地力 评价 分类回归树(cart) 聚类分析 模型
在线阅读 下载PDF
基于决策树的来华留学生跨文化适应性研究 被引量:8
11
作者 王冬燕 钱锦昕 余嘉元 《心理学探新》 CSSCI 2012年第3期225-230,共6页
近年来,越来越多的国外学生选择到中国留学,为了更好地接收和管理留学生,获得留学生跨文化适应性规则十分必要。决策树是提取分类规则的有效方法,以树型结构表示最终分类结果,并生成If-Then形式的便于理解的规则,更有利于留学生管理工... 近年来,越来越多的国外学生选择到中国留学,为了更好地接收和管理留学生,获得留学生跨文化适应性规则十分必要。决策树是提取分类规则的有效方法,以树型结构表示最终分类结果,并生成If-Then形式的便于理解的规则,更有利于留学生管理工作者理解并决策。本研究对全国10个省市15所学校的1294名留学生进行测量。对留学生的社会适应、心理适应和学习适应建立分类回归树。结果表明:(1)分类回归树可以有效地对留学生适应性进行预测;(2)按重要性提取规则,社会服务系统和留学生个性心理特征是影响适应水平的最重要因素,但学校的软硬件环境也在一定程度上对留学生适应性产生影响。 展开更多
关键词 决策树 分类回归 留学生 适应性
在线阅读 下载PDF
基于高阶累积量的核Logistic回归调制分类算法 被引量:1
12
作者 徐闻 王斌 《太赫兹科学与电子信息学报》 2013年第2期260-265,共6页
针对现有数字信号调制识别的问题,提出了一种基于核Logistic回归(KLR)的自动分类方法。该方法提取了信号的高阶累积量参数用作训练与测试数据,采取常用的决策树分类构架的思想,仿真并比较已有的基于支撑向量机(SVM)的调制分类方法,结果... 针对现有数字信号调制识别的问题,提出了一种基于核Logistic回归(KLR)的自动分类方法。该方法提取了信号的高阶累积量参数用作训练与测试数据,采取常用的决策树分类构架的思想,仿真并比较已有的基于支撑向量机(SVM)的调制分类方法,结果表明,在低信噪比为0 dB时,分类性能一般高于SVM;5 dB时,采用KLR的分类识别率均达到90%以上,有较为优越的分类性能。 展开更多
关键词 调制识别 分类 高阶累积量 核Logistic回归 决策树
在线阅读 下载PDF
基于游戏玩家流失预警的改进决策树算法
13
作者 林雪云 《长春工业大学学报》 CAS 2016年第2期182-186,共5页
首先对样本数据的影响因素进行logistic回归剔除绝大部分噪声因素,再通过降维和共线性诊断进一步筛选出影响因素中对实际结果有重要影响的指标以及共线性的指标,剔除无用和重复的类别,对清洗后的数据进行分析。最后进行了实例验证。
关键词 决策树 流失预警 降维 ID3算法 cart算法 LOGISTIC回归
在线阅读 下载PDF
基于分类回归树分析的棉花种植面积提取——以库、新、沙三县为例 被引量:4
14
作者 玉苏普江.艾麦提 玉苏甫.买买提 阿里木江.卡斯木 《干旱地区农业研究》 CSCD 北大核心 2014年第5期187-191,共5页
以研究区2012年的HJ卫星CCD影像为数据源,通过物候历和主要农作物的光谱特征分析,确定棉花识别最佳时相。采用分类回归树分析(CART)的决策树方法提取棉花种植面积信息,并以农田实地调查样点和统计数据为参考对提取的棉花种植面积结果进... 以研究区2012年的HJ卫星CCD影像为数据源,通过物候历和主要农作物的光谱特征分析,确定棉花识别最佳时相。采用分类回归树分析(CART)的决策树方法提取棉花种植面积信息,并以农田实地调查样点和统计数据为参考对提取的棉花种植面积结果进行评价。结果表明,基于HJ-CCD数据,使用CART算法的决策树可以较好地提取棉花覆盖信息,最终提取的棉花种植面积总量精度为94.29%,位置精度为88.57%;本研究采用的决策树方法,操作方便、容易实现,分类结果较为实际,基本满足棉花种植面积遥感监测的需求,可对棉花种植面积估算和种植结构分析提供一定的参考。 展开更多
关键词 棉花 面积提取 决策树分类 cart算法
在线阅读 下载PDF
企业人工智能战略驱动因素研究——基于LASSO回归和CART算法的分析 被引量:2
15
作者 刘英铎 陈奕 《上海管理科学》 2019年第6期43-51,共9页
随着人工智能技术的发展,越来越多的企业开始采用人工智能技术作为企业转型发展的战略,然而现有研究尚未很好解释企业成功开展人工智能战略的驱动因素。基于资源基础理论,对内外部环境中的分类变量进行One-Hot编码,将企业采用人工智能... 随着人工智能技术的发展,越来越多的企业开始采用人工智能技术作为企业转型发展的战略,然而现有研究尚未很好解释企业成功开展人工智能战略的驱动因素。基于资源基础理论,对内外部环境中的分类变量进行One-Hot编码,将企业采用人工智能战略前后CAGR的差值作为因变量,在对各变量进行最大最小归一化后构建了LASSO回归模型,通过LASSO模型筛选出47个具有显著影响因素的变量,再用被筛选出的47个变量构建CART算法的决策树,探索企业人工智能战略的条件。研究发现,企业在销售净利率、市净率、是否为美元股票、每股现金流量净额、每股净资产、存货周转率、管理费用占比、非流动负债占比、归属母公司的利润占总利润的比例以及总市值等方面满足一定的条件,则更有可能成功开展人工智能战略。 展开更多
关键词 人工智能战略 CAGR LASSO回归 cart决策树 资源基础理论
在线阅读 下载PDF
决策树算法与客户流失分析 被引量:6
16
作者 邓全 《西安邮电学院学报》 2013年第3期49-51,共3页
为了向市场人员提供决策依据,有效降低客户流失率,基于数据挖掘平台Clementine,构造出一种客户流失模型,并分别利用决策树算法C5.0及分类和回归算法对某运营商提供的实际数据进行实验分析。对比实验结果可知,C5.0算法在准确率及覆盖率... 为了向市场人员提供决策依据,有效降低客户流失率,基于数据挖掘平台Clementine,构造出一种客户流失模型,并分别利用决策树算法C5.0及分类和回归算法对某运营商提供的实际数据进行实验分析。对比实验结果可知,C5.0算法在准确率及覆盖率等方面更适合于该运营商。 展开更多
关键词 数据挖掘 CLEMENTINE C5 0算法 分类回归 决策树
在线阅读 下载PDF
分类回归树在航天测控数据关联规则分析中的应用 被引量:2
17
作者 熊宇虹 严云红 +3 位作者 郑庆晖 刘云翔 荣祺 舒明磊 《空间电子技术》 2019年第5期71-75,共5页
发现参数间的关联规则对预测航天器系统状态和改进航天器系统设计都有着重要的意义。如何发现参数间的关联规则是航天测控数据分析中的一个难点问题。针对该问题,在概述小波分析和分类回归树基本原理的基础上,提出了一种基于分类回归树... 发现参数间的关联规则对预测航天器系统状态和改进航天器系统设计都有着重要的意义。如何发现参数间的关联规则是航天测控数据分析中的一个难点问题。针对该问题,在概述小波分析和分类回归树基本原理的基础上,提出了一种基于分类回归树的分析方法。该方法首先采用小波分析技术对参数数据进行去噪声处理,然后用随机采样的方法把数据分为训练数据集和检验数据集两部分,再构建一个分类回归树模型并用训练数据集训练该模型,随后用检验数据集对该模型进行检验,在对检验结果好坏进行评价并确认获得较好结果的基础上,对分类回归树模型进行解析,并最终得出参数间的关联规则。最后运用仿真数据对上述方法进行了实例验证,结果表明该方法能较好地分析出参数间的关联规则。 展开更多
关键词 分类回归 关联规则 决策树 小波分析 航天器
在线阅读 下载PDF
基于随机森林模型的不平衡大数据分类算法 被引量:2
18
作者 魏亚明 孟媛 《吉林大学学报(信息科学版)》 CAS 2023年第6期1079-1085,共7页
针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分... 针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分分析法去掉不平衡大数据中协方差矩阵存在的奇异性,并依据熵值法对其展开权重解析,进而提取不平衡大数据特征信息。将CART(Classification and Regression Trees)决策树当作不平衡大数据的基分类器,进而构建随机森林决策树分类器,最后将提取的不平衡大数据特征信息输入分类器中,实现不平衡大数据分类。实验结果表明,该算法对不平衡大数据的采样效果较好,并且分类精准度、稳定性和性能都较高。 展开更多
关键词 随机森林模型 不平衡大数据分类 SVM支持向量机 反k近邻法 cart决策树
在线阅读 下载PDF
基于SDAE与CART联合智能算法的通信网络用户满意度分析方法 被引量:1
19
作者 李露 于忠义 李福昌 《信息通信技术》 2020年第2期12-18,共7页
论文提出一种基于栈式降噪自编码器(Stacked Denoising Autoencoder,SDAE)与分类和回归决策树(Classification and Regression Tree,CART)的移动互联网满意度预测方法,此模型能挖掘出用户的满意度与用户的特征和网络特征的关联规则,通... 论文提出一种基于栈式降噪自编码器(Stacked Denoising Autoencoder,SDAE)与分类和回归决策树(Classification and Regression Tree,CART)的移动互联网满意度预测方法,此模型能挖掘出用户的满意度与用户的特征和网络特征的关联规则,通过这种规则能更精准及时地预测到用户满意度的变化,以便运营商针对这种变化提前作出决策。论文所提方法能够挖掘特征间的深层关系,通过SDAE编码样本可以获得影响用户体验的隐含特征,及时发现用户对于网络贬损的真正痛点,为运营商网络建设和运行维护部门制定提升用户的网络感知策略提供依据,从而提升用户体验。 展开更多
关键词 栈式降噪自编码器 分类回归决策树 人工智能 移动互联网 满意度
在线阅读 下载PDF
分类算法的研究进展 被引量:1
20
作者 孙嘉睿 《中国新通信》 2015年第21期23-23,共1页
分类是数据挖掘、机器学习和模式识别中一个重要的研究领域,分类的目的是根据数据集的特点构造一个分类函数或分类模型,该分类模型能把未知类别的样本映射到给定类别中的某一个。分类和回归都可以用于预测,和回归方法不同的是,分类的输... 分类是数据挖掘、机器学习和模式识别中一个重要的研究领域,分类的目的是根据数据集的特点构造一个分类函数或分类模型,该分类模型能把未知类别的样本映射到给定类别中的某一个。分类和回归都可以用于预测,和回归方法不同的是,分类的输出是离散的类别值,而回归的输出是连续或有序值。一、分类算法概述为了提高分类的准确性、有效性和可伸缩性,在进行分类之前,通常要对数据进行预处理,包括:(1)数据清理, 展开更多
关键词 分类算法 数据清理 数据挖掘 数据集 分类函数 模式识别 机器学习 未知类别 构造决策树 回归方法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部