期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于影像多种特征的CART决策树分类方法及其应用 被引量:62
1
作者 陈云 戴锦芳 李俊杰 《地理与地理信息科学》 CSCD 北大核心 2008年第2期33-36,共4页
以扬州市宝应县为研究区,采用主成分分析法对研究区影像进行数据压缩和单波段数据增强,利用灰度共生矩阵分析第一主成分的纹理信息。运用基于CART算法的决策树分类方法,选用影像的光谱特征值、NDVI值以及纹理统计量值为测试变量,并通过... 以扬州市宝应县为研究区,采用主成分分析法对研究区影像进行数据压缩和单波段数据增强,利用灰度共生矩阵分析第一主成分的纹理信息。运用基于CART算法的决策树分类方法,选用影像的光谱特征值、NDVI值以及纹理统计量值为测试变量,并通过计算确定决策树的节点规则,提取影像中主要地物信息。将分类结果与单纯依靠光谱特征的监督分类法结果相比较,表明基于影像多种特征的CART决策树分类方法分类精度较高,尤其较好地提取了围网养殖区和建设用地。 展开更多
关键词 纹理特征 光谱特征 cart 决策树
在线阅读 下载PDF
基于Lasso和Xgboost的油价预测研究 被引量:12
2
作者 施国良 景志刚 范丽伟 《工业技术经济》 CSSCI 北大核心 2018年第7期31-37,共7页
鉴于国际原油价格波动的频繁性和对国民经济的重要性,油价的预测和油价的影响因素研究一直是国内外的研究热点。为了提高油价预测的准确性,本文在总结前人提出的油价影响因素的基础上,运用Lasso方法筛选出美国原油生产成本、WTI原油期... 鉴于国际原油价格波动的频繁性和对国民经济的重要性,油价的预测和油价的影响因素研究一直是国内外的研究热点。为了提高油价预测的准确性,本文在总结前人提出的油价影响因素的基础上,运用Lasso方法筛选出美国原油生产成本、WTI原油期货价格、中国原油产量等11个主要影响因素,之后使用Xgboost方法对油价进行预测。数值试验结果表明,相比较其它预测方法,本文构建的Lasso-Xgboost组合方法预测精度更高,泛化能力更强。最后本文应用已有模型对2018~2019年WTI原油价格进行趋势预测。 展开更多
关键词 Lasso方法 Xgboost方法 Lasso-Xgboost方法 WTI现货价格预测 模型误差 分类与回归树
在线阅读 下载PDF
融合多尺度分割与CART算法的矸石山提取 被引量:4
3
作者 赵慧 汪云甲 《计算机工程与应用》 CSCD 2012年第22期222-225,248,共5页
结合多尺度分割和CART算法的特性,提出一种新的目标信息提取方法。其基本思想是将小尺度分割与大尺度分割相结合,将影像分割成一系列同质性对象;以同质性对象为基本单元选择训练样本,后利用CART算法提取目标信息。实验结果表明:与单纯... 结合多尺度分割和CART算法的特性,提出一种新的目标信息提取方法。其基本思想是将小尺度分割与大尺度分割相结合,将影像分割成一系列同质性对象;以同质性对象为基本单元选择训练样本,后利用CART算法提取目标信息。实验结果表明:与单纯像素级的CART算法相比,该方法可有效减少提取结果的噪声,一定程度上排除了其他地类对目标信息的干扰,提取精度显著提高。 展开更多
关键词 多尺度分割 分类和回归树(cart) 矸石山 目标提取
在线阅读 下载PDF
一种同态密码体制下加密云数据的隐私保护CART算法 被引量:5
4
作者 苏杰波 张小萍 +2 位作者 李道丰 赵搏文 周凯 《小型微型计算机系统》 CSCD 北大核心 2016年第11期2537-2541,共5页
CART(Classification And Regression Tree,分类回归树)是一种准确率和效率都较高的数据挖掘算法,它支持离散型和连续型的数据分类,但无法适用于对加密的隐私云数据进行分类.因此提出PPCART(Privacy-preserving CART,隐私保护的分类回归... CART(Classification And Regression Tree,分类回归树)是一种准确率和效率都较高的数据挖掘算法,它支持离散型和连续型的数据分类,但无法适用于对加密的隐私云数据进行分类.因此提出PPCART(Privacy-preserving CART,隐私保护的分类回归树),该算法利用同态加密特性对CART算法做了相应的改善,使之在保持CART原有准确率和相对较好执行效率的情况下能分类加密云数据,避免了在半诚实模型下的分类过程中真实数据的泄露.经过安全分析和实验测试表明,PPCART可显著提高传统CART算法的安全性,且具有接近于它的执行时间. 展开更多
关键词 同态加密 安全多方计算 分类回归树 隐私保护的分类回归树
在线阅读 下载PDF
CART分析及其在故障趋势预测中的应用 被引量:12
5
作者 刘玉茹 赵成萍 +2 位作者 臧军 宁芊 周新志 《计算机应用》 CSCD 北大核心 2017年第A02期57-59,73,共4页
针对机械设备故障监测中的非线性时间序列数据,构建分类回归树(CART),使用最小误差剪枝算法对初次生成的决策树进行剪枝。将CART模型用于滚动轴承设备故障趋势的预测,首先提取滚动轴承的时域和频域特征,然后基于经过主成分析(PCA)降维... 针对机械设备故障监测中的非线性时间序列数据,构建分类回归树(CART),使用最小误差剪枝算法对初次生成的决策树进行剪枝。将CART模型用于滚动轴承设备故障趋势的预测,首先提取滚动轴承的时域和频域特征,然后基于经过主成分析(PCA)降维后的数据进行CART的建模。最后将CART模型预测的结果与BP神经网络模型以及自回归滑动平均模型(ARMA)进行对比,实验结果表明:CART模型预测的平均绝对误差(MAE)和均方根误差(RMSE)值均低于ARMA和BP神经网络模型。其中CART模型预测的RMSE值比ARMA预测模型以及BP神经网络训练5 000次、10 000次的预测模型分别降低了57.26%、69.45%、57.37%。 展开更多
关键词 非线性时间序列 分类回归树 故障趋势预测 最小误差剪枝 BP神经网络 自回归滑动平均
在线阅读 下载PDF
基于CART-熵权法的管道腐蚀状态评估及其应用 被引量:8
6
作者 闻亚星 吕坦 +3 位作者 国滨 王锋 陈金忠 马义来 《腐蚀与防护》 CAS CSCD 北大核心 2023年第9期16-21,100,共7页
管道腐蚀状态评估是管道完整性管理的重要部分,为了评估管道腐蚀状态,根据长输管道腐蚀特点,采用两轮内检测数据计算管道的局部腐蚀速率。以局部腐蚀速率为依据,采用分类与回归树(CART)将管道划分为若干单元,利用熵权法建立腐蚀状态评... 管道腐蚀状态评估是管道完整性管理的重要部分,为了评估管道腐蚀状态,根据长输管道腐蚀特点,采用两轮内检测数据计算管道的局部腐蚀速率。以局部腐蚀速率为依据,采用分类与回归树(CART)将管道划分为若干单元,利用熵权法建立腐蚀状态评估模型,并结合工程实例分析了管道腐蚀状态的相对等级。结果表明:平均预估维修比(ERF)对该管道腐蚀状态的影响最大,该模型确定了腐蚀最严重的管段为44、38、45、37单元,便于业主对这些管段进行重点监测和维修;基于CART-熵权法的腐蚀状态评估模型能够很好地用于管道腐蚀状态评估工作,为业主制定检维修策略提供科学合理的依据。 展开更多
关键词 分类与回归树(cart) 熵权法 管道单元划分 腐蚀状态评估
在线阅读 下载PDF
基于CART的高校教师亚健康决策模型构建 被引量:6
7
作者 易俗 张一川 殷慧文 《实验室研究与探索》 CAS 北大核心 2019年第8期173-178,共6页
传统高校教师亚健康评估缺乏时效性、客观性、高效性。利用大数据技术建立了亚健康决策模型,以支持高校教师亚健康状态的评估与预测。首先针对高校教师亚健康影响因素进行多维分析,构建亚健康多维影响概念模型,其次对样本数据特征进行... 传统高校教师亚健康评估缺乏时效性、客观性、高效性。利用大数据技术建立了亚健康决策模型,以支持高校教师亚健康状态的评估与预测。首先针对高校教师亚健康影响因素进行多维分析,构建亚健康多维影响概念模型,其次对样本数据特征进行分析及数据预处理,在此基础上,利用CART算法给出亚健康决策模型建模的详细过程。最后,给出基于Spark的并行实现过程及实验验证。高校教师亚健康概念模型客观反映教师亚健康评估因素,决策树模型能够支持高校教师亚健康预测分析,实验验证该模型的有效性、即时性、准确性。 展开更多
关键词 高校教师 亚健康 分类与回归树算法 大数据 决策树
在线阅读 下载PDF
基于CART的长输管道腐蚀速率计算方法 被引量:2
8
作者 闻亚星 韩彬 +2 位作者 王锋 陈金忠 马义来 《腐蚀与防护》 CAS 北大核心 2022年第12期78-82,108,共6页
管道腐蚀速率评估是管道完整性管理的重要部分,为了得到比较准确的管道腐蚀速率,利用连续两轮内检测(ILI)的数据计算管道局部腐蚀速率,以局部腐蚀速率为依据,采用分类与回归树(CART)将管道划分为若干管段,通过对管段腐蚀速率的评估,建... 管道腐蚀速率评估是管道完整性管理的重要部分,为了得到比较准确的管道腐蚀速率,利用连续两轮内检测(ILI)的数据计算管道局部腐蚀速率,以局部腐蚀速率为依据,采用分类与回归树(CART)将管道划分为若干管段,通过对管段腐蚀速率的评估,建立管道腐蚀速率计算模型,并结合工程实例,比较分析了局部腐蚀速率、管段最大腐蚀速率、管线最大腐蚀速率对制定维修计划的影响。结果表明:该模型确定了腐蚀最严重的管段为1、6、12、25、38号管段,便于业主对这些管段进行重点监测和维护,并检查相关防腐蚀设施的有效性;基于CART管道划分的管段最大腐蚀速率方法最适用于作为管道评估腐蚀速率,该方法在确保管道安全的前提下,既能很好地表征各管段的腐蚀速率,又能防止管道的过度维修。 展开更多
关键词 分类与回归树(cart) 腐蚀速率 管段划分 内检测(ILI)
在线阅读 下载PDF
基于ARIMA和CART的负载预测模型 被引量:7
9
作者 王电钢 黄林 +2 位作者 常健 梅克进 牛新征 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2019年第3期245-251,共7页
主机资源的负载预测对其运营维护工作具有重要意义.传统负载预测方法通常采用线性时间序列模型拟合负载数据,而负载受复杂的内外部环境影响,线性模型无法很好地表征负载数据规律.为提高模型的精度,提出将负载信息分解为线性部分和非线... 主机资源的负载预测对其运营维护工作具有重要意义.传统负载预测方法通常采用线性时间序列模型拟合负载数据,而负载受复杂的内外部环境影响,线性模型无法很好地表征负载数据规律.为提高模型的精度,提出将负载信息分解为线性部分和非线性部分的思想,并将自回归差分滑动平均(autoregressive integrated moving average,ARIMA)模型和分类回归树(classification and regression tree,CART)模型相结合进行预测.通过加权最小二乘法改进的ARIMA预测线性部分,通过边界判定优化的CART预测非线性部分,并结合两者获得综合预测结果.在真实负载数据集下进行对比实验,结果表明,改进后的算法预测精度相比传统方法提高了15%以上,且对偏远值和不同的时间间隔都均有良好的适应性. 展开更多
关键词 计算机应用技术 时间序列 负载预测 最小二乘法 自回归差分滑动平均模型 分类回归树
在线阅读 下载PDF
考虑颜色特征最优组合的CART决策树火灾图像识别方法 被引量:4
10
作者 李海 孙鹏 《中国安全生产科学技术》 CAS CSCD 北大核心 2023年第1期202-208,共7页
针对火灾图像识别过程中颜色特征数量多、特征间相关性复杂、难以在多维特征融合过程中有效融合图像颜色特征等问题,提出1种考虑颜色特征最优组合的CART决策树火灾图像识别方法。首先,在Lab、RGB、HSV 3种色彩模式下基于图像颜色特征提... 针对火灾图像识别过程中颜色特征数量多、特征间相关性复杂、难以在多维特征融合过程中有效融合图像颜色特征等问题,提出1种考虑颜色特征最优组合的CART决策树火灾图像识别方法。首先,在Lab、RGB、HSV 3种色彩模式下基于图像颜色特征提取火灾图像特征序列;其次,分别在3种色彩模式下基于精细决策树与特征随机排列组合方法提取颜色特征中最优组合特征;最后,将提取的火灾图像最优组合特征序列作为CART决策树输入进行模型训练,并通过测试样本以及其他机器学习方法进行模型泛化能力的分析。研究结果表明:本文方法寻找出识别火灾图像的最优颜色特征组合为“Kb1+Var1+Kg+Kb2+Var2+Kh+Ks+Kv”;CART决策树方法对于火灾图像识别的测试准确度可达84.5%,其分类效果明显优于其他决策树类与集成树类方法;9折为最佳交叉验证折数,其测试准确度可达86.47%,与5折交叉验证相比明显提升14.77%。研究结果可为火灾图像识别提供方法基础。 展开更多
关键词 图像识别 特征贡献度 cart决策树 优化决策树 基尼指数
在线阅读 下载PDF
基于决策树CART选择拼接单元的英语语音合成
11
作者 裴定瑜 柴佩琪 曾令平 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期223-225,共3页
以英语文语转换系统的开发为背景,采用基于大语料库的拼接语音合成方法进行英语语音合成。就英语多音节和无限词汇的特点,选用了3种不同长度的拼接单元:单词,音节,phone。引入了决策树CART(classification and regression tree)方法对... 以英语文语转换系统的开发为背景,采用基于大语料库的拼接语音合成方法进行英语语音合成。就英语多音节和无限词汇的特点,选用了3种不同长度的拼接单元:单词,音节,phone。引入了决策树CART(classification and regression tree)方法对大语料库中的语音单元进行预选,并设计了相应的单元选择算法。实验表明,利用该方法能得到清晰自然的合成效果,并且提高了单元选择的效率。 展开更多
关键词 语音合成 cart 单元预选 单元选择 英语文语转换
在线阅读 下载PDF
基于Google Earth Engine的前郭县春季农田覆膜提取
12
作者 邓韵谣 李晓洁 任建华 《地理科学》 CSSCI CSCD 北大核心 2024年第8期1417-1425,共9页
本文基于Google Earth Engine(GEE)云平台,综合考虑光学影像的波段反射率、光谱指数特征和雷达影像的极化、纹理特征,分别构建仅使用光学特征、仅使用雷达特征以及光学和雷达特征组合3种特征输入组合;根据精度确定最佳输入特征后,分别... 本文基于Google Earth Engine(GEE)云平台,综合考虑光学影像的波段反射率、光谱指数特征和雷达影像的极化、纹理特征,分别构建仅使用光学特征、仅使用雷达特征以及光学和雷达特征组合3种特征输入组合;根据精度确定最佳输入特征后,分别结合机器学习中的分类与回归树、支持向量机、最小距离分类法、梯度提升树和随机森林5种方法建立覆膜提取模型,依据结果精度评估不同方法的性能,并基于最优化模型提取出最终的覆膜农田面积。结果表明:①最佳输入特征为波段反射率特征+光谱指数特征+极化特征+纹理特征;②采用随机森林方法建立的模型精度最高,研究区I的总体精度达到了95.84%,Kappa系数为0.95,地物错分率为1.2%,明显优于其他4种方法(地物错分率较分类与回归树、支持向量机、最小距离和梯度提升树法降低0.8%、7.3%、38.0%和0.3%),研究区II的验证精度达到了87.84%,证明该模型在覆膜提取中可以取得更加准确的结果;③使用本文方法得到2022年研究区I覆膜农田面积为1302.48 km2,估算地膜使用量约为7585.62 t。本文综合考虑光学和雷达影像在地物识别中的特点建立模型,可以准确、高效的识别农田地膜,掌握地膜面积,对环境治理与防治具有重要意义。 展开更多
关键词 覆膜 Google Earth Engine 特征提取 随机森林 支持向量机 分类与回归树 最小距离 梯度提升树
在线阅读 下载PDF
广东沿岸海雾决策树预报模型 被引量:29
13
作者 黄健 黄辉军 +3 位作者 黄敏辉 薛登智 毛伟康 白玉洁 《应用气象学报》 CSCD 北大核心 2011年第1期107-114,共8页
利用汕头、珠海和湛江地面观测站2000 2008年1 5月的海雾历史观测资料和NCEP/NCAR FNL再分析资料,采用分类与回归树(CART)方法对海雾及其生成前24 h的海洋气象条件进行分类分析,建立了海雾决策树预报模型;并根据现有的海雾理论认识,对... 利用汕头、珠海和湛江地面观测站2000 2008年1 5月的海雾历史观测资料和NCEP/NCAR FNL再分析资料,采用分类与回归树(CART)方法对海雾及其生成前24 h的海洋气象条件进行分类分析,建立了海雾决策树预报模型;并根据现有的海雾理论认识,对海雾预报规则包含的物理意义进行讨论。10次交叉检验的结果表明:采用CART方法建立的海雾决策树预报模型有较好的预报性能,对广东沿岸海雾的预报准确率总体上可达到73%以上。根据决策树预报模型建立的海雾预报判别流程,可在业务工作中直接用于有雾/无雾判别。海雾预报判别流程同时也具有明确的物理意义,能够较好地反映水汽与海表冷却条件对平流冷却雾形成的重要性,CART方法可作为海雾业务预报的有效建模工具。 展开更多
关键词 广东沿岸海雾 分类与回归树 决策树预报模型 判别流程
在线阅读 下载PDF
基于声学相关特征与词典语法相关特征的汉语重音检测 被引量:8
14
作者 倪崇嘉 张爱英 刘文举 《计算机学报》 EI CSCD 北大核心 2011年第9期1638-1649,共12页
重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学... 重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学相关特征以及词典语法相关特征进行建模,Boosting集成分类回归树充分利用了当前音节的特性.同时还对词典语法相关特征采用条件随机场方法建模,条件随机场很好地利用了当前音节的上下文特性.最后,将Boosting集成分类回归树模型和条件随机场模型加权组合获得识别率更高的混合模型.该混合模型克服了Boosting集成分类回归树模型的不足,实现了Boosting集成分类回归树和条件随机场的优势互补.实验结果表明该方法具有较好的分类效果,在ASCCD语料库上能够获得84.82%重音检测正确率.同时,与之前其他人的工作在相同的条件下(相同的训练集和测试集)对比,在正确率方面,该方法分别有4.01%和1.67%的提高.另外,该文中,对英语的重音检测和汉语的重音检测做了对比,并通过特征分析方法从另一个层面验证了一些语言学上的结论. 展开更多
关键词 重音 boosting集成分类回归树 条件随机场 神经网络 分类回归树
在线阅读 下载PDF
电能质量复合扰动特征选择与最优决策树构建 被引量:60
15
作者 黄南天 彭华 +1 位作者 蔡国伟 徐殿国 《中国电机工程学报》 EI CSCD 北大核心 2017年第3期776-785,共10页
针对电能质量(power quality,PQ)复合扰动识别中缺少特征选择与最优决策树自动构建方法的不足,提出采用分类回归树的PQ特征选择与最优决策树构建方法。首先,通过S变换提取64种PQ特征,构成原始特征集;然后,采用嵌入式特征选择方法,获取特... 针对电能质量(power quality,PQ)复合扰动识别中缺少特征选择与最优决策树自动构建方法的不足,提出采用分类回归树的PQ特征选择与最优决策树构建方法。首先,通过S变换提取64种PQ特征,构成原始特征集;然后,采用嵌入式特征选择方法,获取特征Gini重要度及排序,确定最优特征子集;最后,应用1-标准误差规则子树评估法,进行代价复杂度剪枝,获得最优分类树。实验证明,新方法能够根据训练集自动构建最优决策树,并实现最优特征选择;最优决策树可准确识别不同噪声环境下,含多种复合扰动的PQ信号,分类准确率高于概率神经网络和支持向量机方法,具有良好的鲁棒性与抗噪性。 展开更多
关键词 电能质量 复合扰动 S变换 分类回归树 Gini重要度 1-标准误差规则
在线阅读 下载PDF
汉语韵律边界的声学实验研究 被引量:17
16
作者 胡伟湘 徐波 黄泰翼 《中文信息学报》 CSCD 北大核心 2002年第1期43-48,共6页
本文以带有韵律标注的语料库ASCCD为基础 ,从语音信号分析的角度 ,研究了汉语普通话韵律间断模式在语音的时长、基频和音强等三个方面的表现特征 ,并在大量统计分析的基础上建立了识别分类的决策树模型 ,实验证明 。
关键词 韵律边界 韵律结构 决策树 汉语 语音合成 语音识别
在线阅读 下载PDF
基于DGA技术和SAMME的变压器故障诊断 被引量:12
17
作者 黄新波 李文君子 +1 位作者 宋桐 王岩妹 《高压电器》 CAS CSCD 北大核心 2016年第2期13-18,共6页
油中溶解气体分析(dissolved gas analysis,DGA)技术可以有效发现充油变压器内部的早期潜伏性故障,是对充油设备进行诊断的常用检测方法。CART(classification and regression trees)分类回归树是一种可处理连续属性的不平衡算法。SAMM... 油中溶解气体分析(dissolved gas analysis,DGA)技术可以有效发现充油变压器内部的早期潜伏性故障,是对充油设备进行诊断的常用检测方法。CART(classification and regression trees)分类回归树是一种可处理连续属性的不平衡算法。SAMME作为Ada Boost二分类算法的延伸,可将多个略好于随机猜测的弱分类器组合提升为分类精度更高的强分类器,完成多分类任务。针对单一算法往往不能满足实际工程对分类精度的需求且高精度算法难以获得的问题,采用SAMME算法对CART弱学习器的权重根据误差不断调整,再通过加权投票将其组合提升为强分类器,并采用V折交叉验证确定SAMME-CART模型的最优迭代次数。以此提高故障诊断模型的泛化能力。实验结果表明,运用该模型结合DGA技术对变压器故障进行诊断,相比于单一CART算法,诊断准确率整体提高了18.7%,表明该方法是可行的。 展开更多
关键词 变压器 故障诊断 交叉验证 SAMME cart
在线阅读 下载PDF
在线电压安全评估的多重动态决策树方法 被引量:10
18
作者 顾伟 丁涛 +1 位作者 杨自群 万秋兰 《中国电机工程学报》 EI CSCD 北大核心 2011年第31期142-148,共7页
利用数据挖掘技术对电力系统在线动态安全进行评估,能够为系统运行控制提供决策指导,防止连续的系统安全问题。提出一种基于相量测量单元(phasor measurementunit,PMU)的在线电压安全评估算法:利用电网数据库已有的数据离线建立电压安... 利用数据挖掘技术对电力系统在线动态安全进行评估,能够为系统运行控制提供决策指导,防止连续的系统安全问题。提出一种基于相量测量单元(phasor measurementunit,PMU)的在线电压安全评估算法:利用电网数据库已有的数据离线建立电压安全评估决策树,根据PMU的实时采样数据动态对决策树进行更新,形成动态决策树,在线对电压安全进行监控。此外,利用不同的属性集合构建多重决策树,替代原来单一决策树评估,大大提高了决策树分类的准确度和评估的可靠性。结合IEEE 57节点仿真系统,给出多重动态决策树的构建方法以及多重决策树的模型。仿真结果表明,基于PMU的动态多重决策树是一种在线电压安全评估的可行方法。 展开更多
关键词 电压安全评估 相量测量单元 决策树 分类与回归树算法 广域测量系统
在线阅读 下载PDF
基于聚类和分类与回归树的地力等级评价研究 被引量:5
19
作者 闫一凡 刘建立 +2 位作者 李晓鹏 张佳宝 赵炳梓 《土壤》 CAS CSCD 北大核心 2014年第4期656-661,共6页
以黄淮海平原粮食主产区河南封丘县为研究区域,利用基于GIS的土壤空间和属性数据库,采用聚类分析和分类与回归树(CART)相结合的方法建立了耕地地力评价模型。研究结果表明,基于聚类分析和CART的地力评价模型准确度为93.56%,较单独使用... 以黄淮海平原粮食主产区河南封丘县为研究区域,利用基于GIS的土壤空间和属性数据库,采用聚类分析和分类与回归树(CART)相结合的方法建立了耕地地力评价模型。研究结果表明,基于聚类分析和CART的地力评价模型准确度为93.56%,较单独使用决策树模型的准确度有明显提高;根据耕地地力分级规则,一等地至五等地分别占全县61 733.3 hm2耕地的28.167%、49.518%、9.389%、5.77%和7.156%;地力等级较高的耕地主要分布于封丘西北部,地力较低的区域主要在东南部,由西北向东南地力呈带状递减趋势。本文的研究结果可为当地中低产田及其障碍因子的解析和农田精准管理提供参考依据。 展开更多
关键词 耕地地力 评价 分类与回归树(cart) 聚类分析 模型
在线阅读 下载PDF
三种用于垃圾网页检测的随机欠采样集成分类器 被引量:8
20
作者 陈木生 卢晓勇 《计算机应用》 CSCD 北大核心 2017年第2期535-539,558,共6页
针对垃圾网页检测过程中轻微的不平衡分类问题,提出三种随机欠采样集成分类器算法,分别为一次不放回随机欠采样(RUS-once)、多次不放回随机欠采样(RUS-multiple)和有放回随机欠采样(RUS-replacement)算法。首先使用其中一种随机欠采样... 针对垃圾网页检测过程中轻微的不平衡分类问题,提出三种随机欠采样集成分类器算法,分别为一次不放回随机欠采样(RUS-once)、多次不放回随机欠采样(RUS-multiple)和有放回随机欠采样(RUS-replacement)算法。首先使用其中一种随机欠采样技术将训练样本集转换成平衡样本集,然后对每个平衡样本集使用分类回归树(CART)分类器算法进行分类,最后采用简单投票法构建集成分类器对测试样本进行分类。实验表明,三种随机欠采样集成分类器均取得了良好的分类效果,其中RUS-multiple和RUS-replacement比RUS-once的分类效果更好。与CART及其Bagging和Adaboost集成分类器相比,在WEBSPAM UK-2006数据集上,RUS-multiple和RUS-replacement方法的AUC指标值提高了10%左右,在WEBSPAM UK-2007数据集上,提高了25%左右;与其他最优研究结果相比,RUS-multiple和RUS-replacement方法在AUC指标上能达到最优分类结果。 展开更多
关键词 垃圾网页检测 不平衡分类 集成学习 欠采样 分类回归树
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部