期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于随机森林的变量重要性研究
被引量:
37
1
作者
曹桃云
《统计与决策》
CSSCI
北大核心
2022年第4期60-63,共4页
对变量进行重要性度量是变量选择的依据。变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景。基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述...
对变量进行重要性度量是变量选择的依据。变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景。基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述,并采用数值模拟研究了各种重要性度量的性能,为新方法的设计提供了基础。
展开更多
关键词
随机森林
最小深度
分裂频次
节点纯度
置换重要性
在线阅读
下载PDF
职称材料
融合光谱和空间特征的土壤重金属含量极端随机树估算
被引量:
14
2
作者
于海洋
谢赛飞
+2 位作者
郭灵辉
刘鹏
张平
《农业机械学报》
EI
CAS
CSCD
北大核心
2022年第8期231-239,共9页
针对高光谱遥感土壤重金属含量估算研究中光谱特征信息弱、模型反演鲁棒性差的问题,提出构建污染源-汇空间特征量化污染物扩散与汇聚空间影响因子,融合光谱特征建立基于极端随机树(Extremely randomized trees,ERT)的土壤重金属含量估...
针对高光谱遥感土壤重金属含量估算研究中光谱特征信息弱、模型反演鲁棒性差的问题,提出构建污染源-汇空间特征量化污染物扩散与汇聚空间影响因子,融合光谱特征建立基于极端随机树(Extremely randomized trees,ERT)的土壤重金属含量估算模型。以济源市耕地土壤为研究区,布设采集土壤样本249个,分析了光谱特征、地形特征和污染源空间特征在土壤重金属铅(Pb)、铬(Cd)含量反演中的有效性及影响机理,采用置换重要性指数优选多源特征,通过与多种回归模型对比,评价ERT模型的预测精度。研究表明,变换后的土壤光谱特征构建ERT模型引入地形特征和污染源空间特征后精度提升显著,尤其是污染源空间特征优势更为明显,Pb的ERT模型均方根误差由43.185 mg/kg下降到22.301 mg/kg,下降了48.36%。Cd的ERT模型均方根误差由0.738 mg/kg下降到0.371 mg/kg,下降了49.73%,充分说明引入污染扩散空间特征的有效性。与其他回归模型对比,ERT估算模型在各项指标评价中优势明显,其中Pb的ERT模型的测试集R^(2)达0.964,Cd的ERT模型R^(2)为0.923。
展开更多
关键词
土壤
重金属
高光谱遥感
空间特征
极端随机树
置换重要性
在线阅读
下载PDF
职称材料
融合分数阶微分与PIMP-RF算法的集成学习模型预测成熟期苹果可溶性固形物含量
被引量:
1
3
作者
黄华
刘亚
+5 位作者
库尔班古丽·都力昆
曾繁琳
玛依热·麦麦提
阿瓦古丽·麦麦提
买地努尔汗·艾则孜
郭俊先
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2023年第10期3059-3066,共8页
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC...
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC,共552个样本。然后融合分数阶微分(FD)及置换重要性-随机森林(PIMP-RF)算法,构建成熟期苹果SSC预测的集成学习模型。结果表明,基于PLS模型优选的分数阶微分阶次为0阶、0.4阶、1.1阶和1.6阶,且通过PIMP-RF算法进行特征重要性和可解释性分析结果显示,利用可见/近红外光谱预测成熟期苹果SSC的关键波长主要为可见光波段,这为今后研发新疆冰糖心红富士苹果的快速无损检测设备提供参考;基于分数阶微分技术和PIMP-RF算法构建的成熟期苹果SSC集成学习模型具有很好的预测能力,其训练集的相关系数r等于0.9892,平均绝对误差MAE等于0.2412,均方根误差RMSE等于0.3091,平均绝对百分误差等于0.0183;测试集的相关系数r等于0.9038,平均绝对误差MAE等于0.5499,均方根误差RMSE等于0.7408,平均绝对百分误差等于0.0434,相比于FD0-PIMP-RF、FD0.4-PIMP-RF、FD1.1-PIMP-RF和FD1.6-PIMP-RF模型,集成学习模型为最优。故而,集成分数阶微分技术与PIMP-RF算法,结合可见近红外光谱技术可有效地实现成熟期苹果的可溶性固形物含量预测。
展开更多
关键词
可见/近红外光谱
分数阶微分
置换重要性
-随机森林
K近邻(KNN)回归
可溶性固形物含量
在线阅读
下载PDF
职称材料
基于学生化极差分布的随机森林变量选择研究
被引量:
5
4
作者
曹桃云
陈敏琼
《统计与信息论坛》
CSSCI
北大核心
2021年第8期15-22,共8页
变量选择一直是统计分析与推断中的重要研究内容。针对该研究内容,提出一种基于随机森林的变量选择新方法。以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差...
变量选择一直是统计分析与推断中的重要研究内容。针对该研究内容,提出一种基于随机森林的变量选择新方法。以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差分布进行变量重要性得分差异是否显著的检验。根据检验的结果将变量分组,对分组变量采用逐步回归方法挑选。运用新方法在模拟设计的线性模型、二次函数模型和复杂模型上,都能够选出真正变量,验证了新方法的有效性和可行性。经典的波士顿房价数据上的运用分析给出了新方法的实用性。
展开更多
关键词
学生化极差分布
随机森林
变量选择
最小深度
重要性
置换重要性
在线阅读
下载PDF
职称材料
基于AdaBoost模型的大渡河流域中长期径流预报应用研究
被引量:
3
5
作者
李佳
曲田
+2 位作者
朱艳军
陶思铭
胡义明
《水电能源科学》
北大核心
2022年第10期10-13,共4页
以集成学习算法中的AdaBoost模型为基础,开展大渡河流域猴子岩断面未来12个月预见期(最长预见期为12个月)的中长期径流预报研究。先采用置换准确度重要性度量方法筛选各预报月份影响因子,在此基础上采用交叉验证-随机搜索方法进行模型优...
以集成学习算法中的AdaBoost模型为基础,开展大渡河流域猴子岩断面未来12个月预见期(最长预见期为12个月)的中长期径流预报研究。先采用置换准确度重要性度量方法筛选各预报月份影响因子,在此基础上采用交叉验证-随机搜索方法进行模型优化,构建了各预报月份的中长期径流预报模型。通过逐月滚动建模及滚动预报的方式评估模型在不同预见期及不同月份的真实预报效果。结果表明,不同预见期(1~12月)条件下,模型预报系列与实测系列的相关系数均大于0.9,模型具有较高的预报精度。就不同预见期预报精度的综合结果来看,1~6、8~10、12月的预报精度均大于80%;7、11月的预报精度在75%左右。2018年1~12月和2020年10月至2021年9月共12个不同预见期的平均预报精度分别为85.7%、85.1%。从中长期精度预报角度而言,模型具有较好的实用精度要求,可为流域水资源精准调配和发电效益的提高提供支撑。
展开更多
关键词
ADABOOST
置换
准确度
重要性
度量
随机搜索方法
中长期径流预报
大渡河流域
在线阅读
下载PDF
职称材料
题名
基于随机森林的变量重要性研究
被引量:
37
1
作者
曹桃云
机构
广东财经大学大数据与教育统计应用实验室
广东财经大学统计与数学学院
出处
《统计与决策》
CSSCI
北大核心
2022年第4期60-63,共4页
基金
广东省自然科学基金面上项目(2020A1515011580)
广东财经大学校级学位与研究生教育改革研究项目(2021YB08)
广东高校省级重点平台和重大科研项目特色创新项目(2018GKTSCX010)。
文摘
对变量进行重要性度量是变量选择的依据。变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景。基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述,并采用数值模拟研究了各种重要性度量的性能,为新方法的设计提供了基础。
关键词
随机森林
最小深度
分裂频次
节点纯度
置换重要性
Keywords
random forest
minimum depth
splitting frequency
the purity of nodes
substitution importance
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
O212 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
融合光谱和空间特征的土壤重金属含量极端随机树估算
被引量:
14
2
作者
于海洋
谢赛飞
郭灵辉
刘鹏
张平
机构
河南理工大学测绘与国土信息工程学院
河南理工大学自然资源部矿山时空信息与生态修复重点实验室
河南省自然资源科学研究院河南省国土资源动态监测重点实验室
河南省航空物探遥感中心遥感技术研究院
出处
《农业机械学报》
EI
CAS
CSCD
北大核心
2022年第8期231-239,共9页
基金
国家自然科学基金项目(U1304402、41977284)
河南省自然资源厅自然科技项目(2019-378-16)
文摘
针对高光谱遥感土壤重金属含量估算研究中光谱特征信息弱、模型反演鲁棒性差的问题,提出构建污染源-汇空间特征量化污染物扩散与汇聚空间影响因子,融合光谱特征建立基于极端随机树(Extremely randomized trees,ERT)的土壤重金属含量估算模型。以济源市耕地土壤为研究区,布设采集土壤样本249个,分析了光谱特征、地形特征和污染源空间特征在土壤重金属铅(Pb)、铬(Cd)含量反演中的有效性及影响机理,采用置换重要性指数优选多源特征,通过与多种回归模型对比,评价ERT模型的预测精度。研究表明,变换后的土壤光谱特征构建ERT模型引入地形特征和污染源空间特征后精度提升显著,尤其是污染源空间特征优势更为明显,Pb的ERT模型均方根误差由43.185 mg/kg下降到22.301 mg/kg,下降了48.36%。Cd的ERT模型均方根误差由0.738 mg/kg下降到0.371 mg/kg,下降了49.73%,充分说明引入污染扩散空间特征的有效性。与其他回归模型对比,ERT估算模型在各项指标评价中优势明显,其中Pb的ERT模型的测试集R^(2)达0.964,Cd的ERT模型R^(2)为0.923。
关键词
土壤
重金属
高光谱遥感
空间特征
极端随机树
置换重要性
Keywords
soil
heavy metal
hyperspectral remote sensing
spatial features
extremely randomized trees
permutation importance
分类号
X53 [环境科学与工程—环境工程]
在线阅读
下载PDF
职称材料
题名
融合分数阶微分与PIMP-RF算法的集成学习模型预测成熟期苹果可溶性固形物含量
被引量:
1
3
作者
黄华
刘亚
库尔班古丽·都力昆
曾繁琳
玛依热·麦麦提
阿瓦古丽·麦麦提
买地努尔汗·艾则孜
郭俊先
机构
新疆农业大学数理学院
新疆农业科学院综合试验场
新疆农业大学机电工程学院
出处
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2023年第10期3059-3066,共8页
基金
国家自然科学基金项目(61367001)
新疆维吾尔自治区教育厅面上重点项目(XJEDU2020I009)
+1 种基金
新疆维吾尔自治区科技厅面上基金项目(2019D01A52)
2022年度新疆农业大学大学生创新项目资助。
文摘
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC,共552个样本。然后融合分数阶微分(FD)及置换重要性-随机森林(PIMP-RF)算法,构建成熟期苹果SSC预测的集成学习模型。结果表明,基于PLS模型优选的分数阶微分阶次为0阶、0.4阶、1.1阶和1.6阶,且通过PIMP-RF算法进行特征重要性和可解释性分析结果显示,利用可见/近红外光谱预测成熟期苹果SSC的关键波长主要为可见光波段,这为今后研发新疆冰糖心红富士苹果的快速无损检测设备提供参考;基于分数阶微分技术和PIMP-RF算法构建的成熟期苹果SSC集成学习模型具有很好的预测能力,其训练集的相关系数r等于0.9892,平均绝对误差MAE等于0.2412,均方根误差RMSE等于0.3091,平均绝对百分误差等于0.0183;测试集的相关系数r等于0.9038,平均绝对误差MAE等于0.5499,均方根误差RMSE等于0.7408,平均绝对百分误差等于0.0434,相比于FD0-PIMP-RF、FD0.4-PIMP-RF、FD1.1-PIMP-RF和FD1.6-PIMP-RF模型,集成学习模型为最优。故而,集成分数阶微分技术与PIMP-RF算法,结合可见近红外光谱技术可有效地实现成熟期苹果的可溶性固形物含量预测。
关键词
可见/近红外光谱
分数阶微分
置换重要性
-随机森林
K近邻(KNN)回归
可溶性固形物含量
Keywords
Visible/near-infrared spectrum
Fractional differential
Permutation importance-random forest
K-nearest neighbors(KNN)regression
Soluble solids content
分类号
O657.3 [理学—分析化学]
在线阅读
下载PDF
职称材料
题名
基于学生化极差分布的随机森林变量选择研究
被引量:
5
4
作者
曹桃云
陈敏琼
机构
广东财经大学统计与数学学院
中山大学新华学院经济与贸易学院
出处
《统计与信息论坛》
CSSCI
北大核心
2021年第8期15-22,共8页
基金
广东省自然科学基金面上项目“机器学习方法在纵向数据分析中的稳健性研究”(2020A1515011580)
广东财经大学校级学位与研究生教育改革研究项目“科教融合视角下研究生培养模式探索与实践”(2021YB08)。
文摘
变量选择一直是统计分析与推断中的重要研究内容。针对该研究内容,提出一种基于随机森林的变量选择新方法。以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差分布进行变量重要性得分差异是否显著的检验。根据检验的结果将变量分组,对分组变量采用逐步回归方法挑选。运用新方法在模拟设计的线性模型、二次函数模型和复杂模型上,都能够选出真正变量,验证了新方法的有效性和可行性。经典的波士顿房价数据上的运用分析给出了新方法的实用性。
关键词
学生化极差分布
随机森林
变量选择
最小深度
重要性
置换重要性
Keywords
studentized range distribution
randon forests
variable selection
minimum depth importance
permutation importance
分类号
O212 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
基于AdaBoost模型的大渡河流域中长期径流预报应用研究
被引量:
3
5
作者
李佳
曲田
朱艳军
陶思铭
胡义明
机构
国能大渡河流域水电开发有限公司
河海大学水文水资源学院
出处
《水电能源科学》
北大核心
2022年第10期10-13,共4页
基金
国家自然科学基金项目(41730750)
国能大渡河流域水电开发有限公司科技项目(CEZB200505212)。
文摘
以集成学习算法中的AdaBoost模型为基础,开展大渡河流域猴子岩断面未来12个月预见期(最长预见期为12个月)的中长期径流预报研究。先采用置换准确度重要性度量方法筛选各预报月份影响因子,在此基础上采用交叉验证-随机搜索方法进行模型优化,构建了各预报月份的中长期径流预报模型。通过逐月滚动建模及滚动预报的方式评估模型在不同预见期及不同月份的真实预报效果。结果表明,不同预见期(1~12月)条件下,模型预报系列与实测系列的相关系数均大于0.9,模型具有较高的预报精度。就不同预见期预报精度的综合结果来看,1~6、8~10、12月的预报精度均大于80%;7、11月的预报精度在75%左右。2018年1~12月和2020年10月至2021年9月共12个不同预见期的平均预报精度分别为85.7%、85.1%。从中长期精度预报角度而言,模型具有较好的实用精度要求,可为流域水资源精准调配和发电效益的提高提供支撑。
关键词
ADABOOST
置换
准确度
重要性
度量
随机搜索方法
中长期径流预报
大渡河流域
Keywords
AdaBoost
replacement accuracy of importance measurement
random search method
mid-and long-term runoff forecasting
Daduhe River Basin
分类号
TV124 [水利工程—水文学及水资源]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于随机森林的变量重要性研究
曹桃云
《统计与决策》
CSSCI
北大核心
2022
37
在线阅读
下载PDF
职称材料
2
融合光谱和空间特征的土壤重金属含量极端随机树估算
于海洋
谢赛飞
郭灵辉
刘鹏
张平
《农业机械学报》
EI
CAS
CSCD
北大核心
2022
14
在线阅读
下载PDF
职称材料
3
融合分数阶微分与PIMP-RF算法的集成学习模型预测成熟期苹果可溶性固形物含量
黄华
刘亚
库尔班古丽·都力昆
曾繁琳
玛依热·麦麦提
阿瓦古丽·麦麦提
买地努尔汗·艾则孜
郭俊先
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
4
基于学生化极差分布的随机森林变量选择研究
曹桃云
陈敏琼
《统计与信息论坛》
CSSCI
北大核心
2021
5
在线阅读
下载PDF
职称材料
5
基于AdaBoost模型的大渡河流域中长期径流预报应用研究
李佳
曲田
朱艳军
陶思铭
胡义明
《水电能源科学》
北大核心
2022
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部