期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
融合MHSA与Boruta的电力系统暂态功角稳定关键特征筛选 被引量:1
1
作者 王曼 周小雨 +2 位作者 陈凡 赖业宁 朱瑛 《电力工程技术》 北大核心 2025年第1期155-164,共10页
现有暂态稳定特征选择方法中初始特征的选定会限制后续寻找最佳特征组合的能力,同时缺乏客观方法来确定关键特征的数量,为此,文中提出一种融合多头自注意力(multi-head self-attention,MHSA)与Boruta的暂态功角稳定关键特征筛选方法。首... 现有暂态稳定特征选择方法中初始特征的选定会限制后续寻找最佳特征组合的能力,同时缺乏客观方法来确定关键特征的数量,为此,文中提出一种融合多头自注意力(multi-head self-attention,MHSA)与Boruta的暂态功角稳定关键特征筛选方法。首先,构建深度神经网络模型,并在输入侧添加MHSA模块进行暂态稳定评估。MHSA直接面向输入的电网特征,可在模型训练过程中自适应调整注意力权重,聚焦关键特征。其次,利用Boruta算法生成真假特征组合,经过MHSA模型的训练,选择高于最大虚假特征权重的真实特征,由模型本身确定关键特征数量。最后,在IEEE 39和IEEE 118节点系统上进行算例分析。算例结果表明,所提方法可在保证评估精度的同时大幅减少输入特征的数量,相比于传统方法,可选出评估精度更高的关键特征。 展开更多
关键词 多头自注意力(MHSA) boruta算法 暂态稳定 特征选择 关键特征 虚假特征
在线阅读 下载PDF
早期心房颤动预测模型构建:基于中国人群窦性心律期间心电定量特征
2
作者 朱晓庆 石亚君 +5 位作者 沈娟 王清松 宋婷婷 修建成 陈韬 郭军 《南方医科大学学报》 北大核心 2025年第2期223-228,共6页
目的基于中国人群的心电大数据开发早期房颤风险预测模型。方法回顾性纳入2009年~2023年于解放军总医院有多次心电图检查记录的患者30383例。患者按7∶3的比例随机划分为训练集和内部测试集。使用训练集数据,采用单因素分析、LASSO回归... 目的基于中国人群的心电大数据开发早期房颤风险预测模型。方法回顾性纳入2009年~2023年于解放军总医院有多次心电图检查记录的患者30383例。患者按7∶3的比例随机划分为训练集和内部测试集。使用训练集数据,采用单因素分析、LASSO回归、Boruta算法筛选预测因子。基于Cox比例风险回归建立心电模型以及结合年龄、性别和心电模型评分的复合模型。采用受试者工作特征分析曲线下面积(AUROC)、校准曲线、决策曲线评估模型区分度、校准度及临床净获益。结果纳入患者的中位年龄为51(36,62)岁,男性占比51.1%,房颤的发生率为4.5%(1370/30383)。在心电模型中,P波相关参数及QRS波相关参数是重要预测变量。在测试集中,心电模型预测5年房颤风险的AUROC为0.77(95%CI:0.74-0.80),加入年龄和性别后的复合模型AUROC提升至0.81(95%CI:0.78-0.83),净重新分类指数为0.123,综合判别改善指数为0.04(P<0.05)。模型校准曲线斜率接近对角线。决策曲线分析显示复合模型的临床净获益在绝大多数风险阈值范围内均高于心电模型。结论基于中国人群窦性心律期间的心电图定量特征及年龄和性别开发的复合模型可有效预测未来房颤风险,为房颤的早期风险评估及预防干预提供了低成本的筛查工具。 展开更多
关键词 心电图 心房颤动 LASSO回归 boruta算法
在线阅读 下载PDF
基于随机森林模型上海市社区家庭康复护理项目医保纳入现况调查
3
作者 胡玉红 张明辉 +3 位作者 郭丽君 孙炜 黄春玉 鲍勇 《中国卫生事业管理》 北大核心 2025年第4期381-388,397,共9页
目的:调查上海市社区卫生服务机构康复护理项目纳入医保实际情况,探究康复护理纳入医保的影响因素,为开展康复护理项目提供建议。方法:采用分阶段随机整群抽样方法,对上海市36家社区卫生服务机构进行问卷调查。采用Spearman相关分析探... 目的:调查上海市社区卫生服务机构康复护理项目纳入医保实际情况,探究康复护理纳入医保的影响因素,为开展康复护理项目提供建议。方法:采用分阶段随机整群抽样方法,对上海市36家社区卫生服务机构进行问卷调查。采用Spearman相关分析探讨康复护理项目纳入医保的单相关因素,采用Boruta算法进行特征筛选,将相关性分析和特征筛选结果综合,纳入二元Logistic回归模型来探索是否将康复护理项目纳入医保的影响因素。结果:27.78%的机构将康复护理纳入医保支付,Spearman相关分析显示是否将康复指导项目纳入医保支付呈显著的正相关(r=0.531,P<0.05),而推荐康复指导家庭项目(r=-0.482,P<0.05)、推荐康复护理家庭项目(r=-0.446,P<0.05)则呈显著的负相关。Boruta算法显示是否将康复指导纳入医保支付、推荐家庭康复护理项目、推荐家庭康复指导项目为重要变量,家庭病床数、职工医保结算方式、常住人口数、康复床位数为暂定变量。二元Logistic回归显示是否将康复指导项目纳入医保支付(OR=10.994,95%CI:1.583~76.342)、推荐康复护理家庭项目进入方程(OR=0.108,95%CI:0.015~0.801),且结果显著。结论:应该规范康复护理及康复指导定义,制定合理康复护理收费标准;将家庭康复护理项目纳入长期护理保险服务范畴;多方面加强家庭康复护理的发展,加大对家庭照护者康复护理知识普及。 展开更多
关键词 康复护理项目 医保支付 boruta算法 现况
在线阅读 下载PDF
构建和验证乳腺癌患者麻醉苏醒延迟风险的机器学习网络计算器
4
作者 葛亮 冷玉芳 +2 位作者 张鹏 孔令国 韩旭东 《中国临床药理学与治疗学》 北大核心 2025年第9期1182-1192,共11页
目的:基于机器学习(ML)模型构建网络计算器预测乳腺癌(BC)患者麻醉苏醒延迟风险。方法:选取本院2023年1月至2024年6月手术治疗的435例BC患者。使用Boruta算法筛选麻醉苏醒延迟风险重要特征变量。根据3∶2比例将所有患者随机分配为训练集... 目的:基于机器学习(ML)模型构建网络计算器预测乳腺癌(BC)患者麻醉苏醒延迟风险。方法:选取本院2023年1月至2024年6月手术治疗的435例BC患者。使用Boruta算法筛选麻醉苏醒延迟风险重要特征变量。根据3∶2比例将所有患者随机分配为训练集(n=261)和测试集(n=174)并构建和训练9种ML模型。根据10次随机抽样的受试者工作特征(ROC)曲线评估9种ML模型并使用决策曲线分析评估模型临床实用价值。结合SHapley加法解释(SHAP)条形图、摘要图和力图附加解释和可视化ML模型。使用R包构建预测BC患者麻醉苏醒延迟风险的网络计算器。结果:435例BC患者中,25.1%患者出现麻醉苏醒延迟。Boruta算法筛选出7个特征变量。ROC曲线显示9种ML模型中XGBoost模型的10次随机抽样的曲线下面积(AUC)最高,决策曲线显示XGBoost模型具有显著临床净收益。SHAP条形图显示重要性排序为ASA分级、手术时间、麻醉时间、术中失血量、丙泊酚、术前贫血和术中低体温。SHAP摘要图反映7个重要特征变量的影响范围分布,呈“两端分离”现象。SHAP力图可视化XGBoost模型预测单个患者麻醉苏醒延迟风险,麻醉苏醒延迟患者预测值为0.998,无麻醉苏醒延迟患者预测值为0.00891。基于可解释XGBoost模型的网络计算器(https://xz-nomogram.shinyapps.io/DE_web/)能有效预测BC患者麻醉苏醒延迟风险。结论:ASA分级、手术时间、丙泊酚、术中失血量、麻醉时间、术前贫血和术中低体温是BC患者麻醉苏醒延迟风险重要特征变量。基于可解释XGBoost模型的网络计算器能准确快捷定量麻醉苏醒延迟风险,有助于临床医生有效调整治疗策略,更好改善患者预后。 展开更多
关键词 乳腺癌 麻醉苏醒延迟 机器学习 boruta算法 SHAP XGBoost模型 网络计算器
在线阅读 下载PDF
基于机器学习构建全髋置换术患者术后谵妄风险的预测模型
5
作者 王小锋 蔡宁 +2 位作者 王建彭 杨芳芳 王秋锋 《临床麻醉学杂志》 北大核心 2025年第10期1021-1027,共7页
目的 基于Shapley加性解释(SHAP)和机器学习(ML)模型构建预测全髋置换术(THA)患者术后谵妄(POD)风险预测模型并开发在线应用程序。方法 选择2023年1月至2024年11月行THA的患者277例,男76例,女201例,年龄≥65岁,BMI 18.5~30.0 kg/m^(2),... 目的 基于Shapley加性解释(SHAP)和机器学习(ML)模型构建预测全髋置换术(THA)患者术后谵妄(POD)风险预测模型并开发在线应用程序。方法 选择2023年1月至2024年11月行THA的患者277例,男76例,女201例,年龄≥65岁,BMI 18.5~30.0 kg/m^(2),ASAⅠ—Ⅲ级。通过Boruta算法筛选THA患者发生POD的风险因素。基于风险因素构建、训练和比较6种ML模型,使用受试者工作特征(ROC)曲线和校准曲线评估6种ML模型,筛选最佳预测性能模型。使用SHAP值对ML模型进行解释和可视化,并使用Shiny等R包开发预测THA患者POD风险的在线应用程序。结果 有65例(23.8%)患者发生POD。Boruta算法筛选出麻醉时间、C-反应蛋白(CRP)浓度、年龄、顺式阿曲库铵用量、七氟醚用量、术中失血量、手术时间以及白蛋白(Alb)浓度是THA患者发生POD的风险因素。6种ML算法中,ROC曲线和校准曲线证实极端梯度提升(XGBoost)模型预测POD风险性能最高。基于SHAP值附加解释和可视化XGBoost模型能以极高准确度预测POD风险。在线应用程序网址https://mldynamic.shinyapps.io/PD-web/。结论 麻醉时间、CRP浓度、年龄、顺式阿曲库铵用量、七氟醚用量、术中失血量、手术时间以及Alb浓度是THA患者发生POD的风险因素。基于SHAP值解释的XGBoost模型有极高的预测性能,基于此开发的在线应用程序能帮助使用者快捷计算THA患者POD风险,优化治疗方案。 展开更多
关键词 全髋置换术 术后谵妄 机器学习 boruta算法 Shapley加性解释
在线阅读 下载PDF
基于Boruta-支持向量回归的安徽省土壤pH值预测制图 被引量:14
6
作者 卢宏亮 赵明松 +2 位作者 刘斌寅 张平 陆龙妹 《地理与地理信息科学》 CSCD 北大核心 2019年第5期66-72,共7页
以安徽省为研究区域,将Boruta算法用于特征筛选,选择最优变量组合输入支持向量回归(SVR)模型,经参数优化和核函数对比后,选择最优的SVR预测模型进行土壤pH值空间分布制图。结果表明:1)使用Boruta算法筛选后的特征变量建模优于全部变量建... 以安徽省为研究区域,将Boruta算法用于特征筛选,选择最优变量组合输入支持向量回归(SVR)模型,经参数优化和核函数对比后,选择最优的SVR预测模型进行土壤pH值空间分布制图。结果表明:1)使用Boruta算法筛选后的特征变量建模优于全部变量建模;特征变量重要性分析表明,年均降水(MAP)是影响安徽省土壤pH值的最重要因素,多尺度山谷平坦指数(MrVBF)、多尺度山脊平坦指数(MrRTF)和年均温(MAT)等特征变量均对土壤pH值有较重要的影响。2)选择径向基函数(RBF)作为核函数建立SVR模型进行土壤pH值预测最为合理;参数C=1,γ=0.125时,SVR模型精度最高,可以解释土壤pH值变异的74%,验证集R^2为0.62。3)土壤pH值预测制图结果表明,安徽省土壤pH值空间分布呈由北至南逐渐降低的趋势,符合“南酸北碱”特征,且预测制图的统计结果与样本点的统计结果基本一致。将Boruta算法与SVR模型结合可以提高土壤pH值的预测制图精度,且模型的泛化能力较强。 展开更多
关键词 土壤pH值预测 boruta算法 核函数 支持向量机回归 安徽省
在线阅读 下载PDF
基于遥感的北京市森林地上碳储量监测 被引量:2
7
作者 贺晨瑞 庞丽峰 +2 位作者 谭炳香 黄逸飞 孙学霞 《西北林学院学报》 CSCD 北大核心 2024年第3期162-170,265,共10页
城市是CO_(2)排放的主要区域,推动城市碳减排与低碳发展对于早日实现“双碳”战略具有重要帮助。城市森林碳储量是反映城市CO_(2)吸收能力和评估生态系统质量的重要指标。以北京市森林为对象,以Landsat8OLI遥感影像、数字高程和森林资... 城市是CO_(2)排放的主要区域,推动城市碳减排与低碳发展对于早日实现“双碳”战略具有重要帮助。城市森林碳储量是反映城市CO_(2)吸收能力和评估生态系统质量的重要指标。以北京市森林为对象,以Landsat8OLI遥感影像、数字高程和森林资源二类调查数据为数据源,采用逐步回归分析、递归消除算法和Boruta算法进行特征选择,然后采用多元线性回归模型、BP神经网络、随机森林算法以及极端梯度提升算法模型(XGBoost)进行北京市森林AGC模型构建,最后选择效果最好的模型对北京市整体森林AGC进行反演估测。结果表明:1)基于Boruta算法选择特征集进行4种AGC模型构建时,其R 2是最好的,优于SRA与RFE选择方法;2)XGBoost算法构建的森林AGC模型的精度最高,其根据Boruta算法选择特征集得到的训练集、测试集R^(2)、RMSE、RRMSE分别为0.95、0.69、3.16、5.18、17.70%、21.49%;3)2014年北京市总体森林AGC为8931820.34 t,与实际值差距较小;在空间分布上均呈西北部高、中部及东南部低的现象;密云区、怀柔区及延庆区森林AGC较多,而朝阳区、丰台区及石景山区较少。总体上说,基于Boruta的特征选择与现代集成的XGBoost森林AGC模型有着较好的估测效果。该研究为超大城市森林AGC精准监测提供了技术支撑。 展开更多
关键词 城市森林 碳储量 XGBoost模型 boruta算法 北京市
在线阅读 下载PDF
基于随机森林的高速公路变路径偷逃费行为识别 被引量:1
8
作者 邹杰 曹宏禄 +2 位作者 李平安 黄诗音 赵建东 《科学技术与工程》 北大核心 2024年第36期15694-15700,共7页
为提高高速公路变路径偷逃费行为识别效率,针对改变路径偷逃费行为进行研究,建立一种基于随机森林的高速公路变路径偷逃费行为识别模型,能够有效识别该类偷逃费行为,协助高速公路相关管理部门追缴偷逃费用。首先,分析原始收费数据,筛选... 为提高高速公路变路径偷逃费行为识别效率,针对改变路径偷逃费行为进行研究,建立一种基于随机森林的高速公路变路径偷逃费行为识别模型,能够有效识别该类偷逃费行为,协助高速公路相关管理部门追缴偷逃费用。首先,分析原始收费数据,筛选出与本次研究相关的字段,经过运算得到12个模型可输入的初始特征;然后,通过计算各个特征的方差膨胀因子(variance inflation factor,VIF)和容忍度(tolerance,TOL)值来剔除存在共线性的特征,并利用Boruta算法筛选高重要性特征(“行驶方向是否一致”“入出站是否一致”“通行时间”和“最小费额里程”);其次,使用SMOTETomek综合采样技术来平衡数据集;再其次,利用网格搜索法对随机森林进行超参数调优;最后,利用所建立模型进行训练和识别,并与基准模型的识别效果进行对比。结果表明:所建立模型能够更好地对高速公路变路径偷逃费行为进行识别,Macro-F1分数达到了0.966,优于极限梯度提升(extreme gradient boost,XGBoost)(0.9431)、决策树(decision tree,DT)(0.9563)和梯度提升决策树(gradient boosting decision trees,GBDT)(0.9382),能够为运营管理部门稽查该类偷逃费车辆提供参考。 展开更多
关键词 随机森林(RF) 改变路径偷逃费 boruta算法 数据不平衡处理
在线阅读 下载PDF
可视化影像决策模型在评估肺结节浸润程度中的价值 被引量:3
9
作者 张榕 蔡宏杰 +5 位作者 梁演婷 洪敏萍 刘子蔚 杨少民 王华峰 胡秋根 《放射学实践》 CSCD 北大核心 2024年第8期1032-1039,共8页
目的:探讨基于临床资料、影像征象和影像组学特征构建的联合模型在术前对肺结节浸润程度的预测价值,并通过决策热图及Shapley算法对模型进行可视化分析。方法:回顾性搜集2018年1月-2022年3月在本院经病理确诊的179例肺结节患者的临床资... 目的:探讨基于临床资料、影像征象和影像组学特征构建的联合模型在术前对肺结节浸润程度的预测价值,并通过决策热图及Shapley算法对模型进行可视化分析。方法:回顾性搜集2018年1月-2022年3月在本院经病理确诊的179例肺结节患者的临床资料和术前CT图像(肺窗平扫)。根据肺肿瘤新分类,分为腺体前驱病变组(78例)和浸润性肺腺癌组(101例)。采用Deepwise软件,分别提取瘤灶、瘤周3 mm和5 mm区域的影像组学特征。使用单因素分析、相关性分析、Boruta算法和逐步logistic回归分析等特征筛选算法确定各区域的最佳组学特征,然后采用logistics方法分别构建3个单区域及2个多区域(肿瘤+瘤周3 mm及肿瘤+瘤周5 mm)共5个影像组学模型,分析各模型的预测效能并计算其影像组学评分(Radsocre)。通过单因素和多因素logistic回归方法筛选相关临床指标和结节的主要CT征象,并采用XGBoost算法将筛选出的高危因素结合瘤灶+瘤周3 mm联合模型的影像组学得分构建临床影像联合模型。额外收集浙江省嘉兴市中医医院经病理证实的69例肺结节患者的临床和CT资料来完成联合模型的泛化性验证。利用决策热图和Shapley算法对模型分别进行可视化和特征贡献度分析。结果:相比单区域影像组学模型(训练集:AUC=0.740、0753、0.768;验证集:AUC=0.841、0.856、0.809),多区域影像组学模型在两个数据集中均显示出更高的预测效能(AUC=0.878和0.834)。XGBoost联合模型的预测效能得到进一步地提高(AUC=0.948和0.886)。Shapley分析显示影像组学得分、CT值和结节长度为预测肺结节浸润程度的最重要的3个特征。决策热图算法实现了对浸润性预测推演过程的可视化。结论:XGBoost模型对肺结节浸润性的评估具有较高的准确性和泛化性。决策热图实现了可解释机器学习算法的可视化从而保障了模型的实用性,为肺结节的临床处理及管理提供了一种无创性的辅助诊断工具。 展开更多
关键词 肺结节 浸润程度 瘤周 影像组学 boruta算法 XGBoost算法 Shapley算法
在线阅读 下载PDF
基于模态分解及注意力机制长短时间网络的短期负荷预测 被引量:33
10
作者 乔石 王磊 +2 位作者 张鹏超 闫群民 王桂宝 《电网技术》 EI CSCD 北大核心 2022年第10期3940-3951,共12页
短期电力负荷受多种因素影响,具有波动性大、随机性强的特点,使得高精度的短期负荷预测比较困难。为充分提取负荷数据中的特征,提升短期负荷预测精度,提出了一种基于模态分解及注意力机制长短时间网络(long and short-term temporal net... 短期电力负荷受多种因素影响,具有波动性大、随机性强的特点,使得高精度的短期负荷预测比较困难。为充分提取负荷数据中的特征,提升短期负荷预测精度,提出了一种基于模态分解及注意力机制长短时间网络(long and short-term temporal networks with attention,LSTNet-Attn)的短期负荷预测模型。首先该模型采用自适应白噪声的完整经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)对包含大量高频分量且频率成分复杂的原始负荷时间序列进行处理,经频率分离后得到若干个包含不同频率成分的本征模函数(intrinsic mode functions,IMF)。其次,在采集特征的基础上构建日期特征,并通过Boruta算法优化输入数据维度冗余问题。然后,在上述基础上构建LSTNet-Attn预测模型,模型包括卷积模块、循环跳过模块、自回归(autoregressive,AR)模块和注意力机制模块。卷积模块和循环跳过模块提取输入负荷数据中高度非线性的长短期特征和线性特征;AR模块优化神经网络对线性特征识别不敏感问题;注意力机制实现对重要特征分配更多权重以捕获全局与局部的联系,优化模型提升预测精度。最后采用于麻省理工数据集进行实例验证,并与常用预测模型进行对比研究和模型消融研究,证明该模型有效提高了负荷预测的精确性。 展开更多
关键词 短期负荷预测 CEEMDAN boruta算法 LSTNet 注意力机制
在线阅读 下载PDF
不同联合方式的瘤内与瘤周影像组学特征对肺腺癌的诊断价值研究 被引量:9
11
作者 陈小波 郭馨雨 +2 位作者 于哲轩 许茂盛 周长玉 《中国医学计算机成像杂志》 CSCD 北大核心 2021年第4期289-295,共7页
目的:对比瘤内、瘤周及不同联合方式的影像组学方法对肺腺癌及良性结节的诊断价值。方法:回顾性分析经病理确诊的肺结节(恶性161例,良性134例),依次从瘤内[肿瘤区(GTV)]、瘤周[肿瘤周围区(PTV);分别外扩0~3mm和3~5mm,记为PTV_(3)和PTV_(... 目的:对比瘤内、瘤周及不同联合方式的影像组学方法对肺腺癌及良性结节的诊断价值。方法:回顾性分析经病理确诊的肺结节(恶性161例,良性134例),依次从瘤内[肿瘤区(GTV)]、瘤周[肿瘤周围区(PTV);分别外扩0~3mm和3~5mm,记为PTV_(3)和PTV_(5)]、瘤内和瘤周总区域(GPTV;瘤内至瘤周3mm和5mm,记为GPTV_(3)和GPTV_(5)]中提取1037个影像组学特征。按照7∶3随机划分为训练集(207例)和验证集(88例)。通过单因素分析和Boruta算法,筛选得到潜在预测性的组学特征,最后构建logistic逐步回归模型。通过受试者操作特征(ROC)曲线下面积(AUC)评价模型效能,DeLong检验比较不同模型的效能。结果:PTV模型(AUC_(PTV3)=0.892,AUC_(PTV5)=0.858)和GPTV模型(AUC_(GPTV3)=0.859,AUC_(GPTV5)=0.833)效能均低于GTV模型(AUC_(GTV)=0.916),GTV和PTV特征联立的组合模型(AUC_(Combined3)=0.952,AUC_(Combined5)=0.953)效能则高于GTV和相应的GPTV模型(P<0.05)。结论:相比于GPTV,GTV和PTV特征联立的组合方法在肺腺癌及良性结节鉴别中具有更高的价值。 展开更多
关键词 计算机体层成像 肺腺癌 影像组学 boruta算法
在线阅读 下载PDF
吉林省极端降水事件对玉米产量的影响研究 被引量:5
12
作者 张耀东 郭恩亮 +2 位作者 王永芳 顾锡羚 康尧 《中国农村水利水电》 北大核心 2023年第1期52-61,共10页
吉林省作为我国玉米种植主产区,探究该地区玉米生长发育及产量对极端降水事件的敏感性和响应机制显得尤为重要。基于吉林省24个气象站点1961-2019年的逐日最高、最低气温和降水数据以及各站点的玉米单产数据,采用5年滑动平均、森式斜率... 吉林省作为我国玉米种植主产区,探究该地区玉米生长发育及产量对极端降水事件的敏感性和响应机制显得尤为重要。基于吉林省24个气象站点1961-2019年的逐日最高、最低气温和降水数据以及各站点的玉米单产数据,采用5年滑动平均、森式斜率、M-K非参数检验等方法对吉林省极端降水事件和玉米产量时空变化特征进行分析,并利用皮尔逊相关性分析法、布尔塔(Boruta)算法定量厘定极端降水事件对玉米产量的影响。结果表明:强降水量(R95p)、雨日降水总量(PRCPTOT)、大雨日数(R20)、普通日降水强度(SDII)的Sen斜率值分别为0.301 mm/a、-0.18 mm/a、0.31 d/a、0.27 mm/(d·a),除PRCPTOT以外均呈上升趋势,表明极端降水事件逐渐增多;玉米实际单产与趋势产量均呈显著上升趋势;玉米气候产量在-1 802.24~1 579.04 kg/hm^(2)区间内呈波动下降趋势,年际间差异较大;玉米相对气候产量在59 a间,有11个气候丰年、10个气候歉年,其余年份为正常年份;玉米气候产量与极端降水指数整体在西北部以及东部地区呈正相关,在南部呈负相关;结合多项式拟合曲线分析可知,当R95p≥190 mm,PRCPTOT≥610 mm,R20mm≥8 d时,玉米气候产量呈逐渐下降的态势;R20、R95p对玉米气候产量的重要性程度较高,表明玉米气候产量对极端降水日数及极端降水量的敏感性较强。研究结果有助于吉林省提出针对性农业适应气候变化措施以提高粮食安全水平。 展开更多
关键词 极端降水事件 玉米产量 时空特征 boruta算法 吉林省
在线阅读 下载PDF
重庆市2009—2016年细菌性痢疾空间流行病学特征及基于气象要素的预测模型研究 被引量:12
13
作者 刘勋 孟秋雨 +3 位作者 谢佳伽 肖达勇 王怡 邓丹 《上海交通大学学报(医学版)》 CAS CSCD 北大核心 2019年第2期187-192,共6页
目的·分析重庆市细菌性痢疾的空间流行病学特征及其与气象要素的相关性,并构建其发病率预测模型,为重庆市细菌性痢疾疫情的防控提供科学依据。方法·收集2009—2016年重庆市细菌性痢疾及气象要素数据,并进行描述性流行病学分析... 目的·分析重庆市细菌性痢疾的空间流行病学特征及其与气象要素的相关性,并构建其发病率预测模型,为重庆市细菌性痢疾疫情的防控提供科学依据。方法·收集2009—2016年重庆市细菌性痢疾及气象要素数据,并进行描述性流行病学分析,采用时空扫描统计量进行细菌性痢疾时空聚集性分析,运用DCCA系数法量化细菌性痢疾发病率与气象要素的相关性,运用Boruta算法结合粒子群优化算法(particle swarm optimization,PSO)及支持向量机回归模型(support vector machine for regression,SVR)构建细菌性痢疾发病率预测模型。结果·①2009—2016年重庆市细菌性痢疾年均报告发病率为29.394/100 000,0~5岁年龄组发病率(295.892/100 000)最高,散居儿童占比(50.335%)最大,5月—10月为其季节性发病高峰;细菌性痢疾呈现显著的时空聚集性,一类聚集区主要集中在重庆市主城区,二类聚集区主要集中在重庆市东北地区;6月—10月为其主要的聚集时间。②与人群细菌性痢疾发病率具有很强相关性的气象要素分别为月平均气压(ρ_(DCCA)=-0.918)、月平均最高气温(ρ_(DCCA)=0.875)及月平均气温(ρ_(DCCA)=0.870)。③基于气象要素构建的PSO_SVR模型均方误差(mean squared error,MSE)、平均绝对百分比误差(mean absolute percentage error,MAPE)、平方相关系数(square correlation coefficient,R2)分别为0.055、0.101及0.909。结论·重庆市主城区及渝东北地区应作为细菌性痢疾的重点防控区域,同时相关卫生部门应结合气象要素与细菌性痢疾发病率的密切相关性及其季节性高发特点,对0~5岁儿童、散居儿童、农民等人群采取针对性的应对措施以控制细菌性痢疾传播与流行。基于气象要素建立的PSO_SVR模型预测性能良好,可为细菌性痢疾的防控提供有力的理论支撑。 展开更多
关键词 细菌性痢疾 空间流行病学 DCCA系数法 boruta算法 粒子群优化算法 支持向量机回归模型
在线阅读 下载PDF
基于Boruta+PSO-MLP模型的中央空调系统能耗预测
14
作者 赵昱 颜承初 +3 位作者 郭霖 程远达 王昊博 龚雷阳 《太原理工大学学报》 2025年第6期1154-1161,共8页
【目的】空调能耗在整个建筑能耗中具有重要的地位,建立空调系统能耗模型可以帮助建筑运营人员制定精确的能源管理计划,优化建筑能耗设备的运行,实现智能化的能源管理。【方法】提出一种混合空调系统能耗组合预测模型,利用粒子群优化算... 【目的】空调能耗在整个建筑能耗中具有重要的地位,建立空调系统能耗模型可以帮助建筑运营人员制定精确的能源管理计划,优化建筑能耗设备的运行,实现智能化的能源管理。【方法】提出一种混合空调系统能耗组合预测模型,利用粒子群优化算法(Particle Swarm Optimiza⁃tion,PSO)对多层感知机(Multi-Layer Perceptron,MLP)的超参数进行优化,并使用Boruta对数据集进行特征选择,建立PSO-MLP模型来预测系统能耗。【结果】研究结果表明,基于Boruta+PSOMLP的能耗预测模型能够更准确地预测建筑空调能耗,对比单一的MLP模型,平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)分别降低了57.3%和49.7%,相关系数达到了0.962。 展开更多
关键词 中央空调 能耗预测 boruta特征选择 粒子群优化算法 多层感知机
在线阅读 下载PDF
基于改进Apriori的网络高维数据关联特征挖掘
15
作者 王灵 侯春明 《现代电子技术》 2025年第24期67-71,共5页
为可靠挖掘具有维度高、倍增特点且呈稀疏分布的网络数据之间的关联特征,提出一种基于改进Apriori的网络高维数据关联特征挖掘方法。采用Boruta算法在原始网络高维数据中筛选出最具有代表性的特征,并有效处理其中的冗余特征数据;通过K... 为可靠挖掘具有维度高、倍增特点且呈稀疏分布的网络数据之间的关联特征,提出一种基于改进Apriori的网络高维数据关联特征挖掘方法。采用Boruta算法在原始网络高维数据中筛选出最具有代表性的特征,并有效处理其中的冗余特征数据;通过K最近邻插补子空间聚类算法插补选择的特征数据,以提升特征数据的完整性和连续性;利用改进Apriori算法挖掘插补后的特征数据集,结合关联规则支持度、置信度和提升度的计算结果确定多个关联规则强度,更好地判断特征之间的关联程度,实现网络高维数据关联特征的挖掘。测试结果表明:所提方法具有较好的特征选择能力,归一化互信息结果均在0.909以上,特征冗余程度均低于0.0155;且能够较好地实现缺失特征插补处理,并依据设定阈值范围完成网络高维数据关联特征挖掘。 展开更多
关键词 高维数据 关联特征挖掘 数据插补 Apriori算法 boruta算法 特征选择
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部