-
题名基于孤立森林采样策略的企业异常用水模式检测
被引量:1
- 1
-
-
作者
林青轩
郭强
邓春燕
王雅静
刘建国
-
机构
上海理工大学复杂系统科学研究中心
上海财经大学会计与财务研究院
-
出处
《复杂系统与复杂性科学》
EI
CSCD
2020年第3期47-51,共5页
-
基金
国家自然科学基金(61773248,71771152)
国家社科重大基金(18ZDA088,20ZDA060)。
-
文摘
为解决企业异常用水模式检测过程中的低频短时间序列数据和不平衡分类问题,提出了一种基于孤立森林采样策略的二分类预测方法。首先构造用水波动性特征和统计性特征,利用孤立森林算法计算多数类中样本点的“孤立”程度以衡量每个样本的“代表性”,再按样本“代表性”排序,对“代表性”高的样本优先进行采样;然后将抽取出的样本与少数类合并,构成较平衡的训练样本集;最后利用较平衡的数据集训练XGBoost分类器并进行预测。在某市的7604家企业13个月的用水量数据集上,该方法对企业异常用水模式的预测结果AUC和查全率可达到0.927和0.891,比基于随机欠采样的XGBoost方法的0.885和0.733分别提升了4.7%和21.6%。
-
关键词
异常用水模式检测
不平衡分类
孤立森林
XGBoost
-
Keywords
abnormal water consumption pattern detection
unbalanced classification
isolation forest
XGBoost
-
分类号
N94
[自然科学总论—系统科学]
TP391
[自动化与计算机技术—计算机应用技术]
-