-
题名基于动态样本选择的概念漂移自适应预测方法
- 1
-
-
作者
代劲
李昊
王国胤
-
机构
重庆邮电大学软件学院
重庆邮电大学计算机学院
计算智能重庆市重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第9期3228-3239,共12页
-
基金
国家自然科学基金(No.61936001,No.62002037)
重庆市自然科学基金(No.cstc2021jcyj-msxmX0849,No.cstb2023nscq-LZX0006)。
-
文摘
概念漂移是影响流数据挖掘性能的重要因素,当前主要通过增量更新或重训练模型进行处理,但对已有知识并未充分利用.从综合利用全体样本出发,本文构建了一种基于动态样本选择的概念漂移自适应分类方法.该方法在新样本到来时进行基于局部一致性的漂移检测,在发现漂移发生时去除区域内的噪声样本,当检测到新概念出现时,对历史相似概念进行重用.最后,对区域内不同类别样本进行多代表点归纳,并同步更新预测模型.本文在含有不同漂移类型的合成数据集上进行去噪效果验证,并在真实数据集上进行预测任务.实验结果表明,该方法可以有效去除因概念漂移而形成的漂移噪声,有效提升了预测模型性能,整体预测表现优于流行的概念漂移自适应模型.
-
关键词
概念漂移
局部漂移检测
流数据
样本选择
样本去噪
自适应预测
-
Keywords
concept drift
local drift detection
stream data
sample selection
sample denoisy
adaptive forecast
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-