-
题名基于聚簇模型重用的概念漂移数据流半监督分类算法
被引量:2
- 1
-
-
作者
康伟
黎利辉
文益民
-
机构
广西图像图形与智能处理重点实验室(桂林电子科技大学)
-
出处
《计算机科学》
CSCD
北大核心
2024年第4期124-131,共8页
-
基金
广西重点研发计划(桂科AB21220023)
国家自然科学基金(62366011)
广西图像图形与智能处理重点实验室项目(GIIP2306)。
-
文摘
带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史聚簇模型。因此,文中提出了一种新的聚簇模型重用的半监督分类算法,称为CDCMR。首先,数据流以数据块的形式到来,对数据块分完类后,训练一个簇数自适应确定的聚簇模型。其次,通过计算分类器池中的各组件分类器与聚簇模型之间的相似度,挑选多个组件分类器。再次,用当前数据块对挑选出来的组件分类器进行模型重用后,与聚簇模型集成。然后,将分类器池划分为新旧更替和多样性最大化分类器池进行更新。最后,对下一个数据块的样本进行集成分类。在多个人工和真实数据集上进行实验,结果表明,所提算法1)能有效适应概念漂移,与现有方法相比其性能有显著性提升。
-
关键词
数据流
半监督学习
概念漂移
聚簇模型重用
集成学习
-
Keywords
Data stream
Semi-supervised learning
Concept drift
Clustering model reuse
Ensemble learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-