摘要
离群点检测是数据挖掘领域的一个重要分支,当前数据流的离群点检测研究越来越受到关注.为了快速准确地检测出数据流中离群点,提出一种在线数据流离群点检测算法ODDS(outlier detection in online data stream s).它利用数据与频繁模式的相异程度来度量数据的离群程度,通过构建ODDS-Tree树,能动态地更新数据流中候选离群点的离群信息.实验结果验证了该算法与其他同类算法相比具有较高的效率与优良的可扩展性能.
Outlier detection is a significant branch in the field of data mining.Recently research on outlier detection in data stream is receiving more and more attention.In order to detect outliers in data stream fast and accurately,this paper proposes a novel method called ODDS(outlier detection in online data streams).This method measures the outlying degree of data elements by defference between frequent patterns and data elemnts.The method can dynamically update the information about candidate outliers using ODDS-Tree.The experimental results show that ODDS is efficient and scalable.
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第1期9-16,共8页
Journal of Chinese Computer Systems
基金
国家自然科学基金项目(60873030)资助
国家"八六三"高技术研究发展计划项目(2007AA01Z309)资助
国家国防预研基金项目(9140A04010209JW05049140A15040208JW0501)资助
关键词
数据流
离群点检测
频繁模式
离群因子
data streams
outlier detection
frequent pattern
outlier factor
作者简介
E-mail:txhwuhan@163.com唐向红.男,1979年生,男,博士研究生,研究方向为实时数据库系统、数据挖掘;
李国徽,男,1973年生,教授,博士生导师,研究方向为现代数据库工程、实时数据库系统;
杨观赐,男,1983年生,博士研究生,主要研究方向为智能系统,数据挖掘.