-
题名NBCC:一种数据流上变化的挖掘算法
被引量:1
- 1
-
-
作者
马瑞民
王小龙
-
机构
大庆石油学院计算机与信息技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第7期166-168,共3页
-
文摘
针对数据流上变化的挖掘问题,提出了算法NBCC,首先利用精确抽样的方法对数据流构建概要数据结构,然后借鉴经典朴素贝叶斯分类方法的思想,将训练样本集分成Ci类,i=1,2,…,m。对测试样本集设定一个阈值!:当P(Ci|X)<!时,即当样本X属于任何已知类别Ci的概率都小于设定的!时,表明有变化发生,并且保留该变化,记为新类Cm+1,并重复使用该方法。
-
关键词
数据流
变化概要数据结构
精确抽样
朴素贝叶斯分类
阈值
-
Keywords
data streams,change,synopsis data structure,concise sampling,naive Bayes classification,threshold value
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-