-
题名面向多维混合型数据分布的混合多维直方图初探
被引量:1
- 1
-
-
作者
曹巍
王珊
-
机构
中国人民大学数据工程与知识工程教育部重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2009年第9期2487-2490,2519,共5页
-
文摘
现实世界中,多维数据分布常常不是单一一种类型,而是在不同的数据区域中呈现不同类型的数据分布。提出了一种面向多维混合型数据分布的混合多维直方图COCA*-Hist方法。这种方法在给定的空间预算下,根据数据分布空间不同的区域中的数据分布类型,可以包含多种不同类型的直方桶,从总体上提高直方图的准确性。由于需要对创建多维直方图的树结构进行二次遍历,以识别不同类型的数据分布区域并进行空间预算的重分配,COCA*-Hist时间效率略低于MHist算法,但对因此获得的准确性的提高和面对不同数据分布类型的通用性来说,是可以接受的。
-
关键词
多维直方图
数据相关性
值域密度
混合型多维数据分布
-
Keywords
multi-dimensional histograms
data correlation
value distribution density
hybrid multi-dimensional data distribution
-
分类号
TP311.132.3
[自动化与计算机技术—计算机软件与理论]
-