-
题名面向范畴类型数据的sIB算法
被引量:5
- 1
-
-
作者
叶阳东
何锡点
贾利民
-
机构
郑州大学信息工程学院计算机科学系
北京交通大学轨道交通控制与安全国家重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2009年第10期2165-2172,共8页
-
基金
国家自然科学基金(No.60773048)
-
文摘
本文针对sIB算法仅适用于共现数据的问题,提出了一种能够自动进行范畴类型数据分析的sIB算法:CD-sIB.该算法根据范畴类型数据的离散化表示、不同属性值有限的特征,进行数据的属性的拓展和二元化处理,基于属性值的出现进行X,Y的联合分布的计算,使得sIB算法可有效应用于范畴类型数据的分析.实验结果表明:CD-sIB算法相对于现有的面向范畴类型数据聚类模式分析的算法GAClust和K-modes具有明显的优势;CD-sIB算法在进行数据属性概化程度高、类数据分布相对平衡的范畴类型数据的分析中,在效率和精确度方面均很突出.
-
关键词
IB理论
SIB算法
范畴类型数据
概化
聚类
-
Keywords
IB theory
sIB algorithm
categorical data
generalization
clustering
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种自动确定参数的sIB算法
被引量:5
- 2
-
-
作者
叶阳东
刘东
贾利民
LI Gang
-
机构
郑州大学信息工程学院计算机科学系
北京交通大学轨道交通控制与安全国家重点实验室
迪肯大学信息技术学院维多利亚澳大利亚
-
出处
《计算机学报》
EI
CSCD
北大核心
2007年第6期969-978,共10页
-
基金
国家自然科学基金(600332020)
河南省自然科学基金(0411012300)资助
-
文摘
针对sIB算法的压缩变量参数的确定问题,采用最小描述长度原理,构建一种自动确定参数的AsIB算法.算法使用一种有效的编码方案对数据分析模型和相应的数据进行描述,将最小描述长度的模型作为选择标准,从而有效发现了数据蕴含的特征模式数目.实验表明:AsIB算法所采用的编码方案有效,在不设定模式数目的情况下,能够正确发现数据集所蕴含的模式.该算法解决了现sIB算法对先验知识的依赖问题,将能拓展其在多维数据的自动降维分析和模式提取等方面的应用.
-
关键词
IB理论
SIB算法
AsIB算法
最小描述长度原理
模型选择
-
Keywords
IB theory
slB algorithm
AslB algorithm
minimum description length principle
model selection
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-