-
题名基于局部密度下降搜索的自适应聚类方法
被引量:6
- 1
-
-
作者
徐正国
郑辉
贺亮
姚佳奇
-
机构
盲信号处理国家科技重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2016年第8期1719-1728,共10页
-
文摘
聚类分析是数据挖掘中一个重要的研究领域,用于在无监督条件下,从混合类别的数据集中分离各样本的自然分组.根据不同的先验条件,现已提出了多种不同的聚类算法.但复杂数据集中存在的聚类个数未知、聚类形态混杂、样本分布不均匀以及类间样本数不均衡等问题,仍然是当前聚类分析研究中的重难点问题.针对这些问题,通过定义样本分布的局部密度,提出了一种利用类内密度有序性搜索聚类边界的新的聚类方法,能够实现在未知聚类个数条件下,对任意分布形态的数据样本集进行聚类.同时,通过自适应调节聚类参数来处理数据分布疏密度不一、类间样本数不均衡以及局部密度异常等特殊情况,避免样本类别被误划分和噪声数据干扰.实验结果表明,在6类典型测试集上,提出的新聚类算法均有较好的适用性,而在与典型聚类算法和最近发表的一种聚类算法的性能指标对比上,新算法也表现更优.
-
关键词
数据挖掘
聚类
局部密度
下降搜索
自适应
-
Keywords
data mining
clustering
local density
descending search
self-adaption
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于ACD模型的网络数据流时域微观特性分析
被引量:1
- 2
-
-
作者
徐正国
郑辉
邓月华
-
机构
盲信号处理国家科技重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2016年第17期11-15,共5页
-
文摘
对网络中不同类型的数据流,应用自回归条件持续期模型(ACD),分析其中存在的时域微观特性,并研究ACD模型对网络数据流时序建模的适用性。使用ACD模型为具有随机到达过程的网络数据流时间序列建模,其优点是能够在不损失原始非等间隔时间序列特性的条件下,直接分析得到数据流的时域微观性质。在对实验数据集统计特性进行研究的基础上,得出数据包到达过程适用ACD模型的基本依据,采用ACD(2,1)模型对不同类型的网络数据流时间序列进行建模,结果表明其具有较好的拟合程度。
-
关键词
自回归条件持续期
网络数据流
非等间隔采样
时间序列
-
Keywords
autoregressive conditional duration
network flow
unevenly sampling
time series
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-