-
题名面向大数据集的共享近邻聚类研究
被引量:5
- 1
-
-
作者
潘章明
陈尹立
-
机构
广东金融学院计算机科学与技术系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2014年第1期50-54,共5页
-
基金
广东省教育部产学研结合项目(2011B090400466)资助
广东省教育科学规划项目(2010tjk119)资助
广东金融学院校级课题项目(11XJ04-03)资助
-
文摘
共享近邻(SNN)相似度能有效克服由高维和多密度等因素引起的聚类有效性问题,但计算效率不高.基于分治策略,提出一种改进的共享近邻聚类算法(DC-SNN).采用软划分策略将数据集分割为多个小规模子集,降低了计算SNN相似矩阵时需要搜索的数据点数量,同时,也避免了子集分割边界对数据点K近邻产生的不利影响.根据在子集中定义的核心数据点和扩展数据点,给出了子集中SNN相似矩阵的计算方法和合并策略,从而确保了以子集SNN相似矩阵表示整个数据集SNN相似矩阵的有效性.实验结果表明,DC-SNN算法能够在确保聚类精度不变的情况下,显著提高共享近邻聚类的效率.
-
关键词
共享近邻
分治法
大数据集
聚类分析
-
Keywords
shared nearest neighbor
divide and conquer
large dataset
clustering analysis
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名搜索空间边界连接的微粒群优化算法
被引量:1
- 2
-
-
作者
潘章明
唐川
-
机构
广东金融学院计算机科学与技术系
-
出处
《计算机工程与科学》
CSCD
北大核心
2012年第7期154-159,共6页
-
基金
广东省自然科学基金资助项目(8151052101000009)
-
文摘
针对粒子出界问题对微粒群优化算法收敛性能产生的不利影响,本文提出一种搜索空间边界连接的边界处理算法。该算法首先将搜索空间每一维的上下边界连接,形成一个逻辑上闭合的搜索空间,然后通过调整该空间中粒子位置的更新策略以及粒子速度更新公式中个体认知和社会认知差分向量的计算方法,消除了边界对飞行粒子的不利影响,使粒子在可行解空间中能够更加高效且均匀地搜索。实验结果表明,无论全局最优解位于搜索空间的边界区域还是中心区域,本文方法的全局搜索性能均优于现有的粒子边界处理方法。
-
关键词
边界条件
微粒群优化
搜索空间
全局优化
-
Keywords
boundary condition
particle swarm optimization
search space
global optimization
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于KD树子样的自动聚类方法
被引量:4
- 3
-
-
作者
潘章明
-
机构
广东金融学院计算机科学与技术系
-
出处
《计算机工程与科学》
CSCD
北大核心
2011年第1期166-170,共5页
-
文摘
基于进化算法的自动聚类方法具有搜索目标函数全局最优和自动发现聚类数的优点,同时也存在时间代价过高的缺陷。本文提出一种基于KD树子样的自动聚类方法,该方法使用KD树对样本空间进行分割,并在各子空间中随机取样形成KD树子样,然后在子样中自动聚类,最后运用K-Means在整个样本集中优化子样中的聚类结果。本文方法能够有效避免随机子样分布有偏的缺陷,即使比例很小的子样也能获得较好的聚类效果。仿真结果表明,本文方法能够保证聚类效果没有明显下降的情况下,显著缩短进化算法自动聚类的时间。
-
关键词
KD树
子样
差分进化
自动聚类
-
Keywords
KD-tree
subsample
differential evolution
automatic clustering
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名半监督的自动聚类
被引量:2
- 4
-
-
作者
潘章明
-
机构
广东金融学院计算机科学与技术系
-
出处
《计算机应用》
CSCD
北大核心
2010年第10期2614-2617,共4页
-
文摘
基于进化算法的自动聚类方法在处理聚类结构比较松散的数据集时,存在聚类准确性不高、收敛速度慢的缺陷,为此提出一种半监督的自动聚类算法。该算法从调整染色体的解码过程入手,首先从染色体中分离出聚类数和所有的质心,然后使用最近邻规则滤去部分偏离数据集分布区域的无效质心,最后嵌入先验信息辅助K-均值方法对剩余的质心聚类,进一步优化染色体的解码结果。实验结果表明,该算法对聚类结构紧密或松散的数据集均可给出较精确的聚类结果。
-
关键词
半监督聚类
自动聚类
差分进化
全局优化
K-均值
-
Keywords
semi-supervised clustering
automatic clustering
differential evolution
global optimization
K-means
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于亲和度累积的人工免疫网络聚类
被引量:2
- 5
-
-
作者
潘章明
-
机构
广东金融学院计算机科学与技术系
-
出处
《计算机应用》
CSCD
北大核心
2011年第6期1660-1663,共4页
-
文摘
当数据集聚类边界不清晰或存在噪声干扰时,人工免疫网络聚类算法通常无法获得有效的聚类划分。受抗体免疫差异性的启发,提出一种基于抗体亲和度累积的人工免疫网络聚类算法。该算法在抗体中引入亲和度累积及有效的更新策略,使用记忆网络中抗体的亲和度累积强度分布表达数据集的空间密度变化趋势,从而在记忆网络中通过二次免疫抑制,使网络中抗体的聚类结构更加清晰。实验结果表明,该算法对聚类边界不清晰的数据集可获得较精确的聚类划分,同时具有很强的噪声抑制能力。
-
关键词
人工免疫网络
聚类
网络抑制
亲和度
-
Keywords
artificial immune network
clustering
network suppression
affinity
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名自适应双群微粒群优化算法
被引量:2
- 6
-
-
作者
潘章明
-
机构
广东金融学院计算机科学与技术系
-
出处
《计算机应用与软件》
CSCD
2010年第7期239-241,273,共4页
-
文摘
针对微粒群优化算法PSO(Particle Swarm Optimization Algorithm)容易陷入局部最优点的缺陷,提出一种自适应双群微粒群优化算法(ATS-PSO)。该算法将种群分成两个子群,分别采用全局版本和局部版本两种不同的搜索策略,共同更新种群的历史最优解,并且在算法迭代期间根据群体适应值方差自适应调整两个子群的规模和结构。为了分析算法的性能,对几种典型的非线性函数进行了测试。结果表明,新算法的全局收敛能力有了明显改善,而且能有效缓解早熟收敛问题。
-
关键词
微粒群优化
自适应
子群
熟收敛
-
Keywords
Particle swarm optimization Adaptive Sub-swarm Premature convergence
-
分类号
TP24
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于排列的微粒群优化算法
- 7
-
-
作者
潘章明
王占刚
王泽
-
机构
广东金融学院
北京交通大学计算机学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第10期2444-2446,共3页
-
文摘
针对基本微粒群优化算法(PSO)存在陷入局部最优的问题,提出一种基于排列的改进微粒群算法(RPSO)。该算法对每次迭代过程中的个体历史最优解按照适应值的优劣顺序排列,然后选择若干个较优的个体历史最优解作为候选解,再以概率方式在候选解中确定群体历史最优解的位置。RPSO算法使基本PSO算法易于陷入局部最优的问题,得到有效的缓解。为了分析算法的性能,对几种典型的非线性函数进行了测试。实验结果表明,RPSO算法比基本PSO算法具有更好的寻优能力。
-
关键词
微粒群优化
全局优化
排列
轮盘赌选择
群体智能
-
Keywords
particle swarm optimization
global optimization
rank
roulette selection
swarm intelligence
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-