题名 基于聚类集成选择的随机森林聚类方法
1
作者
李金玉
刘静玮
杜明晶
吴福玉
机构
江苏师范大学计算机科学与技术学院江苏省高校教育智能技术重点实验室
中国航天科工集团第二研究院七〇六所
出处
《计算机工程与设计》
北大核心
2025年第4期990-996,共7页
基金
国家自然科学基金项目(62006104)
江苏师范大学研究生科研与实践创新基金项目(2024XKT2591)。
文摘
为解决一些决策树受到数据噪声等因素的影响,导致它们对随机森林聚类产生有限甚至负面贡献这一问题,提出一种基于聚类集成选择的随机森林聚类方法(random forest clustering method based on cluster ensemble selection,RFCCES)。将每一棵决策树视为一个基聚类器,根据基聚类器集合的稳定和不稳定性设计两种不同的聚类集成选择方法,将评估单个决策树对随机森林的增益问题,转化为基聚类器对最终的聚类集成结果的增益问题。该算法与5种对比方法在10个数据集上进行比较,实验结果验证了RFCCES的独特优势和整体有效性。
关键词
随机森林
聚 类
决策树
稳定性
聚 类 集成
基聚 类 器
聚类集成选择
Keywords
random forest
clustering
decision tree
stability
clustering ensemble
base clusterers
cluster ensemble selection
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 一种改进的自适应聚类集成选择方法
被引量:8
2
作者
徐森
皋军
花小朋
李先锋
徐静
机构
盐城工学院信息工程学院
江苏省媒体设计与软件技术重点实验室(江南大学)
出处
《自动化学报》
EI
CSCD
北大核心
2018年第11期2103-2112,共10页
基金
国家自然科学基金(61105057
61375001)
+5 种基金
江苏省自然科学基金(BK20151299)
江苏省政策引导类计划(产学研合作)–前瞻性联合研究项目(BY2016065-01)
江苏省高等学校自然科学研究项目(18KJB520050)
江苏省媒体设计与软件技术重点实验室(江南大学)开放课题(18S T0201)
江苏省"333工程"
江苏省高校"青蓝工程"资助~~
文摘
针对自适应聚类集成选择方法 (Adaptive cluster ensemble selection, ACES)存在聚类集体稳定性判定方法不客观和聚类成员选择方法不够合理的问题,提出了一种改进的自适应聚类集成选择方法 (Improved ACES, IACES). IACES依据聚类集体的整体平均归一化互信息值判定聚类集体稳定性,若稳定则选择具有较高质量和适中差异性的聚类成员,否则选择质量较高的聚类成员.在多组基准数据集上的实验结果验证了IACES方法的有效性:1) IACES能够准确判定聚类集体的稳定性,而ACES会将某些不稳定的聚类集体误判为稳定; 2)与其他聚类成员选择方法相比,根据IACES选择聚类成员进行集成在绝大部分情况下都获得了更佳的聚类结果,在所有数据集上都获得了更优的平均聚类结果.
关键词
机器学习
聚 类 分析
聚 类 集成
聚类集成选择
Keywords
Machine learning
cluster analysis
cluster ensemble
cluster ensemble selection
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于证据空间有效性指标的聚类选择性集成
被引量:6
3
作者
毕凯
王晓丹
邢雅琼
机构
空军工程大学防空反导学院
出处
《通信学报》
EI
CSCD
北大核心
2015年第8期135-145,共11页
基金
国家自然科学基金资助项目(60975026
61273275)~~
文摘
首先针对距离空间在描述数据复杂结构信息方面的不足给出证据空间的概念。然后基于证据空间扩展有效性指标Davies-Bouldin,同时利用聚类成员的类别相关矩阵度量差异性。最后以较高有效性和较大差异性为目标选择聚类成员并用于集成。实验结果显示所提方法能够有效提高聚类集成算法的有效性。
关键词
Davies-Bouldin指标
证据空间
聚 类 选择 性集成
互相关矩阵
Keywords
Davies-Bouldin index
evidence space
cluster ensemble selection
co-association matrix
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于改进BPSO的聚类选择性集成
被引量:1
4
作者
毕凯
王晓丹
邢雅琼
机构
空军工程大学防空反导学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2016年第3期692-698,共7页
基金
国家自然科学基金(60975026
61273275)资助课题
文摘
首先针对离散二进制粒子群(binary particle swarm optimization,BPSO)容易陷入局部收敛的问题,提出一种改进的BPSO算法。在分析高斯密度函数对尺度敏感性的基础上,利用粒子群与全局最优粒子的一致性动态调节尺度参数,并利用密度函数对称区间的定积分确定全局最优粒子的变异概率。而后将聚类的选择性集成抽象为组合优化问题,利用聚类成员有效性和差异性的加权组合定义适应度并以改进BPSO的进化过程实现聚类的选择性集成。最后基于标准数据集和图像数据集验证算法的有效性。
关键词
聚 类 选择 性集成
离散二进制粒子群
高斯密度函数
图像分割
Keywords
cluster ensemble selection
binary particle swarm optimization(BPSO)
Gaussian density function
image segmentation
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于群体智慧的簇连接聚类集成算法
被引量:7
5
作者
张恒山
高宇坤
陈彦萍
王忠民
机构
西安邮电大学计算机学院
陕西省网络数据分析与智能处理重点实验室(西安邮电大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第12期2611-2619,共9页
基金
国家自然科学基金项目(61373116)
陕西省科技统筹创新工程基金项目(2016KTZDGY04-01)~~
文摘
利用群体智慧原理,将多个相互独立的聚类算法的结果进行聚合,将显著提高聚类结果的准确性.基于群体智慧的簇连接聚类集成算法,首先使用群体智慧理论的独立性、分散性、多样性原则引导个体聚类结果的生成,然后提出基于连接三元组的聚类集成算法对个体聚类结果进行分组聚合,将分组聚合的结果再次进行聚合得到最终的聚类结果.该算法的优点包括:1)通过簇的分组和权重调整,避免了对基聚类生成的簇进行选择,有利于充分利用已生成簇的信息;2)采用连接三元组算法计算数据之间的相似性,可以充分挖掘数据点之间的关系.对不同数据集的实验研究表明:该算法相对传统的集成聚类算法以及群体智慧与机器学习相结合的集成聚类算法,可以进一步提高集成聚类结果的准确性.
关键词
群体智慧
聚 类 集成
连接三元组
聚类集成选择
数据挖掘
Keywords
wisdom of crowds (WOC)
clustering ensemble
connecting triple
clustering ensemble select (CES)
data mining
分类号
TP399
[自动化与计算机技术—计算机应用技术]
题名 基于Xie-Beni指数的选择性聚类集成
6
作者
邵超
马进家
机构
河南财经政法大学计算机与信息工程学院
出处
《计算机科学》
CSCD
北大核心
2020年第S01期457-460,共4页
基金
国家自然科学基金(61806073,61907011)。
文摘
选择性聚类集成是选择一部分精度高、差异性大的基聚类结果进行集成,从而得到更为有效的聚类集成结果。然而,聚类结果的准确性难以客观度量。为此,文中提出了一种基于Xie-Beni指数的选择性聚类集成算法,该算法采用Xie-Beni指数来度量基聚类结果的有效性,利用并结合NMI(互信息)选择出精度较高的基聚类结果,从而提升聚类结果的准确性。实验结果证实了该算法的有效性。
关键词
选择 性聚 类 集成
聚 类 有效性指数
Xie-beni
NMI
Keywords
Selective clustering ensemble
Clustering validity index
Xie-beni
NMI
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于核独立分量分析的模糊核聚类神经网络集成方法
被引量:1
7
作者
李岩
王东风
韩璞
机构
华北电力大学控制科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2009年第9期3318-3320,共3页
基金
华北电力大学重大预研基金资助项目(20041306)
华北电力大学留学回国人员科研启动基金资助项目(200814002)
文摘
提出一种基于核独立分量分析的模糊核聚类神经网络集成方法。该方法首先采用核独立分量分析对高维数据进行特征提取;随后用模糊核聚类算法根据相互独立训练出的多个神经网络个体在验证集上的输出对其进行分类,并计算每一类中的所有个体在验证集上的泛化误差;然后取其中平均泛化误差最小的神经网络个体作为这一类的代表;最后经相对多数投票法得到集成的最终输出。实验结果表明,与其他集成方法相比,该方法具有较高的精确度和稳定性。
关键词
核独立分量分析
特征提取
模糊核聚 类
选择 性聚 类 集成
Keywords
kernel independent component analysis (KICA)
features extraction
kernel fuzzy C-means clustering(KFCM)
selective clustering ensemble
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]