-
题名基于量子蚁群优化的近邻传播聚类算法研究
被引量:5
- 1
-
-
作者
郑冬花
叶丽珠
刘月红
牛少华
-
机构
广州商学院信息技术与工程学院
马来西亚管理与科学大学研究生院
桂林理工大学信息科学与工程学院
北京理工大学机电学院
-
出处
《南京理工大学学报》
CAS
CSCD
北大核心
2022年第4期412-418,共7页
-
基金
国家自然科学基金(61961010)
广东省高等教育学会项目(21GYB08)
+3 种基金
广州市哲学社会科学发展规划项目(2021GZGJ145)
广东省高等学校特色专业建设项目(2020SJTSZY01)
广东省普通高校特色创新类项目(2021KTSCX150)
教育部高等教育司产学合作协同育人项目(202002030019)。
-
文摘
为了提高近邻传播聚类性能,引入偏向参数的量子蚁群优化策略,增强聚类适用性。进行样本初始化,获得相似矩阵及偏向参数随机值。采用蚁群算法优化偏向参数:输入近邻传播算法的偏向参数作为蚂蚁个体构建蚁群,将聚类准确度作为蚁群最佳路径适应度进行优化求解;为了提高蚁群最优路径搜索精度,对蚁群位置采用量子比特编码,细化蚁群个体位置更新粒度;通过信息素值变化不断选择优化路径,从而获得最优偏向参数。采用量子蚁群优化算法获得的最优偏向参数进行聚类运算,获得稳定的聚类结果。试验证明,通过合理设置蚁群的概率因子、启发因子和蒸发因子等参数,相比于常用聚类算法,基于量子蚁群的近邻传播聚类可以获得更高的聚类综合性能。
-
关键词
聚类
近邻传播
蚁群优化算法
量子编码
聚类适用性
偏向参数
-
Keywords
clustering
affinity propagation
ant colony optimization algorithm
quantum coding
clustering applicability
bias parameter
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名基于鲸群优化随机森林算法的非平衡数据分类
被引量:16
- 2
-
-
作者
叶丽珠
郑冬花
刘月红
牛少华
-
机构
广州商学院信息技术与工程学院
马来西亚管理与科学大学研究生院
桂林理工大学信息科学与工程学院
北京理工大学机电学院
-
出处
《南京邮电大学学报(自然科学版)》
北大核心
2022年第6期99-105,共7页
-
基金
国家自然科学基金(61961010)
广东省高等学校特色专业建设项目(2020SJTSZY01)
+2 种基金
广东省“十四五”规划高等教育研究课题(21GYB08)
广东省普通高校特色创新类项目(2021KTSCX150)
广西省自然科学基金青年基金(2018GXNSFBA050029)资助项目。
-
文摘
为了提高非平衡数据分类的准确性,采用随机森林算法用于数据分类,并结合鲸鱼优化算法对随机森林弱分类器权重进行优化求解,以增强随机森林算法对非平衡数据分类的适应性。首先,建立基于随机森林的非平衡数据分类模型。通过随机森林的多个决策树弱分类器进行分类,有效解决样本不均衡导致的分类困难问题。接着,采用鲸群优化算法对弱分类器权重进行优化求解,将分类准确率均值作为鲸群优化适应度函数,以提高弱分类器权重投票对最终分类结果的精度。最后,采用经过鲸群优化得到的随机森林模型进行非平衡数据分类。实验证明,通过合理设置鲸群优化算法参数,可以获得分类准确度更高的随机森林弱分类器权重,相较于常用非平衡数据分类算法,文中算法能够获得更优的分类性能。
-
关键词
非平衡数据分类
随机森林
鲸群优化算法
弱分类器
决策树
-
Keywords
unbalanced data classification
random forest
whale swarm optimization algorithm
weak classifier
decision tree
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向高维数据的人工蜂群优化密度峰值聚类
被引量:4
- 3
-
-
作者
叶丽珠
郑冬花
隋栋
吴迪
-
机构
广州商学院信息技术与工程学院
马来西亚管理与科学大学研究生院
北京建筑大学电气与信息工程学院
哈尔滨工程大学计算机科学与技术学院
-
出处
《南京理工大学学报》
CAS
CSCD
北大核心
2022年第3期291-297,共7页
-
基金
国家自然科学基金(61702026)
教育部高等教育司基金(202002030019)
+2 种基金
广东省高等学校特色专业建设项目(2020SJTSZY01)
广东省高等教育学会“十四五”规划2021年度高等教育研究课题(21GYB08)
广州市哲学社会科学发展“十四五”规划(2021GZGJ24)。
-
文摘
为了提高复杂高维数据的聚类性能,采用改进的密度峰值聚类(DPC)方法进行聚类分析。首先计算各样本点之间的距离,结合核函数获得各样本点的密度和距离,然后选择两者均较大的点作为聚类中心点,再根据剩余节点和各中心点的距离设定剩余节点所属类别。引入人工蜂群(ABC)算法对DPC进行优化。将距离阈值作为ABC算法的蜜源进行搜索优化,采用ABC-DPC算法对高维数据样本进行聚类分析,获得样本类别。分别采用模糊聚类、决策树、卷积神经网络(CNN)、非参数密度峰值聚类和ABC-DPC算法对样本进行仿真。ABC-DPC算法的聚类准确率最高,非参数密度峰值聚类算法次之,模糊聚类算法最差。在seeds集上ABC-DPC算法的聚类准确率为0.8675。ABC-DPC和非参数密度峰值聚类算法的聚类准确率的标准差性能较好,明显优于模糊聚类和决策树算法。ABC-DPC算法在seeds集上获得了最优标准差0.2513。
-
关键词
高维数据
人工蜂群算法
密度峰值聚类
模糊聚类
决策树
卷积神经网络
非参数密度
-
Keywords
high dimensional data
artificial bee colony algorithm
density peak clustering
fuzzy clustering
decision tree
convolutional neural network
nonparametric density
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-