题名 基于粒球邻域粗糙集的三支高斯混合聚类
1
作者
邵春梅
万仁霞
苗夺谦
赵杰
机构
北方民族大学数学与信息科学学院
宁夏智能信息与大数据处理重点实验室(北方民族大学)
同济大学电子与信息工程学院
出处
《郑州大学学报(理学版)》
北大核心
2025年第6期16-23,共8页
基金
国家自然科学基金项目(62066001)
宁夏科技领军人才项目(2022GKLRLX08)
宁夏自然科学基金项目(2021AAC03203)。
文摘
为了解决高维数据集中冗余信息影响三支高斯混合模型聚类效果的问题,将粒球邻域粗糙集的理论融入三支高斯混合聚类模型中,提出一种基于粒球邻域粗糙集的三支高斯混合聚类模型。首先,使用k-means聚类生成满足纯度要求的粒球集,再在粒球生成正域不变约束下进行属性约简,提取关键属性。其次,使用三支高斯混合模型对约简后的数据进行聚类,将对象划分到类簇的核心域或边界域。在7个UCI公共数据集上的对比实验结果表明,所提模型不仅继承了三支高斯混合聚类模型优越的聚类性能,具有更高的准确率、轮廓系数和更低的戴维森堡丁指数,其对类簇边界部分的刻画也更加准确。此外,由于所提模型对高维空间进行了属性约简处理,使得其具有更小的时间复杂度。
关键词
高维数据
三支高斯混合模型
聚类
粒球邻域粗糙集
正域
属性约简
Keywords
high-dimensional data
three-way Gaussian mixture model
clustering
granular ball neigh-borhood rough set
positive region
attribute reduction
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于阴影集的三支高斯混合聚类算法
被引量:1
2
作者
董雪
万仁霞
苗夺谦
岳晓冬
机构
北方民族大学数学与信息科学学院
同济大学计算机科学与技术系
上海大学计算机科学与技术系
宁夏智能信息与大数据处理重点实验室
出处
《广西大学学报(自然科学版)》
CAS
北大核心
2023年第4期958-971,共14页
基金
国家自然科学基金项目(62066001,61662001)
宁夏自然科学基金项目(2021AAC03203)
中央高校基本科研业务费专项资金项目(FWNX04)。
文摘
针对三支高斯混合聚类算法(three-way Gaussian mixture model,T-GMM)的阈值通常为人为设定,增加算法的不确定性的问题,本文中将阴影集思想融入三支高斯混合模型,提出一种基于阴影集的三支高斯混合聚类算法(three-way Gaussian mixture model clustering based on shadow sets,ST-GMM);ST-GMM算法先构造一个关于阈值的目标函数,再通过优化算法选取最优阈值。基于10个不同类型的UCI数据集的实验结果表明:ST-GMM算法不仅继承了T-GMM算法的特点,同时有效地降低了人为设定阈值的误差,聚类细节的刻画也更加准确。针对评价指标的测试进一步验证了ST-GMM算法具有良好的聚类性能。
关键词
聚类
三支高斯混合模型
阴影集
优化算法
Keywords
clustering
three-way Gaussian mixture model
shadow set
optimization algorithm
分类号
TP391
[自动化与计算机技术—计算机应用技术]