期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
混合属性数据集的自适应谱聚类算法
1
作者 陈玉 汪宇欣 苏欢 《陕西科技大学学报》 北大核心 2025年第5期200-206,共7页
为解决谱聚类算法在处理混合属性数据集时的属性偏斜问题,以及高斯核函数尺度参数人为选择的难题,提出了一种基于改进分类属性相似性度量和共享自然邻的自适应谱聚类算法(IEMN-SC).该算法通过计算数值属性和分类属性的信息熵,获取平衡... 为解决谱聚类算法在处理混合属性数据集时的属性偏斜问题,以及高斯核函数尺度参数人为选择的难题,提出了一种基于改进分类属性相似性度量和共享自然邻的自适应谱聚类算法(IEMN-SC).该算法通过计算数值属性和分类属性的信息熵,获取平衡差异因子,改进了传统的分类属性相似性度量.在高斯核函数中,利用共享自然近邻计算每个样本的邻域半径,自适应求解尺度参数.最后,通过核函数构建混合属性样本的相似度矩阵进行谱聚类.实验结果表明,IEMN-SC算法在ACC、ARI和NMI指标上优于四种常用混合属性数据集聚类算法,且聚类结果更稳定.该算法能够有效解决属性偏斜问题,尤其能完全自适应地发现混合属性数据集的真实分布信息,聚类效率显著提升. 展开更多
关键词 信息熵 谱聚类 混合属性数据集 自然近邻 自适应
在线阅读 下载PDF
基于残差分析的混合属性数据聚类算法 被引量:12
2
作者 邱保志 张瑞霖 李向丽 《自动化学报》 EI CSCD 北大核心 2020年第7期1420-1432,共13页
针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题,提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis)RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的... 针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题,提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis)RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的相似性,以提出的基于KNN和Parzen窗的局部密度计算方法计算每个对象的密度,通过线性回归和残差分析进行聚类中心预选取,然后以提出的聚类中心目标优化模型确定真正的聚类中心,最后将其他数据对象按照距离高密度对象的最小距离划分到相应的簇中,形成最终聚类.在合成数据集和UCI数据集上的实验结果验证了算法的有效性.与同类算法相比,RA-Clust具有较高的聚类精度. 展开更多
关键词 聚类 残差分析 线性回归 混合属性数据集 聚类中心
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部