期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
一种面向分类属性数据的聚类融合算法研究 被引量:7
1
作者 李桃迎 陈燕 +1 位作者 张金松 张琳 《计算机应用研究》 CSCD 北大核心 2011年第5期1671-1673,共3页
为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通... 为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通过寻求目标函数最小的划分来简化聚类过程。算法在UCI数据集上进行了验证,结果表明算法的效率和精度都优于现有算法,说明算法的设计和更新策略是有效的。 展开更多
关键词 聚类融合 分类属性数据 数据挖掘 相似度
在线阅读 下载PDF
基于最大似然原理的分类属性数据分层聚类算法 被引量:3
2
作者 李建伏 赵玉成 贺怀清 《计算机应用与软件》 CSCD 2015年第3期247-252,296,共7页
对分类属性数据进行处理时,现有的聚类算法一般都通过距离函数将原始数据转换为表示两两距离的距离矩阵,然后再根据距离矩阵进行聚类,聚类结果很大程度上依赖于距离函数。针对上述问题,提出一种基于最大似然原理的分类属性数据分层聚类... 对分类属性数据进行处理时,现有的聚类算法一般都通过距离函数将原始数据转换为表示两两距离的距离矩阵,然后再根据距离矩阵进行聚类,聚类结果很大程度上依赖于距离函数。针对上述问题,提出一种基于最大似然原理的分类属性数据分层聚类算法,称为HAC_ML算法。HAC_ML算法优点在于直接处理分类属性数据,不依赖于距离函数,并且克服了分层聚类不能回溯的缺点。在UCI数据集上的测试结果表明与经典的ROCK算法和K-Modes算法相比,HAC_ML算法是一种有效地处理分类属性数据的分层聚类算法。 展开更多
关键词 分层聚类 最大似然值 分类属性数据
在线阅读 下载PDF
基于量子机制的改进的分类属性数据聚类算法 被引量:2
3
作者 赵正天 赵小强 李炜 《兰州理工大学学报》 CAS 北大核心 2009年第3期98-102,共5页
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进... 分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法. 展开更多
关键词 分类属性数据 量子聚类 聚类算法 相异性度量测度
在线阅读 下载PDF
近似k-median分类属性数据聚类
4
作者 赵恒 张高煜 《计算机工程》 CAS CSCD 北大核心 2007年第8期66-67,70,共3页
数据挖掘中解决分类属性数据聚类的算法有很多种,但大多数基于划分的方法得到的聚类中心一般不是数据集中的实际数据对象,缺乏实际的物理意义,有时会导致某一聚类为空。该文研究了近似k-median的求解算法,用数据的近似中值来代替模式进... 数据挖掘中解决分类属性数据聚类的算法有很多种,但大多数基于划分的方法得到的聚类中心一般不是数据集中的实际数据对象,缺乏实际的物理意义,有时会导致某一聚类为空。该文研究了近似k-median的求解算法,用数据的近似中值来代替模式进行聚类,提出了分类属性数据的近似k-median聚类算法,克服了一般基于划分的可分类属性数据聚类中所遇到的问题,仿真实验证明该算法有效。 展开更多
关键词 数据挖掘 近似k-median聚类 分类属性数据
在线阅读 下载PDF
基于互信息的分类属性数据特征选择算法 被引量:3
5
作者 顾文强 李志华 《计算机工程与应用》 CSCD 2014年第16期135-139,共5页
提出了一种针对分类属性数据特征选择的新算法。通过给出一种能够直接评价分类属性数据特征选择的评价函数新定义,重新构造能实现分类属性数据信息量、条件互信息、特征之间依赖度定义的计算公式,并在此基础上,提出了一种基于互信息较... 提出了一种针对分类属性数据特征选择的新算法。通过给出一种能够直接评价分类属性数据特征选择的评价函数新定义,重新构造能实现分类属性数据信息量、条件互信息、特征之间依赖度定义的计算公式,并在此基础上,提出了一种基于互信息较大相关、较小冗余的特征选择(MRLR)算法。MRLR算法在特征选择时不仅考虑了特征与类标签之间的相关性,而且还考虑了特征之间的冗余性。大量的仿真实验表明,MRLR算法在针对分类属性数据的特征选择时,能获得冗余度小且更具代表性的特征子集,具有较好的高效性和稳定性。 展开更多
关键词 分类属性数据 特征选择 互信息
在线阅读 下载PDF
基于新的距离度量的K-Modes聚类算法 被引量:47
6
作者 梁吉业 白亮 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-... 传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的. 展开更多
关键词 聚类算法 分类属性数据 粗糙集 粗糙隶属度 距离度量
在线阅读 下载PDF
一种改进的k-modes聚类算法 被引量:7
7
作者 施振佺 陈世平 《运筹与管理》 CSSCI CSCD 北大核心 2019年第12期112-117,共6页
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在... 传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。 展开更多
关键词 聚类算法 分类属性数据 粗糙集 知识粒度 距离度量
在线阅读 下载PDF
k-modes聚类方法的改进与在可追溯猪肉消费偏好研究中的应用 被引量:3
8
作者 陆姣 吴林海 +1 位作者 董汉芳 陈秀娟 《系统管理学报》 CSSCI CSCD 北大核心 2019年第4期752-762,共11页
可追溯食品消费偏好等实证调查中具有大量的分类属性的数据,而常用的k-means聚类方法主要适用于连续的数值型数据,难以精确分析可追溯食品消费者类别.为此,引入k-modes聚类方法,通过改进聚类精度,改善聚类流程,改进了现有的k-modes算法... 可追溯食品消费偏好等实证调查中具有大量的分类属性的数据,而常用的k-means聚类方法主要适用于连续的数值型数据,难以精确分析可追溯食品消费者类别.为此,引入k-modes聚类方法,通过改进聚类精度,改善聚类流程,改进了现有的k-modes算法,以更好地应用于分类属性数据的聚类分析.以分类正确率、类精度、召回率和平均迭代次数为评价检验的具体指标,相关检验表明,与经典k-modes聚类算法等相比较,改进后的k-modes聚类算法在标准数据集上实验结果良好.在此基础上,以可追溯猪肉为案例,通过菜单选择实验法收集消费者对可追溯猪肉信息属性偏好的数据,建立仿真分析流程,运用改进后的k-modes算法进行聚类分析,研究了消费者对可追溯猪肉属性的群体性偏好.仿真结果显示,消费者对可追溯猪肉信息属性的偏好具有明显的层次性、差异性,可基于消费偏好将消费者划分为4个类别. 展开更多
关键词 可追溯猪肉 聚类算法 分类属性数据 消费偏好
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部