题名 动态的模糊K-Modes初始化算法
被引量:1
1
作者
张伟
周霆
陈芸
邹汉斌
机构
江南大学信息工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2006年第4期682-683,707,共3页
文摘
模糊K-Modes聚类算法针对分类属性的数据进行聚类,使用爬山法来寻找最优解,因此该算法对初始值较为敏感。为了克服该缺点,提出一种动态的模糊K-Modes初始化算法,该方法能够自动确定聚类数目,以及对应的聚类中心;而且能够应用于数值属性和分类属性相混合的数据集。该初始化算法可以有效地克服模糊K-Modes算法对初值的敏感性。实验的结果表明了该初始化算法的可行性和有效性。
关键词
模糊
k—modes算法
动态初始化算法
聚类中心
分类属性
Keywords
fuzzy
k -modes algorithm
dynamic initial algorithm
modes
categorical attribute
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 粗糙K-Modes聚类算法
被引量:5
2
作者
李仁侃
叶东毅
机构
福州大学数学与计算机科学学院
出处
《计算机应用》
CSCD
北大核心
2011年第1期97-100,共4页
基金
国家自然科学基金资助项目(60805042)
福建省自然科学基金资助项目(2010J01329)
文摘
Michael K.Ng等人提出了新K-Modes聚类算法,它采用基于相对频率的启发式相异度度量方法,有效地提高了聚类精度,但不足的是在计算各类的属性分类值频率时假定类中样本对聚类的贡献相同。为了考虑类中样本对类中心的不同影响,提出一种粗糙K-Modes算法,通过粗糙集的上、下近似度量数据样本在类内的重要性程度,不仅可以获得比新K-Modes算法更好的聚类效果,而且可以在保证聚类效果的基础上降低白亮等人提出的基于粗糙集改进的K-Modes算法的计算复杂度。对几个UCI的数据集的测试实验结果显示出新算法的优良性能。
关键词
聚类
k—modes算法
粗糙集
类中心
聚类精度
Keywords
clustering
k -modes algorithm
rough set
cluster center
clustering accuracy
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于新的相异度量的模糊K-Modes聚类算法
被引量:5
3
作者
白亮
曹付元
梁吉业
机构
计算智能与中文信息处理教育部重点实验室
山西大学计算机与信息技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第16期192-194,共3页
基金
国家"863"计划基金资助项目(2007AA01Z165)
国家自然科学基金资助项目(60773133)
+1 种基金
山西省自然科学基金资助项目(2008011038)
山西省高校科技开发基金资助项目(2007103)
文摘
传统的模糊K-Modes聚类算法采用简单匹配方法度量对象与Mode之间的相异程度,没有充分考虑Mode对类的代表程度,容易造成信息的丢失,弱化了类内的相似性。针对上述问题,通过对象对类的隶属度反映Mode对类的代表程度,提出一种新的相异度量,并将它应用于传统的模糊K-Modes聚类算法。与传统的K-Modes和模糊K-Modes聚类算法相比,该相异度量是有效的。
关键词
模糊k —modes 聚类算法
相异度量
类中心
Keywords
fuzzy k -modes clustering algorithm
dissimilarity measure
cluster center
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于贝叶斯距离的K-modes聚类算法
被引量:5
4
作者
赵亮
刘建辉
张昭昭
机构
辽宁工程技术大学研究生院
辽宁工程技术大学电子与信息工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2017年第1期188-193,共6页
基金
国家自然基金(61440059)
辽宁省自然基金(LS2013129)
文摘
K-modes算法中原有的分类变量间距离度量方法无法体现属性值之间差异,对此提出了一种基于朴素贝叶斯分类器中间运算结果的距离度量。该度量构建代表分类变量的特征向量并计算向量间的欧氏距离作为变量间的距离。将提出的距离度量代入K-modes聚类算法并在多个UCI公共数据集上与其他度量方法进行比较,实验结果表明该距离度量更加有效。
关键词
k —modes 聚类算法
分类变量
朴素贝叶斯分类器
距离度量
Keywords
k -modes clustering algorithm
categorical variables
Naive Bayes classifier
distance measure
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 改进的分类数据聚类中心初始化方法
被引量:6
5
作者
王思杰
唐雁
机构
西南大学计算机与信息科学学院
出处
《计算机应用》
CSCD
北大核心
2018年第A01期73-76,共4页
基金
中央高校基本科研业务费专项资金资助项目(XDJK2015C110)
文摘
模糊K-modes算法是一种有效的针对分类数据的聚类方法,但算法性能非常依赖于初始中心的选择。针对模糊聚类算法对初始中心敏感这一问题,提出一种改进的基于距离和离群点检测的初始中心选择的方法。首先,通过增大初始中心选择过程中距离所占的比重,使所选择的初始中心点更具有分布性;然后,运用基于距离的离群点检测技术对初始中心点进行进一步筛选,避免离群点成为初始中心。对比实验结果表明,改进方法提高了分类数据初始中心选择的成功率,并具有较高的准确率。
关键词
模糊k—modes算法
距离
密度
初始聚类中心
离群点检测
Keywords
fuzzy k -modes algorithm
distance
density
initial chster center
outlier detection
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]