期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种面向分类属性数据的聚类融合算法研究
被引量:
7
1
作者
李桃迎
陈燕
+1 位作者
张金松
张琳
《计算机应用研究》
CSCD
北大核心
2011年第5期1671-1673,共3页
为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通...
为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通过寻求目标函数最小的划分来简化聚类过程。算法在UCI数据集上进行了验证,结果表明算法的效率和精度都优于现有算法,说明算法的设计和更新策略是有效的。
展开更多
关键词
聚类融合
分类属性数据
数据
挖掘
相似度
在线阅读
下载PDF
职称材料
基于最大似然原理的分类属性数据分层聚类算法
被引量:
3
2
作者
李建伏
赵玉成
贺怀清
《计算机应用与软件》
CSCD
2015年第3期247-252,296,共7页
对分类属性数据进行处理时,现有的聚类算法一般都通过距离函数将原始数据转换为表示两两距离的距离矩阵,然后再根据距离矩阵进行聚类,聚类结果很大程度上依赖于距离函数。针对上述问题,提出一种基于最大似然原理的分类属性数据分层聚类...
对分类属性数据进行处理时,现有的聚类算法一般都通过距离函数将原始数据转换为表示两两距离的距离矩阵,然后再根据距离矩阵进行聚类,聚类结果很大程度上依赖于距离函数。针对上述问题,提出一种基于最大似然原理的分类属性数据分层聚类算法,称为HAC_ML算法。HAC_ML算法优点在于直接处理分类属性数据,不依赖于距离函数,并且克服了分层聚类不能回溯的缺点。在UCI数据集上的测试结果表明与经典的ROCK算法和K-Modes算法相比,HAC_ML算法是一种有效地处理分类属性数据的分层聚类算法。
展开更多
关键词
分层聚类
最大似然值
分类属性数据
在线阅读
下载PDF
职称材料
基于量子机制的改进的分类属性数据聚类算法
被引量:
2
3
作者
赵正天
赵小强
李炜
《兰州理工大学学报》
CAS
北大核心
2009年第3期98-102,共5页
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进...
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.
展开更多
关键词
分类属性数据
量子聚类
聚类算法
相异性度量测度
在线阅读
下载PDF
职称材料
近似k-median分类属性数据聚类
4
作者
赵恒
张高煜
《计算机工程》
CAS
CSCD
北大核心
2007年第8期66-67,70,共3页
数据挖掘中解决分类属性数据聚类的算法有很多种,但大多数基于划分的方法得到的聚类中心一般不是数据集中的实际数据对象,缺乏实际的物理意义,有时会导致某一聚类为空。该文研究了近似k-median的求解算法,用数据的近似中值来代替模式进...
数据挖掘中解决分类属性数据聚类的算法有很多种,但大多数基于划分的方法得到的聚类中心一般不是数据集中的实际数据对象,缺乏实际的物理意义,有时会导致某一聚类为空。该文研究了近似k-median的求解算法,用数据的近似中值来代替模式进行聚类,提出了分类属性数据的近似k-median聚类算法,克服了一般基于划分的可分类属性数据聚类中所遇到的问题,仿真实验证明该算法有效。
展开更多
关键词
数据
挖掘
近似k-median聚类
分类属性数据
在线阅读
下载PDF
职称材料
基于互信息的分类属性数据特征选择算法
被引量:
3
5
作者
顾文强
李志华
《计算机工程与应用》
CSCD
2014年第16期135-139,共5页
提出了一种针对分类属性数据特征选择的新算法。通过给出一种能够直接评价分类属性数据特征选择的评价函数新定义,重新构造能实现分类属性数据信息量、条件互信息、特征之间依赖度定义的计算公式,并在此基础上,提出了一种基于互信息较...
提出了一种针对分类属性数据特征选择的新算法。通过给出一种能够直接评价分类属性数据特征选择的评价函数新定义,重新构造能实现分类属性数据信息量、条件互信息、特征之间依赖度定义的计算公式,并在此基础上,提出了一种基于互信息较大相关、较小冗余的特征选择(MRLR)算法。MRLR算法在特征选择时不仅考虑了特征与类标签之间的相关性,而且还考虑了特征之间的冗余性。大量的仿真实验表明,MRLR算法在针对分类属性数据的特征选择时,能获得冗余度小且更具代表性的特征子集,具有较好的高效性和稳定性。
展开更多
关键词
分类属性数据
特征选择
互信息
在线阅读
下载PDF
职称材料
基于新的距离度量的K-Modes聚类算法
被引量:
47
6
作者
梁吉业
白亮
曹付元
《计算机研究与发展》
EI
CSCD
北大核心
2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-...
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的.
展开更多
关键词
聚类算法
分类属性数据
粗糙集
粗糙隶属度
距离度量
在线阅读
下载PDF
职称材料
一种改进的k-modes聚类算法
被引量:
7
7
作者
施振佺
陈世平
《运筹与管理》
CSSCI
CSCD
北大核心
2019年第12期112-117,共6页
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在...
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。
展开更多
关键词
聚类算法
分类属性数据
粗糙集
知识粒度
距离度量
在线阅读
下载PDF
职称材料
k-modes聚类方法的改进与在可追溯猪肉消费偏好研究中的应用
被引量:
3
8
作者
陆姣
吴林海
+1 位作者
董汉芳
陈秀娟
《系统管理学报》
CSSCI
CSCD
北大核心
2019年第4期752-762,共11页
可追溯食品消费偏好等实证调查中具有大量的分类属性的数据,而常用的k-means聚类方法主要适用于连续的数值型数据,难以精确分析可追溯食品消费者类别.为此,引入k-modes聚类方法,通过改进聚类精度,改善聚类流程,改进了现有的k-modes算法...
可追溯食品消费偏好等实证调查中具有大量的分类属性的数据,而常用的k-means聚类方法主要适用于连续的数值型数据,难以精确分析可追溯食品消费者类别.为此,引入k-modes聚类方法,通过改进聚类精度,改善聚类流程,改进了现有的k-modes算法,以更好地应用于分类属性数据的聚类分析.以分类正确率、类精度、召回率和平均迭代次数为评价检验的具体指标,相关检验表明,与经典k-modes聚类算法等相比较,改进后的k-modes聚类算法在标准数据集上实验结果良好.在此基础上,以可追溯猪肉为案例,通过菜单选择实验法收集消费者对可追溯猪肉信息属性偏好的数据,建立仿真分析流程,运用改进后的k-modes算法进行聚类分析,研究了消费者对可追溯猪肉属性的群体性偏好.仿真结果显示,消费者对可追溯猪肉信息属性的偏好具有明显的层次性、差异性,可基于消费偏好将消费者划分为4个类别.
展开更多
关键词
可追溯猪肉
聚类算法
分类属性数据
消费偏好
在线阅读
下载PDF
职称材料
题名
一种面向分类属性数据的聚类融合算法研究
被引量:
7
1
作者
李桃迎
陈燕
张金松
张琳
机构
大连海事大学交通运输管理学院
出处
《计算机应用研究》
CSCD
北大核心
2011年第5期1671-1673,共3页
基金
国家自然科学基金资助项目(70801007
70940008)
+3 种基金
国家教育部博士点基金资助项目(200801510001)
国家教育部科学技术研究重点资助项目(209030)
国家科技支撑计划资助项目(2009BAG13A03)
中央高校基本科研业务费专项资金资助项目(2009QN085)
文摘
为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其转换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通过寻求目标函数最小的划分来简化聚类过程。算法在UCI数据集上进行了验证,结果表明算法的效率和精度都优于现有算法,说明算法的设计和更新策略是有效的。
关键词
聚类融合
分类属性数据
数据
挖掘
相似度
Keywords
clustering ensemble
categorical data
data mining
similarity degree
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于最大似然原理的分类属性数据分层聚类算法
被引量:
3
2
作者
李建伏
赵玉成
贺怀清
机构
中国民航大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2015年第3期247-252,296,共7页
基金
国家自然科学基金项目(61103005)
2013年度中国民航大学预研重大项目(3122013P003)
文摘
对分类属性数据进行处理时,现有的聚类算法一般都通过距离函数将原始数据转换为表示两两距离的距离矩阵,然后再根据距离矩阵进行聚类,聚类结果很大程度上依赖于距离函数。针对上述问题,提出一种基于最大似然原理的分类属性数据分层聚类算法,称为HAC_ML算法。HAC_ML算法优点在于直接处理分类属性数据,不依赖于距离函数,并且克服了分层聚类不能回溯的缺点。在UCI数据集上的测试结果表明与经典的ROCK算法和K-Modes算法相比,HAC_ML算法是一种有效地处理分类属性数据的分层聚类算法。
关键词
分层聚类
最大似然值
分类属性数据
Keywords
Hierarchical clustering Maximum likelihood Categorical attribute data
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于量子机制的改进的分类属性数据聚类算法
被引量:
2
3
作者
赵正天
赵小强
李炜
机构
兰州理工大学电气工程与信息工程学院
出处
《兰州理工大学学报》
CAS
北大核心
2009年第3期98-102,共5页
基金
甘肃省自然科学基金(3ZS051-A25-032)
甘肃省高校研究生导师基金(050301)
文摘
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.
关键词
分类属性数据
量子聚类
聚类算法
相异性度量测度
Keywords
categorical attribution data
quantum clustering
clustering algorithm
dissimilarity measure
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
近似k-median分类属性数据聚类
4
作者
赵恒
张高煜
机构
西安电子科技大学电子工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第8期66-67,70,共3页
文摘
数据挖掘中解决分类属性数据聚类的算法有很多种,但大多数基于划分的方法得到的聚类中心一般不是数据集中的实际数据对象,缺乏实际的物理意义,有时会导致某一聚类为空。该文研究了近似k-median的求解算法,用数据的近似中值来代替模式进行聚类,提出了分类属性数据的近似k-median聚类算法,克服了一般基于划分的可分类属性数据聚类中所遇到的问题,仿真实验证明该算法有效。
关键词
数据
挖掘
近似k-median聚类
分类属性数据
Keywords
Data mining
Approximate k-median clustering
Categorical data
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于互信息的分类属性数据特征选择算法
被引量:
3
5
作者
顾文强
李志华
机构
江南大学物联网工程学院轻工过程先进控制教育部重点实验室
物联网应用技术教育部工程研究中心
出处
《计算机工程与应用》
CSCD
2014年第16期135-139,共5页
文摘
提出了一种针对分类属性数据特征选择的新算法。通过给出一种能够直接评价分类属性数据特征选择的评价函数新定义,重新构造能实现分类属性数据信息量、条件互信息、特征之间依赖度定义的计算公式,并在此基础上,提出了一种基于互信息较大相关、较小冗余的特征选择(MRLR)算法。MRLR算法在特征选择时不仅考虑了特征与类标签之间的相关性,而且还考虑了特征之间的冗余性。大量的仿真实验表明,MRLR算法在针对分类属性数据的特征选择时,能获得冗余度小且更具代表性的特征子集,具有较好的高效性和稳定性。
关键词
分类属性数据
特征选择
互信息
Keywords
nominal data
feature selection
mutual information
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于新的距离度量的K-Modes聚类算法
被引量:
47
6
作者
梁吉业
白亮
曹付元
机构
山西大学计算机与信息技术学院
计算智能与中文信息处理教育部重点实验室(山西大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第10期1749-1755,共7页
基金
国家"八六三"高技术研究发展计划基金项目(2007AA01Z165)
国家自然科学基金项目(60773133
+2 种基金
70971080)
山西省自然科学基金项目(2008011038)
山西省高校科技开发项目(2007103)~~
文摘
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的.
关键词
聚类算法
分类属性数据
粗糙集
粗糙隶属度
距离度量
Keywords
clustering algorithm
categorical data
rough set
rough membership degree
distance measure
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种改进的k-modes聚类算法
被引量:
7
7
作者
施振佺
陈世平
机构
上海理工大学管理学院
南通大学
出处
《运筹与管理》
CSSCI
CSCD
北大核心
2019年第12期112-117,共6页
文摘
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。
关键词
聚类算法
分类属性数据
粗糙集
知识粒度
距离度量
Keywords
clustering algorithm
categorical data
rough set
knowledge granulation
distance measure
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
k-modes聚类方法的改进与在可追溯猪肉消费偏好研究中的应用
被引量:
3
8
作者
陆姣
吴林海
董汉芳
陈秀娟
机构
山西医科大学管理学院
江南大学商学院
江南大学食品安全风险治理研究院
江南大学物联网工程学院
出处
《系统管理学报》
CSSCI
CSCD
北大核心
2019年第4期752-762,共11页
基金
国家自然科学基金青年项目(71804101,71803067)
江苏省社会科学基金重大项目(18ZD004)
文摘
可追溯食品消费偏好等实证调查中具有大量的分类属性的数据,而常用的k-means聚类方法主要适用于连续的数值型数据,难以精确分析可追溯食品消费者类别.为此,引入k-modes聚类方法,通过改进聚类精度,改善聚类流程,改进了现有的k-modes算法,以更好地应用于分类属性数据的聚类分析.以分类正确率、类精度、召回率和平均迭代次数为评价检验的具体指标,相关检验表明,与经典k-modes聚类算法等相比较,改进后的k-modes聚类算法在标准数据集上实验结果良好.在此基础上,以可追溯猪肉为案例,通过菜单选择实验法收集消费者对可追溯猪肉信息属性偏好的数据,建立仿真分析流程,运用改进后的k-modes算法进行聚类分析,研究了消费者对可追溯猪肉属性的群体性偏好.仿真结果显示,消费者对可追溯猪肉信息属性的偏好具有明显的层次性、差异性,可基于消费偏好将消费者划分为4个类别.
关键词
可追溯猪肉
聚类算法
分类属性数据
消费偏好
Keywords
traceable pork
clustering algorithm
categorical data
consumers’ preference
分类号
C939 [经济管理—管理学]
F713.55 [经济管理—市场营销]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种面向分类属性数据的聚类融合算法研究
李桃迎
陈燕
张金松
张琳
《计算机应用研究》
CSCD
北大核心
2011
7
在线阅读
下载PDF
职称材料
2
基于最大似然原理的分类属性数据分层聚类算法
李建伏
赵玉成
贺怀清
《计算机应用与软件》
CSCD
2015
3
在线阅读
下载PDF
职称材料
3
基于量子机制的改进的分类属性数据聚类算法
赵正天
赵小强
李炜
《兰州理工大学学报》
CAS
北大核心
2009
2
在线阅读
下载PDF
职称材料
4
近似k-median分类属性数据聚类
赵恒
张高煜
《计算机工程》
CAS
CSCD
北大核心
2007
0
在线阅读
下载PDF
职称材料
5
基于互信息的分类属性数据特征选择算法
顾文强
李志华
《计算机工程与应用》
CSCD
2014
3
在线阅读
下载PDF
职称材料
6
基于新的距离度量的K-Modes聚类算法
梁吉业
白亮
曹付元
《计算机研究与发展》
EI
CSCD
北大核心
2010
47
在线阅读
下载PDF
职称材料
7
一种改进的k-modes聚类算法
施振佺
陈世平
《运筹与管理》
CSSCI
CSCD
北大核心
2019
7
在线阅读
下载PDF
职称材料
8
k-modes聚类方法的改进与在可追溯猪肉消费偏好研究中的应用
陆姣
吴林海
董汉芳
陈秀娟
《系统管理学报》
CSSCI
CSCD
北大核心
2019
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部