-
题名基于EMD距离的多示例聚类
被引量:3
- 1
-
-
作者
李展
彭进业
温超
-
机构
西北大学信息科学与技术学院
西北工业大学电子信息学院
-
出处
《计算机科学》
CSCD
北大核心
2011年第7期235-239,共5页
-
基金
教育部新世纪优秀人才支持计划项目(NCET-07-0693)
陕西省教育厅科研项目(10JK852)资助
-
文摘
多示例学习中,包由多个示例组成,有明确标记,而示例标记却不确定。已有聚类研究都针对单示例、单标记,因而无法直接应用于多示例问题。基于推土机距离(earth mover’s distance,EMD)提出了一种新的多示例聚类算法ECMIL。该方法首先利用欧式距离计算包内示例相似度,将相似示例合并;然后将需要度量距离相似性的包内示例分别看作供货者和消费者,计算货物拥有量和货物需求量;对推土机距离无法供货问题,通过增大满足条件供货者的权值加以解决;最后使用k-medoids算法进行聚类。在基准数据集MUSK,Corel和SIVAL上进行实验,表明EC-MIL算法是有效的。
-
关键词
多示例聚类
推土机距离
k-medoids
-
Keywords
Multi-instance clustering
Earth mover's distance
K-medoids
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-