文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和...文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和先来先服务(first come first served,FCFS)、k-means以及Canopy-k-means算法的实际效果,实验结果表明:该算法可以避免k-means算法中k值选取的盲目性,同时可以有效地提高分拣效率以及降低分拣批次。展开更多
为快速发现海量遥测数据中的相关关系,提出一种基于改进最大信息系数(Maximal Information Coefficient,MIC)的遥测数据相关性知识发现方法。以Mini Batch K-Means聚类算法为前驱过程对数据进行网格划分;计算该网格划分下的互信息,并以...为快速发现海量遥测数据中的相关关系,提出一种基于改进最大信息系数(Maximal Information Coefficient,MIC)的遥测数据相关性知识发现方法。以Mini Batch K-Means聚类算法为前驱过程对数据进行网格划分;计算该网格划分下的互信息,并以信息熵代替原有最大熵对互信息进行归一化矫正得到信息系数;选择不同网格划分下MIC作为变量相关性的测度。采用量子卫星遥测数据进行试验,结果表明:与基于动态规划算法的MIC方法相比,所提方法可有效解决MIC测度偏向多值变量的问题,时间复杂度从O(n^2.4)下降为O(n^1.6),是一种适用于大规模遥测数据相关性分析的有效方法。展开更多
文摘文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和先来先服务(first come first served,FCFS)、k-means以及Canopy-k-means算法的实际效果,实验结果表明:该算法可以避免k-means算法中k值选取的盲目性,同时可以有效地提高分拣效率以及降低分拣批次。
文摘为快速发现海量遥测数据中的相关关系,提出一种基于改进最大信息系数(Maximal Information Coefficient,MIC)的遥测数据相关性知识发现方法。以Mini Batch K-Means聚类算法为前驱过程对数据进行网格划分;计算该网格划分下的互信息,并以信息熵代替原有最大熵对互信息进行归一化矫正得到信息系数;选择不同网格划分下MIC作为变量相关性的测度。采用量子卫星遥测数据进行试验,结果表明:与基于动态规划算法的MIC方法相比,所提方法可有效解决MIC测度偏向多值变量的问题,时间复杂度从O(n^2.4)下降为O(n^1.6),是一种适用于大规模遥测数据相关性分析的有效方法。