检索结果-维普期刊中文期刊服务平台

一种采用新型聚类方法的最佳类簇数确定算法被引量：9: 1; 作者朱二周孙悦 +3 位作者张远翔高新马汝辉李学俊《软件学报》 EI CSCD 北大核心 2021年第10期3085-3103,共19页; 聚类分析是统计学、模式识别和机器学习等领域的研究热点.通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来.然而,无监督学习的特性使得当前已有的聚类方法依旧面临着聚类效果不稳定、无法对多种结构的数据集进行正确聚... 展开更多; 关键词聚类分析聚类算法聚类有效性指标最佳类簇数数据挖掘; 在线阅读下载PDF 职称材料

基于语义的中文文本聚类最佳簇数研究: 2; 作者刘金岭《计算机工程与设计》 CSCD 北大核心 2010年第9期2034-2036,2100,共4页; 分析了聚类数目的确定对大样本数据聚类效果的影响,对目前聚类质量衡量指标的几个主要流行观点进行了剖析。利用文本相似度的概念对文本语义最佳聚类数问题进行了研究,提出了一种基于聚类过程的文本最佳聚类数算法CTBP,其主要思想是在... 展开更多; 关键词文本聚类聚类簇数增量划分 CTBP; 在线阅读下载PDF 职称材料

结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究被引量：16: 3; 作者张亚迪孙悦 +1 位作者刘锋朱二周《计算机科学》 CSCD 北大核心 2022年第1期121-132,共12页; 聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点... 展开更多; 关键词聚类算法聚类有效性指标最佳类簇数类簇中心数据挖掘; 在线阅读下载PDF 职称材料

一种新聚类评价指标被引量：15: 4; 作者谢娟英周颖《陕西师范大学学报（自然科学版）》 CAS CSCD 北大核心 2015年第6期1-8,共8页; 用于发现数据集类簇数k的常用内部评价指标DB(Davies Bouldin)和BWP(Between-within Proportion)等需要先确定一个搜索范围kmax,使数据集的类簇数满足k≤kmax,但如何确定kmax尚无理论指导。针对这一问题,提出一个新F统计量Fr,将Fr作为... 展开更多; 关键词 F统计量内部评价指标类簇数 K-medoids聚类算法最小生成树; 在线阅读下载PDF 职称材料

融合聚类算法和缺陷预测的测试用例优先排序方法被引量：6: 5; 作者肖蕾陈荣赏 +1 位作者缪淮扣洪煜《计算机科学》 CSCD 北大核心 2021年第5期99-108,共10页; 持续集成环境下,软件快速更新加快了回归测试执行的频率,但缺陷快速反馈的需求对回归测试又提出了更高要求。测试用例优先排序技术研究测试用例的重要性,通常将缺陷探测能力强的测试用例优先执行,使其提早发现软件缺陷,其可解决持续集... 展开更多; 关键词回归测试测试用例优先排序缺陷预测聚类分析最佳类簇数特征子集; 在线阅读下载PDF 职称材料

一种对孤立点不敏感的新的K-Means聚类算法被引量：5: 6; 作者包志强赵媛媛 +1 位作者胡啸天赵研《现代电子技术》北大核心 2020年第5期109-112,共4页; 针对传统K-Means聚类算法的不足,提出一种新的对孤立点不敏感的K-Means聚类算法。首先,采用孤立点移除算法消除数据集中存在的孤立点;然后,对不包含孤立点的数据集进行传统K-Means聚类,再引入轮廓系数并选择轮廓系数最大值对应的簇类数... 展开更多; 关键词 K-MEANS聚类算法孤立点轮廓系数簇类数聚类有效性评价函数聚类中心; 在线阅读下载PDF 职称材料

题名一种采用新型聚类方法的最佳类簇数确定算法被引量：9: 1; 作者朱二周孙悦张远翔高新马汝辉李学俊; 机构计算智能与信号处理教育部重点实验室(安徽大学) 安徽大学计算机科学与技术学院上海交通大学电子信息与电气工程学院; 出处《软件学报》 EI CSCD 北大核心 2021年第10期3085-3103,共19页; 基金安徽省自然科学基金(2008085MF188) 国家自然科学基金(61972001)。; 文摘聚类分析是统计学、模式识别和机器学习等领域的研究热点.通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来.然而,无监督学习的特性使得当前已有的聚类方法依旧面临着聚类效果不稳定、无法对多种结构的数据集进行正确聚类等问题.针对这些问题,首先将K-means算法和层次聚类算法的聚类思想相结合,提出了一种混合聚类算法K-means-AHC;其次,采用拐点检测的思想,提出了一个基于平均综合度的新聚类有效性指标DAS(平均综合度之差,difference of average synthesis degree),以此来评估K-means-AHC算法聚类结果的质量;最后,将K-means-AHC算法和DAS指标相结合,设计了一种寻找数据集最佳类簇数和最优划分的有效方法.实验将K-means-AHC算法用于测试多种结构的数据集,结果表明:该算法在不过多增加时间开销的同时,提高了聚类分析的准确性.与此同时,新的DAS指标在聚类结果的评价上要优于当前已有的常用聚类有效性指标.; 关键词聚类分析聚类算法聚类有效性指标最佳类簇数数据挖掘; Keywords clustering analysis clustering algorithm clustering validity index optimal clustering number data mining; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于语义的中文文本聚类最佳簇数研究: 2; 作者刘金岭; 机构江苏淮阴工学院计算机系; 出处《计算机工程与设计》 CSCD 北大核心 2010年第9期2034-2036,2100,共4页; 文摘分析了聚类数目的确定对大样本数据聚类效果的影响,对目前聚类质量衡量指标的几个主要流行观点进行了剖析。利用文本相似度的概念对文本语义最佳聚类数问题进行了研究,提出了一种基于聚类过程的文本最佳聚类数算法CTBP,其主要思想是在文本向量集的每个文本向量中抽取出一个词汇,按相似度有序排列,用增量逐层划分以得到最优划分所对应的簇类数。这样通过扫描一遍数据就可以获得多个统计信息,最后求出最优解。实验结果表明了该算法的高质量和高效率。; 关键词文本聚类聚类簇数增量划分 CTBP; Keywords text clustering cluster class number increment division CTBP; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究被引量：16: 3; 作者张亚迪孙悦刘锋朱二周; 机构安徽大学计算机科学与技术学院; 出处《计算机科学》 CSCD 北大核心 2022年第1期121-132,共12页; 基金安徽省自然科学基金(面上项目)(2008085MF188)。; 文摘聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用。通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来。作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点。然而,受收敛规则的影响,K-means算法仍然存在着对初始类簇中心的选取非常敏感、不能很好地处理非凸型分布和有离群值的数据集等问题。文中提出了一种基于密度参数和中心替换的改进K-means算法DC-Kmeans。该算法采用数据对象的密度参数来逐步确定初始类簇中心,使用中心替换方法更新偏离实际位置的初始中心,因而比传统聚的类算法更加精确。为了获得最佳聚类效果,文中同时提出了一个能够对聚类结果进行有效评价的新聚类有效性指标SCVI和一个能够快速获得目标数据集最佳类簇数的新算法OCNS。实验结果表明,所提聚类方法对各种类型的数据集都是有效的。; 关键词聚类算法聚类有效性指标最佳类簇数类簇中心数据挖掘; Keywords Clustering algorithm Clustering validity index Optimal clustering number Cluster center Data mining; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名一种新聚类评价指标被引量：15: 4; 作者谢娟英周颖; 机构陕西师范大学计算机科学学院; 出处《陕西师范大学学报（自然科学版）》 CAS CSCD 北大核心 2015年第6期1-8,共8页; 基金国家自然科学基金(31372250) 陕西省科技攻关项目(2013K12-03-24) 中央高校基本科研业务费专项资金(GK201503067); 文摘用于发现数据集类簇数k的常用内部评价指标DB(Davies Bouldin)和BWP(Between-within Proportion)等需要先确定一个搜索范围kmax,使数据集的类簇数满足k≤kmax,但如何确定kmax尚无理论指导。针对这一问题,提出一个新F统计量Fr,将Fr作为新聚类有效性准则,以判断聚类算法收敛与否,自适应地确定数据集类簇数;将Fr应用于快速K-medoids算法的收敛性判断,并以基于最小生成树的测地距离,即样本对在最小生成树上的路径长度,代替其间的直接欧氏距离度量样本相似性,得到一种自适应的快速K-medoids聚类算法,解决了K-medoids算法需要人为给定类簇数和不能发现任意形状簇的问题。UCI机器学习数据库数据集和人工模拟数据集实验测试表明,本文提出的Fr指标是一种有效的聚类算法评价指标,基于该指标和测地距离的K-medoids算法不仅能发现任意形状的簇,还可以自适应地确定数据集的类簇数,且对噪音数据有很好的鲁棒性。; 关键词 F统计量内部评价指标类簇数 K-medoids聚类算法最小生成树; Keywords F-statistics internal evaluation criterion the number of clusters K-medoids clustering algorithm minimum spanning tree; 分类号 TP181.1 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名融合聚类算法和缺陷预测的测试用例优先排序方法被引量：6: 5; 作者肖蕾陈荣赏缪淮扣洪煜; 机构厦门理工学院计算机与信息工程学院上海大学计算机工程与科学学院上海市计算机软件评测重点实验室福建省软件评测工程技术研究中心福建壹飞信息科技有限公司; 出处《计算机科学》 CSCD 北大核心 2021年第5期99-108,共10页; 基金国家自然科学基金(61572306) 福建省软件评测工程技术研究中心资助项目(ST2019002) 2020年度重庆市出版专项资金资助项目。; 文摘持续集成环境下,软件快速更新加快了回归测试执行的频率,但缺陷快速反馈的需求对回归测试又提出了更高要求。测试用例优先排序技术研究测试用例的重要性,通常将缺陷探测能力强的测试用例优先执行,使其提早发现软件缺陷,其可解决持续集成环境下的快速反馈需求。缺陷预测技术可通过被测系统代码特征和历史缺陷来预估信息预测软件在新版本中发现缺陷的可能性,传统基于聚类的测试用例优先排序方法大多未考虑不同类簇数和特征子集对聚类结果的影响。文中将缺陷预测应用到聚类优先排序方法,构建测试用例和代码关联矩阵,对测试用例进行聚类分析,结合缺陷预测结果和最大最小距离策略指导簇间和簇内排序。通过实验验证发现,类簇数和聚类特征子集选择对排序效果有一定影响,当未能获取最佳类簇数和特征子集时,相比单一的聚类优先排序方法,所提方法可更有效地提高回归测试效率。; 关键词回归测试测试用例优先排序缺陷预测聚类分析最佳类簇数特征子集; Keywords Regression testing Test case prioritization Defect prediction Cluster analysis The best cluster number Feature subset; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名一种对孤立点不敏感的新的K-Means聚类算法被引量：5: 6; 作者包志强赵媛媛胡啸天赵研; 机构西安邮电大学通信与信息工程学院; 出处《现代电子技术》北大核心 2020年第5期109-112,共4页; 基金陕西省教育厅专项科研计划项目(17JK0703)。; 文摘针对传统K-Means聚类算法的不足,提出一种新的对孤立点不敏感的K-Means聚类算法。首先,采用孤立点移除算法消除数据集中存在的孤立点;然后,对不包含孤立点的数据集进行传统K-Means聚类,再引入轮廓系数并选择轮廓系数最大值对应的簇类数作为数据集中簇的最优选择数目K;最后,通过自定义的聚类有效性评价函数评估聚类效果。实验结果表明,相对于传统K-Means聚类算法,对孤立点不敏感的新的K-Means聚类算法能够消除孤立点对数据集整体的影响,并优化了聚类中心的选择。; 关键词 K-MEANS聚类算法孤立点轮廓系数簇类数聚类有效性评价函数聚类中心; Keywords K-Means clustering algorithm outlier contour coefficient number of clusters clustering effectiveness evaluation function cluster center; 分类号 TN911.1-34 [电子电信—通信与信息系统] TP391.9 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种采用新型聚类方法的最佳类簇数确定算法	朱二周孙悦张远翔高新马汝辉李学俊	《软件学报》 EI CSCD 北大核心	2021	9	在线阅读下载PDF 职称材料
2	基于语义的中文文本聚类最佳簇数研究	刘金岭	《计算机工程与设计》 CSCD 北大核心	2010	0	在线阅读下载PDF 职称材料
3	结合密度参数与中心替换的改进K-means算法及新聚类有效性指标研究	张亚迪孙悦刘锋朱二周	《计算机科学》 CSCD 北大核心	2022	16	在线阅读下载PDF 职称材料
4	一种新聚类评价指标	谢娟英周颖	《陕西师范大学学报（自然科学版）》 CAS CSCD 北大核心	2015	15	在线阅读下载PDF 职称材料
5	融合聚类算法和缺陷预测的测试用例优先排序方法	肖蕾陈荣赏缪淮扣洪煜	《计算机科学》 CSCD 北大核心	2021	6	在线阅读下载PDF 职称材料
6	一种对孤立点不敏感的新的K-Means聚类算法	包志强赵媛媛胡啸天赵研	《现代电子技术》北大核心	2020	5	在线阅读下载PDF 职称材料