期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
多代表点的子空间分类算法 被引量:6
1
作者 张健飞 陈黎飞 +1 位作者 郭躬德 李南 《计算机科学与探索》 CSCD 2011年第11期1037-1047,共11页
多代表点近邻分类克服了传统近邻分类算法的缺点,使用以代表点为中心的模型簇构造分类模型并自动确定近邻数目。此类算法在不同类别的样本存在大量重叠时将导致模型簇数量增大,造成预测精度下降。提出了一种多代表点的子空间分类算法,... 多代表点近邻分类克服了传统近邻分类算法的缺点,使用以代表点为中心的模型簇构造分类模型并自动确定近邻数目。此类算法在不同类别的样本存在大量重叠时将导致模型簇数量增大,造成预测精度下降。提出了一种多代表点的子空间分类算法,将不同类别的训练样本投影到多个不同的子空间,使用子空间模型簇构造分类模型,有效分隔了不同类别样本在全空间中重叠的区域,以提高分类性能。与传统的kNN(k nearest neighbor)、kNNModel、SVM(support vector machine)等分类算法的实验对比结果表明,新方法可以对复杂类别结构数据进行有效分类,且较好地提高了分类精度。 展开更多
关键词 投影 子空间 多代表点 分类模型
在线阅读 下载PDF
多代表点特征树与空间聚类算法 被引量:5
2
作者 黄添强 秦小麟 王金栋 《计算机科学》 CSCD 北大核心 2006年第12期189-195,共7页
空间数据具有海量、复杂、连续、空间自相关、存在缺损与误差等的特点,要求空间聚类算法具有高效率,能处理各种复杂形状的簇,聚类结果与数据空间分布顺序无关,并且对离群点是健壮的等性能,已有的算法难以同时满足要求。本文提出了一个... 空间数据具有海量、复杂、连续、空间自相关、存在缺损与误差等的特点,要求空间聚类算法具有高效率,能处理各种复杂形状的簇,聚类结果与数据空间分布顺序无关,并且对离群点是健壮的等性能,已有的算法难以同时满足要求。本文提出了一个适合处理海量复杂空间数据的数据结构-多代表点特征树。基于多代表点特征树提出了适合挖掘海量复杂空间数据聚类算法CAMFT,该算法利用多代表点特征树对海量的数据进行压缩,结合随机采样的方法进一步增强算法处理海量数据的能力;同时,多代表点特征树能够保存复杂形状的聚类特征,适合处理复杂空间数据。实验表明了算法CAMFT能够快速处理带有离群点的复杂形状聚类的空间数据,结果与对象空间分布顺序无关,并且效率优于已有的同类聚类算法BIRCH与CURE。 展开更多
关键词 空间聚类 空间数据 多代表点特征树
在线阅读 下载PDF
基于多代表点近邻传播的大数据图像分割算法 被引量:5
3
作者 许晓丽 《图学学报》 CSCD 北大核心 2016年第1期91-96,共6页
基于多代表点近邻传播聚类算法,提出一种有效的大数据图像的快速分割算法。该算法首先运用均值漂移算法将彩色图像分割成很多小的同质区域,然后计算每个区域中所有像素的颜色向量平均值,并用区域数目代替原图像像素点数目,选用区域间的... 基于多代表点近邻传播聚类算法,提出一种有效的大数据图像的快速分割算法。该算法首先运用均值漂移算法将彩色图像分割成很多小的同质区域,然后计算每个区域中所有像素的颜色向量平均值,并用区域数目代替原图像像素点数目,选用区域间的距离作为相似度的测度指标,最后应用多代表点近邻传播聚类算法在区域相似度矩阵上进行二次聚类,得到最终的图像分割结果。实验结果证明,提出的算法在大数据图像的分割中取得了较为满意的分割效果,且分割效率较高。 展开更多
关键词 多代表点近邻传播 大数据 图像分割
在线阅读 下载PDF
基于多代表点的文本分类研究 被引量:1
4
作者 陈可华 《郑州大学学报(工学版)》 CAS 北大核心 2010年第6期116-118,125,共4页
文本自动分类是一种有效的组织信息和管理信息的工具,传统分类方法一般在分类效果和运行效率上两者不可兼得,通过综合Rocchio和KNN2种分类方法的优点,设计出一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真... 文本自动分类是一种有效的组织信息和管理信息的工具,传统分类方法一般在分类效果和运行效率上两者不可兼得,通过综合Rocchio和KNN2种分类方法的优点,设计出一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好地解决不平衡类问题,实验结果显示,该方法能达到与SVM相当的分类效果. 展开更多
关键词 文本分类 多代表点 ROCCHIO KNN
在线阅读 下载PDF
面向大规模数据的快速多代表点仿射传播算法 被引量:1
5
作者 刘季 陈秀宏 杭文龙 《计算机科学与探索》 CSCD 北大核心 2016年第2期268-276,共9页
针对原始的仿射传播(affinity propagation,AP)聚类算法难以处理多代表点聚类,以及空间和时间开销过大等问题,提出了快速多代表点仿射传播(multi-exemplar affinity propagation using fast reduced set density estimator,FRSMEAP)聚... 针对原始的仿射传播(affinity propagation,AP)聚类算法难以处理多代表点聚类,以及空间和时间开销过大等问题,提出了快速多代表点仿射传播(multi-exemplar affinity propagation using fast reduced set density estimator,FRSMEAP)聚类算法。该算法在聚类初始阶段,引入快速压缩集密度估计算法(fast reduced set density estimator,FRSDE)对大规模数据集进行预处理,得到能够充分代表样本属性的压缩集;在聚类阶段,使用多代表点仿射传播(multi-exemplar affinity propagation,MEAP)聚类算法,获得比AP更加明显的聚类决策边界,从而提高聚类的精度;最后再利用K-邻近(K-nearest neighbor,KNN)算法分配剩余点得到最终的数据划分。在人工数据集和真实数据集上的仿真实验结果表明,该算法不仅能在大规模数据集上进行聚类,而且具有聚类精度高和运行速度快等优点。 展开更多
关键词 仿射传播 聚类 大数据 多代表点
在线阅读 下载PDF
代表点一致性约束的多视角模糊聚类算法 被引量:18
6
作者 张远鹏 周洁 +4 位作者 邓赵红 钟富礼 蒋亦樟 杭文龙 王士同 《软件学报》 EI CSCD 北大核心 2019年第2期282-301,共20页
多视角数据的涌现对传统单视角聚类算法提出了挑战.利用单视角聚类算法独立地对每个视角进行划分,再通过集成机制获取全局划分的方法,人为地割裂了视角之间的内在联系,难以获得理想的聚类效果.针对此问题,提出了一个多视角聚类模型.该... 多视角数据的涌现对传统单视角聚类算法提出了挑战.利用单视角聚类算法独立地对每个视角进行划分,再通过集成机制获取全局划分的方法,人为地割裂了视角之间的内在联系,难以获得理想的聚类效果.针对此问题,提出了一个多视角聚类模型.该模型不仅考虑了视角内的划分质量,还兼顾了视角间的协同学习机制.对于视角内的划分,为了捕捉更为准确的簇内结构信息,采用多代表点的簇结构表示策略;对于视角间的协同学习机制,假设簇中代表点在不同视角下,其代表性保持.因此,在该模型基础上提出了基于代表点一致性约束的多视角模糊聚类算法(multi-view fuzzy clustering with a medoid invariant constraint,简称MFCMddI).该算法通过最大化两两相邻视角下代表点权重系数的乘积之和来保证代表点一致性.MFCMddI的目标函数可通过引入拉格朗日乘子和KKT条件进行优化.在人工数据集以及真实数据集上的实验结果均表明,该算法相对于所引入的对比算法而言具有一定的优势. 展开更多
关键词 多视角聚类 多代表点 代表一致性 模糊聚类 协同学习 MRI 分割
在线阅读 下载PDF
密集簇中心二次模糊聚类算法 被引量:1
7
作者 田生文 黄明明 《计算机工程与设计》 CSCD 北大核心 2007年第2期436-439,共4页
针对模糊C—均值聚类算法偏好发现球形簇,以及对孤立点非常敏感的问题,提出了密集簇中心二次模糊聚类算法,其中引入聚类有效性度量函数,并进行了有效的孤立点处理,最终的模糊簇由多个代表点共同表示,故算法可有效发现数据集中的自然簇数... 针对模糊C—均值聚类算法偏好发现球形簇,以及对孤立点非常敏感的问题,提出了密集簇中心二次模糊聚类算法,其中引入聚类有效性度量函数,并进行了有效的孤立点处理,最终的模糊簇由多个代表点共同表示,故算法可有效发现数据集中的自然簇数目,对簇的大小和形状没有偏好性,且在孤立点的处理上具有较好的健壮性。另外,随机采样过程方便地实现了上述算法在大型数据集上的扩展;与模糊C—均值聚类算法的实验结果比较也表明了该算法的优越性。 展开更多
关键词 模糊聚类 聚类有效性 密集簇 多代表点 随机采样
在线阅读 下载PDF
食品HACCP分类的BIRCH算法 被引量:3
8
作者 陈绍彬 叶飞跃 +1 位作者 刘佰强 金涛 《计算机工程》 CAS CSCD 北大核心 2008年第23期59-61,共3页
食品卫生的HACCP自动分类要处理的数据集形状呈现多样性,对分类结果的准确性和专业性要求很高,已有的算法难以满足。该文基于经典BIRCH算法,结合多阈值思想和多代表点特征树思想,提出多阈值多代表点的BIRCH算法,增加了专业分类知识的指... 食品卫生的HACCP自动分类要处理的数据集形状呈现多样性,对分类结果的准确性和专业性要求很高,已有的算法难以满足。该文基于经典BIRCH算法,结合多阈值思想和多代表点特征树思想,提出多阈值多代表点的BIRCH算法,增加了专业分类知识的指导,并对每一个代表点设立单独的阈值,使得该算法能适应各种形状的数据集,减少了聚类特征树重建次数,提高了算法的效率。 展开更多
关键词 BIRCH算法 聚类特征树 多代表点 多阈值
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部