期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于满二叉树的二分K-means聚类并行推荐算法 被引量:10
1
作者 陈平华 陈传瑜 《计算机工程与科学》 CSCD 北大核心 2015年第8期1450-1457,共8页
在推荐系统中应用K-means算法聚类可有效降维,然而聚类效果往往依赖于选定的初始中心,并且一旦选定目标簇后,推荐过程只针对目标簇进行,与其他簇无关。针对上述两个问题,提出一种基于满二叉树的二分K-means聚类并行推荐算法。该算法首... 在推荐系统中应用K-means算法聚类可有效降维,然而聚类效果往往依赖于选定的初始中心,并且一旦选定目标簇后,推荐过程只针对目标簇进行,与其他簇无关。针对上述两个问题,提出一种基于满二叉树的二分K-means聚类并行推荐算法。该算法首先反复迭代二分K-means算法,迭代过程中使用簇内凝聚度作为分裂阈值,形成一颗满二叉树;然后通过层次遍历将用户归入到K个叶子节点(簇);最后针对K个簇,应用MapReduce框架进行并行推荐预测。MovieLens上的实验结果表明,该算法可大幅度提高推荐系统准确性,同时增强系统可扩展性。 展开更多
关键词 满二叉树 K—means 聚类 推荐算法 MAPREDUCE
在线阅读 下载PDF
基于粗集与聚类投票机制的光谱双星特征分析 被引量:1
2
作者 王琦 杨海峰 蔡江辉 《光谱学与光谱分析》 北大核心 2025年第2期463-468,共6页
光谱双星通常是指光谱中呈现双主导成分特征,由于该双成分复杂多样,其成因也多种多样,同时光谱信噪比相对比较低,现有许多分析方法将双成分系统光谱分离成两条光谱进行分析,而分离方法无法保证光谱的准确性,现有聚类方法的单次聚类可靠... 光谱双星通常是指光谱中呈现双主导成分特征,由于该双成分复杂多样,其成因也多种多样,同时光谱信噪比相对比较低,现有许多分析方法将双成分系统光谱分离成两条光谱进行分析,而分离方法无法保证光谱的准确性,现有聚类方法的单次聚类可靠性比较低。提出一种基于粗集与聚类投票机制的光谱双星分析与评估方法,采用多次聚类和投票思想,给出每条光谱属于相应类别的梯度可靠性。该方法包含两个部分:(1)采用不同思想的聚类算法,将光谱双星数据集进行重构,将每种聚类算法标签采用匈牙利算法将聚类标签对齐作为光谱属性,从而重构数据集。(2)利用投票机制,得票数反映聚类结果的一致程度,获得每条光谱的类别,定义粗集示踪每类光谱特征,采用上/下近似集给出每条光谱所归类别的可靠性。选择郭守敬望远镜(LAMOST)DR10发布光谱双星集作为分析对象,采用基于划分的K-means、基于模型的GMM(Gaussian mixture model)、谱聚类(spectral clustering)和层次聚类(agglomerative clustering)四种聚类算法重构光谱数据集,选择得票数下界μ为2,通过投票得到1、0.75、0.5为可靠性梯度的聚类结果。其中大约1/3的样本可靠性为1,说明这批样本的四种聚类结果完全一致;对每类光谱和投票数的信噪比进行统计分析,投票数低的样本的信噪比相对较低,是它们被不同的聚类算法划分到不同类别的原因之一;对可靠性为1的6类光谱样本进行了物理成因的分析,其中以双星、河内星云+目标恒星两种为主,聚类标签的差异可能由于两种成分流量差异或拼接、定标等数据处理所导致。也有可能由于光谱质量较低导致pipeline误判的因素,其天区位置分布与低质量数据分布特征的研究基本一致。 展开更多
关键词 光谱双星 光谱分析 聚类算法 郭守敬望远镜(LAMOST)
在线阅读 下载PDF
Web mining based on chaotic social evolutionary programming algorithm
3
作者 Xie Bin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第6期1272-1276,共5页
With an aim to the fact that the K-means clustering algorithm usually ends in local optimization and is hard to harvest global optimization, a new web clustering method is presented based on the chaotic social evoluti... With an aim to the fact that the K-means clustering algorithm usually ends in local optimization and is hard to harvest global optimization, a new web clustering method is presented based on the chaotic social evolutionary programming (CSEP) algorithm. This method brings up the manner of that a cognitive agent inherits a paradigm in clustering to enable the cognitive agent to acquire a chaotic mutation operator in the betrayal. As proven in the experiment, this method can not only effectively increase web clustering efficiency, but it can also practically improve the precision of web clustering. 展开更多
关键词 web clustering chaotic social evolutionary programming k-means algorithm
在线阅读 下载PDF
基于遗传算法的聚类分析 被引量:49
4
作者 傅景广 许刚 王裕国 《计算机工程》 CAS CSCD 北大核心 2004年第4期122-124,共3页
给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到使聚类划分效果最好的聚... 给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到使聚类划分效果最好的聚类中心。实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法。 展开更多
关键词 遗传算法 聚类 K-均值算法 二进制编码
在线阅读 下载PDF
一种基于模糊聚类的快速二值化方法 被引量:10
5
作者 丁震 胡钟山 +1 位作者 杨静宇 唐振民 《计算机学报》 EI CSCD 北大核心 1998年第S1期331-334,共4页
通过确定阈值实现图像的二值化分割是一种重要且实用的图像分割技术.本文提出了一种基于模糊聚类的二值化方法.这种方法将模糊C-均值算法加以推广(GFCM)后,应用于图像的二值化分割.通过与Otsu阈值法的分割结果比较后表明,该方法... 通过确定阈值实现图像的二值化分割是一种重要且实用的图像分割技术.本文提出了一种基于模糊聚类的二值化方法.这种方法将模糊C-均值算法加以推广(GFCM)后,应用于图像的二值化分割.通过与Otsu阈值法的分割结果比较后表明,该方法的分割效果好,分割耗时少且适用性强. 展开更多
关键词 图像分割 图像二值化 模糊聚类 模糊C-均值算法
在线阅读 下载PDF
基于模糊支持向量机的变压器故障诊断 被引量:13
6
作者 肖燕彩 张清 《北京交通大学学报》 CAS CSCD 北大核心 2012年第1期117-121,共5页
针对支持向量机对训练样本内的噪声和孤立点比较敏感,影响了支持向量机分类性能的弱点,利用模糊支持向量机的学习方法,构建了变压器故障诊断模型.采取一种基于二叉树的多分类方法,使用模糊C均值聚类算法求取模糊支持向量机的模糊隶属度... 针对支持向量机对训练样本内的噪声和孤立点比较敏感,影响了支持向量机分类性能的弱点,利用模糊支持向量机的学习方法,构建了变压器故障诊断模型.采取一种基于二叉树的多分类方法,使用模糊C均值聚类算法求取模糊支持向量机的模糊隶属度,采用径向基核函数,并利用遗传算法对模糊支持向量机的参数进行寻优.实验结果表明,基于二叉数的模糊支持向量机模型相比BP神经网络、支持向量机有更高的诊断准确率,基于二叉树模糊支持向量机的变压器故障诊断方法是可行的. 展开更多
关键词 模糊支持向量机 二叉树 故障诊断 模糊C均值聚类算法 遗传优化 变压器
在线阅读 下载PDF
一种基于灰度值矩阵的文档复原方法研究 被引量:5
7
作者 刘宪国 贾子钰 +1 位作者 刘万军 韩敏 《计算机应用研究》 CSCD 北大核心 2016年第12期3901-3904,3908,共5页
对于切碎英文文档自动拼接还原中无法利用碎纸片几何形状特征的问题,提出一种基于灰度值矩阵的文档碎片拼接方法。利用碎片图像的特征向量消除同行字母处于不同高度的负影响,提取其特征位置作为动态聚类的分类标准,依据文本行特征进行... 对于切碎英文文档自动拼接还原中无法利用碎纸片几何形状特征的问题,提出一种基于灰度值矩阵的文档碎片拼接方法。利用碎片图像的特征向量消除同行字母处于不同高度的负影响,提取其特征位置作为动态聚类的分类标准,依据文本行特征进行动态聚类和类间排序,设计了一种基于原图像碎片边界矩阵的四邻拼接算法进行逐一高效地拼接还原。仿真结果表明,该方法准确率较高且操作简便,对规则碎片拼接还原具有良好的实际意义。 展开更多
关键词 文档碎片拼接 二值图像 特征位置 动态聚类 四邻拼接算法
在线阅读 下载PDF
基于二进制灰狼优化的特征选择及文本聚类 被引量:10
8
作者 王琛 董永权 《计算机工程与设计》 北大核心 2021年第9期2526-2535,共10页
提出基于二进制灰狼优化的特征选择与文本聚类算法。为得到最佳聚类结果,将文本数据表达为矢量空间模型;利用二进制灰狼优化算法对文本特征进行选择,得到初选特征子集;对前一阶段中不同特征相关分值计算方法得到的初选特征子集进行合并... 提出基于二进制灰狼优化的特征选择与文本聚类算法。为得到最佳聚类结果,将文本数据表达为矢量空间模型;利用二进制灰狼优化算法对文本特征进行选择,得到初选特征子集;对前一阶段中不同特征相关分值计算方法得到的初选特征子集进行合并与交叉操作,进一步计算最优特征子集;在新特征子集基础上,利用同步考虑余弦相似度和欧氏距离指标的多目标优化K均值算法完成文本聚类,得到最优文本聚类解。实验结果表明,在多数数据集上,该算法可以有效降低特征维度,聚类指标表现更好。 展开更多
关键词 文本聚类 二进制灰狼算法 K均值聚类 特征选择 选择合并 词条权重
在线阅读 下载PDF
基于蚁群K均值聚类算法的边坡稳定性分析 被引量:5
9
作者 刘星 毕奇龙 郑付刚 《水电能源科学》 北大核心 2010年第8期108-109,169,共3页
针对岩石边坡稳定分析中常规聚类算法存在收敛速度慢、易陷入局部最优的局限性,基于蚁群信息素的K均值聚类法,提出一种解决边坡稳定性的新方法,分析了三峡库区36个边坡数据资料,并结合工程类比综合判断了边坡的稳定状态。结果表明,该法... 针对岩石边坡稳定分析中常规聚类算法存在收敛速度慢、易陷入局部最优的局限性,基于蚁群信息素的K均值聚类法,提出一种解决边坡稳定性的新方法,分析了三峡库区36个边坡数据资料,并结合工程类比综合判断了边坡的稳定状态。结果表明,该法的聚类效果优于常规聚类法,计算效率高,为边坡稳定性分级的聚类分析评价提供了新途径。 展开更多
关键词 蚁群 均值聚类算法 边坡稳定性分析 clustering algorithm k-means Ant Based Slope Stability 边坡稳定性分级 聚类法 边坡稳定分析 综合判断 稳定状态 数据资料 收敛速度 三峡库区 局部最优 计算效率 工程类比 分析评价
在线阅读 下载PDF
基于co-occurrence相似度的聚类集成方法 被引量:3
10
作者 凌光 王明春 冯嘉毅 《计算机应用》 CSCD 北大核心 2011年第2期441-445,461,共6页
首先提出了一种基于属性值的co-occurrence相似度概念,通过对其进一步的研究,提出了3个等价性表述;然后对属性值之间的co-occurrence相似度进行引申,给出了数据对象之间co-occurrence相似度的定义,并将其成功应用到聚类集成方法中。利用... 首先提出了一种基于属性值的co-occurrence相似度概念,通过对其进一步的研究,提出了3个等价性表述;然后对属性值之间的co-occurrence相似度进行引申,给出了数据对象之间co-occurrence相似度的定义,并将其成功应用到聚类集成方法中。利用co-occurrence相似度在计算某个初始聚类结果中数据对象之间的相似度时,充分考虑了其他初始聚类结果和该初始聚类结果之间的相互影响和联系。实验表明,基于co-occurrence相似度的聚类集成(CSCE)方法能有效识别数据之间的细微结构,有助于提高聚类集成的效果。 展开更多
关键词 聚类集成 binary相似度 co-occurrence相似度 基于簇相似的划分算法 基于co-occurrence相似度的聚类集成
在线阅读 下载PDF
二元数据子空间聚类算法的初始化研究 被引量:2
11
作者 夏英 鲁宁 丰江帆 《计算机应用研究》 CSCD 北大核心 2009年第1期47-49,共3页
针对二元数据空间高维稀疏性的特点而提出的有限混合伯努利模型,能够快速寻找映射簇的模型框架;EM算法是数学模型进行参数迭代的重要方法,其算法的优劣很大程度上取决于其初始参数。对于运用EM算法来实现有限混合伯努利模型聚类算法已... 针对二元数据空间高维稀疏性的特点而提出的有限混合伯努利模型,能够快速寻找映射簇的模型框架;EM算法是数学模型进行参数迭代的重要方法,其算法的优劣很大程度上取决于其初始参数。对于运用EM算法来实现有限混合伯努利模型聚类算法已有许多研究,EM算法中参数的选取直接影响聚类算法的性能。引入Binning法和改变数据之间相似度测量方式、中心点的选取方式来进行初始化,从而大大减少聚类结果对初始参数的依赖,实验证明该算法是高效的、正确的。 展开更多
关键词 子空间聚类 二元数据 有限混合伯努利模型 EM算法
在线阅读 下载PDF
基于遗传算法的动态文本聚类 被引量:3
12
作者 乐兵 王明文 《江西师范大学学报(自然科学版)》 CAS 北大核心 2006年第3期278-281,共4页
为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直... 为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直至适应度函数收敛,得到使聚类划分效果最好的聚类中心.实验表明该方法可以克服局部极值点的问题,且聚类结果的评价指标Purity(纯度)也比较好. 展开更多
关键词 文本聚类 遗传算法 二进制编码 欧氏距离 纯度
在线阅读 下载PDF
一种基于二叉树结构的入侵检测研究 被引量:1
13
作者 纪祥敏 戴英侠 +1 位作者 连一峰 刘青普 《计算机应用研究》 CSCD 北大核心 2005年第8期94-96,共3页
提出以二叉树结构取代原有入侵检测系统采用的链表结构,旨在改进入侵规则的存储和模式匹配,提高检测速度。对Snort规则结构作了简要分析,详细阐述了以规则聚类思想构建二叉树结构的过程;同时,采用C4.5算法为二叉树每个规则集节点动态选... 提出以二叉树结构取代原有入侵检测系统采用的链表结构,旨在改进入侵规则的存储和模式匹配,提高检测速度。对Snort规则结构作了简要分析,详细阐述了以规则聚类思想构建二叉树结构的过程;同时,采用C4.5算法为二叉树每个规则集节点动态选择最显著的特征,并进行并行测试,实现性能优化。为了尽可能减少冗余比较和无效匹配,引入数字型的IntMatch串匹配算法,有效地提高了模式匹配速度和规则的访问速度。 展开更多
关键词 二叉树结构 规则聚类 匹配算法
在线阅读 下载PDF
基于宽度优先搜索的K-medoids聚类算法 被引量:5
14
作者 颜宏文 周雅梅 潘楚 《计算机应用》 CSCD 北大核心 2015年第5期1302-1305,共4页
针对传统K-medoids聚类算法对初始值敏感、中心点随机选择以及聚类精度不够高等缺点,在粒计算有效初始化的基础上,提出中心点宽度优先搜索策略。首先,利用粒计算初始化获取K个有效粒子,遴选该K个粒子所对应的K个中心点作为K个初始中心点... 针对传统K-medoids聚类算法对初始值敏感、中心点随机选择以及聚类精度不够高等缺点,在粒计算有效初始化的基础上,提出中心点宽度优先搜索策略。首先,利用粒计算初始化获取K个有效粒子,遴选该K个粒子所对应的K个中心点作为K个初始中心点;然后,根据对象间的相似性分别对K个粒子中的对象建立以中心点为根节点的相似对象二叉树,通过宽度优先搜索遍历二叉树迭代出最优中心点,同时采用簇间距离和簇内距离优化准则函数。实验结果表明,所提算法在UCI中Iris和Wine标准数据集中测试,在有效缩短迭代次数的同时保证了算法聚类准确率。 展开更多
关键词 K-medoids聚类算法 粒计算 相似对象二叉树 宽度优先搜索 适应度函数
在线阅读 下载PDF
改进的粒子群算法优化的特征选择方法 被引量:36
15
作者 李炜 巢秀琴 《计算机科学与探索》 CSCD 北大核心 2019年第6期990-1004,共15页
特征选择是数据挖掘中数据预处理的一个重要步骤,因此选择出最优的特征子集可有效地降低学习算法的数据维度和计算成本。采用二进制粒子群优化算法(binary particle swarm optimization algorithm,BPSO)来对特征选择过程进行优化。提出... 特征选择是数据挖掘中数据预处理的一个重要步骤,因此选择出最优的特征子集可有效地降低学习算法的数据维度和计算成本。采用二进制粒子群优化算法(binary particle swarm optimization algorithm,BPSO)来对特征选择过程进行优化。提出基于特征聚类信息进行种群初始化的策略,其中特征的聚类由社团划分算法完成,并根据划分后的信息,在初始化过程中减少信息冗余,提高初始化种群的质量。提出一种基于决策空间相似性的自适应局部搜索策略,其中粒子的相似性指数由粒子在决策空间中的相似性确定。进化过程中,自适应地调整粒子进行局部搜索,避免算法早熟。最后,选择三种代表性的优化算法分别在11个UCI数据集上进行对比实验。实验结果表明,改进后的BPSO算法得到的特征选择结果在降低特征数目方面明显优于其他对比算法,且分类精度也有显著提高。 展开更多
关键词 二进制粒子群优化算法 特征聚类 交互操作 粒子密度 群智能算法
在线阅读 下载PDF
基于二叉树结构聚类算法的彩色图像分割研究 被引量:1
16
作者 王浩川 王学军 +1 位作者 刘艳春 闻跃华 《河南农业大学学报》 CAS CSCD 北大核心 2008年第4期461-464,共4页
提出了一种基于二叉树结构的彩色图像分割方法,首先对待分割图像采用最优阈值化方法获取R,G,B3个颜色空间的最佳阈值,然后通过构造自适用二叉树进行一次粗分割提取目标区域,最后采用C-均值聚类算法对二叉树的每个叶子节点进行精确分割.... 提出了一种基于二叉树结构的彩色图像分割方法,首先对待分割图像采用最优阈值化方法获取R,G,B3个颜色空间的最佳阈值,然后通过构造自适用二叉树进行一次粗分割提取目标区域,最后采用C-均值聚类算法对二叉树的每个叶子节点进行精确分割.试验表明,该算法可以在保留原图像中大部分的信息的基础上,对目标物体进行有效的分割. 展开更多
关键词 彩色图像分割 最优阈值化 二叉树 聚类算法
在线阅读 下载PDF
基于递推质心算法的二元传感器网络分布式目标跟踪 被引量:1
17
作者 周红波 万福 丁敬校 《电光与控制》 北大核心 2014年第2期28-31,共4页
传感器网络的一个重要应用方向是目标定位与跟踪。为了减少通信消耗,二元传感器是一个很好的选择。在递推质心算法和动态分簇结构的基础上提出了一种分布式递推质心算法,并将其应用到二元传感器网络分布式目标跟踪中。计算机仿真结果表... 传感器网络的一个重要应用方向是目标定位与跟踪。为了减少通信消耗,二元传感器是一个很好的选择。在递推质心算法和动态分簇结构的基础上提出了一种分布式递推质心算法,并将其应用到二元传感器网络分布式目标跟踪中。计算机仿真结果表明,该算法能够有效地对目标进行定位跟踪,并能够在节点密度大、节点探测半径大和采样周期小的情况下减少能量消耗和计算量,从而延长网络使用寿命。 展开更多
关键词 传感器网络 目标跟踪 二元传感器 质心算法 动态分簇
在线阅读 下载PDF
基于改进SimRank的产品特征聚类研究 被引量:2
18
作者 刘臣 段俊 《计算机应用研究》 CSCD 北大核心 2019年第7期1951-1954,共4页
针对在线用户评论中产品特征的提取和聚类问题进行了研究,提出一种改进的SimRank算法。将情感词-特征对放入二分网中,在二分网中使用改进后的SimRank算法计算特征词之间的相似度;再通过谱聚类算法对特征相似度进行聚类,提取网络产品的... 针对在线用户评论中产品特征的提取和聚类问题进行了研究,提出一种改进的SimRank算法。将情感词-特征对放入二分网中,在二分网中使用改进后的SimRank算法计算特征词之间的相似度;再通过谱聚类算法对特征相似度进行聚类,提取网络产品的特征集合。以某电脑评论为例,从中提取情感词-特征对进行研究。实验结果显示,改进后的算法准确率更高。改进后的特征相似度检测方法可以作为检测特征相似度的有效方法,实验采用在线产品的评论语料。实验结果表明,使用改进后的SimRank相似度对特征词进行聚类提取出特征更加准确。 展开更多
关键词 SimRank算法 特征聚类 二分网 特征相似度
在线阅读 下载PDF
基于二进制数计算相似度的高属性维稀疏数据聚类方法
19
作者 谢宁新 周永权 《计算机工程与应用》 CSCD 北大核心 2004年第19期179-181,共3页
针对一种特定类型高属性维数据———区间变量型高属性维稀疏数据聚类问题,提出高属性维稀疏信息系统,稀疏特征编码,基于二进制数计算相似度概念,给出一种新的基于二进制数计算相似度的高属性维稀疏数据聚类算法,由于计算属性稀疏特征... 针对一种特定类型高属性维数据———区间变量型高属性维稀疏数据聚类问题,提出高属性维稀疏信息系统,稀疏特征编码,基于二进制数计算相似度概念,给出一种新的基于二进制数计算相似度的高属性维稀疏数据聚类算法,由于计算属性稀疏特征相似度所采用的是二进制数布尔AND运算,因此,相比目前人们所使用的聚类算法,它是一种计算简单、精度高、聚类质量较高的聚类算法。该算法在高属性维稀疏数据挖掘及聚类分析中有着重要的应用。通过数值算例分析表明该聚类方法有效。 展开更多
关键词 稀疏特征 二进制数 相似度 聚类算法
在线阅读 下载PDF
基于安全聚类的大型机械故障诊断算法及应用
20
作者 吴笛 《组合机床与自动化加工技术》 北大核心 2010年第12期71-76,共6页
针对大型机械的故障特点,提出一种安全聚类故障诊断算法。该算法引入影响因子来度量故障带来的后果,把故障样本的相关性和安全性结合考虑,通过计算故障样本的相似度距离,把相似度比较接近的故障类别聚类成一个新的聚类中心,并利用训练... 针对大型机械的故障特点,提出一种安全聚类故障诊断算法。该算法引入影响因子来度量故障带来的后果,把故障样本的相关性和安全性结合考虑,通过计算故障样本的相似度距离,把相似度比较接近的故障类别聚类成一个新的聚类中心,并利用训练样本生成的安全二叉树实现该算法的故障诊断流程。在生成的安全二叉树中,影响因子越大的故障类别越靠近二叉树的根结点处。利用安全二叉树对测试样本进行故障诊断时,按照从二叉树根结点到叶结点的顺序进行诊断,有效保证了后果严重的故障类别优先诊断。最后,将该算法应用在液压挖掘机故障诊断中,实验结果表明该算法的故障诊断正确率高,诊断的效率也较高,对大型机械的故障诊断具有可行性和有效性。 展开更多
关键词 安全聚类 故障诊断 算法 二叉树
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部