期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
Global Optimization for Combination Test Suite by Cluster Searching Algorithm
1
作者 Hao Chen Xiaoying Pan Jiaze Sun 《自动化学报》 EI CSCD 北大核心 2017年第9期1625-1635,共11页
在线阅读 下载PDF
扩充关系型激光点云数据库语义精准标注方法
2
作者 段宏伟 郇甜甜 白彦辉 《激光杂志》 北大核心 2025年第9期202-207,共6页
为了显著提升扩充关系型激光点云数据库的语义标注精度,提出扩充关系型激光点云数据库语义精准标注方法。首先,建立扩充关系型激光点云数据库,为后续的激光点云数据分割和语义标注提供支撑;其次,利用RANSAC与欧氏聚类结合方法对激光点... 为了显著提升扩充关系型激光点云数据库的语义标注精度,提出扩充关系型激光点云数据库语义精准标注方法。首先,建立扩充关系型激光点云数据库,为后续的激光点云数据分割和语义标注提供支撑;其次,利用RANSAC与欧氏聚类结合方法对激光点云数据库内激光点云数据展开分割处理,将复杂的点云数据简化为多个相对简单的部分,以便于后续的精准标注;最后,利用改进排序批处理模式采样算法(MRBMS)通过排序和批处理的方式从分割后的点云数据中选取具有代表性的样本实行语义精准标注。实验结果表明,所提方法的扩充关系型激光点云数据库语义精度更高,且适用于实际应用。 展开更多
关键词 激光点云数据库 RANSAC算法 欧氏聚类结合方法 MRBMS算法 语义精准标注
在线阅读 下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测 被引量:1
3
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 CSSCI 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式聚类 主题词提取 组合相似度 动态聚类算法 词熵
在线阅读 下载PDF
组合聚类和深度学习模型的风电场群风速预测 被引量:1
4
作者 樊雅洁 王聪 +2 位作者 张宏立 马萍 李新凯 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第12期71-80,共10页
为提高规模化风电场群的风速预测精度,进而保障中国电网的安全稳定运行,提出了一种基于粒子群-投影寻踪聚类算法结合NS-L-Transformer的风电场群短期风速混合预测模型。首先,通过变分模态分解、去伪分量和小波变换的方法对采集的风速数... 为提高规模化风电场群的风速预测精度,进而保障中国电网的安全稳定运行,提出了一种基于粒子群-投影寻踪聚类算法结合NS-L-Transformer的风电场群短期风速混合预测模型。首先,通过变分模态分解、去伪分量和小波变换的方法对采集的风速数据集进行处理,得到滤除噪声干扰后的风速数据集。其次,考虑风电场群间的风速空间关联特性,根据其风速波动特征,采用粒子群-投影寻踪聚类算法分析了风电场群间的空间相关性,根据算法所得到的评价指标对风电场群进行了场群关联性最优分类,并构造了分类后的高维风速数据集。最后,通过Transformer模型的自注意力机制结合LSTM模型的门控单元机制捕捉风速时间序列的局部特征,提出了NS-L-Transformer模型对所构造的具有局部特性的高维风速数据集进行了风速预测。选用中国东南某地区风电场群的风速数据进行了仿真分析,研究结果表明,采用分类后的高维数据集进行风速预测较单一风速数据集的预测精度有较大的提升;相较于Transformer模型,NS-L-Transformer的预测误差减少,从而验证了本研究所提混合预测模型的有效性。 展开更多
关键词 风速预测 风速数据降噪 风电场群分类 粒子群-投影寻踪聚类算法 NS-L-Transformer模型
在线阅读 下载PDF
跟驰工况下考虑风险分布的驾驶风格分类 被引量:1
5
作者 姜平 范虹慧 +2 位作者 黄鹤 石琴 周宇 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第11期1514-1518,共5页
车辆跟驰工况下,为通过驾驶场景中各因素的风险分布研究驾驶员特性,实现车路交互下的驾驶风格分类,文章提出一种基于改进的模糊综合评价法的驾驶风格分类方法。通过驾驶模拟器采集试验数据,并将车辆行驶参数和安全势场作为分类的特征参... 车辆跟驰工况下,为通过驾驶场景中各因素的风险分布研究驾驶员特性,实现车路交互下的驾驶风格分类,文章提出一种基于改进的模糊综合评价法的驾驶风格分类方法。通过驾驶模拟器采集试验数据,并将车辆行驶参数和安全势场作为分类的特征参数;使用组合权重法对模糊综合评价法的权重集进行改进,从而对各特征参数赋予相应的权重,再通过改进的模糊综合评价法将驾驶风格分为冷静型、普通型、激进型3类;最后通过K-means聚类算法验证上述方法的合理性。改进的模糊综合评价法分类结果与K-means聚类结果的对比表明,两者的差异率仅为2%,且当聚类簇数为3时,轮廓系数高达0.685,即与无监督学习算法相同。研究结果表明,使用该文模糊综合评价法可以实现对驾驶风格的有效分类。 展开更多
关键词 驾驶风格分类 安全势场 模糊综合评价法 组合权重法 K-MEANS聚类算法
在线阅读 下载PDF
复杂网络社区挖掘—基于聚类融合的遗传算法 被引量:58
6
作者 何东晓 周栩 +3 位作者 王佐 周春光 王喆 金弟 《自动化学报》 EI CSCD 北大核心 2010年第8期1160-1170,共11页
针对当前研究复杂网络社区挖掘的热点问题,提出了一种基于聚类融合的遗传算法用于复杂网络社区挖掘.该算法将聚类融合引入到交叉算子中,利用父个体的聚类信息辅以网络拓扑结构的局部信息产生新个体,避免了传统交叉算子单纯交换字符块而... 针对当前研究复杂网络社区挖掘的热点问题,提出了一种基于聚类融合的遗传算法用于复杂网络社区挖掘.该算法将聚类融合引入到交叉算子中,利用父个体的聚类信息辅以网络拓扑结构的局部信息产生新个体,避免了传统交叉算子单纯交换字符块而忽略了聚类内容所带来的问题.为使聚类融合的作用得以充分发挥,本文提出了基于马尔科夫随机游走的初始群体生成算法,使初始群体中的个体具有一定聚类精度并有较强的多样性.初始群体生成算法与基于聚类融合的交叉算子互相配合,有效地增强了算法的寻优能力.此外,算法将局部搜索机制用于变异算子,通过迫使变异节点与其多数邻居在同一社区内,有针对性地缩小了搜索空间,从而加快了算法收敛速度.在计算机生成网络和真实世界网络上进行了测试,并与当前具有代表性的社区挖掘算法进行比较,实验结果表明了该算法的可行性和有效性. 展开更多
关键词 复杂网络 社区结构 遗传算法 聚类融合 局部搜索
在线阅读 下载PDF
一种基于蚁群算法的聚类组合方法 被引量:39
7
作者 杨燕 靳蕃 Mohamed Kamel 《铁道学报》 EI CAS CSCD 北大核心 2004年第4期64-69,共6页
蚂蚁等群居类昆虫被看作能解决复杂问题的分布式系统,研究者从它们的协作性能以及自组织、信息素通信、任务划分等机理中获得灵感,已在组合优化、通信网络、机器人等许多应用领域找到解决问题的新方法。聚类作为一种无监督的学习,能根... 蚂蚁等群居类昆虫被看作能解决复杂问题的分布式系统,研究者从它们的协作性能以及自组织、信息素通信、任务划分等机理中获得灵感,已在组合优化、通信网络、机器人等许多应用领域找到解决问题的新方法。聚类作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。基于蚁群算法的聚类方法已经在当前数据挖掘研究中得到应用。本文提出的基于蚁群算法的聚类组合新方法,模仿多蚁群的协作性能,将运动速度类型各异的多个蚁群,独立而并行地进行聚类分析,然后组合其聚类结果为超图,再用蚁群算法对超图进行2次划分。实验结果表明,该方法能自动决定聚类的数目,聚类组合方法能明显改善聚类质量。 展开更多
关键词 蚁群算法 聚类组合 超图 图划分 数据挖掘
在线阅读 下载PDF
基于特征加权理论的数据聚类算法 被引量:40
8
作者 费贤举 李虹 田国忠 《沈阳工业大学学报》 EI CAS 北大核心 2018年第1期77-81,共5页
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,... 针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值. 展开更多
关键词 数据挖掘 数据聚类 特征加权 软子空间聚类 竞争合并机制 模糊聚类算法 聚类中心 聚类数目
在线阅读 下载PDF
基于改进K-means聚类算法的组合模型建模 被引量:18
9
作者 杨慧中 董陶 陶洪峰 《控制工程》 CSCD 北大核心 2013年第2期201-203,208,共4页
在传统的K-means聚类算法中,初始聚类是随机选取的,其聚类结果易随着不同的初始聚类中心波动。针对这一问题,首先采用最大距离积法对传统K-means聚类算法的初始聚类中心进行了优化。同时定义了一种新的目标函数并将其引用到传统的K-mean... 在传统的K-means聚类算法中,初始聚类是随机选取的,其聚类结果易随着不同的初始聚类中心波动。针对这一问题,首先采用最大距离积法对传统K-means聚类算法的初始聚类中心进行了优化。同时定义了一种新的目标函数并将其引用到传统的K-means聚类算法中,以实现对聚类结构类别数K的优化选择。将训练集样本数据经上述方法聚类后,再将各个子类分别建立基于支持向量机的子模型,通过开关切换的方式连接各子模型得到组合的支持向量机模型。将该方法应用于双酚A生产过程的缩合反应单元溶解罐出口苯酚含量的软测量建模。工业实例仿真结果表明:该算法能较好地跟踪苯酚含量的变化趋势,有效地改善了数据分类效果,提高了软测量模型的估计精度,显示了它在工业领域的应用潜力。 展开更多
关键词 K-MEANS聚类算法 目标函数 初始聚类中心 组合支持向量机
在线阅读 下载PDF
蚁群优化与模糊聚类结合的文本聚类研究 被引量:3
10
作者 王飞 张德贤 +1 位作者 韩金淑 陶永波 《计算机工程与应用》 CSCD 北大核心 2010年第32期126-129,共4页
针对模糊文本聚类算法(FCM)对输入顺序以及初始点敏感的问题,提出了一种使用蚁群优化的模糊聚类算法(FACA)。该算法采用蚁群聚类算法(ACA)找到聚类的初始中心点,以解决模糊聚类的输入顺序以及初始点敏感等问题。模糊文本聚类算法的线性... 针对模糊文本聚类算法(FCM)对输入顺序以及初始点敏感的问题,提出了一种使用蚁群优化的模糊聚类算法(FACA)。该算法采用蚁群聚类算法(ACA)找到聚类的初始中心点,以解决模糊聚类的输入顺序以及初始点敏感等问题。模糊文本聚类算法的线性复杂度使其更便于在计算机实现。与经典的基本模糊聚类以及蚁群聚类在真实数据集上仿真相比较,结果表明经蚁群优化过的模糊聚类算法(FACA)效果更有效,更适合应用于大型的数据集。 展开更多
关键词 文本聚类 模糊聚类(FCM) 蚁群聚类(ACA) 蚁群优化的模糊聚类算法(FACA)
在线阅读 下载PDF
聚类后的关联规则快速更新算法研究 被引量:3
11
作者 董彩云 杜韬 +1 位作者 郭春燕 曲守宁 《计算机应用研究》 CSCD 北大核心 2004年第11期30-32,共3页
关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起... 关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起来的联合挖掘,使其可以有效地压缩数据规模。给出了聚类后的关联规则快速更新算法描述。实验结果表明,算法性能优良,提高了数据挖掘执行效率。 展开更多
关键词 数据挖掘 关联规则 聚类分析 联合挖掘 K-MEANS算法
在线阅读 下载PDF
融合多特征的天基典型目标光学识别方法 被引量:5
12
作者 智喜洋 侯晴宇 +1 位作者 张伟 孙晅 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2016年第10期44-50,共7页
为满足天基近距离目标高精度探测和识别的需求,提出一种多特征融合的卫星局部识别方法.首先分析卫星局部物理特征,构建了融合形态学多特征参量的局部构件分形聚类参数集,并建立基于聚类特征加权组合的构件聚类模型.利用该模型即可实现... 为满足天基近距离目标高精度探测和识别的需求,提出一种多特征融合的卫星局部识别方法.首先分析卫星局部物理特征,构建了融合形态学多特征参量的局部构件分形聚类参数集,并建立基于聚类特征加权组合的构件聚类模型.利用该模型即可实现通过计算待识别目标隶属于各构件类的匹配性概率来识别目标;在此基础上,针对空间目标光学成像的图像降质、局部遮挡等问题,提出了目标识别算法,并以其在实际应用中的识别概率为依据,结合粒子群算法迭代优化加权系数,提高了识别算法效率与鲁棒性;最后利用4类典型卫星及伽利略卫星缩比模型对识别算法进行了数字仿真和半物理实验验证.实验结果表明,在低对比度、SNR仅为5,且构件存在较严重变形与互遮挡的情况下,算法仍能有效识别卫星构件,识别概率优于0.95. 展开更多
关键词 天基目标识别 卫星局部 多特征参量 聚类模型 识别算法
在线阅读 下载PDF
基于关联规则与熵聚类的解毒类中成药组方规律研究 被引量:6
13
作者 吴嘉瑞 金燕萍 +2 位作者 蔺梦娟 纪凯 周唯 《世界中医药》 CAS 2016年第8期1598-1601,共4页
目的:探讨常用解毒类中成药组方规律。方法:以收集解毒类中成药处方为基础,运用关联规则、复杂系统熵聚类等算法,挖掘处方中各药物的使用频次及药物之间的关联关系。结果:在解毒类中成药处方中,高频次药物有甘草、冰片、金银花、黄芩、... 目的:探讨常用解毒类中成药组方规律。方法:以收集解毒类中成药处方为基础,运用关联规则、复杂系统熵聚类等算法,挖掘处方中各药物的使用频次及药物之间的关联关系。结果:在解毒类中成药处方中,高频次药物有甘草、冰片、金银花、黄芩、连翘等;高频次药物组合包括"连翘、金银花""连翘、黄芩"等;置信度大于等于0.75的关联规则包括"人工麝香->冰片""珍珠->冰片""牛黄->冰片";并挖掘出40个核心组合以及20首新处方。结论:处方用药中除常见的清热解毒类中药外,还包括具有凉血祛瘀、醒神开窍类中药。 展开更多
关键词 解毒 组方规律 关联规则 熵聚类
在线阅读 下载PDF
基于K-means聚类组合模型的公交线路客流短时预测 被引量:13
14
作者 陈维亚 潘鑫 方晓平 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第4期83-89,113,共8页
预测公交线路短时客流是实现公交动态调度的关键技术.文中通过分析客流特性,构建了基于K-means聚类算法的组合预测模型.首先利用K-means算法将短时客流数据按照时变特征的相似度划分为不同聚类,然后为每类客流数据分别建立最小二乘支持... 预测公交线路短时客流是实现公交动态调度的关键技术.文中通过分析客流特性,构建了基于K-means聚类算法的组合预测模型.首先利用K-means算法将短时客流数据按照时变特征的相似度划分为不同聚类,然后为每类客流数据分别建立最小二乘支持向量机、BP神经网络、自回归滑动平均模型,并考虑天气因素的影响,用遗传算法优化模型参数,对比预测结果,从中选择每个聚类的最佳预测模型构成组合模型.最后以长沙市104路公交客流数据作为实例进行预测分析,结果显示:客流数据时变特征对模型具有选择性,K-means聚类组合模型能够更好地根据不同时段客流数据的时变特征进行分类,因而有利于提高预测绩效;考虑了天气因素的K-means聚类组合模型能进一步提高公交线路的短时预测绩效. 展开更多
关键词 公交线路客流 短时预测 K-MEANS聚类算法 组合预测模型
在线阅读 下载PDF
基于层次分析和模糊专家评判的投影寻踪决策方法 被引量:8
15
作者 葛延峰 孔祥勇 +1 位作者 李丹 高立群 《系统仿真学报》 CAS CSCD 北大核心 2014年第3期567-573,620,共8页
针对投影寻踪方法对多属性决策问题建模时,无法兼顾决策者经验及偏好、权重系数可能违背实际的问题,提出了一种基于层次分析和模糊专家评判的投影寻踪决策方法。借助层次分析法的思想构建指标的层次结构,然后专家根据经验进行模糊评判,... 针对投影寻踪方法对多属性决策问题建模时,无法兼顾决策者经验及偏好、权重系数可能违背实际的问题,提出了一种基于层次分析和模糊专家评判的投影寻踪决策方法。借助层次分析法的思想构建指标的层次结构,然后专家根据经验进行模糊评判,得到准则的重要程度序关系,将其以约束的形式融入投影寻踪模型中。同时,针对差分进化算法的不足,提出了自适应聚类差分进化算法,并用于投影寻踪模型中的指标函数优化,得到最佳权重系数。该方法在客观赋权的基础上,融合了主观信息,弥补了两种赋权方法的不足,实际的算例验证了所提出的决策方法与优化算法的可行性与有效性。 展开更多
关键词 多属性决策 属性权重 模糊专家评判 层次分析 投影寻踪 自适应聚类差分进化算法
在线阅读 下载PDF
基于气象因子权重相似日的短期光伏功率预测 被引量:19
16
作者 李伟 王冰 +1 位作者 陈献慧 缪永来 《广东电力》 2018年第4期59-64,共6页
基于相似日的短期功率预测是一种有效的光伏预测方法,而相似日选取的准确性直接影响预测结果的准确性。通过k均值聚类算法将天气类型聚类识别,并利用光伏功率与气象因子的相关性分析提取出主要气象因子,再根据灰色关联度分析得出不同类... 基于相似日的短期功率预测是一种有效的光伏预测方法,而相似日选取的准确性直接影响预测结果的准确性。通过k均值聚类算法将天气类型聚类识别,并利用光伏功率与气象因子的相关性分析提取出主要气象因子,再根据灰色关联度分析得出不同类别中气象因子对于发电功率的权重,并给出带权重的相似度计算公式,从而获得相似日样本训练集。然后根据训练集建立遗传算法优化的RBF-BP组合神经网络模型进行预测,通过与传统的相似日选择算法进行比较,证明该模型具有更高的精度和适用性。 展开更多
关键词 相似日 聚类分析 RBF-BP组合神经网络 遗传算法 功率预测
在线阅读 下载PDF
基于竞争学习的K质心组合聚类算法 被引量:1
17
作者 张宇 邵良杉 +1 位作者 邱云飞 刘威 《计算机工程》 CAS CSCD 北大核心 2011年第15期40-42,45,共4页
K-Means算法的聚类结果对初始簇的选择非常敏感,通常获得的是局部最优解而非全局最优解。为此,在K-Means聚类算法基础上,引入组合聚类和竞争学习概念,提出一种基于竞争学习的K质心组合聚类算法CLK-Centroid。该算法采用竞争学习策略计... K-Means算法的聚类结果对初始簇的选择非常敏感,通常获得的是局部最优解而非全局最优解。为此,在K-Means聚类算法基础上,引入组合聚类和竞争学习概念,提出一种基于竞争学习的K质心组合聚类算法CLK-Centroid。该算法采用竞争学习策略计算簇的质心,以适应噪声数据和分布异常数据的要求,使用组合聚类策略提高聚类的精度。在数据集上构建多个CLK-Centroid聚类器进行聚类,构建子簇相似矩阵,并根据子簇之间的相似性合并相似簇。理论分析和实验结果表明该算法能够提高聚类质量。 展开更多
关键词 CLK-Centroid算法 K-MEANS算法 竞争学习 组合 聚类
在线阅读 下载PDF
一种基于模糊聚类的组合BP网络挖掘方法 被引量:2
18
作者 蔡虹 叶水生 张永 《计算机工程与应用》 CSCD 北大核心 2005年第36期83-85,共3页
介绍了一种基于模糊聚类的组合BP神经网络的数据挖掘方法,并给出了该方法的模型和启发式BP改进算法Heuristicbp,且将其应用于数学函数值预测中,取得了学习时间短和预测精度高的效果,实验证明该方法是有效的,具有较高的实用性。
关键词 模糊聚类 组合BP神经网络 Heuristicbp算法 分类 预测
在线阅读 下载PDF
一种基于径向基神经网络的组合预测模型 被引量:7
19
作者 姚亚夫 彭昊 《郑州大学学报(工学版)》 CAS 2008年第3期137-140,共4页
根据基于最近邻聚类算法(NNCA)的径向基(RBF)神经网络和自回归求和滑动平均(AR IMA)两种方法,建立了各自的单项预测子模型,并利用RBF神经网络对两个单项预测子模型结果进行组合预测,得到最终的预测值.将该模型应用于长沙市某路段的交通... 根据基于最近邻聚类算法(NNCA)的径向基(RBF)神经网络和自回归求和滑动平均(AR IMA)两种方法,建立了各自的单项预测子模型,并利用RBF神经网络对两个单项预测子模型结果进行组合预测,得到最终的预测值.将该模型应用于长沙市某路段的交通流量预测,实验结果证明了该预测模型的有效性,采用组合预测模型比单一预测模型的预测精度有了较大提高. 展开更多
关键词 组合预测模型 最近邻聚类算法 径向基 RBF神经网络 交通流量
在线阅读 下载PDF
基于特征矩阵优化与数据降维的文本聚类算法 被引量:20
20
作者 陈玮 卢佳伟 《数据采集与处理》 CSCD 北大核心 2021年第3期587-594,共8页
针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis,PCA)降维的聚类算法。在原基于文档频率和逆词频(Term frequency inverse docu... 针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis,PCA)降维的聚类算法。在原基于文档频率和逆词频(Term frequency inverse document frequency,TF-IDF)算法的基础上提出ALFW(Adaptive length frequency weight)权重优化方案,使得特征矩阵的分布性更好,特征项的表征更加明显。在降维处理上,采用信息论中的联合熵标准对PCA算法进行了优化,提出UE-PCA(United entropy-PCA)算法对稀疏高维数据进一步降维,更好地保留了原高维数据的真实性。仿真实验表明,本文提出的算法(K-means+UE-PCA+ALFW)对比其他同类型算法取得了更好的表现效果。 展开更多
关键词 文本聚类 特征矩阵 联合熵 TF-IDF算法 PCA
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部