期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
基于轮廓系数的聚类有效性分析 被引量:127
1
作者 朱连江 马炳先 赵学泉 《计算机应用》 CSCD 北大核心 2010年第12期139-141,198,共4页
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果... 针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。 展开更多
关键词 聚类 K均值算法 轮廓系数 有效性分析 无监督
在线阅读 下载PDF
基于轮廓系数的参数无关空中交通轨迹聚类方法 被引量:16
2
作者 孙石磊 王超 赵元棣 《计算机应用》 CSCD 北大核心 2019年第11期3293-3297,共5页
为消除专家经验的主观性、避免依赖轨迹特征并且减轻实验调参的负担,提出一种基于轮廓系数的参数无关聚类分析(PICBASIC)算法。首先,比较了现有基于欧氏距离的航迹配对方法,并且建立基于动态时间弯曲(DWT)距离和高斯核函数的轨迹相似度... 为消除专家经验的主观性、避免依赖轨迹特征并且减轻实验调参的负担,提出一种基于轮廓系数的参数无关聚类分析(PICBASIC)算法。首先,比较了现有基于欧氏距离的航迹配对方法,并且建立基于动态时间弯曲(DWT)距离和高斯核函数的轨迹相似度计算模型;其次,利用谱聚类对空中交通轨迹进行聚类划分;最后,提出一种基于轮廓系数的最佳簇数寻优方法,并且其具有对聚类结果量化评价功能。利用真实进场轨迹进行实验验证,PICBASIC判断将28L跑道的365条轨迹聚为5个簇,28R跑道的530条轨迹聚为6个簇时聚类质量最佳,平均轮廓系数分别为0.8099和0.8056。相同实验数据条件下,PICBASIC与MeanShift聚类的平均轮廓系数差异率分别为-1.23%和0.19%。实验结果表明:PICBASIC包容轨迹的速度和长度差异,全程无需人工指导或实验调参,而且能够筛除异常轨迹对聚类质量的不利影响。 展开更多
关键词 空中交通轨迹 聚类分析 轮廓系数 谱聚类 动态时间弯曲 高斯核函数 参数无关
在线阅读 下载PDF
基于改进轮廓系数法的航空公司客户分群研究 被引量:21
3
作者 马鑫 段刚龙 +1 位作者 王建仁 薛宏全 《运筹与管理》 CSSCI CSCD 北大核心 2021年第1期140-146,共7页
鉴于航空公司在客户聚类分群中对聚类效果进行评价并确定最佳k值的轮廓系数法存在时间复杂度过高O(n2)以及准确率较低问题,文章首先采用对象与同簇或不同簇中心间距离计算来替换同类或异类对象间的距离计算,并通过聚类效果变化率确定轮... 鉴于航空公司在客户聚类分群中对聚类效果进行评价并确定最佳k值的轮廓系数法存在时间复杂度过高O(n2)以及准确率较低问题,文章首先采用对象与同簇或不同簇中心间距离计算来替换同类或异类对象间的距离计算,并通过聚类效果变化率确定轮廓系数调节位置及调节权重,提出一种改进的轮廓系数法;其次,基于预处理且特征选择后真实航空公司客户数据构建聚类模型,借助改进轮廓系数法确定最优客户分群,并构建用户画像;最后,针对不同航空公司分群客户进行特征描述并提出相应个性化服务措施,辅助航空公司为客户提供个性化产品与服务。实证研究结果表明:不同样本量下改进轮廓系数法的精确率和运行效率均有所提升;基于改进轮廓系数法的航空公司客户分群结果符合客观实际,所提服务措施为航空公司最大化客户需求、提高客户满意度提供借鉴。 展开更多
关键词 改进轮廓系数 最佳k值 客户分群 特征选择 用户画像
在线阅读 下载PDF
基于互信息和轮廓系数的聚类结果评估方法 被引量:20
4
作者 尹世庄 王韬 +3 位作者 谢方方 刘丽君 曲直 张斌 《兵器装备工程学报》 CAS 北大核心 2020年第8期207-213,共7页
在采用改进k-means对未知二进制协议聚类的基础上,引入调整互信息和轮廓系数两种参数,分别对聚类的簇内聚类效果和整体聚类效果进行评估,并以真实的二进制协议数据为例,验证了评估的有效性。实验表明,基于调整互信息的评估方法类簇中样... 在采用改进k-means对未知二进制协议聚类的基础上,引入调整互信息和轮廓系数两种参数,分别对聚类的簇内聚类效果和整体聚类效果进行评估,并以真实的二进制协议数据为例,验证了评估的有效性。实验表明,基于调整互信息的评估方法类簇中样本判定的准确率大于90%,并且与数据报文真实的类别相符;基于轮廓系数的评估方法对不同数据集聚类结果的评估与聚类结果准确率的分布也相一致。该方法运算速度快,并且准确率优于代表点法,更符合二进制协议特征。 展开更多
关键词 二进制协议 聚类 互信息 轮廓系数 评估
在线阅读 下载PDF
基于字符串相似度的URL聚类方法研究
5
作者 刘翼 田亮亮 +2 位作者 高明 李凯茵 叶倩 《现代电子技术》 北大核心 2025年第11期84-88,共5页
内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,... 内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,利用协议分析抽取特征信息,转化为数据集;其次,进行数据清洗与处理,去除缺省字段和错误字段,将相同数据条目集成;最后,采用字符串相似度算法计算URL之间的距离作为聚类算法的特征,并采用K-means聚类算法划分相似URL,达到将多个不同域名分类到相同网络服务的目的。实验通过对5种不同方法进行比较发现,Levenshtein算法的平均轮廓系数达到了91.4%,较其他方法平均提高12%,能够有效应对精确度降低和检索效率低下的问题。 展开更多
关键词 数据聚类 字符串相似度 轮廓系数 协议分析 K-MEANS URL CDN Levenshtein算法
在线阅读 下载PDF
基于自适应K值算法的微灌管网压力监测点布置模型
6
作者 柳文涛 李金山 +2 位作者 冯亚阳 孙秀路 贾艳辉 《排灌机械工程学报》 北大核心 2025年第8期852-858,共7页
为提高规模化微灌管网安全诊断和压力监测的准确性,减少监测点数量,提出了一种针对规模化微灌管网压力监测点优化布置适应性更强的算法.首先对供水管网初始节点压力数据进行极差标准化处理,通过计算聚类误差总平方和(SSE)的方法自适应... 为提高规模化微灌管网安全诊断和压力监测的准确性,减少监测点数量,提出了一种针对规模化微灌管网压力监测点优化布置适应性更强的算法.首先对供水管网初始节点压力数据进行极差标准化处理,通过计算聚类误差总平方和(SSE)的方法自适应选取管网监测点数量,最后利用不同聚类算法求解确定监测点布设的最优方案.结果表明,随监测点数量增加,SSE值下降呈先快后缓的趋势,研究将曲线出现明显转折的值作为目标监测点数量;计算3条干管在目标算法下的平均轮廓系数分别为0.40089,0.51818,0.41021,比对照算法分别提高了15.3%,2.5%,2.4%.该方法保证了监测点数量的经济性与可靠性和布设位置的准确性,为规模化微灌管网压力安全监测点优化布置提供了理论基础和方法指导. 展开更多
关键词 微灌管网 压力监测点 聚类算法 自适应K值 轮廓系数
在线阅读 下载PDF
基于语义引导的多模型融合运动物体检测方法
7
作者 苗洋 牛雪梅 沈晔湖 《机床与液压》 北大核心 2025年第10期199-206,共8页
为了解决现有运动物体检测方法在退化以及透视场景表现不佳的问题,提出一种基于语义引导的多模型融合运动物体检测方法。针对实际运动物体检测中运动数量未知的问题,采用轮廓系数估计运动数量。在传统多模型融合的基础上引入几何约束,... 为了解决现有运动物体检测方法在退化以及透视场景表现不佳的问题,提出一种基于语义引导的多模型融合运动物体检测方法。针对实际运动物体检测中运动数量未知的问题,采用轮廓系数估计运动数量。在传统多模型融合的基础上引入几何约束,以增强多模型间融合的一致性;进一步利用语义信息引导几何约束的生成,降低几何约束下模型融合的错误率,提高多模型的融合效果。结果表明:相比传统多模型方法,文中所提方法在平均分类误差上降低了13.5%。对于运动物体数量的估计正确率提高了11.1%,在复杂环境中具有更好的鲁棒性。 展开更多
关键词 运动物体检测 多模型融合 语义引导 轮廓系数
在线阅读 下载PDF
考虑季节性储氢的园区综合能源系统优化配置研究
8
作者 谷丰 艾欣 +1 位作者 王昊洋 潘玺安 《太阳能学报》 北大核心 2025年第8期666-675,共10页
针对可再生能源出力的不确定性以及季节不平衡等问题,提出一种考虑阶梯碳交易和季节性储氢的电热气氢综合能源系统优化配置方法。首先,为减小长时间尺度规划计算的复杂性,保持电力季节性波动特性,采用基于改进轮廓系数的K-means++法对... 针对可再生能源出力的不确定性以及季节不平衡等问题,提出一种考虑阶梯碳交易和季节性储氢的电热气氢综合能源系统优化配置方法。首先,为减小长时间尺度规划计算的复杂性,保持电力季节性波动特性,采用基于改进轮廓系数的K-means++法对风光负荷数据进行聚类分析。其次,对季节性储氢单元进行建模,并在优化配置模型中引入阶梯碳交易机制,以经济成本和碳交易成本最小为目标函数建立含季节性储氢的园区综合能源系统优化配置模型。算例基于不同场景对比,分析不同的碳交易机制对于此园区综合能源系统的影响,最后验证了所提模型在提高可再生能源的消纳、经济性和低碳性方面的有效性。 展开更多
关键词 综合能源系统 改进轮廓系数聚类 季节性氢储能 阶梯碳交易机制
在线阅读 下载PDF
多标度数据轮廓相似性的度量公理与计算 被引量:9
9
作者 包研科 赵凤华 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2012年第5期797-800,共4页
为了完善轮廓相似性度量的概念和计算,拓展轮廓相似度计算公式的应用,讨论了样本几何轮廓的序结构和表示定理,修正了轮廓相似性的度量公理与计算公式.在样本几何轮廓和"轮廓优"序的定义下,证明了"轮廓优"序的"... 为了完善轮廓相似性度量的概念和计算,拓展轮廓相似度计算公式的应用,讨论了样本几何轮廓的序结构和表示定理,修正了轮廓相似性的度量公理与计算公式.在样本几何轮廓和"轮廓优"序的定义下,证明了"轮廓优"序的"严格弱序"结构,证明了在轮廓相似性分析问题中表示定理成立,奠定了约定"轮廓相似性度量公理"的逻辑基础,进而定义了样本几何轮廓的"相似度"序,证明了"相似度"序的"严格偏序"结构,并修正了轮廓相似度计算公式.使轮廓相似分析的概念与相似度计算公式能适应不同背景下的多标度数据分析的要求. 展开更多
关键词 多标度数据 几何轮廓 序结构 相似性度量公理 址联系数 标联系数 轮廓相似系数 轮廓相似度
在线阅读 下载PDF
双目视觉下多尺度舰船图像轮廓特征点提取算法 被引量:6
10
作者 于海燕 《舰船科学技术》 北大核心 2020年第10期70-72,共3页
为清晰分辨船舶航行图像的边缘特征信息,提出双目视觉原理下的多尺度舰船图像轮廓特征点提取算法。依照图像信息的测距处理方案,匹配必要的视觉性像素,完成基于双目视觉的舰船图像特征点标注处置。在此基础上,根据多尺度成像坐标原理,... 为清晰分辨船舶航行图像的边缘特征信息,提出双目视觉原理下的多尺度舰船图像轮廓特征点提取算法。依照图像信息的测距处理方案,匹配必要的视觉性像素,完成基于双目视觉的舰船图像特征点标注处置。在此基础上,根据多尺度成像坐标原理,判定舰船图像的灰度信息,再通过计算轮廓特征系数的方式,实现双目视觉下多尺度舰船图像轮廓特征点提取算法的应用。对比实验结果表明,与SIFT算法相比,应用新型特征点提取算法后,QDI系数指标出现明显提升的变化趋势,船舶航行图像的边缘特征信息得到清晰化分辨。 展开更多
关键词 双目视觉 舰船图像 特征点提取 测距处理 视觉像素 成像坐标系 图像灰度 轮廓特征系数
在线阅读 下载PDF
跳跃跟踪SSA交叉迭代AP聚类算法 被引量:4
11
作者 黄鹤 李文龙 +3 位作者 杨澜 王会峰 高涛 陈婷 《电子学报》 EI CAS CSCD 北大核心 2024年第3期977-990,共14页
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入... 针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值. 展开更多
关键词 近邻传播聚类 改进Tent映射 改进麻雀搜索算法 轮廓系数 聚类数据集
在线阅读 下载PDF
Color projector light intensity adaptive high dynamic range 3D measurement method
12
作者 HUANG Hao-zhen NIU Bin +2 位作者 CHENG Shen QU Xing-hua ZHANG Fu-min 《中国光学(中英文)》 北大核心 2025年第5期1219-1229,共11页
The Fringe Projection Profilometry(FPP)system with a single exposure time or a single projection intensity is limited by the dynamic range of the camera,which can lead to overexposure and underexposure of the image,re... The Fringe Projection Profilometry(FPP)system with a single exposure time or a single projection intensity is limited by the dynamic range of the camera,which can lead to overexposure and underexposure of the image,resulting in point cloud loss or reduced accuracy.To address this issue,unlike the pixel modulation method of projectors,we utilize the characteristics of color projectors where the intensity of the three-channel LED can be controlled independently.We propose a method for separating the projector's three-channel light intensity,combined with a color camera,to achieve single exposure and multi-intensity image acquisition.Further,the crosstalk coefficient is applied to predict the three-channel reflectance of the measured object.By integrating clustering and channel mapping,we establish a pixel-level mapping model between the projector's three-channel current and the camera's three-channel image intensity,which realizes the optimal projection current prediction and the high dynamic range(HDR)image acquisition.The proposed method allows for high-precision three-dimensional(3D)data acquisition of HDR scenes with a single exposure.The effectiveness of this method has been validated through experiments with standard planes and standard steps,showing a significant reduction in mean absolute error(44.6%)compared to existing singleexposure HDR methods.Additionally,the number of images required for acquisition is significantly reduced(by 70.8%)compared to multi-exposure fusion methods.This proposed method has great potential in various FPP-related fields. 展开更多
关键词 fringe projection profilometry crosstalk coefficient optimal projection currents high dynamic range
在线阅读 下载PDF
基于自适应LTTB与DTW-DBA-Means的动力电池组不一致性评估方法 被引量:2
13
作者 吴凤和 柴海宁 +4 位作者 章正柱 张宁 王正明 蒋展鹏 郭保苏 《计量学报》 CSCD 北大核心 2024年第6期890-898,共9页
针对电动汽车动力电池组不一致性难以通过外部参数有效评估问题,在对电池组电压数据进行分析时,引入轮廓系数作为不一致性评价指标,并融合自适应降采样(LTTB)与时序聚类(DTW-DBA-Means)算法,提出一种新的动力电池组不一致性评估方法。... 针对电动汽车动力电池组不一致性难以通过外部参数有效评估问题,在对电池组电压数据进行分析时,引入轮廓系数作为不一致性评价指标,并融合自适应降采样(LTTB)与时序聚类(DTW-DBA-Means)算法,提出一种新的动力电池组不一致性评估方法。自适应LTTB能够根据电池组电压序列特点自适应分配压缩区间采样点数目并调整压缩比,可提高DTW-DBA-Means运算效率的同时保证聚类效果。通过运行9个月的实车数据进行实验验证,结果表明,自适应LTTB降采样效果优于动态LTTB与LTTB,且DTW-DBA-Means时序聚类效果优于k-Shape,所提方法在保证评估准确性同时可节省约96.7%的运算时间。 展开更多
关键词 电学计量 动力电池组 不一致性评估 轮廓系数 降采样 时序数据聚类
在线阅读 下载PDF
STK:基于对比学习嵌入的聚类方法 被引量:1
14
作者 刘晋霞 张曦 《计算机科学》 CSCD 北大核心 2024年第S02期621-626,共6页
SimCSE作为一种对比学习方法,在文本嵌入和聚类中表现出了良好的性能。文中旨在优化SimCSE训练模型生成的句子嵌入使其适用于聚类任务,通过多个算法组合和训练参数调整,解决聚类算法选择、噪声及异常值的影响等问题。文中提出一种联合K... SimCSE作为一种对比学习方法,在文本嵌入和聚类中表现出了良好的性能。文中旨在优化SimCSE训练模型生成的句子嵌入使其适用于聚类任务,通过多个算法组合和训练参数调整,解决聚类算法选择、噪声及异常值的影响等问题。文中提出一种联合KL散度和KMeans算法的无监督聚类模型STK(SimCSE t-SNE KMeans),使用SimCSE对文本进行编码;随后采用t-SNE算法对高维嵌入进行降维,通过最小化KL散度保留低维空间中高维数据点之间的相似性关系,降维的同时改善文本嵌入表示;最后使用KMeans算法对降维后的嵌入进行聚类,得到聚类结果。通过将本研究的聚类结果与Bert,UMAP,HDBSCAN等算法得到的结果进行比较,发现文中提出的模型在制氢领域专利和论文数据集上表现出更好的聚类效果,尤其在轮廓系数这一评价指标上。 展开更多
关键词 SimCSE 句嵌入 KL散度 聚类 轮廓系数
在线阅读 下载PDF
贝叶斯优化模糊聚类地级行政区声环境 被引量:1
15
作者 曾宇 姚琨 +1 位作者 任爽 户文成 《应用声学》 CSCD 北大核心 2024年第2期385-392,共8页
声环境功能区划是噪声污染管理的重要手段。当前声环境功能区划研究大多是基于某个特定的地级行政区来进行的,难以反映各地级行政区声环境的异同。该文基于134个地级行政区的人口、面积、各声环境功能区面积和及面积占比,进行地级行政... 声环境功能区划是噪声污染管理的重要手段。当前声环境功能区划研究大多是基于某个特定的地级行政区来进行的,难以反映各地级行政区声环境的异同。该文基于134个地级行政区的人口、面积、各声环境功能区面积和及面积占比,进行地级行政区声环境表征和归一化处理。以轮廓系数作为聚类有效性评价指标,基于贝叶斯优化模糊聚类方法对地级行政区声环境表征进行聚类分析。通过与谱聚类、K-medoids聚类、高斯混合模型聚类的聚类性能对比,验证了该方法的有效性。结果表明,我国地级行政区声环境分为9类,城市规模和用地情况发生显著变化导致其声环境表征和归类发生变化后应重新评估当前噪声污染管理政策,并借鉴同类的地级行政区的噪声污染管理政策做出必要的调整。 展开更多
关键词 声环境功能区 地级行政区 模糊聚类 贝叶斯优化 轮廓系数
在线阅读 下载PDF
基于人工鱼群的自适应密度峰值聚类算法 被引量:2
16
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 聚类算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
在线阅读 下载PDF
基于自适应布谷鸟优化特征选择的K-means聚类 被引量:9
17
作者 孙林 刘梦含 《计算机应用》 CSCD 北大核心 2024年第3期831-841,共11页
K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首... K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首先,为提升CS算法的搜索速度和精度,在莱维飞行阶段,设计了自适应步长因子;为调节CS算法全局搜索和局部搜索之间的平衡、加快CS算法的收敛,动态调整发现概率,进而提出改进的动态CS算法(IDCS),在IDCS的基础上构建了结合动态CS的特征选择算法(DCFS)。其次,为提升传统欧氏距离的计算精确度,设计同时考虑样本和特征对距离计算贡献程度的加权欧氏距离;为了确定最佳聚类数目的选取方法,依据改进的加权欧氏距离构造了加权簇内距离和簇间距离。最后,为克服传统K-means聚类目标函数仅考虑簇内的距离而未考虑簇间距离的缺陷,提出基于中位数的轮廓系数的目标函数,进而设计了DCFSK。实验结果表明,在10个基准测试函数上,IDCS的各项指标取得了较优的结果;相较于K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等算法,在6个合成数据集与6个UCI数据集上,DCFSK的聚类效果最佳。 展开更多
关键词 布谷鸟搜索算法 K-MEANS聚类 欧氏距离 特征选择 轮廓系数
在线阅读 下载PDF
基于时间戳间距的用户在线时长聚类方法
18
作者 叶倩 高明 +2 位作者 田亮亮 韦雨萌 刘翼 《现代电子技术》 北大核心 2024年第16期47-50,共4页
在网络用户行为分析中,以时序维度为基础,研究用户网络行为的变化趋势,提出并挖掘更多有价值的信息,可为管理或商业决策提供有力支持。为此,文中提出一种基于时间戳间距的用户在线时长聚类方法,以用户访问日志文件中时间戳之间的间距作... 在网络用户行为分析中,以时序维度为基础,研究用户网络行为的变化趋势,提出并挖掘更多有价值的信息,可为管理或商业决策提供有力支持。为此,文中提出一种基于时间戳间距的用户在线时长聚类方法,以用户访问日志文件中时间戳之间的间距作为特征,首先将获取的日志数据进行预处理,获得用户的在线时长统计;然后采用K-Means聚类算法对用户进行聚类,并使用轮廓系数对K值进行评价分析,确定聚类K值范围,准确判定用户单次访问在线时长及类型。采用真实校园网用户访问日志数据对所提方法进行评价,实验结果表明,该方法的准确度达到0.9180,精确度达到0.7685,召回率达到0.8093。 展开更多
关键词 用户在线时长 用户聚类 K-MEANS聚类算法 数据预处理 时间戳间距 轮廓系数
在线阅读 下载PDF
基于大数据挖掘技术的输变电设备故障诊断方法 被引量:97
19
作者 胡军 尹立群 +3 位作者 李振 郭丽娟 段炼 张玉波 《高电压技术》 EI CAS CSCD 北大核心 2017年第11期3690-3697,共8页
传统输变电设备故障诊断方法具有易受专家意见主观影响以及模型固化的缺点。为此,提出了基于大数据挖掘技术的设备故障诊断方法,介绍了设备故障模式聚类算法、状态参量相关性分析算法以及基于相关性矩阵的故障诊断方法等基于大数据分析... 传统输变电设备故障诊断方法具有易受专家意见主观影响以及模型固化的缺点。为此,提出了基于大数据挖掘技术的设备故障诊断方法,介绍了设备故障模式聚类算法、状态参量相关性分析算法以及基于相关性矩阵的故障诊断方法等基于大数据分析的设备故障诊断关键技术,并采用某电网公司500 kV电压等级油浸式变压器套管近10 a故障记录数据作为数据挖掘案例进行了实证。研究结果表明:k-means聚类算法配合轮廓系数能准确得得出故障分类模式;Apriori关联算法配合Tanimoto系数可用于评估状态参量之间的强弱关系;基于皮尔逊相关系数构造故障诊断矩阵能够准确判断出与实际运行维护试验结果相符合的设备故障模式。因此,基于大数据挖掘技术的输变电设备故障诊断方法能够有效挖掘出设备状态记录数据内在的规律,实现具有数据自适应性的、更加准确的设备故障诊断。 展开更多
关键词 大数据分析 故障诊断 相关性 K-MEANS聚类算法 轮廓系数 Tanimoto系数 Apriori关联算法
在线阅读 下载PDF
基于K-means聚类分区的西北地区近半个世纪气温变化特征分析 被引量:25
20
作者 冯克鹏 田军仓 沈晖 《干旱区地理》 CSCD 北大核心 2019年第6期1239-1252,共14页
采用K-means聚类分区,Sen’s斜率估计,Kendall-Tau非参数检验等方法,分析和讨论了近半个世纪(1960-2015年)我国西北地区不同区域的气温变化特征。发现近半个世纪西北地区气温保持了持续的显著上升,年均最低气温上升速率高于年均气温和... 采用K-means聚类分区,Sen’s斜率估计,Kendall-Tau非参数检验等方法,分析和讨论了近半个世纪(1960-2015年)我国西北地区不同区域的气温变化特征。发现近半个世纪西北地区气温保持了持续的显著上升,年均最低气温上升速率高于年均气温和年均最高气温。从空间的角度来看,新疆北疆地区的东北部,内蒙古北部、西部中东部,甘肃中部、西部,青海北部、中部,宁夏中部、北部地区以及陕西北部是升温最快的区域。虽然西北地区气温总体是上升趋势,但在时间上并不均匀一致。从1998年开始,西北地区气温升温减缓,部分地区出现了下降趋势。近半个世纪西北地区季节气温与年际气温变化趋势并不一致,变暖减缓在该地区不同季节的响应不同。1998-2015年,冬季是增温幅度最小的季节,多数子区冬季存在升温趋势减缓,甚至转为下降趋势。 展开更多
关键词 聚类分析 轮廓系数 变暖减缓 西北地区
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部