期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
层次凝聚聚类算法的动态分析与准则函数设计 被引量:1
1
作者 王洋 涂登彪 +2 位作者 安明远 孙凝晖 王伟平 《高技术通讯》 CAS CSCD 北大核心 2012年第11期1169-1175,共7页
为提高层次凝聚聚类(HAC)算法的执行效率和结果质量,对其进行了动态分析,研究了一次合并对后续合并的影响。分析表明,合并两个类会生成一个新类,并使被合并的类的共享邻居的邻居数减小1;当新生成的类或邻居数减小的类参与后续合... 为提高层次凝聚聚类(HAC)算法的执行效率和结果质量,对其进行了动态分析,研究了一次合并对后续合并的影响。分析表明,合并两个类会生成一个新类,并使被合并的类的共享邻居的邻居数减小1;当新生成的类或邻居数减小的类参与后续合并时,会影响执行效率;一次合并会改变参与合并的类和它们的候选邻居之间的准则函数值,从而影响后续合并提高质量的程度。基于上述分析并结合模块性的定义,研究了现有准则函数对凝聚过程的影响以及它们的缺陷,并设计了两个新的准则函数。在大量数据集上的买验表明,新的准则函数提高了层次凝聚聚类算法的执行效率和结果质量。 展开更多
关键词 层次凝聚聚类(HAC)算法 准则函数 模块性 聚类分析
在线阅读 下载PDF
一种新的基于层次凝聚的高效复合聚类算法 被引量:1
2
作者 赵春 潘建平 陈璟 《科技通报》 北大核心 2012年第4期125-127,共3页
复合聚类算法是在改进的单连接算法和基于距离的聚合算法的基础上叠加形成。改进传统的单连接算法可以缩短数据聚合的时间,而基于距离的聚合算法则可以增大结点规模,满足数据量大、复杂度高的要求。实验结果表明,采用复合聚类算法能够... 复合聚类算法是在改进的单连接算法和基于距离的聚合算法的基础上叠加形成。改进传统的单连接算法可以缩短数据聚合的时间,而基于距离的聚合算法则可以增大结点规模,满足数据量大、复杂度高的要求。实验结果表明,采用复合聚类算法能够有效地提高数据聚集的准确率和缩短响应时间。 展开更多
关键词 层次凝聚 单连接算法 基于距离的聚类 复合聚类
在线阅读 下载PDF
基于Web挖掘的层次凝聚类算法研究 被引量:2
3
作者 杨金花 《电子设计工程》 2012年第12期30-32,共3页
网络提供了海量的共享资源,人们需要从网络上搜索出自己感兴趣的信息,由此产生了Web挖掘的问题。Web挖掘就是借用数据挖掘技术来实现的。Web挖掘主要是文本信息的挖掘,本文主要研究了实现文本挖掘的层次凝聚类算法,对于传统的算法存在... 网络提供了海量的共享资源,人们需要从网络上搜索出自己感兴趣的信息,由此产生了Web挖掘的问题。Web挖掘就是借用数据挖掘技术来实现的。Web挖掘主要是文本信息的挖掘,本文主要研究了实现文本挖掘的层次凝聚类算法,对于传统的算法存在的问题,提出了改进的算法,研究了相似度值对整个算法过程的影响,设计了一个动态改变相似度值的计算公式。 展开更多
关键词 数据挖掘 WEB文本挖掘 层次凝聚类算法 相似度值 改进的层次凝聚类算法
在线阅读 下载PDF
基于音素后验概率和层次凝聚聚类算法的音素边界检测
4
作者 冯志远 张连海 《太赫兹科学与电子信息学报》 2014年第2期260-265,共6页
提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈... 提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。 展开更多
关键词 音素边界检测 音素后验概率 层次凝聚聚类
在线阅读 下载PDF
考虑交通状态影响的服务区凝聚层次聚类入区判别模型 被引量:1
5
作者 章玉 张婷婷 +1 位作者 姚成北 曹鹏超 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期84-91,共8页
为了精准掌握高速公路服务区入区车辆特征、提升服务区运营管理水平,基于高速公路ETC门架通行和收费数据,在分析服务区路段和邻近服务区路段车辆行程时间和速度分布特征基础上,考虑路段交通运行状态影响,提出了基于凝聚层次聚类的运行... 为了精准掌握高速公路服务区入区车辆特征、提升服务区运营管理水平,基于高速公路ETC门架通行和收费数据,在分析服务区路段和邻近服务区路段车辆行程时间和速度分布特征基础上,考虑路段交通运行状态影响,提出了基于凝聚层次聚类的运行状态识别方法和服务区分车型入区判别模型。以G65包茂高速大观服务区为例,通过关联上、下游门架路段交通运行状态,明确了服务区路段车辆在4种不同运行状态下的速度概率分布特性,结合聚类给出了各个运行状态下车流密度和速度变化的入区判定条件,并利用服务区视频卡口数据进行验证分析。结果表明:判别误差主要分布在拥堵时段,全日客车和货车在考虑运行状态下的相对误差分别为1.5%、7.0%,与不考虑路段运行状态情况相比分别提高了2.9%、4.1%,验证了模型的有效性,为获取高速公路服务区入区车辆特征提供了一种新的思路。 展开更多
关键词 交通工程 高速公路服务区 入区车辆判别 凝聚层次聚类 ETC数据
在线阅读 下载PDF
基于凝聚层次聚类分析法的岩体随机结构面产状优势分组 被引量:27
6
作者 张奇 王清 +2 位作者 阙金声 李严严 宋盛渊 《岩土工程学报》 EI CAS CSCD 北大核心 2014年第8期1432-1437,共6页
在岩体斜坡稳定性分析和岩体水力学分析中,岩体随机结构面的优势分组是一项十分重要的内容。提出一种基于凝聚层次聚类分析的岩体随机结构面产状优势分组的新方法,这种方法的优点在于事先无需确定聚类中心,在分类结果生成后还可明显剔... 在岩体斜坡稳定性分析和岩体水力学分析中,岩体随机结构面的优势分组是一项十分重要的内容。提出一种基于凝聚层次聚类分析的岩体随机结构面产状优势分组的新方法,这种方法的优点在于事先无需确定聚类中心,在分类结果生成后还可明显剔除数据的孤点与野值。应用人工随机生成的结构面产状数据对这种新方法和模糊C均值法进行了对比验证。结果表明,凝聚层次聚类分析法不仅在无孤值点的情况下分组结果优于模糊C均值算法,而且还可以有效地剔除孤值点对于分组结果的不利影响。最后将这种方法应用于松塔水电站坝肩结构面优势分组中,同样得到了比较满意的结果。 展开更多
关键词 结构面 优势分组 凝聚层次聚类 模糊C均值
在线阅读 下载PDF
基于凝聚层次聚类的K均值结构面产状分组 被引量:5
7
作者 李运生 宋金龙 +1 位作者 李煜 靖盼盼 《人民长江》 北大核心 2018年第6期44-49,共6页
结构面产状数据分组是进行岩体力学性质分析及稳定性评价的基础工作,是工程地质领域一个重要的研究课题。K均值聚类方法从提出到现在,在结构面分组中得到了很好的应用,但是它需要事先给定聚类中心及分组数。为此,提出了改进算法,采用凝... 结构面产状数据分组是进行岩体力学性质分析及稳定性评价的基础工作,是工程地质领域一个重要的研究课题。K均值聚类方法从提出到现在,在结构面分组中得到了很好的应用,但是它需要事先给定聚类中心及分组数。为此,提出了改进算法,采用凝聚层次聚类法作为前处理,得到间距较大的几个聚类中心,随后以此聚类中心为初始聚心进行K均值聚类,并同时根据相关目标函数来确定最优分组数。将此改进方法应用于野外实测结构面分组中,得到的结果可靠,分类合理,可以准确确定结构面的优势产状。 展开更多
关键词 结构面分组 产状数据 K均值聚类 凝聚层次聚类 岩体力学
在线阅读 下载PDF
基于层次化主题分析的铁路敏感数据智能识别与分类分级方法
8
作者 江文彬 刘兆霖 +2 位作者 谢仕康 傅一馨 李琪 《铁路计算机应用》 2024年第10期7-12,共6页
为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据... 为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据敏感级别。考虑到铁路网络数据的敏感级别分布不平衡,设计分级概率向量加权聚合机制,利用凝聚层次聚类算法实现准确定级。经实验验证,与基于语义和K-means聚类的传统主题分析方法相比,该方法可有效缓解分布不平衡问题,实现细粒度、动态可调整的铁路敏感数据智能识别与准确定级,从而为落实铁路网络数据分级管理要求、确保铁路网络数据安全可控提供技术支撑。 展开更多
关键词 自然语言处理 凝聚层次聚类 主题分析 铁路网络数据 敏感属性识别 数据分类分级
在线阅读 下载PDF
一种基于量子机制的分类属性数据层次聚类算法
9
作者 赵正天 赵小强 +2 位作者 李炜 段晓燕 卢勇 《兰州理工大学学报》 CAS 北大核心 2009年第5期89-94,共6页
受物理学中量子机制特性的启发,结合层次凝聚思想,通过引入新的相异性度量测度以及聚类度量尺度步长sβtep概念,重新定义以紧致性指标AIAD和离散性指标AIED为基础的聚类有效性函数CVF,提出一种针对分类属性数据的基于量子机制层次聚类算... 受物理学中量子机制特性的启发,结合层次凝聚思想,通过引入新的相异性度量测度以及聚类度量尺度步长sβtep概念,重新定义以紧致性指标AIAD和离散性指标AIED为基础的聚类有效性函数CVF,提出一种针对分类属性数据的基于量子机制层次聚类算法CQHC.该算法首先在不同粒度水平上划分数据样本产生初始类(簇),然后以聚类有效性函数CVF为评价标准,动态地合并初始类(簇)完成聚类.仿真实验采用2个真实数据集,即:线性可分的大豆疾病样本数据集和线性不可分的动物园数据集.实验结果表明,该算法与已有的其他几个算法相比,不仅具有更高的聚类准确率,而且能够准确地检测出最佳类别数,是有效且可行的. 展开更多
关键词 分类属性 量子机制 层次凝聚 聚类度量尺度步长 聚类有效性函数
在线阅读 下载PDF
基于层次聚类的共享单车维修点规划模型
10
作者 毛昊迪 汤鲲 《电子设计工程》 2022年第21期20-23,28,共5页
该文针对共享单车的固定维修点设置问题,提出了使用蚁群算法优化的层次凝聚聚类方法,该聚类方法使用蚁群算法的信息素机制和簇间距离来进行聚类,通过引入随机性来解决层次聚类的局部最优问题,使用层次聚类的树形结构来应对维修点的数量... 该文针对共享单车的固定维修点设置问题,提出了使用蚁群算法优化的层次凝聚聚类方法,该聚类方法使用蚁群算法的信息素机制和簇间距离来进行聚类,通过引入随机性来解决层次聚类的局部最优问题,使用层次聚类的树形结构来应对维修点的数量变化,将每个簇的聚类中心作为维修点位置。该算法在西雅图2015年自行车租车站点位置的真实数据集和加州大学欧文分校的数据集上的仿真实验结果表明,相对于传统聚类算法,该算法可以找出更好的维修点位置。 展开更多
关键词 层次凝聚聚类 蚁群优化 聚类中心 共享单车
在线阅读 下载PDF
基于模糊层次聚类与模糊推论技术的模糊信息检索方法的研究
11
作者 张颖超 王洁 《濮阳职业技术学院学报》 2007年第1期11-12,共2页
本文研究了一种新的基于模糊层次聚类与模糊推论技术的模糊信息检索方法。该方法通过对文件的聚类、构建模糊集群文件、建立集群中心文件的模糊逻辑规则来修改用户的查询信息,使查询结果更加符合用户的需求。这种模糊信息检索方法因为... 本文研究了一种新的基于模糊层次聚类与模糊推论技术的模糊信息检索方法。该方法通过对文件的聚类、构建模糊集群文件、建立集群中心文件的模糊逻辑规则来修改用户的查询信息,使查询结果更加符合用户的需求。这种模糊信息检索方法因为能够扩展用户的查询条件来使用一种更有效率的方式进行模糊检索,所以比现有的方法更加灵活化和智能化。 展开更多
关键词 凝聚层次模糊聚类 模糊逻辑规则 模糊关联 查询扩展
在线阅读 下载PDF
基于双重注意力变换模型的分布式屋顶光伏变电站级日前功率预测 被引量:1
12
作者 王光华 张纪欣 +3 位作者 崔良 薛书倩 张彬 张沛 《全球能源互联网》 CSCD 北大核心 2024年第4期393-405,共13页
分布式屋顶光伏地理位置分散,受地理环境遮挡和多种气象因素影响,导致光伏出力特性存在差异,给变电站级分布式屋顶光伏日前功率预测造成挑战。针对上述问题,提出了一种基于双重注意力变换模型的分布式屋顶光伏变电站级日前功率预测方法... 分布式屋顶光伏地理位置分散,受地理环境遮挡和多种气象因素影响,导致光伏出力特性存在差异,给变电站级分布式屋顶光伏日前功率预测造成挑战。针对上述问题,提出了一种基于双重注意力变换模型的分布式屋顶光伏变电站级日前功率预测方法。首先,基于动态时间规整算法计算分布式光伏用户出力特性间的相似度,并基于凝聚层次聚类法将其划分成若干类;然后,利用自主注意力网络学习各时间步间的时序关联特性,通道卷积注意力机制学习多特征变量间的相关性,构建日前功率预测模型;最后,将每一类日前预测结果相加,实现变电站级日前功率预测。算例结果表明所提方法在多种天气状况下,较Transformer、长短期记忆神经网络和时序卷积网络,预测精度显著提升。 展开更多
关键词 日前功率预测 动态时间规整 凝聚层次聚类 双重注意力变换模型
在线阅读 下载PDF
基于电子商务网站的改进聚类算法的应用研究
13
作者 吴强 《郑州轻工业学院学报(自然科学版)》 CAS 2008年第3期103-107,共5页
运用图的孤立点的概念,对传统Rock算法进行了改进,提出了电子商务网站由算法本身自动生成适合的聚类集的方法,并给出了该算法的具体实现,以及与传统Rock算法的对比与分析.实验数据表明,采用Roc改进算法进行聚类要比采用传统的Rock算法... 运用图的孤立点的概念,对传统Rock算法进行了改进,提出了电子商务网站由算法本身自动生成适合的聚类集的方法,并给出了该算法的具体实现,以及与传统Rock算法的对比与分析.实验数据表明,采用Roc改进算法进行聚类要比采用传统的Rock算法具有更好的实际价值. 展开更多
关键词 聚类算法 层次凝聚 Rock算法 电子商务 VISUAL C#
在线阅读 下载PDF
基于改进DTW_AGNES的网约车需求量时间序列聚类研究 被引量:9
14
作者 黎新华 李俊辉 黎景壮 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第8期13-19,共7页
对网约车需求量时间序列进行聚类分析,识别不同日期需求量变化规律的相似性和差异性,以合理制定运营调度计划,为乘客提供更高水平运输服务。针对现有的欧氏距离凝聚层次聚类(Euc_AGNES)不能识别时间序列偏移、伸缩等问题和针对动态时间... 对网约车需求量时间序列进行聚类分析,识别不同日期需求量变化规律的相似性和差异性,以合理制定运营调度计划,为乘客提供更高水平运输服务。针对现有的欧氏距离凝聚层次聚类(Euc_AGNES)不能识别时间序列偏移、伸缩等问题和针对动态时间弯曲(DTW)距离计算时间开销大的问题,提出一种改进DTW_AGNES聚类方法,通过调整匹配路径约束范围来优化DTW的动态规划搜索范围,并使用改进后的DTW作为凝聚层次聚类(AGNES)的相似性度量方法。实验结果表明:普通DTW_AGNES聚类和改进DTW_AGNES聚类均比Euc_AGNES聚类更能识别网约车需求量时间序列变化规律,为网约车运营商制定编排调度计划提供可靠依据,且改进后的DTW_AGNES聚类运行效率比普通DTW_AGNES聚类提高了62.4%,节省了计算时间和计算资源,证明了方法的有效性。 展开更多
关键词 交通运输工程 凝聚层次聚类 动态时间弯曲 时间序列 DTW_AGNES算法 网约车
在线阅读 下载PDF
QH-K:面向新闻文本主题抽取的改进H-K聚类算法 被引量:6
15
作者 杨玉娟 冯霞 王永利 《南京邮电大学学报(自然科学版)》 北大核心 2020年第1期82-88,共7页
随着网络信息文本的爆发式增长,人们从繁多的新闻中获取特定有效的信息变得愈发困难。在大数据处理中,学者们经常使用文本聚类方法作为新闻主题提取和趋势跟踪的主要措施。针对凝聚型层次聚类算法和K-Means算法在文本聚类上的优势和缺陷... 随着网络信息文本的爆发式增长,人们从繁多的新闻中获取特定有效的信息变得愈发困难。在大数据处理中,学者们经常使用文本聚类方法作为新闻主题提取和趋势跟踪的主要措施。针对凝聚型层次聚类算法和K-Means算法在文本聚类上的优势和缺陷,提出一种新的新闻文本聚类优化处理算法——QH-K(K-Means based on Quick Hierarchical Clustering)算法。首先,通过word2vector模型训练文本得到词向量;其次,采用优化的凝聚型层次聚类算法对文本聚类,并根据优化处理算法所提出聚类有效性指标ST得到初始聚类个数和聚类中心;最后,引入K-Means算法对聚类结果进行优化,提高最终聚类的效果。实验证明,QHK聚类优化处理算法的正确率、召回率、F值相比传统算法都得到了一定程度的提升;此外,算法的运行时间也有所下降。 展开更多
关键词 文本聚类 凝聚层次聚类 K-MEANS
在线阅读 下载PDF
基于多种词特征的微博突发事件检测方法 被引量:5
16
作者 张仰森 段宇翔 +1 位作者 王建 吴云芳 《电子学报》 EI CAS CSCD 北大核心 2019年第9期1919-1928,共10页
近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件... 近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件给社会带来的危害.首先根据时间信息对微博数据进行时间切片,对每一个时间窗口内的数据分别计算各个词语的词频特征、话题标签特征和词频增长率特征;然后基于D-S证据理论和层次分析法,确定词的各个特征权重,并进行加权融合得到词的突发特征值,将突发特征值大的词挑选出来构成突发特征词集,构建基于共现度和结合紧密度的突发事件特征词集的耦合度矩阵;最后将该耦合度矩阵作为凝聚式层次聚类算法的输入,生成一棵由突发词为叶子节点的二叉树,并采用内部相似度的二叉树剪枝算法对聚类结果进行划分,即可实现对相应时间窗口突发事件的检测.实验结果表明,基于突发词的事件检测模型在簇内部相似度阈值等于1.1时效果最好,正确率达到0.8462、召回率达到0.8684、F值为0.8571,表明了本文所提方法的有效性. 展开更多
关键词 微博 突发事件 突发特征词 D-S证据理论 凝聚层次聚类
在线阅读 下载PDF
自闭症谱系障碍儿童静息状态下脑电微状态研究 被引量:3
17
作者 张锁良 万灵燕 +3 位作者 张志明 康健楠 李小俚 庞姣 《中国生物医学工程学报》 CAS CSCD 北大核心 2021年第6期653-661,共9页
利用微状态分析方法,在静息状态下的脑电图(EEG)尺度上探究自闭症谱系障碍(ASD)儿童与正常儿童(TD)在脑机制上的差异。根据Cartool中的准则和不同微状态类别的数目对于被试者EEG数据的解释程度,确定微状态类别的数目为4;使用原子化与凝... 利用微状态分析方法,在静息状态下的脑电图(EEG)尺度上探究自闭症谱系障碍(ASD)儿童与正常儿童(TD)在脑机制上的差异。根据Cartool中的准则和不同微状态类别的数目对于被试者EEG数据的解释程度,确定微状态类别的数目为4;使用原子化与凝聚层次聚类算法,分割出个人水平和组水平上的微状态类别,分别标记为微状态A、B、C和D。然后根据这4类微状态的地形图和EEG数据各时间点的GEV相关性,将数据拟合回EEG数据,最终得到微状态时间序列,提取时域上的参数特征,比较ASD组和TD组的差异。选取的时间参数为平均持续时间、发生频率、时间覆盖率和转移概率,并通过计算马尔可夫模型的方法探究微状态序列的独立性。结果表明,在ASD组vs TD组中表现有统计差异(P<0.05)的微状态时间参数有:持续时间(A:0.110±0.013 vs 0.180±0.048,C:0.140±0.024 vs 0.220±0.067,D:0.130±0.050 vs 0.190±0.037,单位:s)、时间覆盖率(A:22.0±5.4 vs 27.0±7.2,B:27.0±4.7 vs 18.0±5.5,单位:%)、发生频率(A:1.93±0.52 vs 1.55±0.22,B:2.08±0.46 vs 1.39±0.32,C:2.10±0.49 vs 1.47±0.30,D:1.78±0.19 vs 1.27±0.27,单位:次/s),且卡方检验不支持微状态类别之间在时间序列上是独立的零假设(P<0.01),提示微状态类别之间存在依赖性以及信息共享性。本研究为自闭症的评估提供了客观指标和科学依据。 展开更多
关键词 静息态脑电 自闭症谱系障碍微状态 自闭症谱系障碍 原子化与凝聚层次聚类
在线阅读 下载PDF
融合簇边界移动与自适应合成的混合采样算法 被引量:4
18
作者 高雷阜 张梦瑶 赵世杰 《电子学报》 EI CAS CSCD 北大核心 2022年第10期2517-2529,共13页
针对伪负采样算法(Pseudo-Negative Sampling,PNS)存在的类内子聚集和类别重叠问题,提出一种融合簇边界负样本移动策略(Cluster Boundary Negative Movement Strategy,CBNMS)与自适应正样本合成技术(Adaptive Pos⁃itive Synthesis Techn... 针对伪负采样算法(Pseudo-Negative Sampling,PNS)存在的类内子聚集和类别重叠问题,提出一种融合簇边界负样本移动策略(Cluster Boundary Negative Movement Strategy,CBNMS)与自适应正样本合成技术(Adaptive Pos⁃itive Synthesis Technology,ADPST)的改进混合采样算法(Improved Cluster Boundary Negative Movement Strategy,ICB⁃NMS),以提升非均衡数据的整体分类性能和正类识别精度.CBNMS策略采用凝聚层次聚类对正负类样本进行划分,并通过各局部样本间相似关系识别潜在负类中且与正类相关性较大的簇边界负样本,提高采样的局部精确性和时效性.为进一步加强CBNMS策略对正样本重叠区域的识别性能,ICBNMS算法在簇边界负样本移动均衡化基础上,引入ADPST技术,利用稀疏度与距离复合因子组合加权以自适应确定最优样本生成区域,从而有效削弱样本的重叠性且丰富样本的多样性.实验结果表明,相比其他采样算法,ICBNMS算法在10个非均衡数据集的多组实验中G-mean和Fmeasure等指标获得最优值,且时间效率比CDSMOTE和PNS算法分别提升了32.27%和27.88%,凸显出更优越的鲁棒性和泛化性. 展开更多
关键词 非均衡数据分类 凝聚层次聚类 簇边界负样本移动 自适应正样本合成 混合采样
在线阅读 下载PDF
基于VMD-DTW聚类的配电网故障选线方法研究 被引量:6
19
作者 舒征宇 汪俊 +3 位作者 许欣慧 翟二杰 黄志鹏 杨世勇 《三峡大学学报(自然科学版)》 CAS 2021年第3期65-71,共7页
提出了一种基于VMD-DTW聚类的小电流接地系统故障选线方法.通过变分模态分解法(VMD)提取和增强原始信号,而后引入动态时间归整法(DTW)实现不同线路零序电流相似性测度和聚类,根据聚类结果区分故障线路和健康线路,从而实现故障选线的目的... 提出了一种基于VMD-DTW聚类的小电流接地系统故障选线方法.通过变分模态分解法(VMD)提取和增强原始信号,而后引入动态时间归整法(DTW)实现不同线路零序电流相似性测度和聚类,根据聚类结果区分故障线路和健康线路,从而实现故障选线的目的.最终的仿真试验结果证明,本文所提方法在不同场景下的适应性较强,特别是在接地电阻大、消弧线圈电抗较高等故障特征较弱的场景中可以提升故障选线的准确率.同时,该方法具有较强的鲁棒性,当初始信号采样频率和采样存在噪声时依然可以准确地选定故障线路. 展开更多
关键词 变分模态分解(VMD) 动态时间归整(DTW) 层次凝聚聚类 故障选线
在线阅读 下载PDF
基于职业特征的人名消歧算法 被引量:2
20
作者 阳怡林 周杰 +1 位作者 李弼程 李爱国 《信息工程大学学报》 2016年第5期548-554,共7页
职业是人物实体的代表性特征,能够有效地区分人物实体。传统人名消歧算法仅把职业当作一个普通的特征,忽视了它的重要性。针对以上问题,提出了基于职业特征的人名消歧算法。首先通过互联网手动构建基础职业词典;其次以维基百科的所有中... 职业是人物实体的代表性特征,能够有效地区分人物实体。传统人名消歧算法仅把职业当作一个普通的特征,忽视了它的重要性。针对以上问题,提出了基于职业特征的人名消歧算法。首先通过互联网手动构建基础职业词典;其次以维基百科的所有中文页面为训练语料,通过词激活力模型扩展基础职业词典得到职业特征词典;然后从文本中提取职业特征,并抽取人名和作品名作为其补充特征,弥补文本中职业特征缺失和同一人物具有多个职业的问题;最后采用凝聚层次聚类实现人名消歧。在CLP2010的人名消歧训练语料上进行实验,结果表明文章算法能够有效地实现人名消歧。 展开更多
关键词 职业特征 亲和度 人名消歧 词激活力 凝聚层次聚类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部