期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于多重文本关系图中clique子团聚类的主题识别方法研究 被引量:4
1
作者 郭红梅 孔贝贝 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第5期433-442,共10页
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈... 在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。 展开更多
关键词 clique子团 多重文本关系 文本主题识别
在线阅读 下载PDF
基于相对熵和子空间二次过滤的CLIQUE改进算法 被引量:1
2
作者 郭景峰 易莉桦 《燕山大学学报》 CAS 2011年第4期359-365,共7页
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚... 提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。 展开更多
关键词 子空间聚类 相对熵 联合基尼值 维关联度 clique
在线阅读 下载PDF
改进的CLIQUE优化算法 被引量:4
3
作者 高亚鲁 宋余庆 朱玉全 《计算机工程与设计》 CSCD 北大核心 2009年第16期3801-3804,共4页
为了解决子空间聚类算法时间复杂度偏高和网格划分不太合理的问题,通过对数据空间进行网格划分并寻找稀疏区域来发现簇的边界,对算法的时间复杂度进行优化,达到对子空间聚类算法CLIQUE进行了优化和改进目的。优化算法采用了自适应的网... 为了解决子空间聚类算法时间复杂度偏高和网格划分不太合理的问题,通过对数据空间进行网格划分并寻找稀疏区域来发现簇的边界,对算法的时间复杂度进行优化,达到对子空间聚类算法CLIQUE进行了优化和改进目的。优化算法采用了自适应的网格划分方法,提高了发现高维子空间的可能性。优化算法通过对剪枝方式的优化,有效地控制了算法的复杂度。实验结果表明,该算法在精度、时间复杂性等方面的性能良好。 展开更多
关键词 数据挖掘 子空间聚类 网格划分 密度聚类 clique
在线阅读 下载PDF
基于高斯过程的CLIQUE改进算法 被引量:7
4
作者 向柳明 周渭博 钟勇 《计算机应用》 CSCD 北大核心 2015年第A02期85-87,92,共4页
CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLI... CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLIQUE改进算法GP-CLIQUE。该算法识别密集网格后,先在密集网格空间的每一维上进行高斯随机采样快速找到密度局部最大的密集网格;再分别从这些密度局部最大的密集网格进行深度优先遍历生成聚类簇;最后确定每个聚类簇的最小覆盖。实验结果表明,在数据集小且无噪声时,该算法在性能上与CLIQUE相当,当数据集大噪声较多时,其性能较CLIQUE能提高6%~24%。 展开更多
关键词 clique 高斯过程 聚类簇 密集网格 深度优先遍历 局部最大密度 高斯随机采样
在线阅读 下载PDF
基于网格空间团的多级同位模式挖掘方法 被引量:3
5
作者 刘宇情 王丽珍 +1 位作者 杨培忠 朴丽莎 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第5期918-930,共13页
针对传统的多级同位模式挖掘方法未考虑到实际数据分布的网格特性,且从全局到区域的多级模式挖掘框架会导致算法效率低下的问题,提出逆向挖掘多级同位模式的新框架.先挖掘区域同位模式,再由区域同位模式推导出全局同位模式,提出有效的... 针对传统的多级同位模式挖掘方法未考虑到实际数据分布的网格特性,且从全局到区域的多级模式挖掘框架会导致算法效率低下的问题,提出逆向挖掘多级同位模式的新框架.先挖掘区域同位模式,再由区域同位模式推导出全局同位模式,提出有效的剪枝策略提高挖掘效率.考虑真实数据集中数据分布的网格特性,定义实例间的网格邻近关系,提出网格空间团及计算网格空间团的新颖方法.在区域划分阶段,提出基于自适应网格密度峰值聚类的区域划分方法,基于2阶网格空间团的网格相似性来分配簇.在合成和实际数据集上进行大量的实验,验证了提出方法的有效性、高效性和可扩展性,在真实数据集上的剪枝率可以达到78%. 展开更多
关键词 空间数据挖掘 多级同位模式 网格空间团 密度峰值聚类(DPC)
在线阅读 下载PDF
层次聚类社区发现算法的研究 被引量:21
6
作者 龚尚福 陈婉璐 贾澎涛 《计算机应用研究》 CSCD 北大核心 2013年第11期3216-3220,3227,共6页
概述了社区发现算法的研究现状;介绍了因分析对象的不同而产生的四类社区发现方法:矩阵谱分析方法、层次聚类方法、基于边图思想的方法和基于极大团思想的方法。对其中性能最优的层次聚类方法进行了详细的综述,并对其典型算法进行了分... 概述了社区发现算法的研究现状;介绍了因分析对象的不同而产生的四类社区发现方法:矩阵谱分析方法、层次聚类方法、基于边图思想的方法和基于极大团思想的方法。对其中性能最优的层次聚类方法进行了详细的综述,并对其典型算法进行了分析比较。最后,提出了社区发现算法可能的研究方向,为今后的研究提供参考。 展开更多
关键词 社区发现 复杂网络 矩阵谱分析 层次聚类 边图思想 极大团方法
在线阅读 下载PDF
一种有效的并行高维聚类算法 被引量:6
7
作者 冯永 吴开贵 +1 位作者 熊忠阳 吴中福 《计算机科学》 CSCD 北大核心 2005年第3期216-218,共3页
针对CLQUE算法聚类结果精确性不高的缺点,提出利用小波变换来生成自适应网格的方法对CLIQUE算法进行改进,将改进算法并行化以增强聚类维数升高时算法的可伸缩性,并将其应用于药品的销售预测。实验表明本算法聚类结果的精确性高,可伸缩性... 针对CLQUE算法聚类结果精确性不高的缺点,提出利用小波变换来生成自适应网格的方法对CLIQUE算法进行改进,将改进算法并行化以增强聚类维数升高时算法的可伸缩性,并将其应用于药品的销售预测。实验表明本算法聚类结果的精确性高,可伸缩性好,并且有效地降低了计算复杂度。 展开更多
关键词 并行 高维聚类算法 clique算法 小波变换 自适应网络
在线阅读 下载PDF
多维加权社会网络中的个性化推荐算法 被引量:8
8
作者 张华青 王红 +1 位作者 滕兆明 马晓慧 《计算机应用》 CSCD 北大核心 2011年第9期2408-2411,2428,共5页
个性化推荐是解决Internet中信息过载的重要工具,在研究有关个性化推荐的技术和相关动态的基础上,以用户实际应用为驱动,提出一种多维加权社会网络中的个性化推荐算法。首先,该算法构建了用户之间的多维加权网络;然后利用复杂网络的聚... 个性化推荐是解决Internet中信息过载的重要工具,在研究有关个性化推荐的技术和相关动态的基础上,以用户实际应用为驱动,提出一种多维加权社会网络中的个性化推荐算法。首先,该算法构建了用户之间的多维加权网络;然后利用复杂网络的聚类方法——CPM算法寻找邻居用户;最后基于用户之间的相似性做出推荐。实验结果表明,应用该算法的多维网络的推荐系统与基于内容推荐系统和协同过滤推荐系统相比,有较高的查全率和准确率,个性化推荐质量有了一定程度的提高。 展开更多
关键词 个性化推荐 社会网络 权重 复杂网络 CPM聚类
在线阅读 下载PDF
基于子空间聚类算法的时空轨迹聚类 被引量:9
9
作者 马林兵 李鹏 《地理与地理信息科学》 CSCD 北大核心 2014年第4期7-11,F0003,共6页
已有的时空轨迹聚类方法一般以整条轨迹作为聚类单元,聚类效果较低且不能识别轨迹局部特征;另一种轨迹聚类方法是以划分后轨迹段为聚类单元,算法效率较低且不能很好地支持多属性聚类。该文提出基于子空间聚类算法的时空轨迹聚类。首先... 已有的时空轨迹聚类方法一般以整条轨迹作为聚类单元,聚类效果较低且不能识别轨迹局部特征;另一种轨迹聚类方法是以划分后轨迹段为聚类单元,算法效率较低且不能很好地支持多属性聚类。该文提出基于子空间聚类算法的时空轨迹聚类。首先引入数据归约的思想,将轨迹进行离散化处理,再运用CLIQUE算法对离散化后的轨迹段进行聚类。实验结果表明,此轨迹聚类方法具有较高的伸缩性,能有效地处理多维轨迹数据并识别轨迹的局部聚类特征,能揭示时空轨迹在不同子空间的运动规律。 展开更多
关键词 轨迹聚类 子空间 clique算法
在线阅读 下载PDF
移动自组网中基于分簇的数据复制算法(英文) 被引量:3
10
作者 郑静 卢锡城 王意洁 《软件学报》 EI CSCD 北大核心 2005年第8期1474-1483,共10页
在移动自组网络中,网络分割现象可能频繁发生,从而降低了数据的可用性.提出了一种新的分布式分簇算法来组织移动节点,算法保证簇内任意两点间路径的可用概率都大于某个确定的界.在此基础上提出了基于稳定路径分簇的数据复制策略,以提高... 在移动自组网络中,网络分割现象可能频繁发生,从而降低了数据的可用性.提出了一种新的分布式分簇算法来组织移动节点,算法保证簇内任意两点间路径的可用概率都大于某个确定的界.在此基础上提出了基于稳定路径分簇的数据复制策略,以提高在出现链路断接甚至网络分割时的数据可用性.对算法进行了理论证明和实验分析,实验结果表明,由分簇算法构造的簇能够满足我们所要求的特性,并且基于分簇的数据复制算法在移动自组网环境中有效地提高了数据的可用性. 展开更多
关键词 MANET 复制 分簇 数据可用性 最大子图
在线阅读 下载PDF
两元指纹向量聚类问题的复杂性与改进启发式算法 被引量:1
11
作者 刘培强 朱大铭 +2 位作者 谢青松 范辉 马绍汉 《软件学报》 EI CSCD 北大核心 2008年第3期500-510,共11页
证明丢失值位数不超过2的指纹向量聚类问题为NP-Hard,并给出Figueroa等人指纹向量聚类启发式算法的改进算法.主要改进了算法的实现方法.以链表存储相容顶点集合,并以逐位扫描指纹向量的方法产生相容点集链表,可将产生相容点集的时间复... 证明丢失值位数不超过2的指纹向量聚类问题为NP-Hard,并给出Figueroa等人指纹向量聚类启发式算法的改进算法.主要改进了算法的实现方法.以链表存储相容顶点集合,并以逐位扫描指纹向量的方法产生相容点集链表,可将产生相容点集的时间复杂性由O(m·n·2p)减小为O(m·(n·p+1)·2p),可使划分一个唯一极大团或最大团的时间复杂性由O(m·p·2p)减小为O(m·2p).实际测试显示,改进算法的空间复杂性平均减少为原算法的49%以下,平均可用原算法20%的时间求解与原算法相同的实例.当丢失值位数超过6时,改进算法几乎总可用不超过原算法11%的时间计算与原算法相同的实例. 展开更多
关键词 算法 复杂性 指纹向量聚类 基因表达谱 团划分
在线阅读 下载PDF
社群网络中基于链接分类的研究与应用 被引量:1
12
作者 肖丁 万里 +1 位作者 吴斌 陈平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期155-158,共4页
由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其... 由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其在电信客户流失预测的应用方法,在提取并分析大规模客户呼叫图的极大团、结点膨胀率、结点聚集度等与节点稳定性相关的链接属性及其时变特征的基础上,提出了一种适合海量数据的基于链接的电信客户流失预测算法。实验结果表明,此算法较传统分类算法能提高客户流失预测性能,实现了基于链接分类方法的成功应用。 展开更多
关键词 社群网络分析 链接分类 极大团 膨胀率 聚集度
在线阅读 下载PDF
一种MANET环境中基于稳定路径的分簇算法 被引量:1
13
作者 郑静 王意洁 任响响 《计算机工程与科学》 CSCD 2006年第3期81-84,共4页
本文提出一种新的分布式分簇算法来组织MANET中的移动节点。算法基于节点间路径的稳定性,保证簇内任意两点间的路径可用概率大于某个确定的界。由于算法基于路径的可用概率,因此形成的簇能适应网络拓扑变化。算法的目的是为了支持MANET... 本文提出一种新的分布式分簇算法来组织MANET中的移动节点。算法基于节点间路径的稳定性,保证簇内任意两点间的路径可用概率大于某个确定的界。由于算法基于路径的可用概率,因此形成的簇能适应网络拓扑变化。算法的目的是为了支持MANET环境中的数据复制,通过分簇来预测网络分割,以提高数据访问的可用性。本文对算法的复杂性作了理论性分析,对簇的性质进行了理论证明和实验分析。 展开更多
关键词 MANET 分簇 完全子图
在线阅读 下载PDF
一种基于K近邻团的聚类算法
14
作者 曲超 袁瑞芬 魏小锐 《科学技术与工程》 北大核心 2013年第19期5696-5701,共6页
在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通... 在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通过实验证明了该方法的有效性。 展开更多
关键词 K近邻 逆K近邻 K近邻团 聚类算法
在线阅读 下载PDF
基于高维度数据单元划分算法的异常检测
15
作者 彭立志 杨波 陈月辉 《计算机工程与应用》 CSCD 北大核心 2006年第3期133-135,160,共4页
文章借鉴CLIQUE聚类算法关于高维度数据空间单元划分的思想,将该思想引入到异常入侵检测中,并通过非均衡划分方法对该算法进行改进,力图建立一个对高维度入侵检测数据有效的异常检测模型。同时结合遗传算法,基于预定义的入侵检测数据集... 文章借鉴CLIQUE聚类算法关于高维度数据空间单元划分的思想,将该思想引入到异常入侵检测中,并通过非均衡划分方法对该算法进行改进,力图建立一个对高维度入侵检测数据有效的异常检测模型。同时结合遗传算法,基于预定义的入侵检测数据集对高维度的入侵检测数据进行了数据维度约简的研究。 展开更多
关键词 入侵检测 异常检测 数据挖掘 clique聚类算法 遗传算法 高维度数据 单元划分算法
在线阅读 下载PDF
团图点删除问题的近似算法
16
作者 高文宇 李华 《计算机应用》 CSCD 北大核心 2015年第8期2137-2139,2146,共4页
针对团图点删除问题的3-近似算法得到的近似解可能较大的问题,通过对团图点删除问题及团图特性的分析,提出了该问题的一个新的近似算法。新算法通过考察图中节点的一阶和二阶邻点来计算节点关联的P3的数目,然后优先选择P3数最大的节点... 针对团图点删除问题的3-近似算法得到的近似解可能较大的问题,通过对团图点删除问题及团图特性的分析,提出了该问题的一个新的近似算法。新算法通过考察图中节点的一阶和二阶邻点来计算节点关联的P3的数目,然后优先选择P3数最大的节点加入解集,以期尽快消除图中的P3,从而最终获得较小的点删除集。为检验算法效果,设计了多组不同场景的随机实验对新算法和经典的3-近似算法进行了比较。随机实验表明,新算法较经典的3-近似算法有明显的优势。 展开更多
关键词 团图点删除 NP完全 近似算法 团图分析
在线阅读 下载PDF
基于团划分的成像侦察任务聚类方法研究 被引量:7
17
作者 许语拉 徐培德 +1 位作者 王慧林 彭玉华 《运筹与管理》 CSCD 北大核心 2010年第4期143-149,共7页
成像侦察任务聚类是提高成像侦察卫星利用效率的重要手段。在分析成像侦察任务间聚类关系的基础上,建立了成像侦察任务聚类模型,采用图论中的团划分理论对其进行求解,并给出了相应算法,最后用一个示例验证了算法的有效性。
关键词 卫星调度 任务聚类 团划分 成像侦察
在线阅读 下载PDF
基于摄像头域内域间合并的无监督行人重识别方法 被引量:2
18
作者 陈利文 叶锋 +4 位作者 黄添强 黄丽清 翁彬 徐超 胡杰 《计算机研究与发展》 EI CSCD 北大核心 2023年第2期415-425,共11页
在刑事侦查、智能监控、图像检索等领域,行人重识别一直是研究的热点.由于现有的大部分方法依赖有标注数据集,因此标签的缺乏使得无监督的行人重识别技术变得更具挑战性.为了克服这一问题,提出了一个用于生成可靠伪标签的框架,这些生成... 在刑事侦查、智能监控、图像检索等领域,行人重识别一直是研究的热点.由于现有的大部分方法依赖有标注数据集,因此标签的缺乏使得无监督的行人重识别技术变得更具挑战性.为了克服这一问题,提出了一个用于生成可靠伪标签的框架,这些生成标签可以为现有监督行人重识别模型提供监督信号.假设数据集内的大部分图片都满足同一个摄像头拍摄的图片差异主要在于前景(行人)、同一个行人被不同摄像头拍摄到的图片差异主要在于背景.为了消除图片背景带来的差异,首先把数据集中的图片依据摄像头编号分成若干个域,通过计算每个域内的图片间的欧式距离,建立图模型,执行最大团算法寻找最相似的若干个图片并认为它们属于同一个行人;紧接着计算不同摄像头域间的团的相似度,据此进行合并;最终给出全局伪标签.所提的框架无需人为标注数据,以一种无监督的方式运行,并在Market1501和DukeMTMC-ReID数据集上进行实验,实验发现所提方法比其他相关方法具有更高的精度,从而进一步证明了所提方法的有效性. 展开更多
关键词 行人重识别 无监督学习 最大团算法 伪标签 聚类
在线阅读 下载PDF
一种基于通讯痕迹的社会网络团伙分析模型 被引量:6
19
作者 高建强 谭剑 崔永发 《计算机应用与软件》 CSCD 北大核心 2012年第3期206-208,286,共4页
研究在已知目标团伙中某节点以及目标团伙特征的前提下,基于通讯痕迹特征寻找社会网络团伙。研究过程中引入了社会圈、节点中心度和事件集合关联矩阵等概念,重点将聚类分析方法与社会团伙发现相结合,以期得到一种基于通讯痕迹的社会网... 研究在已知目标团伙中某节点以及目标团伙特征的前提下,基于通讯痕迹特征寻找社会网络团伙。研究过程中引入了社会圈、节点中心度和事件集合关联矩阵等概念,重点将聚类分析方法与社会团伙发现相结合,以期得到一种基于通讯痕迹的社会网络团伙分析模型。 展开更多
关键词 通讯痕迹 社会网络 团伙发现 聚类分析
在线阅读 下载PDF
基于网格和密度的聚类算法的分析与研究 被引量:1
20
作者 许英杰 孙俊逸 《现代电子技术》 2008年第20期125-127,共3页
针对CLIQUE算法的特点以及所存在的问题进行深入的研究。为了进一步提高其处理高维海量数据的能力,在原算法的基础上提出一种基于密度样本分析和基于最优区间分割进行改进的聚类算法,并通过使用仿真数据加以验证是可行的,理论分析与实... 针对CLIQUE算法的特点以及所存在的问题进行深入的研究。为了进一步提高其处理高维海量数据的能力,在原算法的基础上提出一种基于密度样本分析和基于最优区间分割进行改进的聚类算法,并通过使用仿真数据加以验证是可行的,理论分析与实验结果表明,与原算法相比,改进算法不仅保留原算法的优点,且对大规模数据集有着很好的聚类效果。 展开更多
关键词 聚类 最优区间分割 密度 clique算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部