期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于多重文本关系图中clique子团聚类的主题识别方法研究 被引量:4
1
作者 郭红梅 孔贝贝 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第5期433-442,共10页
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈... 在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。 展开更多
关键词 clique子团 多重文本关系 文本主题识别
在线阅读 下载PDF
一种用于居住热区聚类的改进CLIQUE算法 被引量:3
2
作者 李世明 张秉桢 +2 位作者 杜军 朱海龙 付宝君 《小型微型计算机系统》 CSCD 北大核心 2020年第1期61-65,共5页
在居住热区分析应用中,已有的CLIQUE算法密度阈值初始化多采用主观性较强的经验值,容易对聚类结果造成不良影响.针对该问题提出了一种自适应密度阈值选取的CLIQUE算法(APS-CLIQUE,Adaptive Parameter Selection-CLIQUE),并对聚类边界进... 在居住热区分析应用中,已有的CLIQUE算法密度阈值初始化多采用主观性较强的经验值,容易对聚类结果造成不良影响.针对该问题提出了一种自适应密度阈值选取的CLIQUE算法(APS-CLIQUE,Adaptive Parameter Selection-CLIQUE),并对聚类边界进行了优化处理.该算法首先使用四分位数箱型模型排除数据形态两端对结果的干扰,解决密度阈值自适应问题;其次通过边界网格的判定,提高了聚类边界精度.使用UCI标准数据集、成都市出租车GPS轨迹浮动数据集进行了对比实验,实验结果表明本文算法的Dunn指数较CLIQUE算法分别提高了26.53%、28.66%. 展开更多
关键词 居住热区 clique算法 自适应密度阈值 Dunn指数
在线阅读 下载PDF
基于相对熵和子空间二次过滤的CLIQUE改进算法 被引量:1
3
作者 郭景峰 易莉桦 《燕山大学学报》 CAS 2011年第4期359-365,共7页
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚... 提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。 展开更多
关键词 子空间聚类 相对熵 联合基尼值 维关联度 clique
在线阅读 下载PDF
改进的CLIQUE优化算法 被引量:4
4
作者 高亚鲁 宋余庆 朱玉全 《计算机工程与设计》 CSCD 北大核心 2009年第16期3801-3804,共4页
为了解决子空间聚类算法时间复杂度偏高和网格划分不太合理的问题,通过对数据空间进行网格划分并寻找稀疏区域来发现簇的边界,对算法的时间复杂度进行优化,达到对子空间聚类算法CLIQUE进行了优化和改进目的。优化算法采用了自适应的网... 为了解决子空间聚类算法时间复杂度偏高和网格划分不太合理的问题,通过对数据空间进行网格划分并寻找稀疏区域来发现簇的边界,对算法的时间复杂度进行优化,达到对子空间聚类算法CLIQUE进行了优化和改进目的。优化算法采用了自适应的网格划分方法,提高了发现高维子空间的可能性。优化算法通过对剪枝方式的优化,有效地控制了算法的复杂度。实验结果表明,该算法在精度、时间复杂性等方面的性能良好。 展开更多
关键词 数据挖掘 子空间聚类 网格划分 密度聚类 clique
在线阅读 下载PDF
基于高斯过程的CLIQUE改进算法 被引量:7
5
作者 向柳明 周渭博 钟勇 《计算机应用》 CSCD 北大核心 2015年第A02期85-87,92,共4页
CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLI... CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLIQUE改进算法GP-CLIQUE。该算法识别密集网格后,先在密集网格空间的每一维上进行高斯随机采样快速找到密度局部最大的密集网格;再分别从这些密度局部最大的密集网格进行深度优先遍历生成聚类簇;最后确定每个聚类簇的最小覆盖。实验结果表明,在数据集小且无噪声时,该算法在性能上与CLIQUE相当,当数据集大噪声较多时,其性能较CLIQUE能提高6%~24%。 展开更多
关键词 clique 高斯过程 聚类簇 密集网格 深度优先遍历 局部最大密度 高斯随机采样
在线阅读 下载PDF
A novel scale-free network model based on clique growth 被引量:1
6
作者 王波 杨旭华 王万良 《Journal of Central South University》 SCIE EI CAS 2009年第3期474-477,共4页
A novel scale-flee network model based on clique (complete subgraph of random size) growth and preferential attachment was proposed. The simulations of this model were carried out. And the necessity of two evolving ... A novel scale-flee network model based on clique (complete subgraph of random size) growth and preferential attachment was proposed. The simulations of this model were carried out. And the necessity of two evolving mechanisms of the model was verified. According to the mean-field theory, the degree distribution of this model was analyzed and computed. The degree distribution function of vertices of the generating network P(d) is 2m^2m1^-3(d-m1 + 1)^-3, where m and m1 denote the number of the new adding edges and the vertex number of the cliques respectively, d is the degree of the vertex, while one of cliques P(k) is 2m^2Ek^-3, where k is the degree of the clique. The simulated and analytical results show that both the degree distributions of vertices and cliques follow the scale-flee power-law distribution. The scale-free property of this model disappears in the absence of any one of the evolving mechanisms. Moreover, the randomicity of this model increases with the increment of the vertex number of the cliques. 展开更多
关键词 SCALE-FREE clique growth preferential attachment degree distribution
在线阅读 下载PDF
复杂属性条件下基于Spark的clique社区搜索算法
7
作者 佘鑫 何震瀛 《计算机工程》 CAS CSCD 北大核心 2021年第12期54-61,70,共9页
现有的社区搜索算法难以在网络中找到满足给定复杂属性条件的社区。同时,随着网络规模的不断扩大,单机串行的社区搜索算法也已无法有效地处理大规模的网络数据。针对复杂属性条件下的clique社区搜索问题,提出一种基于Spark的搜索算法。... 现有的社区搜索算法难以在网络中找到满足给定复杂属性条件的社区。同时,随着网络规模的不断扩大,单机串行的社区搜索算法也已无法有效地处理大规模的网络数据。针对复杂属性条件下的clique社区搜索问题,提出一种基于Spark的搜索算法。在Spark并行计算框架的基础上,结合图的结构特征和内容属性,根据由布尔表达式定义的复杂属性条件采取不同的搜索策略,搜索时利用属性的搜索成本和扩展成本进行局部优化,从而加快搜索过程。实验结果表明,与结构优先或属性优先的社区搜索算法相比,该算法在不同属性条件、网络规模和节点数目的情况下均能保证搜索准确性并提高搜索效率。 展开更多
关键词 社区搜索 复杂属性条件 布尔表达式 Spark并行计算框架 clique结构
在线阅读 下载PDF
A novel weighted evolving network model based on clique overlapping growth
8
作者 杨旭华 王波 孙豹 《Journal of Central South University》 SCIE EI CAS 2010年第4期830-835,共6页
A novel weighted evolving network model based on the clique overlapping growth was proposed.The model shows different network characteristics under two different selection mechanisms that are preferential selection an... A novel weighted evolving network model based on the clique overlapping growth was proposed.The model shows different network characteristics under two different selection mechanisms that are preferential selection and random selection.On the basis of mean-field theory,this model under the two different selection mechanisms was analyzed.The analytic equations of distributions of the number of cliques that a vertex joins and the vertex strength of the model were given.It is proved that both distributions follow the scale-free power-law distribution in preferential selection mechanism and the exponential distribution in random selection mechanism,respectively.The analytic expressions of exponents of corresponding distributions were obtained.The agreement between the simulations and analytical results indicates the validity of the theoretical analysis.Finally,three real transport bus networks(BTNs) of Beijing,Shanghai and Hangzhou in China were studied.By analyzing their network properties,it is discovered that these real BTNs belong to a kind of weighted evolving network model with clique overlapping growth and random selection mechanism that was proposed in this context. 展开更多
关键词 weighted network clique overlapping mean-field theory bus transport network
在线阅读 下载PDF
一种有效的并行高维聚类算法 被引量:6
9
作者 冯永 吴开贵 +1 位作者 熊忠阳 吴中福 《计算机科学》 CSCD 北大核心 2005年第3期216-218,共3页
针对CLQUE算法聚类结果精确性不高的缺点,提出利用小波变换来生成自适应网格的方法对CLIQUE算法进行改进,将改进算法并行化以增强聚类维数升高时算法的可伸缩性,并将其应用于药品的销售预测。实验表明本算法聚类结果的精确性高,可伸缩性... 针对CLQUE算法聚类结果精确性不高的缺点,提出利用小波变换来生成自适应网格的方法对CLIQUE算法进行改进,将改进算法并行化以增强聚类维数升高时算法的可伸缩性,并将其应用于药品的销售预测。实验表明本算法聚类结果的精确性高,可伸缩性好,并且有效地降低了计算复杂度。 展开更多
关键词 并行 高维聚类算法 clique算法 小波变换 自适应网络
在线阅读 下载PDF
高维不确定数据的子空间聚类算法 被引量:3
10
作者 万静 郑龙君 +1 位作者 何云斌 李松 《计算机应用》 CSCD 北大核心 2019年第11期3280-3287,共8页
如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维... 如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维度不确定数据,并分别处理以提高算法效率。采用结合期望距离的K近邻(K NN)查询得到对聚类结果影响最小的不确定数据近似值以提高聚类精度。在得到确定数据之后,采用子空间聚类的方式避免维度灾难的影响。实验结果证明,基于Clique的高维不确定数据聚类算法(UClique)在UCI数据集上有较好的表现,有良好的抗噪声能力和伸缩性,在高维数据上能得到较好的聚类结果,在不同的不确定数据集实验中能够得到较高精度的实验结果,体现出算法具有一定的健壮性,能够有效地对高维不确定数据集聚类。 展开更多
关键词 高维 不确定 clique算法 K近邻
在线阅读 下载PDF
基于子空间聚类算法的时空轨迹聚类 被引量:9
11
作者 马林兵 李鹏 《地理与地理信息科学》 CSCD 北大核心 2014年第4期7-11,F0003,共6页
已有的时空轨迹聚类方法一般以整条轨迹作为聚类单元,聚类效果较低且不能识别轨迹局部特征;另一种轨迹聚类方法是以划分后轨迹段为聚类单元,算法效率较低且不能很好地支持多属性聚类。该文提出基于子空间聚类算法的时空轨迹聚类。首先... 已有的时空轨迹聚类方法一般以整条轨迹作为聚类单元,聚类效果较低且不能识别轨迹局部特征;另一种轨迹聚类方法是以划分后轨迹段为聚类单元,算法效率较低且不能很好地支持多属性聚类。该文提出基于子空间聚类算法的时空轨迹聚类。首先引入数据归约的思想,将轨迹进行离散化处理,再运用CLIQUE算法对离散化后的轨迹段进行聚类。实验结果表明,此轨迹聚类方法具有较高的伸缩性,能有效地处理多维轨迹数据并识别轨迹的局部聚类特征,能揭示时空轨迹在不同子空间的运动规律。 展开更多
关键词 轨迹聚类 子空间 clique算法
在线阅读 下载PDF
基于多重文本术语关系叠加识别文本核心主题的有效性探索 被引量:7
12
作者 郭红梅 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第11期1157-1164,共8页
目前基于图或网络进行文本主题挖掘的研究大多是基于单一文本术语关系,而文本是由一系列具有语义信息的术语,按照一定的逻辑结构构成的,这些术语除了物理位置上共现关系外,还存在句法上的支配从属关系和隐含的语义关联,仅利用单一术语... 目前基于图或网络进行文本主题挖掘的研究大多是基于单一文本术语关系,而文本是由一系列具有语义信息的术语,按照一定的逻辑结构构成的,这些术语除了物理位置上共现关系外,还存在句法上的支配从属关系和隐含的语义关联,仅利用单一术语关系对文本内容进行分析难免会造成信息的丢失,因此本文尝试将术语间的共现、句法和语义三种关系进行叠加,探索基于多重文本术语关系识别核心主题的有效性。文中选取PubMed数据库2012-2014年"migraine disorders"主题相关的249篇论文进行实验,结果表明术语和关系的叠加使文本主题信息更为凸显,同时存在三种关系的术语和边可表征文本的重要内容。对同时存在三种关系的术语和边组成多重文本术语关系图深度分析显示,叠加术语关系图中所包含的clique子团的边数和结点数少于术语共现关系图,但多于术语语义和句法关系图;在凝聚度最大的前20个clique中,叠加术语关系图中所含clique的凝聚度要高于共现、句法和语义三者中的任何一个,且这种差异具有统计学意义。多重术语关系的叠加平衡共现、句法和语义三种关系,在减少术语共现关系影响的同时增加术语语义和句法关系的优势,将三者含有的信息量进行叠加,克服了单独考虑一种术语关系时造成的信息丢失。 展开更多
关键词 文本术语关系叠加 文本主题识别 clique子团
在线阅读 下载PDF
基于高维度数据单元划分算法的异常检测
13
作者 彭立志 杨波 陈月辉 《计算机工程与应用》 CSCD 北大核心 2006年第3期133-135,160,共4页
文章借鉴CLIQUE聚类算法关于高维度数据空间单元划分的思想,将该思想引入到异常入侵检测中,并通过非均衡划分方法对该算法进行改进,力图建立一个对高维度入侵检测数据有效的异常检测模型。同时结合遗传算法,基于预定义的入侵检测数据集... 文章借鉴CLIQUE聚类算法关于高维度数据空间单元划分的思想,将该思想引入到异常入侵检测中,并通过非均衡划分方法对该算法进行改进,力图建立一个对高维度入侵检测数据有效的异常检测模型。同时结合遗传算法,基于预定义的入侵检测数据集对高维度的入侵检测数据进行了数据维度约简的研究。 展开更多
关键词 入侵检测 异常检测 数据挖掘 clique聚类算法 遗传算法 高维度数据 单元划分算法
在线阅读 下载PDF
基于网格和密度的聚类算法的分析与研究 被引量:1
14
作者 许英杰 孙俊逸 《现代电子技术》 2008年第20期125-127,共3页
针对CLIQUE算法的特点以及所存在的问题进行深入的研究。为了进一步提高其处理高维海量数据的能力,在原算法的基础上提出一种基于密度样本分析和基于最优区间分割进行改进的聚类算法,并通过使用仿真数据加以验证是可行的,理论分析与实... 针对CLIQUE算法的特点以及所存在的问题进行深入的研究。为了进一步提高其处理高维海量数据的能力,在原算法的基础上提出一种基于密度样本分析和基于最优区间分割进行改进的聚类算法,并通过使用仿真数据加以验证是可行的,理论分析与实验结果表明,与原算法相比,改进算法不仅保留原算法的优点,且对大规模数据集有着很好的聚类效果。 展开更多
关键词 聚类 最优区间分割 密度 clique算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部