期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
空间极大co-location模式挖掘研究 被引量:5
1
作者 胡新 王丽珍 +1 位作者 周丽华 温佛生 《计算机科学与探索》 CSCD 2014年第2期150-160,共11页
空间co-location模式代表了一组空间特征的子集,它们的实例在空间中频繁地关联。挖掘空间co-location模式的研究已经有很多,但是针对极大co-location模式挖掘的研究非常少。提出了一种新颖的空间极大co-location模式挖掘算法。首先扫描... 空间co-location模式代表了一组空间特征的子集,它们的实例在空间中频繁地关联。挖掘空间co-location模式的研究已经有很多,但是针对极大co-location模式挖掘的研究非常少。提出了一种新颖的空间极大co-location模式挖掘算法。首先扫描数据集得到二阶频繁模式,然后将二阶频繁模式转换为图,再通过极大团算法求解得到空间特征极大团,最后使用二阶频繁模式的表实例验证极大团得到空间极大co-location频繁模式。实验表明,该算法能够很好地挖掘空间极大co-location频繁模式。 展开更多
关键词 空间数据挖掘 空间极大co-location模式挖掘 极大
在线阅读 下载PDF
模糊对象的空间Co-location模式挖掘研究 被引量:27
2
作者 欧阳志平 王丽珍 陈红梅 《计算机学报》 EI CSCD 北大核心 2011年第10期1947-1955,共9页
空间co-location模式表示的是空间对象的实例在一个相同的区域内频繁地空间并置.过去人们已经对确定及不确定数据的co-location模式挖掘问题进行了一些研究,但是针对模糊对象上进行的研究还没有.模糊对象在许多领域里都有着非常重要的应... 空间co-location模式表示的是空间对象的实例在一个相同的区域内频繁地空间并置.过去人们已经对确定及不确定数据的co-location模式挖掘问题进行了一些研究,但是针对模糊对象上进行的研究还没有.模糊对象在许多领域里都有着非常重要的应用,比如生物医学图像数据库和GIS.该文研究模糊对象的空间co-location模式挖掘问题.首先,定义模糊对象上空间co-location模式挖掘的相关概念,包括模糊参与率、模糊参与度等.其次,提出FB算法挖掘模糊对象的co-location模式.接着,提出了3种改进算法,包括剪枝对象、减少实例间连接、改进剪枝步,以提高挖掘性能、加快co-location规则的产生.最后通过大量的实验说明FB算法及其改进算法的效果和效率. 展开更多
关键词 模糊对象 co-location模式 空间数据挖掘 模糊参与率 减少连接
在线阅读 下载PDF
一种基于U-AHC的不确定空间co-location模式挖掘算法 被引量:7
3
作者 高世健 王丽珍 肖清 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期60-66,共7页
不确定数据在一些重要应用领域中是固有存在的,如传感器网络和移动物体追踪等.如何快速、方便、有效地从不确定数据库中发现潜在的、有价值的和人们感兴趣的信息变得越来越重要.首先,把传统的凝聚层次聚类算法(AHC)扩展到不确定的凝聚... 不确定数据在一些重要应用领域中是固有存在的,如传感器网络和移动物体追踪等.如何快速、方便、有效地从不确定数据库中发现潜在的、有价值的和人们感兴趣的信息变得越来越重要.首先,把传统的凝聚层次聚类算法(AHC)扩展到不确定的凝聚层次聚类算法(U-AHC),然后在聚类结果的基础上计算候选co-location模式的粗表实例,并对参与度小于最小参与度阈值的候选模式进行剪枝.接着展开其粗表实例并动态地实施剪枝,最后生成频繁的co-location模式.实验证明这个算法是正确的,而且效率较高. 展开更多
关键词 空间数据挖掘 不确定数据 空间co-location模式 凝聚层次聚类算法 参与度
在线阅读 下载PDF
基于加权欧氏距离的空间Co-location模式挖掘算法研究 被引量:4
4
作者 周剑云 王丽珍 杨增芳 《计算机科学》 CSCD 北大核心 2014年第S1期425-428,共4页
空间Co_location模式挖掘关注空间对象实例在一定区域内同时出现的关系。目前大多数研究都是把空间对象的各个实例按同等权重对待,但现实中容易发现同一类对象的不同实例其大小规模、重要程度或是影响力覆盖范围都是不一样的。因此考虑... 空间Co_location模式挖掘关注空间对象实例在一定区域内同时出现的关系。目前大多数研究都是把空间对象的各个实例按同等权重对待,但现实中容易发现同一类对象的不同实例其大小规模、重要程度或是影响力覆盖范围都是不一样的。因此考虑空间对象实例的影响力因素,引入加权欧氏距离阈值参与计算,能发现更具实际价值的Co_location模式。 展开更多
关键词 空间数据挖掘 co-location模式挖掘 加权欧氏距离
在线阅读 下载PDF
基于特征效用参与率的空间高效用co-location模式挖掘方法 被引量:14
5
作者 王晓璇 王丽珍 +2 位作者 陈红梅 方圆 杨培忠 《计算机学报》 EI CSCD 北大核心 2019年第8期1721-1738,共18页
空间co-location模式是指其实例在空间邻域内频繁一起出现的空间特征子集.与传统的空间co-location模式挖掘不同,在空间高效用co-location模式挖掘中,不再将参与度(PI)作为有趣模式的度量指标,而是将效用值作为挖掘有趣模式的兴趣度量指... 空间co-location模式是指其实例在空间邻域内频繁一起出现的空间特征子集.与传统的空间co-location模式挖掘不同,在空间高效用co-location模式挖掘中,不再将参与度(PI)作为有趣模式的度量指标,而是将效用值作为挖掘有趣模式的兴趣度量指标.现有的空间高效用co-location模式挖掘方法分为特征带效用和实例带效用两类.特征带效用的现有方法没有考虑不同特征效用之间的差异,挖掘的结果往往包含了许多不尽合理的"高效用"模式;而实例带效用的现有方法,则考虑了不同特征对模式效用的影响,但没有客观地度量这种影响.该文提出了一种确定特征在模式中的效用权重ω(fi,c)的方法,定义了更为合理的空间高效用co-location模式概念,设计了一个有效的挖掘算法.大量的实验表明提出的高效用co-location模式度量方法和相应的挖掘算法能够处理特征效用差异性和特征间的相互影响问题,能更有效地挖掘到空间高效用co-location模式. 展开更多
关键词 空间数据挖掘 空间co-location模式 高效用 效用权重 数据挖掘
在线阅读 下载PDF
空间亚频繁co-location模式的主导特征挖掘 被引量:11
6
作者 马董 陈红梅 +1 位作者 王丽珍 肖清 《计算机应用》 CSCD 北大核心 2020年第2期465-472,共8页
空间co-location模式是一组空间特征的子集,它们的实例在邻域内频繁并置出现。通常,空间co-location模式挖掘方法假设空间实例相互独立,并采用空间实例参与到模式实例的频繁性(参与率)来度量空间特征在模式中的重要性,采用空间特征的最... 空间co-location模式是一组空间特征的子集,它们的实例在邻域内频繁并置出现。通常,空间co-location模式挖掘方法假设空间实例相互独立,并采用空间实例参与到模式实例的频繁性(参与率)来度量空间特征在模式中的重要性,采用空间特征的最小参与率(参与度)来度量模式的有趣程度,忽略了空间特征间的某些重要关系。因此为了揭示空间特征间的主导关系而提出主导特征co-location模式。现有主导特征模式挖掘方法是基于传统频繁模式及其团实例模型进行挖掘,然而,团实例模型可能会忽略非团的空间特征间的主导关系。因此,基于星型实例模型,研究空间亚频繁co-location模式的主导特征挖掘,以更好地揭示空间特征间的主导关系,挖掘更有价值的主导特征模式。首先,定义了两个度量特征主导性的指标;其次,设计了有效的主导特征co-location模式挖掘算法;最后,在合成数据集和真实数据集上通过大量实验验证了所提算法的有效性以及主导特征模式的实用性。 展开更多
关键词 空间数据挖掘 空间co-location模式 亚频繁co-location模式 主导特征 主导特征co-location模式
在线阅读 下载PDF
空间co-location模式挖掘中的模糊技术初探 被引量:4
7
作者 雷乐 王丽珍 肖清 《计算机工程与应用》 CSCD 北大核心 2019年第21期158-166,共9页
空间并置(co-location)模式是指其特征的实例在地理空间中频繁并置出现的一组空间特征的集合。传统co-location模式挖掘通常由用户给定一个邻近阈值来确定实例的邻近关系,使用单一的邻近阈值来判定两个空间实例的邻近性可能会造成邻近... 空间并置(co-location)模式是指其特征的实例在地理空间中频繁并置出现的一组空间特征的集合。传统co-location模式挖掘通常由用户给定一个邻近阈值来确定实例的邻近关系,使用单一的邻近阈值来判定两个空间实例的邻近性可能会造成邻近关系的缺失,也没有考虑距离大小的不同对邻近关系的影响。同时,传统方法主要利用频繁性阈值来衡量模式的频繁性,存在着算法效率对频繁性阈值较为敏感的问题。由于频繁并置的特征间具有较高的邻近度,因此利用聚类算法可以将其聚集在一起,加之邻近以及特征间的并置都是模糊的概念,因此将模糊集理论与聚类算法相结合,研究了空间co-location模式挖掘中的模糊挖掘技术,在定义模糊邻近关系的基础上,定义了度量特征之间邻近度的函数,基于特征邻近度利用模糊聚类算法挖掘co-location模式,最后通过广泛的实验验证了提出方法的实用性、高效性及鲁棒性。 展开更多
关键词 空间数据挖掘 空间co-location模式 模糊邻近 模糊聚类
在线阅读 下载PDF
空间co-location模式的主导特征挖掘 被引量:2
8
作者 熊开放 陈红梅 +1 位作者 王丽珍 肖清 《计算机科学》 CSCD 北大核心 2022年第S02期247-253,共7页
空间co-location模式是空间特征的子集,它们的实例在邻域内频繁并置出现。传统co-location模式不区分模式中特征的重要性,忽略了特征间的主导关系。主导特征co-location模式考虑模式中特征的不平等性,分析特征间的主导关系,具有重要的... 空间co-location模式是空间特征的子集,它们的实例在邻域内频繁并置出现。传统co-location模式不区分模式中特征的重要性,忽略了特征间的主导关系。主导特征co-location模式考虑模式中特征的不平等性,分析特征间的主导关系,具有重要的应用意义。然而,现有主导特征模式挖掘没有从特征实例分布的角度综合考虑一个特征主导其他特征的可能倾向和影响强度,使得挖掘的主导特征及模式没有较好地反映特征间的主导关系。首先分析co-location模式中特征实例的空间分布,提出模式主导度,用以度量模式中某个特征主导其他特征的可能倾向;提出主导影响度,用以度量模式中某个特征主导其他特征的影响强度;基于这两个新度量,提出co-location模式的主导特征挖掘。然后通过优化新度量的计算,提出有效的主导特征colocation模式挖掘算法。在真实数据集和合成数据集上开展大量实验,验证了所提方法能够有效地识别co-location模式中的主导特征,所提算法能够高效地挖掘主导特征及模式。 展开更多
关键词 空间数据挖掘 空间co-location模式 主导特征 主导特征模式
在线阅读 下载PDF
空间co-location模式挖掘算法介绍及应用 被引量:2
9
作者 包玉珍 王丽珍 周丽华 《郑州大学学报(理学版)》 CAS 2007年第3期84-88,共5页
当前挖掘空间co-location模式所遇到的困难在于,空间对象的实例分布在连续的空间中并拥有复杂的空间关系,大部分的计算时间需要用来生成co-location模式的表实例.分析了co-location模式挖掘的实质,以及近年来提出的co-location模式挖掘... 当前挖掘空间co-location模式所遇到的困难在于,空间对象的实例分布在连续的空间中并拥有复杂的空间关系,大部分的计算时间需要用来生成co-location模式的表实例.分析了co-location模式挖掘的实质,以及近年来提出的co-location模式挖掘的全连接算法和无连接算法,并对这两种算法在性能上加以比较.在此基础上,结合三江并流国家基金项目,用这两种算法挖掘出了共生植被及其分布情况,为生物学家的科学研究提供了有利的帮助. 展开更多
关键词 空间数据挖掘 空间co-location模式 全连接算法 无连接算法
在线阅读 下载PDF
基于Voronoi图的空间Co-Location核模式挖掘 被引量:3
10
作者 邹目权 王丽珍 +1 位作者 吴萍萍 杨培忠 《计算机学报》 EI CAS CSCD 北大核心 2022年第9期1908-1925,共18页
飞速发展的物联网技术不断催生海量带有时间和空间属性的数据集.这些数据集掀起了以空间co-location模式挖掘为代表的空间数据挖掘研究的高潮.传统空间co-location模式挖掘研究主要发现空间中频繁并置出现的特征的子集.特征在模式内部... 飞速发展的物联网技术不断催生海量带有时间和空间属性的数据集.这些数据集掀起了以空间co-location模式挖掘为代表的空间数据挖掘研究的高潮.传统空间co-location模式挖掘研究主要发现空间中频繁并置出现的特征的子集.特征在模式内部是无序的,特征之间的地位是平等的.例如,co-location模式{看守所,刑警中队,武警中队}表示看守所附近往往存在刑警中队和武警中队,反之亦然.然而,由于空间分布密度差异显著存在,现实中存在特征地位不平等的模式,这些模式中的某些特征(核特征)附近频繁地出现其它特征(非核特征)的实例,而这些非核特征附近不一定频繁地出现核特征的实例.例如,某些肿瘤疾病与某些污染源的关系.在传统模型中,用户为了发现感兴趣的模式不得不将频繁性阈值设置得很低,以至于忽略了模式中特征的主从关系.本文聚焦于前述现象,研究在空间数据集中挖掘核特征与非核特征组成的有趣模式.首先,基于核邻居定义空间co-location核频繁模式(简称核模式)的概念.核邻居与最近邻息息相关,它不仅遵从地理学第一定律而且能排除无关实例的干扰.其次,提出核模式的有趣性度量理论,分析核模式具有的性质,如基于核参与率反单调性的先验原理等.再次,提出基于Voronoi图的核邻居计算思想,避免了传统co-location模式挖掘中为计算邻近关系需要用户预先设定距离阈值等问题.同时,扩展传统的对称的空间邻近关系到不对称的核邻居关系,使其与特征的不平等地位相适应.此外,针对点、线、面等不同几何形状的空间实例,提出基于凹包理论的经典Voronoi图的扩展方法.最后,在合成数据与真实数据上对比验证了Core Pattern Mining(CPM)算法的效果与效率.实验高效地发现了有别于经典co-location模式的有趣模式,它们具有可理解性. 展开更多
关键词 空间数据挖掘 co-location模式 核邻居 VORONOI图 核参与度
在线阅读 下载PDF
星型高影响的空间co-location模式挖掘 被引量:2
11
作者 马董 李新源 +1 位作者 陈红梅 肖清 《计算机科学》 CSCD 北大核心 2022年第1期166-174,共9页
空间co-location模式是其实例在空间邻域内频繁并置出现的一组空间特征集。传统的空间co-location模式挖掘方法通常假设空间实例相互独立,并采用参与度作为模式有趣性的唯一度量指标,没有考虑不同特征或相同特征不同实例在空间邻域内所... 空间co-location模式是其实例在空间邻域内频繁并置出现的一组空间特征集。传统的空间co-location模式挖掘方法通常假设空间实例相互独立,并采用参与度作为模式有趣性的唯一度量指标,没有考虑不同特征或相同特征不同实例在空间邻域内所产生的影响差异,因此挖掘的结果往往缺乏相关性和可解释性。文中提出了一种星型高影响的空间co-location模式及挖掘方法,能够有效发现自身影响高且在邻域范围内也具有一定影响的空间co-location模式。首先,定义了度量模式影响的两个指标:模式影响参与度和模式影响占有度。其次,提出了挖掘星型高影响co-location模式的基础挖掘算法和剪枝策略。最后,通过在大量的真实和合成数据集上进行实验,分析了挖掘算法的效率和挖掘效果。实验结果表明,所提出的星型高影响co-location模式的度量方法和挖掘算法能够挖掘出较强相关性的co-location模式。 展开更多
关键词 空间数据挖掘 空间co-location模式 星型影响 高影响模式
在线阅读 下载PDF
一种模糊对象的极大co-location模式挖掘算法 被引量:1
12
作者 温佛生 肖清 +1 位作者 王丽珍 孔兵 《计算机科学》 CSCD 北大核心 2014年第1期138-145,共8页
空间co-location模式表示的是空间对象的实例在一个相同的区域内频繁地进行空间并置。人们已经对确定和不确定数据co-location模式挖掘做了很多工作,也有很多成果,但对极大co-location模式挖掘研究较少,特别是针对模糊对象的极大co-loca... 空间co-location模式表示的是空间对象的实例在一个相同的区域内频繁地进行空间并置。人们已经对确定和不确定数据co-location模式挖掘做了很多工作,也有很多成果,但对极大co-location模式挖掘研究较少,特别是针对模糊对象的极大co-location模式挖掘研究还未见报道。提出Mevent-tree算法来挖掘模糊对象的极大co-location模式,首先为每个对象构建空间对象树,从而得到候选模式,然后为候选模式集构建HUT树,最后在HUT树中从阶数最大的候选模式开始到阶数2为止,深度优先搜索极大co-location模式并在得到极大模式后对HUT树剪枝。接着提出两个改进算法,包括预处理阶段模糊对象的剪枝算法和在构造HUT树之前co-location候选模式的剪枝算法。最后通过大量实验验证了Mevent-tree算法和改进算法的效果和效率。 展开更多
关键词 模糊对象 极大co-location模式挖掘 模糊参与率
在线阅读 下载PDF
基于凝聚层次聚类的co-location模式挖掘 被引量:4
13
作者 高世健 王丽珍 +1 位作者 冯岭 陈红梅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第2期167-173,共7页
空间的co-location模式代表一组空间对象的子集,它们的实例在空间中频繁地关联,它是空间数据挖掘的重要研究方向。本文首先介绍co-location模式挖掘的基本算法,然后提出一种新的挖掘算法,算法先对空间数据进行凝聚层次聚类,在聚类结果... 空间的co-location模式代表一组空间对象的子集,它们的实例在空间中频繁地关联,它是空间数据挖掘的重要研究方向。本文首先介绍co-location模式挖掘的基本算法,然后提出一种新的挖掘算法,算法先对空间数据进行凝聚层次聚类,在聚类结果上挖掘co-location模式,最后对这种新的算法作实验评估。 展开更多
关键词 空间数据挖掘 co-location模式 凝聚层次聚类 参与度
在线阅读 下载PDF
含关键特征的显著Co-location模式挖掘研究 被引量:5
14
作者 方圆 王丽珍 周丽华 《数据采集与处理》 CSCD 北大核心 2018年第4期692-703,共12页
空间Co-location模式是一组在空间中频繁并置的空间特征的子集。空间Co-location模式挖掘通常假设空间实例之间相互独立,然而,在实际应用中,不同空间特征、不同实例之间往往相互作用或依赖。空间Co-location关键特征是指对模式具有主导... 空间Co-location模式是一组在空间中频繁并置的空间特征的子集。空间Co-location模式挖掘通常假设空间实例之间相互独立,然而,在实际应用中,不同空间特征、不同实例之间往往相互作用或依赖。空间Co-location关键特征是指对模式具有主导作用的特征。在频繁模式中,识别含关键特征的Co-location模式并摘取模式中的关键特征,为用户提供更精简的挖掘结果,提高Co-location模式的可用性,对Co-location模式挖掘具有重要意义。本文首先定义了含有关键特征的显著频繁Co-location模式新概念,以及一系列度量指标以识别显著频繁Co-location模式中的关键特征;其次,给出了一个挖掘显著频繁Co-location模式和关键特征的算法;最后,在模拟和真实数据集上进行了大量的实验,验证了所提出算法的效果及性能。 展开更多
关键词 空间数据挖掘 空间并置(co-location)模式 关键特征 模式显著性
在线阅读 下载PDF
领域驱动的高效用co-location模式挖掘方法 被引量:7
15
作者 江万国 王丽珍 +1 位作者 方圆 陈红梅 《计算机应用》 CSCD 北大核心 2017年第2期322-328,共7页
空间并置(co-location)模式是指其实例在空间邻域内频繁共现的空间特征集的子集。现有的空间colocation模式挖掘的有趣性度量指标,没有充分地考虑特征之间以及同一特征的不同实例之间的差异;另外,传统的基于数据驱动的空间co-location... 空间并置(co-location)模式是指其实例在空间邻域内频繁共现的空间特征集的子集。现有的空间colocation模式挖掘的有趣性度量指标,没有充分地考虑特征之间以及同一特征的不同实例之间的差异;另外,传统的基于数据驱动的空间co-location模式挖掘方法的结果常常包含大量无用或是用户不感兴趣的知识。针对上述问题,提出一种更为一般的研究对象——带效用值的空间实例,并定义了新的效用参与度(UPI)作为高效用co-location模式的有趣性度量指标;将领域知识形式化为三种语义规则并应用于挖掘过程中,提出一种领域驱动的多次迭代挖掘框架;最后通过大量实验对比分析不同有趣性度量指标下的挖掘结果在效用占比和频繁性两方面的差异,以及引入基于领域知识的语义规则前后挖掘结果的变化情况。实验结果表明所提出的UPI度量是一种兼顾频繁和效用的更为合理的度量指标;同时,领域驱动的挖掘方法能有效地挖掘到用户真正感兴趣的模式。 展开更多
关键词 空间模式挖掘 co-location模式 高效用co-location模式 有趣性度量指标 领域驱动 语义规则
在线阅读 下载PDF
极小负co-location模式及有效的挖掘算法 被引量:7
16
作者 王光耀 王丽珍 +1 位作者 杨培忠 陈红梅 《计算机科学与探索》 CSCD 北大核心 2021年第2期366-378,共13页
空间co-location(并置)模式是指实例在空间中频繁关联的一组空间特征的子集。在空间数据挖掘中,现有算法主要针对的是正模式的挖掘,而空间中还存在着具有强负相关性的模式,如负co-location模式,这类模式的挖掘在一些应用中同样具有重要... 空间co-location(并置)模式是指实例在空间中频繁关联的一组空间特征的子集。在空间数据挖掘中,现有算法主要针对的是正模式的挖掘,而空间中还存在着具有强负相关性的模式,如负co-location模式,这类模式的挖掘在一些应用中同样具有重要的意义。现有的负co-location模式挖掘算法的时间复杂度较高,挖掘到的模式数量巨大。针对该问题,探索了负co-location模式的向上包含性质,提出了极小负co-location模式,证明了极小负co-location模式可推导出所有频繁负co-location模式。在负co-location模式挖掘中,计算模式的表实例是制约挖掘效率的根本因素,为此提出了3个剪枝策略有效地提高了算法的效率。在真实和合成数据集上的大量实验,验证了提出方法的正确性和高效性。特别地,大量实验结果表明极小负co-location模式可将频繁负co-location模式数量压缩80%以上。 展开更多
关键词 空间数据挖掘 空间co-location模式 极小负co-location模式 向上包含 紧凑表示
在线阅读 下载PDF
时空亚频繁co-location模式挖掘 被引量:5
17
作者 李新源 陈红梅 +1 位作者 肖清 王丽珍 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第11期68-76,共9页
空间co-location模式挖掘是空间数据挖掘的重要分支,在环境保护、公共交通、位置服务和城市计算等领域得到广泛应用.与基于团实例模型的传统模式相比,基于星型实例模型的空间亚频繁co-location模式可以揭示空间特征更丰富的空间关系.然... 空间co-location模式挖掘是空间数据挖掘的重要分支,在环境保护、公共交通、位置服务和城市计算等领域得到广泛应用.与基于团实例模型的传统模式相比,基于星型实例模型的空间亚频繁co-location模式可以揭示空间特征更丰富的空间关系.然而,现有空间亚频繁模式没有考虑空间数据的时间特性,而时间却是空间数据的重要维度.因此,该研究考虑空间实例的位置时变性,基于星型实例模型的时空亚频繁co-location模式进行挖掘.首先,提出了时空亚频繁co-location模式及其度量指标:时间亚频繁度;其次,证明了时间亚频繁度的反单调性(向下闭合性),提出了有效的时空亚频繁模式挖掘算法;最后,通过大量实验,验证了所提算法的有效性及时空亚频繁模式的实用性. 展开更多
关键词 空间数据挖掘 时空数据 时空亚频繁co-location模式
在线阅读 下载PDF
MLCPM-UC:一种基于模式实例分布均匀系数的多级co-location模式挖掘算法 被引量:4
18
作者 刘新斌 王丽珍 周丽华 《计算机科学》 CSCD 北大核心 2021年第11期208-218,共11页
空间co-location(并置)模式是一组空间特征的子集,其实例在空间中频繁地邻近出现。由于空间数据同时存在关联性和异质性,co-location模式实例的分布或在整个研究区域中全局出现(全局co-location模式),或在研究区域的局部区域出现(区域co... 空间co-location(并置)模式是一组空间特征的子集,其实例在空间中频繁地邻近出现。由于空间数据同时存在关联性和异质性,co-location模式实例的分布或在整个研究区域中全局出现(全局co-location模式),或在研究区域的局部区域出现(区域co-location模式),从而提出了多级co-location模式挖掘。当前的多级co-location模式挖掘方法存在两个问题:1)已有的多级co-location模式挖掘方法忽略了模式在空间中的分布特性,未能准确区分全局和区域co-location模式;2)已有的多级模式挖掘方法将全局非频繁co-location模式作为候选区域co-location模式,导致候选区域co-location模式数量过多。针对以上问题,首先,定义了模式的实例分布均匀系数,在考虑模式频繁性的同时考虑了模式在空间中的分布情况,从而正确、高效地识别出全局和区域co-location模式。其次,基于模式的实例分布均匀系数,设计了一个有效的多级co-location模式挖掘算法,提出了有效的剪枝策略以提高算法效率。最后,在真实和合成数据集上进行了广泛的实验,验证了所提方法的正确性和高效性。 展开更多
关键词 空间数据挖掘 多级co-location模式 空间异质性 均匀系数
在线阅读 下载PDF
CPM-MCHM:一种基于极大团和哈希表的空间并置模式挖掘算法 被引量:8
19
作者 张绍雪 王丽珍 陈文和 《计算机学报》 EI CAS CSCD 北大核心 2022年第3期526-541,共16页
空间并置(co-location)模式挖掘是指在大量的空间数据中发现一组空间特征的子集,这些特征的实例在地理空间中频繁并置出现.传统的空间并置模式挖掘算法通常采用逐阶递增的挖掘框架,从低阶模式开始生成候选模式并计算其参与度(空间并置... 空间并置(co-location)模式挖掘是指在大量的空间数据中发现一组空间特征的子集,这些特征的实例在地理空间中频繁并置出现.传统的空间并置模式挖掘算法通常采用逐阶递增的挖掘框架,从低阶模式开始生成候选模式并计算其参与度(空间并置模式的频繁性度量指标).虽然这种挖掘框架可以得到正确和完整的结果,但是带来的时间和空间开销非常大.此外传统方法对于空间并置模式的最小频繁性阈值较为敏感,当最小频繁性阈值改变时整个挖掘过程需要重新进行.因此,本文提出一种基于极大团和哈希表的空间并置模式挖掘算法CPM-MCHM(Co-location Pattern Mining based on Maximal Clique and Hash Map)来发现完整并且正确的频繁空间并置模式.CPM-MCHM算法不仅避免逐阶候选-测试框架带来的巨大开销问题,还降低了算法对最小频繁性阈值的敏感.首先,采用基于位运算的分区Bron–Kerbosch算法生成给定空间数据集的所有极大团,并将其存储在哈希表中.然后,提出一种两阶段挖掘框架计算所有模式的参与度并过滤所有频繁空间并置模式.最后,在真实和合成数据集上进行了大量的对比实验.与经典的传统算法和近两年内学者提出的两种算法相比,当实验数据的规模达到20万实例数时,本文提出的CPM-MCHM算法的挖掘时间和空间耗费分别降低了90%和70%以上,当实验数据量进一步加大时CPM-MCHM算法的优势更加明显. 展开更多
关键词 空间数据挖掘 空间并置模式 两阶段挖掘框架 极大 哈希表
在线阅读 下载PDF
一种基于本体的有趣Co-location模式的交互式挖掘算法
20
作者 包旭光 王丽珍 +1 位作者 肖清 赵家松 《太原理工大学学报》 CAS 北大核心 2018年第1期94-105,共12页
为了获得用户感兴趣的co-location模式,提出了一个基于本体的交互式挖掘算法OIICM(ontology-based interactive interesting co-location miner)。首先,OIICM利用本体有效地聚合用户的领域知识;其次,OIICM基于本体定义了co-location模... 为了获得用户感兴趣的co-location模式,提出了一个基于本体的交互式挖掘算法OIICM(ontology-based interactive interesting co-location miner)。首先,OIICM利用本体有效地聚合用户的领域知识;其次,OIICM基于本体定义了co-location模式间的语义距离;然后,OIICM设计用户交互过程以获得有趣的co-location模式;最后,OIICM提供过滤器来进一步缩减结果集。通过在合成数据以及实际数据上的大量实验验证了OIICM的准确性和有效性。 展开更多
关键词 空间co-location模式挖掘 本体 二次挖掘 交互式 过滤
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部