期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于x-tuple的概率阈值top-k查询算法
1
作者 黄冬梅 舒博 +1 位作者 王建 熊中敏 《计算机工程》 CAS CSCD 2013年第4期44-47,共4页
不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该... 不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该查询语义下采用动态规划方法求取x-tuple内每个元组排在前k位的概率和,对其进行聚集后做概率阈值top-k查询,并利用观察法、最大上限值等剪枝方法进行优化。实验结果表明,该算法平均扫描全体数据集中60%的数据即可返回正确结果集,证明其查询处理效率较高。 展开更多
关键词 不确定数据库 概率阈值top-k查询 x-元组 动态规划算法 聚集
在线阅读 下载PDF
不确定时间序列Top-k窗口聚合查询方法
2
作者 张航 熊浩然 何震瀛 《计算机工程》 北大核心 2025年第7期161-170,共10页
近年来,如何分析挖掘不确定时间序列数据逐渐受到业界关注。Top-k查询作为数据库领域研究的热点问题,旨在从大规模数据中检索出最符合用户查询条件的前k项结果。然而,尽管Top-k查询在其他领域已被广泛应用,针对不确定时间序列的Top-k查... 近年来,如何分析挖掘不确定时间序列数据逐渐受到业界关注。Top-k查询作为数据库领域研究的热点问题,旨在从大规模数据中检索出最符合用户查询条件的前k项结果。然而,尽管Top-k查询在其他领域已被广泛应用,针对不确定时间序列的Top-k查询研究仍然较少。这种查询可以有效帮助用户从不确定时间序列提取重要信息。提出一种新的Top-k查询问题——不确定时间序列Top-k窗口聚合查询,并针对该问题给出高效的查询方法。这个查询可以作为一个基础工具,辅助用户探索和分析不确定时间序列数据。现有能够支持这个查询的方法均存在查询效率较低或所需存储空间过高的问题。针对该问题,提出一种基于子窗口拼接策略的两级Top-k查询方法,并提出高效计算阈值上界方法解决基于子窗口拼接策略引入的阈值计算复杂难题。该方法能够以较少的预计算存储空间,高效支持不确定时间序列Top-k窗口聚合查询。为了验证所提方法的有效性,在真实和人造数据集上进行实验。实验结果表明,所提方法与基于TA的Top-k查询方法相比,明显降低了预计算列表的存储空间;与基于遍历的FSEC-S方法相比,所提方法以及使用计算阈值上界优化方法的平均查询效率分别提升了7.27倍和20.04倍。 展开更多
关键词 不确定时间序列 top-k查询 窗口 聚合查询 有序列表 阈值
在线阅读 下载PDF
面向不确定数据的概率阈值可见最近邻查询算法 被引量:1
3
作者 刘文远 李承芳 陈子军 《小型微型计算机系统》 CSCD 北大核心 2013年第8期1803-1808,共6页
在现实世界中,障碍物的存在影响了查询点到对象的可见性.可见最近邻查询返回到查询点最近的一个可见对象,是时空数据库中的一类重要应用.由于度量设备的误差和隐私保护,很多关于空间对象位置的数据是不确定的.将不确定对象应用到可见最... 在现实世界中,障碍物的存在影响了查询点到对象的可见性.可见最近邻查询返回到查询点最近的一个可见对象,是时空数据库中的一类重要应用.由于度量设备的误差和隐私保护,很多关于空间对象位置的数据是不确定的.将不确定对象应用到可见最近邻查询中便产生了概率可见最近邻查询,返回成为可见最近邻概率大于0的对象.有些情况下,用户只关心概率超过一定阈值的结果,于是本文提出了概率阈值可见最近邻查询,返回可见最近邻概率超过阈值τ的不确定对象,其中阈值τ是用户设定的,并且给出了高效的概率阈值可见最近邻查询算法.相比以前的工作,不仅处理了概率和为1的不确定对象,而且处理了概率和小于1的不确定对象;此外,通过引入缺失概率和聚类的概念,提出了高效的过滤技术和快速的批处理技术.最后通过实验验证了本算法的高效性和有效性. 展开更多
关键词 不确定数据 阈值 可见 最近邻查询 概率
在线阅读 下载PDF
概率Top-k查询的层次索引 被引量:1
4
作者 王晓伟 贾焰 《小型微型计算机系统》 CSCD 北大核心 2011年第11期2187-2191,共5页
由于在经济、军事等领域的广泛应用,不确定数据的查询处理技术成为近年来数据库领域的研究热点.概率top-k查询根据打分函数和概率两个维度来对数据进行排序,因此具有多种查询语义.作为I/O密集型查询,概率top-k查询需要具备一定通用性的... 由于在经济、军事等领域的广泛应用,不确定数据的查询处理技术成为近年来数据库领域的研究热点.概率top-k查询根据打分函数和概率两个维度来对数据进行排序,因此具有多种查询语义.作为I/O密集型查询,概率top-k查询需要具备一定通用性的索引技术来提高查询效率.本文从分析概率top-k查询满足的性质入手,分别基于skyline和支配频率的概念,提出两种层次索引.通过理论分析和实验证明了满足特定性质的概率top-k查询均可以利用这两种索引来提高I/O效率,其中基于支配频率的索引具有更好的鲁棒性. 展开更多
关键词 不确定数据 概率top-k查询 层次索引 SKYLINE 支配频率
在线阅读 下载PDF
大规模动态图中概率游走约束的节点相似Top-k查询方法 被引量:3
5
作者 陈泽 丁琳琳 +1 位作者 宋宝燕 王俊陆 《计算机工程》 CAS CSCD 北大核心 2021年第1期72-78,86,共8页
大规模动态图节点相似Top-k查询方法对大规模图查询效率较低,且当图发生动态变化时难以对查询结果进行自适应更新,导致查询结果准确度不高。利用大规模动态图概率路径游走约束条件,提出一种节点相似Top-k查询方法。通过引入PageRank概... 大规模动态图节点相似Top-k查询方法对大规模图查询效率较低,且当图发生动态变化时难以对查询结果进行自适应更新,导致查询结果准确度不高。利用大规模动态图概率路径游走约束条件,提出一种节点相似Top-k查询方法。通过引入PageRank概率游走机制实现将基大图生成多个小规模单向图,并利用单边弱化因子对PageRank进行概率游走约束,避免单向图反复选取少数边的情况。采用Monte Carlo模拟法进行单向图集上的相似度累积计算,以Top-k取值为衡量准则递增游走步数,避免次优相似度叠加问题。结合图的动态性特点,依据局部自适应原则提出基大图触发更新策略与单向图集联动更新策略,在保证查询准确度的同时最大限度地降低更新维护代价。实验结果表明,与FR、KM、SimRank、P-SimRank等方法相比,该方法可有效提高查询效率、查询准确度与更新效率。 展开更多
关键词 大规模动态图 PageRank机制 概率游走约束 自适应更新 top-k查询方法
在线阅读 下载PDF
基于阈值的快速启动Top-k查询处理算法
6
作者 江宇 宋省身 +1 位作者 杨岳湘 姜琨 《中文信息学报》 CSCD 北大核心 2017年第5期163-170,共8页
Top-k查询是搜索引擎领域广泛应用的技术之一,该算法从海量数据中返回最符合用户需求的前k个结果,在执行时能避免对大部分无关文档的打分处理。Top-k查询虽然极大提升了查询性能,但其存在的慢启动问题并未得到有效解决。为此,该文首先... Top-k查询是搜索引擎领域广泛应用的技术之一,该算法从海量数据中返回最符合用户需求的前k个结果,在执行时能避免对大部分无关文档的打分处理。Top-k查询虽然极大提升了查询性能,但其存在的慢启动问题并未得到有效解决。为此,该文首先提取倒排索引的静态Top-k信息,再动态计算针对具体查询词项的初始阈值,在此基础上,结合MaxScore和WAND算法,提出了快速启动的Top-k查询处理算法。实验结果表明,该方法能够有效解决上述问题,具有良好的性能。 展开更多
关键词 top-k查询处理 阈值计算 倒排索引
在线阅读 下载PDF
不确定数据Top-k查询算法 被引量:6
7
作者 周帆 李树全 +1 位作者 肖春静 吴跃 《电子测量与仪器学报》 CSCD 2010年第7期650-657,共8页
不确定数据普遍存在于大量应用之中,如移动计算、RFID技术和传感器网络等。针对不确定数据的各种查询算法是数据库领域近年来的热点研究课题。其中,基于不确定数据的Top-k查询和排序查询提出了很多有价值的查询语义和查询算法。详细分... 不确定数据普遍存在于大量应用之中,如移动计算、RFID技术和传感器网络等。针对不确定数据的各种查询算法是数据库领域近年来的热点研究课题。其中,基于不确定数据的Top-k查询和排序查询提出了很多有价值的查询语义和查询算法。详细分析这一最新领域提出的各种查询算法、数据模型、算法复杂度和不同算法所适应的应用场景,并用实验从多个方面比较不同查询算法执行效率、查询语义以及结果集的关联程度。 展开更多
关键词 概率数据库 不确定top-k查询 排序查询 查询算法 数据处理
在线阅读 下载PDF
基于位置-文本关系的空间对象top-k查询与排序方法 被引量:2
8
作者 孟祥福 张霄雁 +2 位作者 赵路路 李盼 毕崇春 《智能系统学报》 CSCD 北大核心 2020年第2期235-242,共8页
针对普通的空间关键字查询通常会导致多查询结果的问题。本文提出了一种基于空间对象位置-文本相关度的top-k查询与排序方法,用于获取与给定空间关键字查询在文本上相关且位置上相近的典型空间对象。该方法分为离线处理和在线查询处理2... 针对普通的空间关键字查询通常会导致多查询结果的问题。本文提出了一种基于空间对象位置-文本相关度的top-k查询与排序方法,用于获取与给定空间关键字查询在文本上相关且位置上相近的典型空间对象。该方法分为离线处理和在线查询处理2个阶段。在离线阶段,根据空间对象之间的位置相近性和文本相似性,度量任意一对空间对象之间的位置-文本关系紧密度。在此基础上,提出了基于概率密度的代表性空间对象选取算法,根据空间对象之间的位置-文本关系为每个代表性空间对象构建相应的空间对象序列。在线查询处理阶段,对于一个给定的空间关键字查询,利用Cosine相似度评估方法计算查询条件与代表性空间对象之间的相关度,然后使用阈值算法(threshold algorithm,TA)在预先创建的空间对象序列上快速选出top-k个满足查询需求的典型空间对象。实验结果表明:提出的空间对象top-k查询与排序方法能够有效地满足用户查询需求,并且具有较高的准确性、典型性和执行效率。 展开更多
关键词 空间数据库 空间关键字查询 位置-文本关系 概率密度 代表性对象选取 top-k查询与排序
在线阅读 下载PDF
P2P环境下面向不确定数据的Top-k查询 被引量:6
9
作者 孙永佼 袁野 王国仁 《计算机学报》 EI CSCD 北大核心 2011年第11期2155-2164,共10页
分布式环境中的top-k查询已经有了广泛的研究.由于仪器不精确和网络延时等原因,大多数分布式数据都存在不确定性.文中基于水平分布在P2P网络中的不确定数据提出了一个有效的top-k查询处理方法.首先利用Quad-tree构建一个分布式的不确定... 分布式环境中的top-k查询已经有了广泛的研究.由于仪器不精确和网络延时等原因,大多数分布式数据都存在不确定性.文中基于水平分布在P2P网络中的不确定数据提出了一个有效的top-k查询处理方法.首先利用Quad-tree构建一个分布式的不确定数据的索引,并基于索引提出了一个空间剪枝算法.然后,根据局部top-k概率与全局top-k概率之间的关系提出不确定数据成为top-k概率的上界,根据top-k概率与skyline概率之间的关系提出不确定数据成为top-k概率的下界,通过两种概率剪枝算法来减少top-k查询在网络中的传输和计算代价,并且进一步减少候选集大小.最后文中采用采样的方法来计算候选集的top-k概率以确定最终的top-k查询结果.大量的实验验证了算法的有效性. 展开更多
关键词 top-k查询 skyline概率 P2P Quad-tree 不确定数据
在线阅读 下载PDF
不确定数据查询技术研究 被引量:17
10
作者 王意洁 李小勇 +1 位作者 祁亚斐 孙伟东 《计算机研究与发展》 EI CSCD 北大核心 2012年第7期1460-1466,共7页
当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用... 当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用,目前已成为数据库和网络计算等领域的一个研究热点.从目前不确定数据查询研究的各种查询类型介绍和查询特点分析出发,主要综述了4种典型的不确定数据查询类型,即不确定Skyline查询、不确定Top-k查询、不确定最近邻(NN)查询以及不确定聚集查询;重点论述了各种不确定数据查询的定义,各类查询的特点,并分类介绍了当前各类不确定数据查询研究的现状和各种查询方法的优缺点;最后,基于当前不确定数据查询技术的最新研究动态指出了未来研究工作的趋势. 展开更多
关键词 不确定数据 查询 SKYLINE top-k 最近邻 聚集 数据流 概率
在线阅读 下载PDF
连续不确定XML数据索引技术研究 被引量:3
11
作者 张换香 张晓琳 刘立新 《计算机应用与软件》 CSCD 北大核心 2013年第8期51-53,共3页
针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定... 针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定小枝的路径概率;CPTI值索引是一个二维表,记录cont类节点的概率信息,通过CPTI值索引过滤与查询无关的元素以减少查询中需要处理的元素数目。实验表明,此索引技术可极大地提高查询处理的性能。 展开更多
关键词 连续不确定 XML 索引 概率阈值查询
在线阅读 下载PDF
RLPI索引:一种处理连续不确定XML索引
12
作者 张晓琳 郭丹丹 +2 位作者 韩雨童 郝琨 谭跃生 《计算机应用与软件》 CSCD 2016年第4期25-29,共5页
针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地... 针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地定位所需节点。RLPI值索引借鉴U树的思想,通过提前计算并存储叶子节点的相关信息,以减少查询中需处理的元素数目,并且其对满足任意连续pdf(probability density function)的不确定数据均适用。理论分析和实验结果表明,RLPI索引技术有效地提高了查询处理的性能。 展开更多
关键词 连续不确定数据 XML 索引 概率阈值范围查询
在线阅读 下载PDF
一种适用连续不确定XML数据的索引
13
作者 张晓琳 郭丹丹 郝琨 《计算机工程与科学》 CSCD 北大核心 2016年第2期305-311,共7页
针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUX... 针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUXI索引树,其中叶子节点存储连续不确定数据辅助信息。为了提高查询效率,对连续不确定数据制定了过滤策略,通过遍历索引树过滤掉不满足查询范围的子树。理论和实验结果表明,此索引技术可提高查询处理的性能。 展开更多
关键词 连续不确定XML 概率阈值范围查询 CUXI索引树 二维数据矩形 过滤
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部