期刊文献+
共找到90篇文章
< 1 2 5 >
每页显示 20 50 100
时空数据查询技术研究综述 被引量:1
1
作者 孟祥福 翁雪 徐永杰 《计算机科学与探索》 北大核心 2025年第8期2001-2023,共23页
随着现代信息技术的快速发展与应用,时空数据的规模迅速增长。这些数据呈现出海量聚集、高维异构以及动态复杂等特点。近年来,以时空数据为背景的时空查询技术得到广泛的研究和应用,如何有效地存储、管理和查询这些数据成为了研究的重... 随着现代信息技术的快速发展与应用,时空数据的规模迅速增长。这些数据呈现出海量聚集、高维异构以及动态复杂等特点。近年来,以时空数据为背景的时空查询技术得到广泛的研究和应用,如何有效地存储、管理和查询这些数据成为了研究的重点。对时空数据的相关查询技术进行综述,从时空数据相关基本概念入手,系统阐述了当前主流的时空查询处理模式,涵盖了范围查询、K近邻查询、反K近邻查询等多种类型;介绍了不同的时空索引技术,包括基于轨迹的索引结构、基于抽样的索引以及其他创新的索引方法;分析了结合其他技术的查询方法,主要包括时空-文本查询、语义近似轨迹查询、并行和分布式查询等,这些技术不仅提升了时空查询的多样性和准确性,还能有效地处理大规模时空数据。展望了时空查询技术的未来发展方向,包括查询结果的可视化展示、隐私保护以及结合机器学习的新型索引结构,为时空数据的高效利用提供了新的思路和挑战。 展开更多
关键词 时空数据 查询处理 索引技术 时空-文本 语义近似 分布式
在线阅读 下载PDF
道路网中针对多目标决策的兴趣点高效查询算法
2
作者 李松 杨晓龙 +1 位作者 靳海鹏 张丽平 《西安交通大学学报》 北大核心 2025年第4期148-157,共10页
为了解决道路网中利用多目标决策技术进行兴趣点推荐和高效位置查询的问题,针对由于数据规模增加产生大量近似数据,导致传统多目标决策技术在道路网环境下查询效率和可用性方面较低的问题,提出了一种道路网广义近似Skyline查询算法。首... 为了解决道路网中利用多目标决策技术进行兴趣点推荐和高效位置查询的问题,针对由于数据规模增加产生大量近似数据,导致传统多目标决策技术在道路网环境下查询效率和可用性方面较低的问题,提出了一种道路网广义近似Skyline查询算法。首先基于兴趣点的维度相似性和道路网近似性构建近似集和独立点,并根据兴趣点特性设计相应的剪枝策略;随后,通过近似集和独立点重构数据集,根据剪枝策略过滤掉当查询位置移动时对查询结果无影响的兴趣点,并构建AA-R*-Tree索引以提升查询效率;最后,根据兴趣点的近似性提出一种广义近似聚集支配算法,通过选取代表点代替近似集进行Skyline计算,减少冗余运算并优化查询结果,最终得到满足兴趣点近似整合有序的Skyline结果集。实验结果表明:所提近似查询算法在大规模数据集和大量相似数据条件下表现出较好的效率与可行性;与Higher-Gsky、MG-EGsky和GSSK-A算法相比,所提算法在数据规模、查询范围及路段数增加时的平均效率提升约14%,能够为道路网用户提供更快速有效的决策支持。 展开更多
关键词 道路网 SKYLINE查询 多目标决策 近似查询 兴趣点推荐
在线阅读 下载PDF
无锁并发布谷鸟过滤器
3
作者 王瀚橙 陈志鹏 +3 位作者 戴海鹏 顾荣 KIM Chaewon 陈贵海 《软件学报》 北大核心 2025年第7期3339-3357,共19页
布谷鸟过滤器是一种高效的概率型数据结构,该数据结构可以快速判断某个元素是否存在于给定集合中,被广泛应用于计算机网络、物联网应用以及数据库系统中.在实践中,上述系统通常需要处理海量数据以及大量并发请求.实现支持高并发的布谷... 布谷鸟过滤器是一种高效的概率型数据结构,该数据结构可以快速判断某个元素是否存在于给定集合中,被广泛应用于计算机网络、物联网应用以及数据库系统中.在实践中,上述系统通常需要处理海量数据以及大量并发请求.实现支持高并发的布谷鸟过滤器可以显著提升系统吞吐以及数据处理能力,对提升系统性能至关重要.为此,设计一个支持无锁并发的布谷鸟过滤器.该过滤器通过所提出的两阶段查询、路径探查与元素迁移分离,以及基于多机器字比较并交换的原子迁移技术实现高性能的查询、插入和删除操作.理论分析和实验验证结果均表明,无锁并发布谷鸟过滤器显著提升现有最先进算法的并发性能.无锁并发布谷鸟过滤器的查询吞吐量,平均为使用细粒度锁的布谷鸟过滤器的查询吞吐量的1.94倍. 展开更多
关键词 布谷鸟过滤器 并发 近似成员资格查询 概率数据结构 计算机网络
在线阅读 下载PDF
基于历史信息的高效近似查询系统
4
作者 韩雨钢 马廷淮 荣欢 《计算机工程与设计》 北大核心 2025年第2期578-586,共9页
近似查询处理技术是提高数据库聚合查询效率的重要方法,针对海量二维数据提出一种基于历史查询负载的近似查询系统,引入历史查询信息,通过在历史查询空间中进行命中性检测,提高查询区域偏斜等情况时的效率。针对全局查询,通过空间数据... 近似查询处理技术是提高数据库聚合查询效率的重要方法,针对海量二维数据提出一种基于历史查询负载的近似查询系统,引入历史查询信息,通过在历史查询空间中进行命中性检测,提高查询区域偏斜等情况时的效率。针对全局查询,通过空间数据划分方法将完整数据集划分为子区域,组织为树状分片索引结构,实现采样和数据摘要方法的结合,提高查询准确性。实验结果表明,当历史查询记录量达到10~4量级时,查询响应时间仅为传统方法的40%。与传统方法相比,该系统平均相对误差降低了63%。随分片数的增加效果有更大提升,当分片数达64时,其平均相对误差仅为传统方法的10%。 展开更多
关键词 数据库系统 近似查询处理 空间索引 历史查询 分片索引树 学习型索引 空间填充曲线
在线阅读 下载PDF
过滤器数据结构研究综述 被引量:1
5
作者 王瀚橙 戴海鹏 +2 位作者 陈树森 陈志鹏 陈贵海 《计算机科学》 CSCD 北大核心 2024年第1期35-40,共6页
过滤器数据结构可以近似地判断某个元素是否属于给定集合。典型的过滤器数据结构,如布隆过滤器、布谷鸟过滤器、商过滤器,以牺牲查询准确性为代价换取更低的内存空间消耗和查询时间开销。因此,得益于空间时间高效性,过滤器数据结构现已... 过滤器数据结构可以近似地判断某个元素是否属于给定集合。典型的过滤器数据结构,如布隆过滤器、布谷鸟过滤器、商过滤器,以牺牲查询准确性为代价换取更低的内存空间消耗和查询时间开销。因此,得益于空间时间高效性,过滤器数据结构现已被广泛应用于计算机网络、物联网、数据库系统、文件系统、生物信息学、机器学习等领域的近似成员资格查询操作中。自20世纪70年代以来,过滤器数据结构受到了广泛的研究,在诸多领域取得了重要的进展,其研究思路也在不断变化。文中整理了近五十年来关于过滤器数据结构的经典研究成果,从过滤器数据结构的原理出发对已有工作进行分类总结,并比较不同工作之间的引证关系和改进思路,最后讨论了过滤器数据结构的未来研究方向。 展开更多
关键词 过滤器 近似成员资格查询 概率数据结构 布隆过滤器 布谷鸟过滤器 商过滤器
在线阅读 下载PDF
学习型过滤器综述
6
作者 李猛 戴海鹏 +2 位作者 眭永熙 顾荣 陈贵海 《计算机科学》 CSCD 北大核心 2024年第1期41-49,共9页
作为一种高效的概率性结构,过滤器可以高效地解决近似集合成员查询问题。近年来,随着机器学习技术的发展,一些学习型过滤器表现出色,超越了传统的过滤器。这些学习型过滤器考虑数据分布信息,将集合成员查询问题视为二分类问题,实现了超... 作为一种高效的概率性结构,过滤器可以高效地解决近似集合成员查询问题。近年来,随着机器学习技术的发展,一些学习型过滤器表现出色,超越了传统的过滤器。这些学习型过滤器考虑数据分布信息,将集合成员查询问题视为二分类问题,实现了超越传统过滤器的性能。受此启发,学习型过滤器研究领域迅速发展,出现了多个变种。然而,目前还缺乏对近些年相关工作的系统性回顾和比较。为了填补上述空缺,文中全面回顾了近年来的学习型过滤器相关工作,并展望了未来的发展方向。 展开更多
关键词 近似成员资格查询 机器学习 BLOOM过滤器 学习型过滤器 假阳率
在线阅读 下载PDF
基于变分自编码器的近似聚合查询优化方法
7
作者 黄龙森 房俊 +1 位作者 周云亮 郭志城 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第5期931-940,共10页
针对偏态数据分布不平衡,传统近似聚合查询方法难以抽样生成偏态分布数据的问题,提出基于优化的变分自编码器的近似聚合查询方法,研究近似聚合查询方法对偏态分布数据的近似聚合查询准确率的影响.在预处理阶段对偏态分布数据进行分层分... 针对偏态数据分布不平衡,传统近似聚合查询方法难以抽样生成偏态分布数据的问题,提出基于优化的变分自编码器的近似聚合查询方法,研究近似聚合查询方法对偏态分布数据的近似聚合查询准确率的影响.在预处理阶段对偏态分布数据进行分层分组,对变分自编码器生成模型的网络结构和损失函数进行优化,降低近似聚合查询相对误差.实验结果表明,与基准方法相比,近似聚合查询对偏态分布数据的查询相对误差更小,且随着偏态系数的提高,查询相对误差的上升趋势更平缓. 展开更多
关键词 近似查询处理 偏态分布 机器学习 变分自编码器 分组抽样
在线阅读 下载PDF
健壮且自适应的学习型近似查询处理方法研究
8
作者 乔艺萌 荆一楠 张寒冰 《计算机工程》 CSCD 北大核心 2024年第1期30-38,共9页
由于在大规模数据集上执行精确查询耗时较长,因此近似查询处理(AQP)技术常被用于在线分析处理,目的是以较短的交互延迟返回查询结果,并尽可能地降低查询误差。现有的学习型AQP方法与底层数据解耦,将I/O密集型计算转化为CPU密集型计算,... 由于在大规模数据集上执行精确查询耗时较长,因此近似查询处理(AQP)技术常被用于在线分析处理,目的是以较短的交互延迟返回查询结果,并尽可能地降低查询误差。现有的学习型AQP方法与底层数据解耦,将I/O密集型计算转化为CPU密集型计算,但是由于计算资源的限制,该类方法通常基于随机的数据样本进行模型训练,此类训练数据会引起稀有群组缺失问题,导致模型预测准确性不高。针对上述问题,提出一种基于分层样本学习的混合型和积网络模型,并基于该模型设计一种AQP框架。分层样本能够有效避免稀有群组缺失现象,基于该样本训练的模型预测准确性大幅提升。此外,针对数据动态更新的情况,提出一种模型自适应更新策略,使得模型能够及时检测数据偏移现象并自适应地执行更新。实验结果表明,与基于抽样和基于机器学习的AQP方法相比,该模型在真实数据集和合成数据集上的平均相对误差分别约降低18.3%和2.2%,在数据动态更新的场景下,其准确性和查询时延均呈现出良好的稳定性。 展开更多
关键词 近似查询处理 和积网络 分层抽样 数据偏移 自适应更新
在线阅读 下载PDF
基于近似存在性查询的高效图像异常检测方法
9
作者 伍凌川 史慧芳 +1 位作者 邱枫 石义官 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期424-430,共7页
对于图像异常检测问题,查询测试样本在正常样本集中的K近邻距离并估计其异常程度,是一类准确率较高、对复杂分布的效果较稳定的方法。此类方法采用近似最近邻搜索(Approximate Nearest Neighbour Search, ANNS)索引进行K近邻搜索。但由... 对于图像异常检测问题,查询测试样本在正常样本集中的K近邻距离并估计其异常程度,是一类准确率较高、对复杂分布的效果较稳定的方法。此类方法采用近似最近邻搜索(Approximate Nearest Neighbour Search, ANNS)索引进行K近邻搜索。但由于ANNS查询操作较高的计算开销和现实问题中庞大的数据量,此类方法的计算效率难以应对低时延、高吞吐量的应用场景。该文基于局部敏感哈希和布隆过滤器,提出了一种近似存在性查询(Approximate Membership Query,AMQ)方法,用特征近似存在性预测异常样本。相比于ANNS,AMQ具有更低的计算复杂度且更适合单指令多数据并行,可以有效解决基于特征库检索方法的计算性能瓶颈。在MVTec-AD数据集上的实验结果显示,基于AMQ的方法的异常分割准确率仅比ANNS方法降低1%左右,但推理时延、吞吐量和内存开销显著较优,接近端到端深度学习异常检测模型的计算效率。 展开更多
关键词 异常检测 无监督学习 近似存在性查询 布隆过滤器 局部敏感哈希
在线阅读 下载PDF
无线传感器网络中一种近似Skyline查询处理算法 被引量:8
10
作者 潘立强 李建中 骆吉洲 《软件学报》 EI CSCD 北大核心 2010年第5期1020-1030,共11页
由于无线传感器网络的能源有限,且在许多应用中Skyline查询的部分结果即可满足用户需求,提出了一种近似Skyline查询处理算法,在满足用户查询需求的前提下最大化地节省能量.该算法仅需无线传感器网络中的部分传感器节点回传其感知数据即... 由于无线传感器网络的能源有限,且在许多应用中Skyline查询的部分结果即可满足用户需求,提出了一种近似Skyline查询处理算法,在满足用户查询需求的前提下最大化地节省能量.该算法仅需无线传感器网络中的部分传感器节点回传其感知数据即可计算出Skyline查询的一个近似结果集.由于该算法在处理查询时,每个传感器节点只需考察自身数据信息即可决定是否回传其感知数据,而无须与其他传感器节点的感知数据进行比较,因此可以避免大量的网内通信开销,从而节省网络能源.模拟环境下的大量实验结果表明,该算法可以根据用户的应用需求,节能地处理传感器网络中的近似skyline查询. 展开更多
关键词 传感器网络 算法 SKYLINE 查询处理 近似查询
在线阅读 下载PDF
配电自动化的数据流管理系统设计 被引量:13
11
作者 王永利 徐宏炳 +2 位作者 董逸生 钱江波 刘学军 《电力系统自动化》 EI CSCD 北大核心 2004年第13期85-89,96,共6页
数据采集与监视控制(SCADA)系统采集的各种实时、连续、有序的值序列是典型的数据流,而目前SCADA系统所采用的实时数据库系统对数据流处理的实时性和自适应性要求尚需改进。文中以配电自动化管理为应用背景,提出一个支持配电自动化的数... 数据采集与监视控制(SCADA)系统采集的各种实时、连续、有序的值序列是典型的数据流,而目前SCADA系统所采用的实时数据库系统对数据流处理的实时性和自适应性要求尚需改进。文中以配电自动化管理为应用背景,提出一个支持配电自动化的数据流管理系统,在配电网远方终端加入查询处理层,降低网络传输负载,提高配电网数据处理的实时性和可靠性。文中描述了系统的基本结构、各组成部分的功能和关键技术,探讨了有关分布式连续查询处理、近似计算、归档数据处理等问题,并提出在数据流研究方面的一些新看法。 展开更多
关键词 配电自动化 数据流管理系统 连续查询 近似计算
在线阅读 下载PDF
基于两阶段查询重写的XML近似查询算法 被引量:6
12
作者 衡星辰 覃征 +2 位作者 邵利平 曹玉辉 高洪江 《电子学报》 EI CAS CSCD 北大核心 2007年第7期1271-1278,共8页
提出了基于两阶段查询重写的XML近似查询算法.该算法不仅能够返回精确查询结果,而且能够返回带有相似度分值的近似结果序列.首先,通过模式重写策略,将原始查询树改写为多种XML DTD(文档类型定义)下的重写查询树,从而解决了XML数据的多... 提出了基于两阶段查询重写的XML近似查询算法.该算法不仅能够返回精确查询结果,而且能够返回带有相似度分值的近似结果序列.首先,通过模式重写策略,将原始查询树改写为多种XML DTD(文档类型定义)下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题,接着,利用基本变异操作得到的变异查询树对XML数据树完成精确嵌入,可将XML近似查询的问题转变为多棵变异查询树的精确查询问题,并给出了基于XML数据统计的相似度计算模型和Top-K问题求解的优化算法.最后,在汽车外形智能化设计的实验中表明该算法优于SSO算法. 展开更多
关键词 XML近似查询 基本变异操作 变异查询树 模式重写 异质XML文档
在线阅读 下载PDF
无线传感器网络中隐私保护通用近似查询协议 被引量:10
13
作者 范永健 陈红 +2 位作者 张晓莹 彭辉 李翠平 《计算机学报》 EI CSCD 北大核心 2014年第4期915-926,共12页
无线传感器网络中实现隐私保护通用近似查询是具有挑战性的问题.文中提出一种无线传感器网络中隐私保护通用近似查询协议PGAQ.PGAQ将传感器节点编号和其采集数据隐藏于设计的数据结构中,在基站构造线性方程组解出直方图,根据直方图具有... 无线传感器网络中实现隐私保护通用近似查询是具有挑战性的问题.文中提出一种无线传感器网络中隐私保护通用近似查询协议PGAQ.PGAQ将传感器节点编号和其采集数据隐藏于设计的数据结构中,在基站构造线性方程组解出直方图,根据直方图具有的统计信息,不泄露隐私地完成Top-k查询、范围查询、SUM、MAX/MIN、Median、Histogram等近似查询.PGAQ使用网内求和聚集以减少能量消耗,并且能够通过调节直方图划分粒度来平衡查询精度与能量消耗.PGAQ协议分为H-PGAQ和F-PGAQ两种模式.H-PGAQ模式使用数据扰动技术加强数据安全性,F-PGAQ使用过滤器减少连续查询通信量.通过理论分析和使用真实数据集实验验证了PGAQ的安全性和有效性. 展开更多
关键词 无线传感器网络 隐私保护 近似查询 数据聚集 物联网
在线阅读 下载PDF
一种新的近似旋律匹配方法及其在哼唱检索系统中的应用 被引量:28
14
作者 李扬 吴亚栋 刘宝龙 《计算机研究与发展》 EI CSCD 北大核心 2003年第11期1554-1560,共7页
提出了一种近似旋律匹配(approximate melody matching)的新方法——线性对齐匹配法,并在此基础上实现了一个哼唱检索(query by humming)系统原型.与已有的基于内容的音乐检索(content-based music retrieval)不同,该算法并非基于近似... 提出了一种近似旋律匹配(approximate melody matching)的新方法——线性对齐匹配法,并在此基础上实现了一个哼唱检索(query by humming)系统原型.与已有的基于内容的音乐检索(content-based music retrieval)不同,该算法并非基于近似符号串匹配、统计模型或者特征空间,而是根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑所设计而成的全新算法.通过实验检验该算法的有效性,在含有3864首乐曲的搜索空间中,检索62段人声哼唱,线性对齐匹配法取得了90.3%的前3位命中率,相比传统的近似符号匹配算法高出11%以上.这一实验结果有力地表明了线性对齐匹配法的有效性,及其应用于大型数字音乐检索引擎的可行性. 展开更多
关键词 基于内容的音乐检索 哼唱检索 近似旋律匹配
在线阅读 下载PDF
基于压缩的海量不完整数据近似查询方法 被引量:7
15
作者 王妍 刘赓浩 +1 位作者 王俊陆 宋宝燕 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期571-581,共11页
随着数据的爆炸式增加,不完整数据普遍存在,传统的数据修复方法对于海量数据处理代价过高,且不能彻底修复,在这些不完整的海量数据上进行满足给定需求的近似查询引起了学术界的关注.因此,提出一种基于压缩的海量不完整数据近似查询方法... 随着数据的爆炸式增加,不完整数据普遍存在,传统的数据修复方法对于海量数据处理代价过高,且不能彻底修复,在这些不完整的海量数据上进行满足给定需求的近似查询引起了学术界的关注.因此,提出一种基于压缩的海量不完整数据近似查询方法,该方法对属性值缺失字段进行标记,根据频繁查询条件对标记后的数据进行压缩,并建立对应索引;根据属性划分对索引文件再次压缩以节省存储空间,采用编码字典对索引压缩文件进行选择和投影操作,最终获得不完整数据的近似查询结果.实验表明,该方法能够快速定位不完整数据的压缩位置,提高了查询效率,节省了存储空间,并且保证了查询结果的完整性. 展开更多
关键词 不完整数据 近似查询 数据压缩 索引 编码字典
在线阅读 下载PDF
基于文档属性单元松弛的XML近似查询方法 被引量:5
16
作者 孟祥福 严丽 +1 位作者 张文博 马宗民 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1936-1946,共11页
为解决普通用户对XML文档的近似查询问题,提出了一种基于文档属性单元松弛的XML近似查询方法.该方法将XML文档中的叶子结点和属性结点作为属性单元处理,基于一致集的概念导出最大集,生成最小非平凡函数依赖集,从而找出属性单元之间的近... 为解决普通用户对XML文档的近似查询问题,提出了一种基于文档属性单元松弛的XML近似查询方法.该方法将XML文档中的叶子结点和属性结点作为属性单元处理,基于一致集的概念导出最大集,生成最小非平凡函数依赖集,从而找出属性单元之间的近似函数依赖关系,进而求出近似候选码和近似关键字.在此基础上,根据属性单元支持度将属性单元按重要程度排列并据此对初始查询条件进行松弛,最不重要的属性单元最先松弛并且松弛程度最大.利用松弛后的查询条件对XML文档进行查询,可得到与初始查询条件近似的查询结果.实验结果和分析表明:提出的XML近似查询方法能够很好地满足用户的查询意图,具有较高的执行效率. 展开更多
关键词 XML文档 结构连接 近似查询 属性单元松弛 近似函数依赖
在线阅读 下载PDF
基于签名的近似垃圾邮件检测算法 被引量:4
17
作者 詹川 卢显良 +1 位作者 侯孟书 刘志辉 《计算机工程》 CAS CSCD 北大核心 2006年第5期122-124,共3页
针对垃圾邮件短小、一定时间内在网络上重复、大量地散发的特点,提出了基于签名的近似垃圾邮件检测算法(ASD)。该算法以句为基本单位,求取邮件所含的全部句子的摘要,垃圾邮件的近似检测转变为两个摘要集近似度的比较。通过与近似文本查... 针对垃圾邮件短小、一定时间内在网络上重复、大量地散发的特点,提出了基于签名的近似垃圾邮件检测算法(ASD)。该算法以句为基本单位,求取邮件所含的全部句子的摘要,垃圾邮件的近似检测转变为两个摘要集近似度的比较。通过与近似文本查询算法DSC、DSC-SS、I-Match的比较,ASD算法在近似垃圾邮件查询中,表现出样本集的存储空间大小适中、运算时间短、鲁棒性高、高准确率、高召回率的特征。 展开更多
关键词 近似垃圾邮件检测 垃圾邮件过滤 签名 文本近似度 查询
在线阅读 下载PDF
基于符号语义的不完整数据聚集查询处理算法 被引量:8
18
作者 张安珍 李建中 高宏 《软件学报》 EI CSCD 北大核心 2020年第2期406-420,共15页
研究了基于符号语义的不完整数据聚集查询处理问题.不完整数据又称为缺失数据,缺失值包括可填充的和不可填充的两种类型.现有的缺失值填充算法不能保证填充后查询结果的准确度,为此,给出了不完整数据聚集查询结果的区间估计.在符号语义... 研究了基于符号语义的不完整数据聚集查询处理问题.不完整数据又称为缺失数据,缺失值包括可填充的和不可填充的两种类型.现有的缺失值填充算法不能保证填充后查询结果的准确度,为此,给出了不完整数据聚集查询结果的区间估计.在符号语义中扩展了传统关系数据库模型,提出了一种通用不完整数据库模型.该模型可以处理可填充的和不可填充的两种类型缺失值.在该模型下,提出一种新的不完整数据聚集查询结果语义:可靠结果.可靠结果是真实查询结果的区间估计,可以保证真实查询结果有很大概率在该估计区间范围内.给出了线性时间求解SUM、COUNT和AVG查询可靠结果的方法.真实数据集和合成数据集上的扩展实验验证了所提方法的有效性. 展开更多
关键词 不完整数据 近似查询处理 数据修复 结果估计 数据可用性
在线阅读 下载PDF
数据流的核心技术与应用发展研究综述 被引量:13
19
作者 杨颖 韩忠明 杨磊 《计算机应用研究》 CSCD 北大核心 2005年第11期4-7,共4页
在数据流基本概念的基础上,综述了数据流领域中主要的流模型、构造概要数据结构的算法、连续查询处理和优化技术等热点问题,以及数据流的应用发展。
关键词 数据流 概要数据结构 连续查询 近似处理
在线阅读 下载PDF
一种基于学习的高维数据c-近似最近邻查询算法 被引量:18
20
作者 袁培森 沙朝锋 +1 位作者 王晓玲 周傲英 《软件学报》 EI CSCD 北大核心 2012年第8期2018-2031,共14页
针对高维数据近似最近邻查询,在过滤-验证框架下提出了一种基于学习的数据相关的c-近似最近邻查询算法.证明了数据经过随机投影之后,满足语义哈希技术所需的熵最大化准则.把经过随机投影的二进制数据作为数据的类标号,训练一组分类器用... 针对高维数据近似最近邻查询,在过滤-验证框架下提出了一种基于学习的数据相关的c-近似最近邻查询算法.证明了数据经过随机投影之后,满足语义哈希技术所需的熵最大化准则.把经过随机投影的二进制数据作为数据的类标号,训练一组分类器用来预测查询的类标号.在此基础上计算查询与数据集中数据对象的海明距离.最后,在过滤后的候选数据集上计算查询的最近邻.与现有方法相比,该方法对空间需求更小,编码长度更短,效率更高.模拟数据集和真实数据集上的实验结果表明,该方法不仅能够提高查询效率,而且方便调控在查询质量和查询处理时间方面的平衡问题. 展开更多
关键词 随机投影 c-近似最近邻查询 支持向量机分类器 高维数据 熵最大化准则 位置敏感哈希
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部