期刊文献+
共找到7,367篇文章
< 1 2 250 >
每页显示 20 50 100
道路网中针对多目标决策的兴趣点高效查询算法
1
作者 李松 杨晓龙 +1 位作者 靳海鹏 张丽平 《西安交通大学学报》 北大核心 2025年第4期148-157,共10页
为了解决道路网中利用多目标决策技术进行兴趣点推荐和高效位置查询的问题,针对由于数据规模增加产生大量近似数据,导致传统多目标决策技术在道路网环境下查询效率和可用性方面较低的问题,提出了一种道路网广义近似Skyline查询算法。首... 为了解决道路网中利用多目标决策技术进行兴趣点推荐和高效位置查询的问题,针对由于数据规模增加产生大量近似数据,导致传统多目标决策技术在道路网环境下查询效率和可用性方面较低的问题,提出了一种道路网广义近似Skyline查询算法。首先基于兴趣点的维度相似性和道路网近似性构建近似集和独立点,并根据兴趣点特性设计相应的剪枝策略;随后,通过近似集和独立点重构数据集,根据剪枝策略过滤掉当查询位置移动时对查询结果无影响的兴趣点,并构建AA-R*-Tree索引以提升查询效率;最后,根据兴趣点的近似性提出一种广义近似聚集支配算法,通过选取代表点代替近似集进行Skyline计算,减少冗余运算并优化查询结果,最终得到满足兴趣点近似整合有序的Skyline结果集。实验结果表明:所提近似查询算法在大规模数据集和大量相似数据条件下表现出较好的效率与可行性;与Higher-Gsky、MG-EGsky和GSSK-A算法相比,所提算法在数据规模、查询范围及路段数增加时的平均效率提升约14%,能够为道路网用户提供更快速有效的决策支持。 展开更多
关键词 道路网 SKYLINE查询 多目标决策 近似查询 兴趣点推荐
在线阅读 下载PDF
时空数据查询技术研究综述 被引量:1
2
作者 孟祥福 翁雪 徐永杰 《计算机科学与探索》 北大核心 2025年第8期2001-2023,共23页
随着现代信息技术的快速发展与应用,时空数据的规模迅速增长。这些数据呈现出海量聚集、高维异构以及动态复杂等特点。近年来,以时空数据为背景的时空查询技术得到广泛的研究和应用,如何有效地存储、管理和查询这些数据成为了研究的重... 随着现代信息技术的快速发展与应用,时空数据的规模迅速增长。这些数据呈现出海量聚集、高维异构以及动态复杂等特点。近年来,以时空数据为背景的时空查询技术得到广泛的研究和应用,如何有效地存储、管理和查询这些数据成为了研究的重点。对时空数据的相关查询技术进行综述,从时空数据相关基本概念入手,系统阐述了当前主流的时空查询处理模式,涵盖了范围查询、K近邻查询、反K近邻查询等多种类型;介绍了不同的时空索引技术,包括基于轨迹的索引结构、基于抽样的索引以及其他创新的索引方法;分析了结合其他技术的查询方法,主要包括时空-文本查询、语义近似轨迹查询、并行和分布式查询等,这些技术不仅提升了时空查询的多样性和准确性,还能有效地处理大规模时空数据。展望了时空查询技术的未来发展方向,包括查询结果的可视化展示、隐私保护以及结合机器学习的新型索引结构,为时空数据的高效利用提供了新的思路和挑战。 展开更多
关键词 时空数据 查询处理 索引技术 时空-文本 语义近似 分布式
在线阅读 下载PDF
基于时空约束和成本感知的集合空间关键字查询
3
作者 李松 曹文琪 +2 位作者 郝晓红 张丽平 郝忠孝 《计算机研究与发展》 北大核心 2025年第3期808-819,共12页
集合空间关键字查询在空间数据库、位置服务、智能推荐和群智感知等领域具有重要的作用.现有的集合空间关键字查询方法没有考虑要求同时带有时空约束和成本感知的问题,不能满足大部分用户在时空约束条件下的查询需求问题,已有研究成果... 集合空间关键字查询在空间数据库、位置服务、智能推荐和群智感知等领域具有重要的作用.现有的集合空间关键字查询方法没有考虑要求同时带有时空约束和成本感知的问题,不能满足大部分用户在时空约束条件下的查询需求问题,已有研究成果具有较大的局限性.为了弥补已有方法的不足,提出一种基于时空约束和成本感知的集合空间关键字查询TDCCA-Co SKQ.为了解决现有索引中无法同时包含关键字信息和时间信息的问题,提出了一种TDCIR-Tree索引,该索引融合了倒排文件和时间属性标签文件,可以减小查询计算的开销;为了有效地筛选出符合查询条件的集合,提出了一种TDCCA_PP算法,其中包括第1层剪枝算法、组间有序排列和第2层剪枝算法,可以提高关键字的查询效率;进一步提出了一种基于TDC成本函数的排序算法,TDC成本函数是由距离成本和时间成本组成的,其中包含代表用户偏好度的自变量系数α和β,可以增加用户的选择自由度,有效解决了现有的成本函数无法满足时空约束和成本感知的集合空间关键字查询的问题.理论研究与实验表明,所提出的方法具有较好的效率与准确性. 展开更多
关键词 集合空间关键字查询 时空约束 成本感知 倒排文件 时间属性标签文件
在线阅读 下载PDF
因素查询语言(FQL)-因素数据库的基本语言
4
作者 孟祥福 李子函 +4 位作者 史家晟 郭建威 赵亮 郭嗣琮 汪培庄 《计算机科学》 北大核心 2025年第S1期651-658,共8页
为支持因素空间理论背景下因素谱系数据的基本存储与高效处理,提出了一种因素查询语言(Factor Query Language,FQL)和因素库管理系统(FBMS)架构。首先,介绍因素谱系的相关概念并给出基于XML规范的因素谱系存储方法。然后,设计因素查询... 为支持因素空间理论背景下因素谱系数据的基本存储与高效处理,提出了一种因素查询语言(Factor Query Language,FQL)和因素库管理系统(FBMS)架构。首先,介绍因素谱系的相关概念并给出基于XML规范的因素谱系存储方法。然后,设计因素查询语言的增删改查基本操作规范。为提高因素的查询效率,在提高数据更新速度的同时降低索引更新成本,针对因素谱系特点进一步提出了基于区间和基于素数与二进制串的因素编码策略。最后,对因素库管理系统的系统架构和功能模块进行了相应设计,作为因素查询语言的操作载体。因素查询语言FQL和因素库管理系统,是因素空间理论落地实施的系统平台,文章在该方面进行了初步探讨,为因素库管理系统的研发和应用提供了基本思路和解决方案。 展开更多
关键词 因素空间 因素库 因素谱系 因素查询语言 因素编码 因素库管理系统
在线阅读 下载PDF
人工智能在档案查询服务中的应用:场景、困境与路径
5
作者 陈勇 蓝佳佳 姚燕珠 《档案管理》 北大核心 2025年第4期58-61,66,共5页
人工智能在档案查询服务中的应用场景,主要有档案智能检索、档案智能浏览、档案智能咨询三个方面。针对目前存在档案智能检索服务中的文本算法分类不明确、图像识别技术误识率较高、语音理解深度不全面,档案智能浏览服务中的知识图谱浏... 人工智能在档案查询服务中的应用场景,主要有档案智能检索、档案智能浏览、档案智能咨询三个方面。针对目前存在档案智能检索服务中的文本算法分类不明确、图像识别技术误识率较高、语音理解深度不全面,档案智能浏览服务中的知识图谱浏览存在局限性、语音朗读角色单一化、信息加工分析能力弱,档案智能咨询服务中的时效性和针对性不佳、准确性和完整性偏弱、被动交互体验感不佳等困境,提出人工智能在档案查询服务中的应用优化路径。 展开更多
关键词 人工智能 档案查询 智能检索 智能浏览 咨询服务 人脸识别 知识图谱
在线阅读 下载PDF
大语言模型和知识图谱协同的跨域异质数据查询框架 被引量:3
6
作者 吴文隆 尹海莲 +7 位作者 王宁 徐梦飞 赵鑫喆 殷崭祚 刘元睿 王昊奋 丁岩 李博涵 《计算机研究与发展》 北大核心 2025年第3期605-619,共15页
大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和... 大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和知识图谱(knowledge graph,KG)协同的跨域异质数据查询框架,在LLM+KG的范式下给出跨域异质数据查询的一个治理方案.为确保LLM能够适应多场景中的跨域异质数据,首先采用适配器对跨域异质数据进行融合,并构建相应的知识图谱.为提高查询效率,引入线性知识图,并提出同源知识图抽取算法HKGE来实现知识图谱的重构,可显著提高查询性能,确保跨域异质数据治理的高效性.进而,为保证多域数据查询的高可信度,提出可信候选子图匹配算法Trust HKGM,用于检验跨域同源数据的置信度计算和可信候选子图匹配,剔除低质量节点.最后,提出基于线性知识图提示的多域数据查询算法MKLGP,实现LLM+KG范式下的高效可信跨域查询.该方法在多个真实数据集上进行了广泛实验,验证了所提方法的有效性和高效性. 展开更多
关键词 大语言模型 跨域异质数据 知识图谱 多域数据查询 数据治理
在线阅读 下载PDF
CPP:分片联盟链中的可验证溯源查询方法 被引量:1
7
作者 信俊昌 崔婷钰 +3 位作者 郝琨 徐浚铭 王之琼 黄敏 《计算机工程与应用》 北大核心 2025年第4期282-288,共7页
随着分片联盟链技术的发展,大量具有内在联系的数据被分散存储在不同分片,溯源查询操作变得复杂。现有研究仅支持单一分片的溯源查询操作,直接进行跨分片溯源将产生查询延迟高和结果验证弱的问题,影响用户体验和结果可信性。针对以上问... 随着分片联盟链技术的发展,大量具有内在联系的数据被分散存储在不同分片,溯源查询操作变得复杂。现有研究仅支持单一分片的溯源查询操作,直接进行跨分片溯源将产生查询延迟高和结果验证弱的问题,影响用户体验和结果可信性。针对以上问题,提出了一种分片联盟链中的可验证溯源查询框架CPP。为了便于跨分片溯源操作,提升查询效率,以属性为单位,设计了新颖的三层索引结构SBP(sharding-block-proofindex)。为了防止因索引被篡改造成的结果不可信,设计了索引防篡改机制。为了防止因恶意节点篡改或删除部分结果造成的结果不可信,设计了支持任意维度属性动态聚合的可验证溯源查询算法,使得用户能够对返回结果的完整性和正确性进行验证。在真实公开数据集上进行实验,验证了所提出方法的高效性和有效性。 展开更多
关键词 分片联盟链 溯源 可验证查询
在线阅读 下载PDF
机器学习赋能的多维数据查询处理研究综述 被引量:4
8
作者 马超红 郝新丽 +1 位作者 孟小峰 张旭康 《计算机学报》 北大核心 2025年第1期100-123,共24页
多维数据的查询和处理在数据库中普遍存在。高效的多维数据查询处理,一方面依赖于精细的索引结构,例如R-tree、KD-tree等被广泛应用;另一方面,也有诸多工作探索利用硬件优势设计高效的数据布局,即研究面向扫描的数据处理策略以及构建数... 多维数据的查询和处理在数据库中普遍存在。高效的多维数据查询处理,一方面依赖于精细的索引结构,例如R-tree、KD-tree等被广泛应用;另一方面,也有诸多工作探索利用硬件优势设计高效的数据布局,即研究面向扫描的数据处理策略以及构建数据概要,避免高代价地访问原始数据。然而,随着数字化社会的发展,网络Web服务更加普及,传感器网络无处不在,诸如网约车、电子地图等基于位置的服务愈发盛行,使得多维数据正在以前所未有的速度产生,对查询处理提出新的要求,包括更快的查询响应、更低的存储占用。近年来,机器学习包括深度学习算法不断优化,且计算机等硬件环境持续发展,为多维数据查询处理带来更多的优化契机,不仅降低查询执行时间,同时能够节省存储资源,取得显著性优势。因此,机器学习被广泛应用于构建更好的数据管理和数据分析任务解决方案。该文提出机器学习赋能的多维数据查询处理研究框架,一方面介绍机器学习模型对多维索引结构的优化和改进;另一方面,介绍机器学习对不依赖索引结构的查询处理任务的赋能研究,包括数据布局策略和数据概要研究。在总结已有研究现状的基础上,指出该领域面临的挑战和未来研究方向。 展开更多
关键词 查询处理 多维学习化索引 数据布局 数据概要 机器学习
在线阅读 下载PDF
空间最近邻及其变体查询研究综述
9
作者 王璐琦 高继勋 +2 位作者 唐昊 李松 赵媛媛 《计算机科学与探索》 北大核心 2025年第9期2319-2340,共22页
空间最近邻查询及其扩展的变体查询是空间数据库研究领域中的重要内容,被广泛地应用于地理信息系统、模式识别、决策支持、城市规划等众多领域。近年来许多空间最近邻及其变体查询算法被提出,对现有的空间最近邻查询工作进行综合分析和... 空间最近邻查询及其扩展的变体查询是空间数据库研究领域中的重要内容,被广泛地应用于地理信息系统、模式识别、决策支持、城市规划等众多领域。近年来许多空间最近邻及其变体查询算法被提出,对现有的空间最近邻查询工作进行综合分析和梳理。针对最近邻查询索引结构,从基于网格的空间索引结构、基于树的空间索引结构和混合空间索引结构详细介绍目前空间索引结构的研究进展,分析索引结构的优缺点;针对最近邻查询算法的变体查询算法,重点研究分析了以下几种最近邻变体查询:反最近邻查询算法、连续最近邻查询算法、最近对查询算法、障碍最近邻查询算法和基于最近邻的空间Skyline查询算法等。对于每种变体详细分析其算法的特点、研究现状和核心技术,并归纳出变体算法的优缺点和适用范围等。阐明了当前研究工作面临空间数据量大量增加、空间数据维度高和数据查询需求的多样性等问题,并对其未来的发展趋势进行了展望。 展开更多
关键词 空间索引结构 最近邻查询 反最近邻查询 连续最近邻查询 最近对查询 障碍最近邻查询 空间Skyline查询
在线阅读 下载PDF
计算平台运维数据融合与查询引擎设计与实现
10
作者 程延福 胡庆宝 +1 位作者 欧歌 石京燕 《计算机工程与设计》 北大核心 2025年第9期2644-2650,共7页
针对大规模计算平台运维数据多、访问慢的问题,研发高效查询引擎,融合多源数据,通过缓存机制、加速算法为应用系统提供近实时的查询服务。引擎屏蔽不同底层存储数据格式差异,支持多数据源接入;采用长、短期结合缓存策略,提升命中率;通... 针对大规模计算平台运维数据多、访问慢的问题,研发高效查询引擎,融合多源数据,通过缓存机制、加速算法为应用系统提供近实时的查询服务。引擎屏蔽不同底层存储数据格式差异,支持多数据源接入;采用长、短期结合缓存策略,提升命中率;通过定制数据格式和聚合算法,提高查询速度。基于查询引擎,研发了面向大规模计算平台实时资源查询系统。目前系统已在国家高能物理数据中心部署,提供便捷高效的资源查询服务。 展开更多
关键词 运维数据 缓存 聚合查询 数据分析 格式化 实时性 查询优化
在线阅读 下载PDF
数据库条件查询的非语义等价关系建模
11
作者 何培蕾 游进国 +1 位作者 王宇轩 丁家满 《小型微型计算机系统》 北大核心 2025年第6期1523-1529,共7页
在数据库中,通过识别等价查询可以减少重复计算.现有方法通常从查询的语义等价关系方面来验证等价查询,然而查询的语义等价是查询结果等价的充分非必要条件,因此,仅依据语义等价关系来判断等价查询会漏掉一些语义不等价但结果相同的查询... 在数据库中,通过识别等价查询可以减少重复计算.现有方法通常从查询的语义等价关系方面来验证等价查询,然而查询的语义等价是查询结果等价的充分非必要条件,因此,仅依据语义等价关系来判断等价查询会漏掉一些语义不等价但结果相同的查询.针对这一问题,本文面向数据库条件查询提出一种非语义等价关系模型(Non-Semantic Equivalence Relation Model,NSERM):以查询的过滤条件间的包含关系作为偏序关系构建查询格,结合查询结果相等划分得到等价类,依据等价类的凸集性质,即包含等价类上界且被下界包含的查询属于该等价类,从而直接识别或回答语义不等价但结果相同的条件查询集.所提出的模型在开源数据库PostgreSQL中实现,基于TPC-H测试集的实验结果表明,NSERM能识别非语义等价的等价查询,同时还能为数据库带来性能上的提升. 展开更多
关键词 数据库 条件查询 非语义等价 查询 等价类
在线阅读 下载PDF
基于学习排序的查询优化算法 被引量:1
12
作者 余阳 彭煜玮 《计算机科学》 北大核心 2025年第8期109-117,共9页
查询优化是关系型数据库中的关键环节。在传统的查询优化过程中,为了获得较优的执行计划,通常需要对查询中的连接和过滤操作进行基数估计。然而,基数估计存在不准确的问题,导致查询优化效果往往不尽如人意。目前,已有部分研究通过基于... 查询优化是关系型数据库中的关键环节。在传统的查询优化过程中,为了获得较优的执行计划,通常需要对查询中的连接和过滤操作进行基数估计。然而,基数估计存在不准确的问题,导致查询优化效果往往不尽如人意。目前,已有部分研究通过基于机器学习的方法改善基数估计问题并取得了一定进展。尽管这些方法在处理查询中数值类型的过滤谓词时表现较好,但对于其他复杂的过滤谓词效果不佳。为解决这一问题,文中提出了一种基于学习排序的查询优化算法。该算法能够为单一查询智能评估多个执行计划并排序,从而选择最佳计划执行。该查询优化算法通过迭代挖掘较优执行计划,并协同机器学习方法,最终筛选出最优计划。实验结果表明,该算法在常规数据集上的性能优于当前基于学习的查询优化算法,并且在复杂数据集中具有更加显著的优势。 展开更多
关键词 查询优化 计划生成 学习排序 数据库 连接顺序 连接类型 扫描类型
在线阅读 下载PDF
不确定时间序列Top-k窗口聚合查询方法
13
作者 张航 熊浩然 何震瀛 《计算机工程》 北大核心 2025年第7期161-170,共10页
近年来,如何分析挖掘不确定时间序列数据逐渐受到业界关注。Top-k查询作为数据库领域研究的热点问题,旨在从大规模数据中检索出最符合用户查询条件的前k项结果。然而,尽管Top-k查询在其他领域已被广泛应用,针对不确定时间序列的Top-k查... 近年来,如何分析挖掘不确定时间序列数据逐渐受到业界关注。Top-k查询作为数据库领域研究的热点问题,旨在从大规模数据中检索出最符合用户查询条件的前k项结果。然而,尽管Top-k查询在其他领域已被广泛应用,针对不确定时间序列的Top-k查询研究仍然较少。这种查询可以有效帮助用户从不确定时间序列提取重要信息。提出一种新的Top-k查询问题——不确定时间序列Top-k窗口聚合查询,并针对该问题给出高效的查询方法。这个查询可以作为一个基础工具,辅助用户探索和分析不确定时间序列数据。现有能够支持这个查询的方法均存在查询效率较低或所需存储空间过高的问题。针对该问题,提出一种基于子窗口拼接策略的两级Top-k查询方法,并提出高效计算阈值上界方法解决基于子窗口拼接策略引入的阈值计算复杂难题。该方法能够以较少的预计算存储空间,高效支持不确定时间序列Top-k窗口聚合查询。为了验证所提方法的有效性,在真实和人造数据集上进行实验。实验结果表明,所提方法与基于TA的Top-k查询方法相比,明显降低了预计算列表的存储空间;与基于遍历的FSEC-S方法相比,所提方法以及使用计算阈值上界优化方法的平均查询效率分别提升了7.27倍和20.04倍。 展开更多
关键词 不确定时间序列 TOP-K查询 窗口 聚合查询 有序列表 阈值
在线阅读 下载PDF
基于稀疏子空间采样的信号检测网络黑盒查询对抗攻击方法
14
作者 李东阳 王林元 +2 位作者 彭进先 马德魁 闫镔 《电子与信息学报》 北大核心 2025年第8期2808-2818,共11页
随着深度神经网络在信号检测任务的应用,神经网络易受到对抗样本攻击的脆弱性也受到了广泛关注。针对无法获取模型内部信息的信号检测网络黑盒攻击场景,该文提出一种基于稀疏子空间采样的黑盒查询对抗攻击方法。该方法将信号样本检测数... 随着深度神经网络在信号检测任务的应用,神经网络易受到对抗样本攻击的脆弱性也受到了广泛关注。针对无法获取模型内部信息的信号检测网络黑盒攻击场景,该文提出一种基于稀疏子空间采样的黑盒查询对抗攻击方法。该方法将信号样本检测数量消失比例作为判断攻击是否成功的约束条件,构造信号检测网络对抗样本攻击模型,参考跳步跳跃攻击(HSJA)算法设计基于决策边界的信号检测网络黑盒查询对抗攻击方法求解该模型,以生成信号对抗样本。为了进一步改善查询效率,该文根据信号对抗扰动特点构建稀疏子空间采样进行查询攻击,即在生成对抗样本时,按照一定比例选择具有较大幅度的信号分量,并仅在这些选定的分量上添加扰动。实验结果表明,在信号目标消失数量比例0.3的决策边界下,稀疏子空间采样黑盒对抗攻击方法使得信号检测网络mAP值降低了43.6%、召回率降低了41.2%。与全空间采样方法相比,稀疏子空间采样方法攻击成功率提升了2.5%,且对抗扰动平均能量比降低了3.47%。稀疏子空间采样攻击方法可以使得信号检测网络性能明显下降,相较于全空间采样具有攻击成功率更高、扰动强度更小等优势。 展开更多
关键词 信号检测网络 信号对抗样本 黑盒查询攻击 稀疏子空间采样
在线阅读 下载PDF
S-Cypher:时态属性图模型上的时态图查询语言
15
作者 蒋甜甜 陈观林 +2 位作者 宋明黎 杭海天 王豪烨 《国防科技大学学报》 北大核心 2025年第3期41-50,共10页
传统的图数据模型未考虑时间维度,可能会导致时态查询极其复杂,甚至破坏时间信息的完整性,为此,提出了一种时态属性图数据模型和相应的时态图查询语言S-Cypher。该时态图数据模型使用对象节点表示实体,引入属性节点和值节点表示实体的属... 传统的图数据模型未考虑时间维度,可能会导致时态查询极其复杂,甚至破坏时间信息的完整性,为此,提出了一种时态属性图数据模型和相应的时态图查询语言S-Cypher。该时态图数据模型使用对象节点表示实体,引入属性节点和值节点表示实体的属性,在节点以及对象节点之间的边上记录有效时间以表达时态信息,其记录的有效时间均遵循一组时态约束。S-Cypher是Cypher的时态拓展,在保证兼容的同时不仅提供了一套简洁完善的时态图查询语法,包括时态数据类型、时态图模式匹配、时间窗口限定和时态路径;还提供了一套在Neo4j上进行S-Cypher时态图查询的实现方案。实验结果显示,S-Cypher的查询时间平均是Cypher的1.29倍,表明S-Cypher能够有效地管理Neo4j中的时态图数据,并具有良好的性能。 展开更多
关键词 时态图 图数据模型 查询语言
在线阅读 下载PDF
基于历史信息的高效近似查询系统
16
作者 韩雨钢 马廷淮 荣欢 《计算机工程与设计》 北大核心 2025年第2期578-586,共9页
近似查询处理技术是提高数据库聚合查询效率的重要方法,针对海量二维数据提出一种基于历史查询负载的近似查询系统,引入历史查询信息,通过在历史查询空间中进行命中性检测,提高查询区域偏斜等情况时的效率。针对全局查询,通过空间数据... 近似查询处理技术是提高数据库聚合查询效率的重要方法,针对海量二维数据提出一种基于历史查询负载的近似查询系统,引入历史查询信息,通过在历史查询空间中进行命中性检测,提高查询区域偏斜等情况时的效率。针对全局查询,通过空间数据划分方法将完整数据集划分为子区域,组织为树状分片索引结构,实现采样和数据摘要方法的结合,提高查询准确性。实验结果表明,当历史查询记录量达到10~4量级时,查询响应时间仅为传统方法的40%。与传统方法相比,该系统平均相对误差降低了63%。随分片数的增加效果有更大提升,当分片数达64时,其平均相对误差仅为传统方法的10%。 展开更多
关键词 数据库系统 近似查询处理 空间索引 历史查询 分片索引树 学习型索引 空间填充曲线
在线阅读 下载PDF
基于Top-k持续匹配机制的动态图查询方法
17
作者 邹付兵 刘凡 +1 位作者 刘强 钟荣锋 《计算机应用与软件》 北大核心 2025年第2期343-354,共12页
为实现高效的持续图形查询,提出一种基于Top-k持续匹配机制的动态图查询方法。通过遍历标记版本图来识别持续匹配,其中每个节点、边和标签均存在于图中的时间间隔集,标记版本图的高效内存布局允许在每个快照快速检索相邻节点;为了减少... 为实现高效的持续图形查询,提出一种基于Top-k持续匹配机制的动态图查询方法。通过遍历标记版本图来识别持续匹配,其中每个节点、边和标签均存在于图中的时间间隔集,标记版本图的高效内存布局允许在每个快照快速检索相邻节点;为了减少候选匹配的数量,引入基于Bloom滤波器的邻域和路径时间索引,利用基于时间索引确定持续时间阈值。实验验证了该方法能够有效实现最持续动态图查询,并且具有较高的计算效率。 展开更多
关键词 持续匹配 图形查询 标记版本图 阈值
在线阅读 下载PDF
差分隐私洗牌模型在范围查询中的应用研究
18
作者 王梓行 陈兵 《信息安全研究》 北大核心 2025年第8期736-745,共10页
范围查询是各种场景下数据分析的关键指标.然而,在处理个体层面的数据时会涉及个人隐私问题.为了解决这个问题,满足本地化差分隐私(local differential privacy,LDP)的范围查询协议被提出.这些协议使数据收集者能够在不依赖可信第三方... 范围查询是各种场景下数据分析的关键指标.然而,在处理个体层面的数据时会涉及个人隐私问题.为了解决这个问题,满足本地化差分隐私(local differential privacy,LDP)的范围查询协议被提出.这些协议使数据收集者能够在不依赖可信第三方的情况下收集关于总体的聚合信息,同时保护每个用户的隐私.尽管如此,现有基于LDP的范围查询协议中使用的扰动方法存在局限性,限制了方法的有效性.此外,这些协议对于小范围区间通常表现出较差的估计性能.鉴于此提出了一种基于差分隐私洗牌模型的分层范围查询(shuffling hierarchical range query,SHRQ)协议.首先,广泛分析了原有协议中扰动方法的方差,SHRQ协议根据每个层次中的节点数量选择最佳扰动方法.然后,SHRQ协议通过利用前一轮的先验知识进行多次迭代,最大限度地发挥洗牌模型的优势,显著提高了小范围查询区间的估计准确性.通过在模拟数据集和真实世界数据集上与原有协议进行大量对比实验,证明了在较少的迭代次数后,SHRQ协议将小范围的估计误差降低1个数量级,将大范围的估计误差降低半个数量级. 展开更多
关键词 差分隐私 范围查询 隐私保护 洗牌模型 数据安全
在线阅读 下载PDF
保护隐私的多维多范围数据查询
19
作者 段雨薇 李顺东 《密码学报(中英文)》 北大核心 2025年第1期117-132,共16页
范围查询作为隐私计算中的一个重要问题实际中应用广泛,目前研究成果集中于在数据集中查询是否有满足规定条件的记录,对于在查询范围内数据的统计量分析研究较少且只有区间合并计数查询,无法对多区间数据分区间单独计数.本文基于算术基... 范围查询作为隐私计算中的一个重要问题实际中应用广泛,目前研究成果集中于在数据集中查询是否有满足规定条件的记录,对于在查询范围内数据的统计量分析研究较少且只有区间合并计数查询,无法对多区间数据分区间单独计数.本文基于算术基本定理提出新的编码方法解决区间分别计数的问题,该方案可用于解决单维数据和多维数据多区间范围查询问题.进一步利用加密选择以及ElGamal门限解密系统设计了保护隐私的多区间范围查询协议,并使用模拟范例对协议进行了安全性证明.实验结果表明本文协议简单高效.该方案基于算术基本定理,将各区间的计数结果转化为素数指数形式,从而有效减少了分区间计数所需的通信量,最大限度地保障了计算过程中的数据安全性.实验结果表明,在包含100个参与方的查询中,单维数据范围计数的时间为130 ms,多维数据范围计数的时间为320 ms,证明了本文协议在安全性和效率方面的优越性. 展开更多
关键词 安全多方计算 范围查询 同态加密 加密选择 多区间
在线阅读 下载PDF
基于本地化差分隐私的多表星形连接查询
20
作者 张啸剑 曹小杰 +1 位作者 王宁 孟小峰 《软件学报》 北大核心 2025年第2期830-850,共21页
基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且... 基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且满足本地化差分隐私的Star-JOIN查询算法LPRR-JOIN(longitudinal path random response for join).该算法充分利用层次树的纵向路径结构与GRR机制,设计一种纵向本地扰动算法LPRR,该算法以所有属性纵向路径上的节点组合作为扰动值域.每个用户把自身元组映射到相应节点组合中,再利用GRR机制对映射后的元组进行本地扰动.为了避免事实表上存在的频率攻击,LPRR-JOIN算法允许每个用户利用阈值τ本地截断自身元组个数,大于τ条元组删减、小于τ条元组补充.为了寻找合适的τ值,LPRR-JOIN算法利用τ-截断带来的偏差与扰动方差构造总体误差函数,通过优化误差目标函数获得τ值;其次结合用户分组策略获得τ值的总体分布,再利用中位数获得合适的τ值.LPRR-JOIN算法与现有算法在3种多关系数据集上进行比较,实验结果表明其响应查询算法优于同类算法. 展开更多
关键词 本地化差分隐私 多表星形连接查询 层次结构 纵向节点组合 随机应答机制
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部