期刊文献+
共找到454篇文章
< 1 2 23 >
每页显示 20 50 100
An adaptive range-query optimization technique with distributed replicas
1
作者 Sayar Ahmet Pierce Marlon Fox C.Geoffrey 《Journal of Central South University》 SCIE EI CAS 2014年第1期190-198,共9页
Replication is an approach often used to speed up the execution of queries submitted to a large dataset.A compile-time/run-time approach is presented for minimizing the response time of 2-dimensional range when a dist... Replication is an approach often used to speed up the execution of queries submitted to a large dataset.A compile-time/run-time approach is presented for minimizing the response time of 2-dimensional range when a distributed replica of a dataset exists.The aim is to partition the query payload(and its range) into subsets and distribute those to the replica nodes in a way that minimizes a client's response time.However,since query size and distribution characteristics of data(data dense/sparse regions) in varying ranges are not known a priori,performing efficient load balancing and parallel processing over the unpredictable workload is difficult.A technique based on the creation and manipulation of dynamic spatial indexes for query payload estimation in distributed queries was proposed.The effectiveness of this technique was demonstrated on queries for analysis of archived earthquake-generated seismic data records. 展开更多
关键词 distributed systems load balancing range query query optimization
在线阅读 下载PDF
企业信息集成中XQuery引擎的查询优化 被引量:2
2
作者 毕蓉蓉 刘渊 翟学敏 《计算机工程与应用》 CSCD 北大核心 2008年第29期161-164,共4页
通过分析研究已有的XQuery引擎和XQ uery查询优化的方法,从减少编译时间和执行时间角度出发,提出了一种基于XQuery语句自身优化的新型综合性优化方法,经过XQuery中某常见查询进行仿真实验,可以说明该新型综合优化方法有较强的优势,可以... 通过分析研究已有的XQuery引擎和XQ uery查询优化的方法,从减少编译时间和执行时间角度出发,提出了一种基于XQuery语句自身优化的新型综合性优化方法,经过XQuery中某常见查询进行仿真实验,可以说明该新型综合优化方法有较强的优势,可以大大地提高XQuery引擎的查询效率。 展开更多
关键词 企业信息集成 引擎 查询优化 查询重写
在线阅读 下载PDF
基于双链架构与BBF-Merkle树的高速公路事故救援数据共享方法
3
作者 王光辉 关道伟 +2 位作者 申凌峰 丁爽 翟中豪 《计算机应用研究》 北大核心 2025年第4期987-994,共8页
针对现有区块链数据共享方法在高速公路事故救援场景下面临的效率瓶颈和安全性不足的问题,提出一种高效、安全的数据共享方法,旨在提高数据查询性能,保证链下数据的防窜改能力。提出的数据共享方法结合公有链与联盟链的优势,采用双链架... 针对现有区块链数据共享方法在高速公路事故救援场景下面临的效率瓶颈和安全性不足的问题,提出一种高效、安全的数据共享方法,旨在提高数据查询性能,保证链下数据的防窜改能力。提出的数据共享方法结合公有链与联盟链的优势,采用双链架构提升数据共享的安全性与效率。通过将公有链链上共享数据的摘要信息同步至外部数据库,设计了基于BBF-Merkle树的数据库索引结构来优化查询性能,同时保证链下数据的防窜改能力。设计了缓存-链下数据库-公有链的分层查询方案,降低整体查询耗时。实验结果表明,基于BBF-Merkle树的外联数据库查询耗时相较于其他方案表现最优,采用基于BBF-Merkle树的缓存-数据库-公有链分层查询方案,相较于公有链智能合约查询速度提高了七倍。所提出的数据共享方法在提升数据共享效率、降低查询延迟的同时,确保了数据的安全性与防窜改能力,为高速公路事故救援数据共享提供了技术支撑。 展开更多
关键词 区块链 数据共享 区块链查询优化 双链架构
在线阅读 下载PDF
基于学习排序的查询优化算法
4
作者 余阳 彭煜玮 《计算机科学》 北大核心 2025年第8期109-117,共9页
查询优化是关系型数据库中的关键环节。在传统的查询优化过程中,为了获得较优的执行计划,通常需要对查询中的连接和过滤操作进行基数估计。然而,基数估计存在不准确的问题,导致查询优化效果往往不尽如人意。目前,已有部分研究通过基于... 查询优化是关系型数据库中的关键环节。在传统的查询优化过程中,为了获得较优的执行计划,通常需要对查询中的连接和过滤操作进行基数估计。然而,基数估计存在不准确的问题,导致查询优化效果往往不尽如人意。目前,已有部分研究通过基于机器学习的方法改善基数估计问题并取得了一定进展。尽管这些方法在处理查询中数值类型的过滤谓词时表现较好,但对于其他复杂的过滤谓词效果不佳。为解决这一问题,文中提出了一种基于学习排序的查询优化算法。该算法能够为单一查询智能评估多个执行计划并排序,从而选择最佳计划执行。该查询优化算法通过迭代挖掘较优执行计划,并协同机器学习方法,最终筛选出最优计划。实验结果表明,该算法在常规数据集上的性能优于当前基于学习的查询优化算法,并且在复杂数据集中具有更加显著的优势。 展开更多
关键词 查询优化 计划生成 学习排序 数据库 连接顺序 连接类型 扫描类型
在线阅读 下载PDF
基于嵌入式关系的一种Multi-join算法
5
作者 何伟 洪晓光 +1 位作者 王海洋 董继润 《计算机科学》 CSCD 北大核心 1999年第7期74-76,共3页
去掉第一范式“原子属性”的限制条件而得到的关系模式称作嵌入式或扩展的关系模式。嵌入式关系模型已经被数据库理论界接受为一种规范的关系模型,它可以有力地支持存储树型(层次)或图形(网状)数据的系统,比如办公自动化、多媒体系统等... 去掉第一范式“原子属性”的限制条件而得到的关系模式称作嵌入式或扩展的关系模式。嵌入式关系模型已经被数据库理论界接受为一种规范的关系模型,它可以有力地支持存储树型(层次)或图形(网状)数据的系统,比如办公自动化、多媒体系统等许多新的应用领域。试验及分析证明嵌入式关系模型与符合第一范式的关系模型同样严格,换句话说,只要遵守更高的规范形式,删除1NF关系“原子属性” 展开更多
关键词 数据库 嵌入式关系 multi-join算法
在线阅读 下载PDF
基于机器学习的数据库多表连接顺序选择研究综述
6
作者 王浩 高锦涛 王杰 《计算机工程》 北大核心 2025年第7期31-46,共16页
多表连接顺序选择是指在进行查询优化时为查询语句中涉及的多个表选择最优的连接顺序以提升查询性能。在复杂查询中,不同的表连接顺序能够显著影响查询执行效率。在大数据时代,面对庞大的数据集、多样的应用环境以及复杂的查询语句,基... 多表连接顺序选择是指在进行查询优化时为查询语句中涉及的多个表选择最优的连接顺序以提升查询性能。在复杂查询中,不同的表连接顺序能够显著影响查询执行效率。在大数据时代,面对庞大的数据集、多样的应用环境以及复杂的查询语句,基于启发式规则的传统多表连接顺序算法无法根据环境动态适应和自我学习,缺乏泛化能力,因此选择次优的多表连接顺序,甚至会严重影响查询性能。随着机器学习技术的蓬勃发展,面向数据库的人工智能(AI4DB)技术逐渐引领查询优化领域。机器学习技术能够解决传统连接顺序选择算法存在的问题,在自我学习以及场景适应方面具有较好表现。首先介绍连接顺序的传统选择算法,挖掘其存在的问题,然后总结当前主流的针对多表连接的机器学习模型,并分别介绍它们的核心技术方案,在效果、可用场景等方面对它们进行横向对比,为该领域后续科研工作者提供有价值的参考。 展开更多
关键词 数据库 查询优化 机器学习 连接顺序 面向数据库的人工智能
在线阅读 下载PDF
结合重写与数据并行的XQuery查询优化
7
作者 陈荣鑫 《陕西科技大学学报(自然科学版)》 2011年第6期75-79,93,共6页
XQuery查询优化是提升查询引擎性能的关键途径.根据XQuery语言特点和多数据源的查询需求,通过在XQuery语言层的重写优化获取高效的查询计划;为适应多核计算环境,通过中间语言层的并行原语实现数据并行处理,进一步提升系统性能.开发查询... XQuery查询优化是提升查询引擎性能的关键途径.根据XQuery语言特点和多数据源的查询需求,通过在XQuery语言层的重写优化获取高效的查询计划;为适应多核计算环境,通过中间语言层的并行原语实现数据并行处理,进一步提升系统性能.开发查询引擎原型系统,实例测试表明,该优化方法能有效提升XQuery查询性能. 展开更多
关键词 Xquery语言 查询优化 查询重写 数据并行
在线阅读 下载PDF
基于XQuery的异构数据源查询处理 被引量:3
8
作者 严小泉 刘渊 《计算机工程》 CAS CSCD 北大核心 2009年第14期87-89,107,共4页
异构数据源的集成问题是当前数据处理领域内研究的热点,它能更有效地利用信息资源,更好地实现数据共享。介绍一种基于Mediator-Wrapper中间层的异构数据源集成系统框架,对XQuery查询处理过程及其关键问题,如查询分解和优化技术进行深入... 异构数据源的集成问题是当前数据处理领域内研究的热点,它能更有效地利用信息资源,更好地实现数据共享。介绍一种基于Mediator-Wrapper中间层的异构数据源集成系统框架,对XQuery查询处理过程及其关键问题,如查询分解和优化技术进行深入研究,并结合实例进一步说明异构数据源中查询分解和优化的具体实现。 展开更多
关键词 异构数据源 查询分解 查询优化
在线阅读 下载PDF
XQuery并行实现中的任务调度算法
9
作者 权跃龙 廖湖声 高红雨 《计算机工程与设计》 北大核心 2015年第1期138-143,183,共7页
为提高XQuery语言的处理性能,针对XQuery并行实现中的任务调度问题,提出一种适用于共享内存多线程环境的调度算法。在一种新型调度策略的指导下,能够利用XQuery语言中存在任务并行性、数据并行性和流水线并行性的特点,提高程序并行执行... 为提高XQuery语言的处理性能,针对XQuery并行实现中的任务调度问题,提出一种适用于共享内存多线程环境的调度算法。在一种新型调度策略的指导下,能够利用XQuery语言中存在任务并行性、数据并行性和流水线并行性的特点,提高程序并行执行效率;针对流水线并行执行方式,建立一种流水线局部并行自动机模型,通过利用流水线中各节拍之间的空闲等待时间,提高系统资源的利用率。通过实验验证了该算法的可行性和有效性。 展开更多
关键词 可扩展标记语言 Xquery语言 并行处理 任务调度 有向无环图 查询优化
在线阅读 下载PDF
面向分布式数据库的算子并行优化策略 被引量:2
10
作者 刘文洁 吕靖超 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第3期453-459,共7页
随着网络技术的不断发展,数据规模呈现爆发式增长,使得传统的单机数据库逐步被分布式数据库所取代。分布式数据库采用节点协同工作方式解决了大规模数据存储问题,但由于增加了节点间通信开销,查询效率却不如单机数据库。分布式架构下,... 随着网络技术的不断发展,数据规模呈现爆发式增长,使得传统的单机数据库逐步被分布式数据库所取代。分布式数据库采用节点协同工作方式解决了大规模数据存储问题,但由于增加了节点间通信开销,查询效率却不如单机数据库。分布式架构下,存储节点的数据仅用作多备份的冗余,为系统故障时提供数据恢复,并未被利用起来改善查询效率。针对上述问题,提出了一种面向分布式数据库的算子并行优化策略,通过对关键物理算子进行拆分,将拆分后的子请求均匀分配到存储层多个节点,由多个节点并行处理,从而减少查询响应时间。上述策略已经在分布式数据库CBase上进行了应用,实验表明,提出的并行优化策略可显著缩短SQL请求查询时间,并提高系统资源利用率。 展开更多
关键词 分布式数据库 并行查询 查询优化 负载均衡 数据分区
在线阅读 下载PDF
GPU数据库实现技术发展演进
11
作者 刘鹏 陈红 +1 位作者 张延松 李翠平 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2691-2724,共34页
爆炸式增长的数据对存储和处理数据提出了更高的需求,GPU数据库作为新硬件数据库的一个重要分支,在大容量和高性能处理方面有其独特的优势.GPU数据库作为高性能数据库的代表,在最近几年受到学术界和产业界的关注,一批具有代表性的研究... 爆炸式增长的数据对存储和处理数据提出了更高的需求,GPU数据库作为新硬件数据库的一个重要分支,在大容量和高性能处理方面有其独特的优势.GPU数据库作为高性能数据库的代表,在最近几年受到学术界和产业界的关注,一批具有代表性的研究成果和标志性的实际产品已经出现.GPU数据库的技术发展按照GPU加速型和GPU内存型两种技术路线展开.两种技术路线都有相应的原型系统或产品出现.虽然两种GPU数据库的发展路线在实现上有所不同,但GPU数据库最基本的功能部分和核心技术是相似的,都有查询编译、查询优化、查询执行以及存储管理等功能.当前主流的数据传输方案除了PCIe之外,NVLink、RDMA和CXL等传输方案也为不同处理器之间的数据传输提供了更多的可能性.大多数GPU数据库使用列存储模型来存储数据,少数GPU数据库(如PG-Strom)对两种存储模型都支持.在列存储模型上利用压缩技术能减少数据的存储空间和传输时延.在GPU数据库上进行的压缩和解压的时间应该在整个数据处理的过程中占比很少.在GPU数据库上建立和维护索引不应该有很大的系统开销.JIT编译时间短、编译效率高,是GPU数据库编译的主流.操作符对数据库查询性能的影响非常明显,连接操作、分组聚集和OLAP运算符是目前研究最多的三个类型.目前大多数的研究中,连接和分组聚集算子通常结合在一起研究.在连接算子执行的过程中还和表的连接顺序结合在一起进行考虑.OLAP算子是GPU数据库中的又一个被大量研究的算子,GPU数据库在OLAP算子和模型方面持续受到研究者的关注.GPU数据库有三种查询处理模型,即行处理、列处理和向量化处理.向量化处理和列处理在实际系统中应用较多.由于GPU加速型数据库技术的发展,CPU-GPU协同处理模型上的查询方案与查询引擎也有一定数量的研究成果出现.当前GPU数据库的查询优化研究主要有三部分:多表连接顺序、查询重写和代价模型.然而,GPU数据库的代价评估模型在目前还没有很好的解决方案,GPU数据库的查询优化在未来仍有很大的研究空间.事务在GPU数据库中没有得到很好的研究,尽管有单独的原型系统,但目前的研究还没有取得重大进展.本文总结了GPU数据库各种关键技术已有的研究成果,指出GPU数据库当前存在的问题和面临的挑战,对未来的研究方向进行了展望. 展开更多
关键词 GPU数据库 数据压缩 算子优化 OLAP查询 查询处理
在线阅读 下载PDF
基于TreeLSTM的查询基数估计 被引量:2
12
作者 齐凯阳 于炯 +1 位作者 何贞贞 苏子航 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第1期55-64,共10页
针对传统的数据库管理系统无法很好地学习谓词之间的交互以及无法准确地估计复杂查询的基数问题,提出了一种树形结构的长短期记忆神经网络(Tree Long Short Term Memory, TreeLSTM)模型建模查询,并使用该模型对新的查询基数进行估计.所... 针对传统的数据库管理系统无法很好地学习谓词之间的交互以及无法准确地估计复杂查询的基数问题,提出了一种树形结构的长短期记忆神经网络(Tree Long Short Term Memory, TreeLSTM)模型建模查询,并使用该模型对新的查询基数进行估计.所提出的模型考虑了查询语句中包含的合取和析取运算,根据谓词之间的操作符类型将子表达式构建为树形结构,根据组合子表达式向量来表示连续向量空间中的任意逻辑表达式.TreeLSTM模型通过捕捉查询谓词之间的顺序依赖关系从而提升基数估计的性能和准确度,将TreeLSTM与基于直方图方法、基于学习的MSCN和TreeRNN方法进行了比较.实验结果表明:TreeLSTM的估算误差比直方图、MSCN、TreeRNN方法的误差分别降低了60.41%,33.33%和11.57%,该方法显著提高了基数估计器的性能. 展开更多
关键词 基数估计 数据库管理系统 查询优化器 神经网络 长短期记忆网络
在线阅读 下载PDF
基于倒排索引的正则路径查询算法 被引量:1
13
作者 夏秀峰 孙翔天 +3 位作者 孙尧 邓国鹏 朱康 邱涛 《计算机工程与设计》 北大核心 2024年第8期2343-2349,共7页
对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快... 对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快速检索标签的相应倒排列表。设计的IRPQ算法将查询转化为面向倒排列表的查询计划树,经过优化以减少冗余列表合并操作。在真实数据集上进行了实验,其结果表明,IRPQ及其优化算法相比现有方法显著提高了查询性能。 展开更多
关键词 属性图模型 正则路径查询 倒排索引 查询计划树 树结构递归 启发式算法 查询树优化
在线阅读 下载PDF
基于机器学习的基数估计技术综述 被引量:1
14
作者 岳文静 屈稳稳 +1 位作者 林宽 王晓玲 《计算机研究与发展》 EI CSCD 北大核心 2024年第2期413-427,共15页
基数估计是数据库关系系统查询优化器的基础和核心.随着人工智能技术的发展,其在数据处理、提取数据之间的关系等方面显现出优越的性能.近年来,基于机器学习的基数估计技术取得了显著的进展,受到了学术界的广泛关注.首先总结了基于机器... 基数估计是数据库关系系统查询优化器的基础和核心.随着人工智能技术的发展,其在数据处理、提取数据之间的关系等方面显现出优越的性能.近年来,基于机器学习的基数估计技术取得了显著的进展,受到了学术界的广泛关注.首先总结了基于机器学习的技术估计技术的发展现状,其次给出了基数估计的相关概念及其特征编码技术.接着建立了基数估计技术的分类体系.在此基础上,进一步将基于机器学习的基数估计技术细分为查询驱动、数据驱动和混合模型这3类基数估计技术.然后重点分析了每一类技术的建模流程、典型技术和模型特点,并对其在SQL和NoSQL中的应用进行了分析和总结.最后讨论了基于机器学习的基数估计技术面临的挑战和未来的研究方向。 展开更多
关键词 数据库 基数估计 机器学习 查询优化 神经网络
在线阅读 下载PDF
基于声明式推理的高效协同查询处理技术
15
作者 邱志林 寿黎但 +3 位作者 陈珂 江大伟 骆歆远 陈刚 《软件学报》 EI CSCD 北大核心 2024年第12期5558-5581,共24页
由于深度学习领域的不断进步,人们对用协同查询处理(CQP)技术扩展关系数据库以处理涉及结构化和非结构化数据的高级分析查询越来越感兴趣.最先进的CQP方法使用用户定义函数(UDFs)来实现深度神经网络(NN)模型来处理非结构化数据,并使用... 由于深度学习领域的不断进步,人们对用协同查询处理(CQP)技术扩展关系数据库以处理涉及结构化和非结构化数据的高级分析查询越来越感兴趣.最先进的CQP方法使用用户定义函数(UDFs)来实现深度神经网络(NN)模型来处理非结构化数据,并使用关系操作来处理结构化数据.基于UDF的方法简化了查询书写,允许用户使用单一的SQL提交分析查询,但要求在即席数据分析中能够根据所需性能指标手动选择合适且高效的模型,这对用户提出了很高的挑战.为了解决该问题,提出基于声明式推理函数(DIF)的协同查询处理技术,通过优化模型选择、执行方式、设备绑定等多个查询实现路径构建完整的协同查询处理框架.基于所提研究设计的成本模型和优化规则,查询处理器能够计算出不同查询计划的代价,并自动选择最优的物理查询计划.在4个数据集上的实验结果证实了提出的基于DIF的CQP方法的有效性和效率. 展开更多
关键词 数据库查询优化 声明式推理函数 协同查询处理 模型选择
在线阅读 下载PDF
面向Select和Sort的数据库算子缓存的设计与实现
16
作者 蔡万里 王新硕 +3 位作者 胡卉芪 蔡鹏 周烜 屠要峰 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2084-2103,共20页
缓存是数据库中提高查询性能的一种常用技术.目前,现有数据库缓存主要有两个方向:查询结果缓存和存储层块缓存.查询结果缓存是利用数据库查询执行的最终结果或中间结果(如子查询),而存储层块缓存则缓存查询涉及的底层数据块.本文从另外... 缓存是数据库中提高查询性能的一种常用技术.目前,现有数据库缓存主要有两个方向:查询结果缓存和存储层块缓存.查询结果缓存是利用数据库查询执行的最终结果或中间结果(如子查询),而存储层块缓存则缓存查询涉及的底层数据块.本文从另外一个角度“缓存中含有的计算量”来重新审视缓存在查询优化中的应用,并以此为基础进一步划分数据库缓存方式.在查询执行过程中,数据库查询被转换成一系列操作(例如选择、排序等)的集合,而算子对应操作.查询处理中算子输出的数据为中间结果,含有部分计算量,我们将这部分数据进行缓存并加以利用.我们将这种缓存部分计算量的缓存方式称为算子缓存,即缓存每个操作执行后的结果.由于不同查询之间可能会存在相同算子,对相近数据执行相同计算,因此利用算子缓存加速查询执行性能具有相当大的潜力.本文的新颖之处在于从缓存含有的计算量角度出发,提出并研究算子缓存如何在查询优化中应用.本文以Filter、Sort算子为例,针对缓存复用提出了一种基于语义树的匹配算法,用于快速匹配缓存中的结果集.同时,针对复用缓存可能劣化查询性能的情况,提出使用基于成本的代价优化器防止使用缓存劣化查询性能.最后,本文基于开源分析型数据库ClickHouse实现了Filter、Sort算子缓存的原型,并对提出的算子缓存方案进行了大量的实验测试.结果表明,相比块缓存、物化视图方式,本文提出的算子缓存方案在本地SSD部署下最大能够分别提升9倍以及1.5倍的查询响应速度,在云环境下部署能够分别提升30倍以及2倍的查询响应速度. 展开更多
关键词 数据库 查询执行 查询优化 算子缓存 联机分析处理
在线阅读 下载PDF
面向用户偏好的动态网页数据交互式查询算法
17
作者 赵红梅 肖明 +1 位作者 白宇 王磊 《吉林大学学报(理学版)》 CAS 北大核心 2024年第2期417-422,共6页
为提高网页数据查询速度、精度及工作效率,提出一种面向用户偏好的动态网页数据交互式查询算法.首先,构建用户偏好模型,增加偏好组合的演化个体适应性,综合计算适配值;其次,为防止数据冗余和重复,基于兴趣相似性,分离相似度高的查询数... 为提高网页数据查询速度、精度及工作效率,提出一种面向用户偏好的动态网页数据交互式查询算法.首先,构建用户偏好模型,增加偏好组合的演化个体适应性,综合计算适配值;其次,为防止数据冗余和重复,基于兴趣相似性,分离相似度高的查询数据和重复数据,识别出网络数据的性质;最后,利用粒子群优化算法寻找最优的动态网页数据交互式查询方案.实验结果表明:在数据集基数影响下,该算法的查询结果集质量在0.95以上;在查询最大维数影响下,该算法的查询结果集质量在0.96以上,表明其查询使用时间短、结果集精度高、自适应能力强. 展开更多
关键词 用户偏好模型 动态网页数据 数据交互式查询 粒子群优化算法 空间维度
在线阅读 下载PDF
OLAP查询基数预估能力评估
18
作者 简炜 胡梓锐 张蓉 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期141-151,共11页
查询优化可以显著提升联机分析处理(online analytical processing,OLAP)数据库系统对海量教育数据的分析效率,为智能教学系统提供快速、精准的数据支持.优化器主要包含基数预估、空间枚举和代价模型3个模块.其中,基数预估决定代价模型... 查询优化可以显著提升联机分析处理(online analytical processing,OLAP)数据库系统对海量教育数据的分析效率,为智能教学系统提供快速、精准的数据支持.优化器主要包含基数预估、空间枚举和代价模型3个模块.其中,基数预估决定代价模型的结果,并指导查询计划的选择.因此,优化器的基数预估模块评估对OLAP数据库系统优化起到积极的推动作用.本文设计并实现了一套基于主键驱动的、构造多样化数据分布和数据关联关系的有效负载生成工具,包含自定义关联关系的数据生成技术、基于有限状态机的负载模版生成技术和目标基数驱动的参数实例化技术.并在3个数据库OceanBase、TiDB和PostgreSQL上进行了实验,分析了3个数据库优化器存在的问题,并给出了建议. 展开更多
关键词 分析型数据库 查询优化 基数预估
在线阅读 下载PDF
RDF数据查询处理技术综述 被引量:65
19
作者 杜方 陈跃国 杜小勇 《软件学报》 EI CSCD 北大核心 2013年第6期1222-1242,共21页
随着语义网以及信息抽取技术等研究的发展,Web上涌现出越来越多的RDF数据,海量RDF数据的管理,已经成为学术界和工业界研究的热点之一.从RDF数据集形态及RDF数据组织存储两个维度以及查询表述、查询处理、查询优化等方面,深入地分析和比... 随着语义网以及信息抽取技术等研究的发展,Web上涌现出越来越多的RDF数据,海量RDF数据的管理,已经成为学术界和工业界研究的热点之一.从RDF数据集形态及RDF数据组织存储两个维度以及查询表述、查询处理、查询优化等方面,深入地分析和比较了RDF数据查询处理方法,并在此基础上提出了未来研究的方向和挑战. 展开更多
关键词 RDF RDF数据管理 RDF查询处理 查询优化
在线阅读 下载PDF
一种基于事先测试的分布式数据库优化联接查询技术 被引量:7
20
作者 徐勋明 薛永生 +1 位作者 王劲波 吕晓华 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第2期175-178,共4页
在分布式数据库系统中,查询优化是一极其重要的问题,其中联接查询的优化因其应用的广泛性而显得尤为关键.本文介绍了在分布式数据库系统中对联接查询的一般处理方法,详细论述了笔者提出的一种在分布式数据库中基于事先测试的优化联接查... 在分布式数据库系统中,查询优化是一极其重要的问题,其中联接查询的优化因其应用的广泛性而显得尤为关键.本文介绍了在分布式数据库系统中对联接查询的一般处理方法,详细论述了笔者提出的一种在分布式数据库中基于事先测试的优化联接查询技术,并进行了分析与总结. 展开更多
关键词 事先测试 分布式数据库 查询优化 联接查询 半联接操作
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部