期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
具有隐私保护的外包数据库合计查询方案 被引量:3
1
作者 蒋亚军 杨波 +1 位作者 张明武 陈旭日 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期721-725,共5页
针对外包数据库中数据的隐私性和安全性问题,提出一种具有隐私保护的外包数据库合计查询方案。利用Mignotte秘密共享方案将数据所有者的数据库外包给服务提供者,服务提供者根据用户提出合计查询要求,在不泄露外包数据的前提下协同计算... 针对外包数据库中数据的隐私性和安全性问题,提出一种具有隐私保护的外包数据库合计查询方案。利用Mignotte秘密共享方案将数据所有者的数据库外包给服务提供者,服务提供者根据用户提出合计查询要求,在不泄露外包数据的前提下协同计算查询并将结果响应给用户,用户根据数据所有者对数据项的Pedersen承诺和生成的Merkle哈希树对结果进行验证。研究结果表明:在查询过程中,该方案能够保证数据项和中间结果的隐私性和安全性;在数据所有者可信的前提下,用户能够验证查询结果;与同类方案相比,该方案具有更高的效率。 展开更多
关键词 外包数据库 合计查询 秘密共享 中国剩余定理
在线阅读 下载PDF
时空聚集计算研究进展 被引量:2
2
作者 包磊 秦小麟 《计算机科学》 CSCD 北大核心 2006年第1期22-24,共3页
时空数据库要处理大量的数据。相对于单个时空数据来说,大量数据的聚集计算结果更有信息量。本文综述了时态聚集、空间聚集和时空聚集计算领域的研究现状,着重分析了各类时空聚集算法的研究进展。讨论了目前时空聚集计算存在的问题,并... 时空数据库要处理大量的数据。相对于单个时空数据来说,大量数据的聚集计算结果更有信息量。本文综述了时态聚集、空间聚集和时空聚集计算领域的研究现状,着重分析了各类时空聚集算法的研究进展。讨论了目前时空聚集计算存在的问题,并指出了今后的发展方向。 展开更多
关键词 时空数据库 聚集查询 聚集函数 空间聚集 计算研究 计算结果 聚集算法 信息量 重分析
在线阅读 下载PDF
数据集成环境下一种高效一致性聚集查询 被引量:2
3
作者 张晓刚 杨路明 潘久辉 《计算机学报》 EI CSCD 北大核心 2014年第9期1936-1946,共11页
对于不一致数据库上的一致性聚集查询问题,Fuxman扩展基于合取查询类C_(forest)的一阶查询重写方法并给出了查询重写算法RewriteCount和RewriteAgg来分别处理包含不同聚集函数的查询.算法产生的重写聚集查询能够使用SQL语句表达,但是其... 对于不一致数据库上的一致性聚集查询问题,Fuxman扩展基于合取查询类C_(forest)的一阶查询重写方法并给出了查询重写算法RewriteCount和RewriteAgg来分别处理包含不同聚集函数的查询.算法产生的重写聚集查询能够使用SQL语句表达,但是其性能却不够理想.文中重点考虑在数据集成环境下如何有效地提高一致性聚集查询的整体性能,通过OR-database集成模式有效地隔离集成数据库的一致性部分和非一致新部分,并在此基础上同样针对合取查询类C_(forest)上的分组聚集查询提出了基于OR-database的一致性查询重写算法RewriteCount_OR(主要处理Count函数)和RewriteAgg_OR(主要处理Max,Min和Sum函数),后面的查询代价比较及模拟实验都表明:与Fuxman的一致性聚集查询方法相比,文中的一致性聚集查询方法在OR-database集成数据库上具有明显的性能优势. 展开更多
关键词 一致性查询 聚集查询 完整性约束 修复 查询重写 不一致集成数据库
在线阅读 下载PDF
基于范围语义的非一致性数据库聚集查询 被引量:3
4
作者 谢东 吴敏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期810-815,共6页
基于非一致性关系数据库的非聚集查询技术,发展普通的一致性查询应答的语义,提出非一致性数据库的范围语义,给出基于一致性查询范围的实际聚集查询重写方法,返回基于这种语义的聚集查询范围值。通过对初始分组属性和键属性聚集得到候选... 基于非一致性关系数据库的非聚集查询技术,发展普通的一致性查询应答的语义,提出非一致性数据库的范围语义,给出基于一致性查询范围的实际聚集查询重写方法,返回基于这种语义的聚集查询范围值。通过对初始分组属性和键属性聚集得到候选结果集,再过滤与初始分组属性值相冲突和不满足初始查询的元组。对于最小值,过滤掉可能不一致的元组,去掉可能值,得到一致性值;对于最大值,得到可能的最大候选值,实验基于TPC-H基准采用不同的参数进行研究。研究结果表明,聚集属性和投影属性数量、数据库以及初始查询的结果集对重写查询的负载有显著的影响,但非一致性数据比例和共享共同键值元组数的影响很小。尽管重写查询比初始查询的执行时间长,但是可以接受。 展开更多
关键词 关系数据库 非一致性数据库 聚集查询
在线阅读 下载PDF
SQL聚集函数扩展 被引量:1
5
作者 肖杰 谢东 曾玢石 《计算机工程》 CAS CSCD 北大核心 2009年第16期73-75,共3页
已经存在的SQL聚集函数在计算百分比方面有明显的限制,提出2种水平与垂直百分比聚集函数用于计算百分比。新的聚集函数容易使用,有广泛的用途,可以被用于作为一种框架去研究百分比查询,能有效地生成SQL代码。实验研究给出百分比聚集方法... 已经存在的SQL聚集函数在计算百分比方面有明显的限制,提出2种水平与垂直百分比聚集函数用于计算百分比。新的聚集函数容易使用,有广泛的用途,可以被用于作为一种框架去研究百分比查询,能有效地生成SQL代码。实验研究给出百分比聚集方法与SQL/OLAP聚集方法的执行性能,结果显示这2种方法在性能上比SQL/OLAP聚集方法有一定的改善。 展开更多
关键词 关系数据库 结构化查询语言 查询处理 聚集函数 百分比聚集
在线阅读 下载PDF
列存储数据库中压缩位图索引技术 被引量:2
6
作者 王梅 杨思箫 乐嘉锦 《计算机工程》 CAS CSCD 2012年第18期26-29,共4页
为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group... 为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group by子句在查询执行过程中的数据提取。在SSB数据集上的实验结果证明,该技术能提高29.7%~38.9%的压缩位图索引性能。 展开更多
关键词 列存储数据库 位图索引 活跃度 SSB数据集 聚集查询
在线阅读 下载PDF
传感器网络多查询架构体系及融合算法 被引量:3
7
作者 南国芳 路晓颖 《计算机工程》 CAS CSCD 北大核心 2010年第1期21-24,共4页
无线传感器网络可以看作是以节点感知、存储数据为基础的分布式数据库系统。针对多查询处理问题,提出一种以节能为目标的查询架构体系,以及多查询的分类算法和查询融合算法。通过实验验证了算法的有效性,即在同等条件下,可以有效节省传... 无线传感器网络可以看作是以节点感知、存储数据为基础的分布式数据库系统。针对多查询处理问题,提出一种以节能为目标的查询架构体系,以及多查询的分类算法和查询融合算法。通过实验验证了算法的有效性,即在同等条件下,可以有效节省传感器网络能量的消耗,进而延长网络的生命周期。 展开更多
关键词 分布式传感器数据库 多查询架构体系 多查询融合算法
在线阅读 下载PDF
概率数据库的聚集查询 被引量:1
8
作者 江彤 金宗安 谢东 《计算机工程》 CAS CSCD 北大核心 2010年第11期42-44,共3页
在概率关系中,聚集查询的目标是每一个可能世界,而可能世界的数目随着概率关系元组数目的增长呈指数增长,当元组数目较多时,聚集查询在线性时间内无法计算。针对该问题,分别为每一个聚集函数定义3个聚集分量,通过对原概率关系进行编码,... 在概率关系中,聚集查询的目标是每一个可能世界,而可能世界的数目随着概率关系元组数目的增长呈指数增长,当元组数目较多时,聚集查询在线性时间内无法计算。针对该问题,分别为每一个聚集函数定义3个聚集分量,通过对原概率关系进行编码,分别采用转换、存储过程和近似计算的方法,在线性时间内实现聚集查询,理论证明和实验结果表明该方法的正确性和有效性。 展开更多
关键词 聚集查询 聚集函数 近似计算
在线阅读 下载PDF
多维数据的复杂查询聚集算法研究 被引量:1
9
作者 刘金岭 《计算机应用》 CSCD 北大核心 2008年第7期1689-1691,共3页
对空间多维数据的复杂查询是多维数据研究的重点和难点,目前研究的结论相对较少。在传统算法的基础上,进行了几个方面的改进:按分组属性值进行数据分块;对分组数据进行有效的排序;在聚集函数的应用上进行优化。模拟数据的试验表明:改进... 对空间多维数据的复杂查询是多维数据研究的重点和难点,目前研究的结论相对较少。在传统算法的基础上,进行了几个方面的改进:按分组属性值进行数据分块;对分组数据进行有效的排序;在聚集函数的应用上进行优化。模拟数据的试验表明:改进算法较大地提高了查询效率。 展开更多
关键词 复杂查询 聚集函数 粒度
在线阅读 下载PDF
基于聚类的非一致性数据库聚集查询重写
10
作者 谢东 杨路明 +1 位作者 蒲保兴 刘波 《小型微型计算机系统》 CSCD 北大核心 2008年第6期1104-1108,共5页
在聚类和非一致性数据库无聚集查询基础上提出聚集查询重写方法.通过聚集值范围限定了最值和期望值,给出无连接和有连接的聚集查询重写策略.聚集重写查询通过分析聚类中可能元组和分组属性来过滤聚类,计算初始分组属性的最值和期望值.... 在聚类和非一致性数据库无聚集查询基础上提出聚集查询重写方法.通过聚集值范围限定了最值和期望值,给出无连接和有连接的聚集查询重写策略.聚集重写查询通过分析聚类中可能元组和分组属性来过滤聚类,计算初始分组属性的最值和期望值.实验使用TPC-H决策支持基准进行性能研究,分析了聚类基数和数据库尺寸等因素的影响.结果显示尽管重写查询显著地比初始查询的执行时间长,但还是可以接受的,表明方法是有效的. 展开更多
关键词 关系数据库 非一致性数据库 聚集查询重写 聚类概率
在线阅读 下载PDF
空间数据库中最小距离聚集查询及其算法
11
作者 刘云生 刘小峰 肖迎元 《计算机科学》 CSCD 北大核心 2005年第9期108-110,122,共4页
提出了一种新的距离查询形式一最小距离聚集查询,这种查询计算几个对象集中对象到一个中心对象集中对象的距离和,并返回最小的K个距离和。在空间数据库中,对基于R树索引的数据集给出了基于最近邻居的方法和阈值算法来回答查询。通过大... 提出了一种新的距离查询形式一最小距离聚集查询,这种查询计算几个对象集中对象到一个中心对象集中对象的距离和,并返回最小的K个距离和。在空间数据库中,对基于R树索引的数据集给出了基于最近邻居的方法和阈值算法来回答查询。通过大量实验对两种算法进行了比较,结果显示阈值算法具有较好的性能。 展开更多
关键词 空间数据库 查询处理 距离查询 距离聚集 R树索引
在线阅读 下载PDF
基于x-tuple的概率阈值top-k查询算法
12
作者 黄冬梅 舒博 +1 位作者 王建 熊中敏 《计算机工程》 CAS CSCD 2013年第4期44-47,共4页
不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该... 不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该查询语义下采用动态规划方法求取x-tuple内每个元组排在前k位的概率和,对其进行聚集后做概率阈值top-k查询,并利用观察法、最大上限值等剪枝方法进行优化。实验结果表明,该算法平均扫描全体数据集中60%的数据即可返回正确结果集,证明其查询处理效率较高。 展开更多
关键词 不确定数据库 概率阈值top-k查询 x-元组 动态规划算法 聚集
在线阅读 下载PDF
反最近关键字聚集查询方法研究
13
作者 曾子维 魏静 《计算机应用与软件》 CSCD 北大核心 2014年第12期68-69,99,共3页
当前时空数据库中的关键字查询大多数都是简单的传统查询。随着基于位置服务(LBS)的进一步发展,新类型的应用也随之出现,这些新的应用中的对象不仅包含位置信息,还包含和位置相关的文本信息,例如名字、类型等等,传统查询不再适用。为了... 当前时空数据库中的关键字查询大多数都是简单的传统查询。随着基于位置服务(LBS)的进一步发展,新类型的应用也随之出现,这些新的应用中的对象不仅包含位置信息,还包含和位置相关的文本信息,例如名字、类型等等,传统查询不再适用。为了能够高效地处理时空查询,提出一种新颖的时空关键字查询类型,称为反最近关键字聚集查询。 展开更多
关键词 时空数据库 移动对象 基于位置的服务 查询 反最近聚集查询
在线阅读 下载PDF
面向聚合查询的Apache IoTDB物理元数据管理 被引量:12
14
作者 赵东明 邱圆辉 +3 位作者 康瑞 宋韶旭 黄向东 王建民 《软件学报》 EI CSCD 北大核心 2023年第3期1027-1048,共22页
时间序列数据在能源、制造、金融、气候等领域有着广泛应用,聚合查询是相关分析场景中常见的查询需求,快速获取海量数据的概要信息,对于提高数据分析工作的效率具有重要意义.通过存储元数据加速聚合查询是一种有效的提升聚合查询执行效... 时间序列数据在能源、制造、金融、气候等领域有着广泛应用,聚合查询是相关分析场景中常见的查询需求,快速获取海量数据的概要信息,对于提高数据分析工作的效率具有重要意义.通过存储元数据加速聚合查询是一种有效的提升聚合查询执行效率的手段,但现有的时间序列数据库都使用时间窗口切分数据,需要对数据进行实时排序和分区,难以适应物联网场景下高并发、大吞吐量的数据写入特点.因此,提出了一种面向聚合查询的ApacheIoTDB物理元数据管理方案.该方案按照数据文件的物理存储特性切分数据,并结合同步计算和异步计算策略,优先保证数据的写入性能.针对时间序列数据中普遍存在的乱序数据,将时间范围重叠的一组文件抽象为乱序文件组并提供元数据,聚合查询会被重写为3个结合物理元数据和原始数据的子查询高效执行.多个数据集上的实验验证了该方案对聚合查询执行效率的提升效果以及不同计算策略对性能的影响. 展开更多
关键词 预聚合 聚合查询 查询重写 物理元数据管理 时间序列数据库
在线阅读 下载PDF
支持大规模监测数据分析的LaUD-KV聚集操作扩展 被引量:1
15
作者 徐昊 杨义繁 +2 位作者 张力 刘英博 王建民 《计算机集成制造系统》 EI CSCD 北大核心 2013年第12期3035-3042,共8页
结合当前维护、维修和大修行业对于大数据存储和查询的需求,对当前工业数据存储方案和大数据查询模式的优缺点进行了研究和分析,提出一套在分布式存储环境下工业大数据的聚集函数查询框架和对应算法。基于现有的LaUD-KV存储模式和LaSQL... 结合当前维护、维修和大修行业对于大数据存储和查询的需求,对当前工业数据存储方案和大数据查询模式的优缺点进行了研究和分析,提出一套在分布式存储环境下工业大数据的聚集函数查询框架和对应算法。基于现有的LaUD-KV存储模式和LaSQL语言,实现了一套能满足工业大数据查询需求的类SQL聚集函数,使得在数据过亿的情况下,系统对于聚集查询的响应时间缩短为原有的30%左右,同时为上层的维护、维修和大修监测平台提供了技术支持。 展开更多
关键词 维护 维修和大修 监测数据 LaUD-KV 聚集函数 查询框架
在线阅读 下载PDF
动态分片在线聚集
16
作者 安明远 孙秀明 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1928-1935,共8页
传统的在线聚集方法为了避免执行中随机I/O导致的性能下降,假设数据本身近似随机分布于数据文件中,用顺序I/O来代替随机I/O.数据随机分布于数据文件的假设在很多实际的应用场景中是难以成立的,从而导致查询结果产生很大误差.提出了动态... 传统的在线聚集方法为了避免执行中随机I/O导致的性能下降,假设数据本身近似随机分布于数据文件中,用顺序I/O来代替随机I/O.数据随机分布于数据文件的假设在很多实际的应用场景中是难以成立的,从而导致查询结果产生很大误差.提出了动态数据分片在线聚集算法DDPOA(dynamicdata-partitioned online aggregation),将整个数据集分片,对各个子数据集独立计算,线性组合子集结果进而得到全集最终结果,一方面降低了在线聚集对整体数据集随机分布的要求,提高了准确性,另一方面动态调整分片数量以改善I/O性能,缩短完成时间.真实系统负载上的实验表明:DDPOA与传统在线聚集相比,在完成时间相差不大的情况下准确性有了大幅提高. 展开更多
关键词 数据库 近似查询 在线聚集 采样 动态分片
在线阅读 下载PDF
基于大数据的城市功能区人口时空聚散模式研究 被引量:16
17
作者 王润泽 周鹏 +2 位作者 潘悦 林奕晨 项晓 《地理与地理信息科学》 CSCD 北大核心 2022年第1期45-50,共6页
城市功能区和人口流动是行为地理学和城市规划领域的研究热点,不同城市功能区的人口聚散现象更是其重点议题。该文基于POI和腾讯位置服务(LBS)大数据,以武汉市主城区为研究区,利用功能密度指数、功能优势指数识别城市功能区,并通过空间... 城市功能区和人口流动是行为地理学和城市规划领域的研究热点,不同城市功能区的人口聚散现象更是其重点议题。该文基于POI和腾讯位置服务(LBS)大数据,以武汉市主城区为研究区,利用功能密度指数、功能优势指数识别城市功能区,并通过空间关联判断城市功能区人口流动变化规律,采用聚类分析方法归纳人口时空聚散模式。研究结果表明:1)中心城区功能混合度较高;2)受人群时空需求影响,不同城市功能区的人口流动规律呈现一定差异性;3)根据城市功能区人口流动聚散趋势并综合其构成特征,可分为公共主导-聚散波动、商务主导-持续集聚、居住主导-持续集聚、绿地主导-聚散交替、商业主导-动态平衡和工业主导-先聚后散共6种模式。研究结果对于优化城市空间布局、合理配置城市资源以及提升城市运行效率具有参考意义。 展开更多
关键词 POI 腾讯位置服务数据 城市功能 时空聚散模式 武汉
在线阅读 下载PDF
含聚集物化视图的增量维护方法
18
作者 孟勃荣 高鹏 +1 位作者 顾云苏 何清法 《计算机工程与设计》 CSCD 北大核心 2009年第23期5419-5423,共5页
针对含聚集物化视图的增量维护问题,提出了一种基于逐步更新思想的增量维护模型和方法。该方法建立了聚集函数计算前查询结果与基表记录之间的映射关系表,并根据映射关系表的增量变化更新物化视图的聚集函数。针对之前方法对于MAX/MIN... 针对含聚集物化视图的增量维护问题,提出了一种基于逐步更新思想的增量维护模型和方法。该方法建立了聚集函数计算前查询结果与基表记录之间的映射关系表,并根据映射关系表的增量变化更新物化视图的聚集函数。针对之前方法对于MAX/MIN聚集函数增量更新的不足,在仅利用增量数据不能更新聚集函数值时,采用仅重新计算映射关系表中相关行的MAX/MIN函数值的方法,极大地减小了更新MAX/MIN聚集函数的计算量。在OSCAR数据库的应用表明了该方法的有效性和高效性。 展开更多
关键词 数据库管理系统 物化视图 增量维护 聚集函数 OSCAR数据库
在线阅读 下载PDF
基于深度自回归模型的近似查询处理方法
19
作者 岑黎彬 李靖东 +1 位作者 林淳波 王晓玲 《计算机应用》 CSCD 北大核心 2023年第7期2034-2039,共6页
聚合函数的近似查询处理(AQP)是近年来数据库领域的研究热点。针对现有的近似查询技术存在查询响应时间长、存储开销大、不支持多谓词查询等问题,提出一种基于深度自回归模型的AQP方法DeepAQP(Deep Approximate Query Processing),利用... 聚合函数的近似查询处理(AQP)是近年来数据库领域的研究热点。针对现有的近似查询技术存在查询响应时间长、存储开销大、不支持多谓词查询等问题,提出一种基于深度自回归模型的AQP方法DeepAQP(Deep Approximate Query Processing),利用深度自回归模型对表中多列数据的联合概率分布进行学习和建模,以估计给定查询的谓词选择度和目标列概率分布,以促进单表下多谓词聚合函数近似查询请求的有效处理。在TPC-H和TPC-DS数据集上进行实验,结果表明,与基于采样的VerdictDB方法相比,DeepAQP在查询响应时间和存储空间开销上均降低了2到3个数量级;与基于传统机器学习模型的DBEst++方法相比,DeepAQP的查询响应时间降低了1个数量级,显著降低了模型训练耗时,并且可以处理DBEst++所不支持的多谓词查询请求。可见,DeepAQP兼顾了查询精度和速度,并显著降低了算法在训练和存储上的开销。 展开更多
关键词 近似查询处理 自回归模型 多谓词查询 深度学习 聚合函数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部