期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
海量数据上的近似连接聚集操作 被引量:3
1
作者 韩希先 杨东华 李建中 《计算机学报》 EI CSCD 北大核心 2010年第10期1919-1933,共15页
连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此... 连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此提出了一种新的算法——(p,ε)-近似连接聚集查询(pε-AJA)来有效地返回满足任意置信区间的近似连接聚集结果.文章提出且预计算两个数据结构:连接随机样本(JRS)和连接位置索引对表(JPIPT).利用JRS,pε-AJA向用户返回近似结果的快速响应.如果利用JRS得到的近似结果没有满足给定的置信区间,pε-AJA利用JPIPT获得更多的随机连接元组.文中提出一种采样算法来获得JPIPT给定数量的样本,并且利用获得的JPIPT样本,该文提出的算法可通过对连接表的一遍顺序扫描获得连接元组.该文还提供了JPIPT和JRS有效的构建和维护算法.实验结果表明:pε-AJA可以获得相对于准确查询1~5个数量级的加速,并且可以有效地完成JPIPT和JRS的构建和维护操作. 展开更多
关键词 pε-近似连接聚集 连接位置索引对表 连接随机样本 海量数据
在线阅读 下载PDF
多关系实体链计算与近似连接查询的研究
2
作者 刘波 《计算机工程与设计》 CSCD 北大核心 2010年第23期5116-5119,5142,共5页
针对多个实体集关系,提出了链接属性及实体链有关概念,研究发现了具有相同或相似链接属性的实体链计算方法。多关系之间的实体链计算是近似连接查询的关键,该研究通过分析链接属性相似度,解决多关系之间数据冲突问题,设计了2-实体链和k... 针对多个实体集关系,提出了链接属性及实体链有关概念,研究发现了具有相同或相似链接属性的实体链计算方法。多关系之间的实体链计算是近似连接查询的关键,该研究通过分析链接属性相似度,解决多关系之间数据冲突问题,设计了2-实体链和k-实体链计算算法,并运用扩展的SQL查询语言实现实体链计算的主要过程。实体链能够应用于多关系高效查询及动态查询,而且可以获得较高的查询准确率。 展开更多
关键词 多关系 实体链 近似连接 相似度 查询
在线阅读 下载PDF
基于马尔可夫预测模型的数据流滑动窗口近似连接缓存管理策略
3
作者 李康宁 卢艳民 陈红 《计算机研究与发展》 EI CSCD 北大核心 2006年第z3期130-136,共7页
数据流中数据是连续不断、无界、速度变化且以一种序列形式到达的.并且计算复杂关系操作(如连接)所需要的存储空间同样是无限的.许多查询无法得到精确的查询结果.于是高质量的近似查询结果是惟一的选择,即利用现有的缓存空间来优化滑动... 数据流中数据是连续不断、无界、速度变化且以一种序列形式到达的.并且计算复杂关系操作(如连接)所需要的存储空间同样是无限的.许多查询无法得到精确的查询结果.于是高质量的近似查询结果是惟一的选择,即利用现有的缓存空间来优化滑动窗口上的操作以得到最好的近似结果.在很多应用中,缓存中的元组的价值可能不同.对于连接操作而言,一些元组会比另外一些更有利于产生连接结果.提出的基于马尔可夫预测模型的缓存管理策略MBPM充分利用了状态转换环境中的马尔可夫预测模型,并在此基础上提出了基于预测风险的缓存淘汰算法.实验证明,该算法相对于传统的缓存淘汰策略具有很好的性能. 展开更多
关键词 数据流 滑动窗口 近似连接 缓存管理 马尔可夫模型 局部性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部