期刊文献+
共找到234篇文章
< 1 2 12 >
每页显示 20 50 100
无锁并发布谷鸟过滤器
1
作者 王瀚橙 陈志鹏 +3 位作者 戴海鹏 顾荣 KIM Chaewon 陈贵海 《软件学报》 北大核心 2025年第7期3339-3357,共19页
布谷鸟过滤器是一种高效的概率型数据结构,该数据结构可以快速判断某个元素是否存在于给定集合中,被广泛应用于计算机网络、物联网应用以及数据库系统中.在实践中,上述系统通常需要处理海量数据以及大量并发请求.实现支持高并发的布谷... 布谷鸟过滤器是一种高效的概率型数据结构,该数据结构可以快速判断某个元素是否存在于给定集合中,被广泛应用于计算机网络、物联网应用以及数据库系统中.在实践中,上述系统通常需要处理海量数据以及大量并发请求.实现支持高并发的布谷鸟过滤器可以显著提升系统吞吐以及数据处理能力,对提升系统性能至关重要.为此,设计一个支持无锁并发的布谷鸟过滤器.该过滤器通过所提出的两阶段查询、路径探查与元素迁移分离,以及基于多机器字比较并交换的原子迁移技术实现高性能的查询、插入和删除操作.理论分析和实验验证结果均表明,无锁并发布谷鸟过滤器显著提升现有最先进算法的并发性能.无锁并发布谷鸟过滤器的查询吞吐量,平均为使用细粒度锁的布谷鸟过滤器的查询吞吐量的1.94倍. 展开更多
关键词 布谷鸟过滤器 并发 近似成员资格查询 概率数据结构 计算机网络
在线阅读 下载PDF
基于XQuery查询优化的研究 被引量:2
2
作者 施振佺 曹渠江 《计算机应用与软件》 CSCD 北大核心 2008年第11期86-88,共3页
XML已经成为网络上信息描述和信息交换的标准,随着XML应用得越来越广泛,人们提出了多种XML数据的查询方法。但是,很多查询方法都有各自的局限性。利用有意义的最小公共实体结构EntityInMLCAS(Entity In Meaning Lowest Common An- cesto... XML已经成为网络上信息描述和信息交换的标准,随着XML应用得越来越广泛,人们提出了多种XML数据的查询方法。但是,很多查询方法都有各自的局限性。利用有意义的最小公共实体结构EntityInMLCAS(Entity In Meaning Lowest Common An- cestor Structure)原理,提出一种优化查询方法。同时采用堆栈技术的方法对XML文档结点树进行自顶向下的遍历,该方法大大提高了优化查询的速度。 展开更多
关键词 XML Xquery EntityInMLCAS 结构化查询
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型
3
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 Text-to-SQL数据集
在线阅读 下载PDF
基于本地化差分隐私的多表星形连接查询
4
作者 张啸剑 曹小杰 +1 位作者 王宁 孟小峰 《软件学报》 北大核心 2025年第2期830-850,共21页
基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且... 基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且满足本地化差分隐私的Star-JOIN查询算法LPRR-JOIN(longitudinal path random response for join).该算法充分利用层次树的纵向路径结构与GRR机制,设计一种纵向本地扰动算法LPRR,该算法以所有属性纵向路径上的节点组合作为扰动值域.每个用户把自身元组映射到相应节点组合中,再利用GRR机制对映射后的元组进行本地扰动.为了避免事实表上存在的频率攻击,LPRR-JOIN算法允许每个用户利用阈值τ本地截断自身元组个数,大于τ条元组删减、小于τ条元组补充.为了寻找合适的τ值,LPRR-JOIN算法利用τ-截断带来的偏差与扰动方差构造总体误差函数,通过优化误差目标函数获得τ值;其次结合用户分组策略获得τ值的总体分布,再利用中位数获得合适的τ值.LPRR-JOIN算法与现有算法在3种多关系数据集上进行比较,实验结果表明其响应查询算法优于同类算法. 展开更多
关键词 本地化差分隐私 多表星形连接查询 层次结构 纵向节点组合 随机应答机制
在线阅读 下载PDF
集合空间关键字内聚组查询方法 被引量:1
5
作者 孟祥福 赖贞祥 崔江燕 《智能系统学报》 CSCD 北大核心 2024年第3期707-718,共12页
给定一个道路网络和社交网络,集合空间关键字查询的目的是找到一组兴趣点,该组兴趣点的文本信息包含所有查询关键字,与查询的位置较近且彼此之间的距离较小。内聚组查询的目的是找到在地理位置和社交关系上紧密联系的一组用户;而集合空... 给定一个道路网络和社交网络,集合空间关键字查询的目的是找到一组兴趣点,该组兴趣点的文本信息包含所有查询关键字,与查询的位置较近且彼此之间的距离较小。内聚组查询的目的是找到在地理位置和社交关系上紧密联系的一组用户;而集合空间关键字内聚组查询的目的是找到满足查询要求的一对最佳匹配的兴趣点集合和用户集合。针对这一问题,提出一种新的集合空间关键字内聚组查询处理模式。首先通过快速贪心查询过程获得候选兴趣点集合,然后使用core-tree结构存储(k,c)-core核心分解的结果,从而提高内聚组查询效率,并且保证查询结果能够同时满足用户之间的社会关系约束和兴趣点之间的空间位置约束。通过在真实数据集上开展实验,结果表明提出的方法比枚举方法的查询效率快1~2个数量级,并且具有较高查询准确性。 展开更多
关键词 集合空间关键字查询 内聚组查询 道路网络 社交网络 core-tree结构 路网索引 滑动窗口 兴趣点
在线阅读 下载PDF
结合时空关键字的轨迹范围查询混合索引结构
6
作者 孟祥福 李天朔 张霄雁 《计算机科学》 CSCD 北大核心 2024年第S02期599-606,共8页
对于路网上广泛的轨迹数据集,传统结合关键字特征的时空范围查询方法存在存储结构冗余和查询效率低下的问题,同时这些方法忽视了文本特征对优化查询结果个性化方面的潜在影响。为此,提出了一种结合文本特征的时空轨迹索引结构,称为IG-T... 对于路网上广泛的轨迹数据集,传统结合关键字特征的时空范围查询方法存在存储结构冗余和查询效率低下的问题,同时这些方法忽视了文本特征对优化查询结果个性化方面的潜在影响。为此,提出了一种结合文本特征的时空轨迹索引结构,称为IG-Tree。其基本思想是将道路网络图划分为分层子图,并据此构建一个平衡的树结构,其中每个树节点均关联并存储其特定的轨迹数据。此外,设计的查询算法利用与IG-Tree节点相关联的子路网图的文本特征,筛选并提出范围边界处的不相关轨迹,实现高效且精准的文本空间范围查询。这种索引结构不仅有效集成了时间、空间和文本3个维度的信息,而且基于这种结构的查询方法能够支持基于时空关键字的轨迹范围查询,从而极大地满足用户查询的个性化需求。在Porto和LA数据集上的实验证明,IG-Tree索引结构不仅在查询精度上表现出色,而且在响应速度上也具有显著优势,这进一步验证了其处理大规模轨迹数据集时的有效性和实用性。 展开更多
关键词 查询 轨迹数据 范围查询 混合索引结构
在线阅读 下载PDF
三维复杂地质结构模型的InterfaceGrid表达方法 被引量:3
7
作者 牛露佳 石成岳 +1 位作者 王占刚 周永章 《地学前缘》 EI CAS CSCD 北大核心 2024年第4期129-138,共10页
三维地质结构模型是地质空间内地质构造和地质体对象边界的数字化表征模型。随着地质数据矢量栅格一体化集成和地质数据空间查询分析需求增多,构建统一表达地质结构的一体化空间数据模型成为三维地质信息科学领域需要解决的基础性问题... 三维地质结构模型是地质空间内地质构造和地质体对象边界的数字化表征模型。随着地质数据矢量栅格一体化集成和地质数据空间查询分析需求增多,构建统一表达地质结构的一体化空间数据模型成为三维地质信息科学领域需要解决的基础性问题之一。针对规则网格、PillarGrid和SBRT模型等难以实现复杂地质结构的精细表达问题,本研究提出InterfaceGrid数据模型,充分考虑地质结构和属性的地下分布具有极强的非均匀性、不连续性和空间多尺度性,且表现出纵向分层特性和多属性场耦合的相关性。基于InterfaceGrid设计理论模型和数据结构,构建统一描述三维地质结构的InterfaceGrid数据模型,实现复杂地质结构的矢量栅格一体化表达。基于GeoAtom地原子理论构建InterfaceGrid的形式化表达框架,提出InterfaceGrid的构建流程,以及基于InterfaceGrid模型设计数据更新和空间查询算法。采用GPU光线投射和自适应采样策略实现地质网格的体可视化和在线浏览,结果显示,与SBRT模型相比较,InterfaceGrid能够更加真实地描述地质边界情况,提高了三维地质结构模型的准确性。在全球岩石圈三维网格化构建应用InterfaceGrid,验证了InterfaceGrid在大规模地质数据组织管理中的适用性,相比较PillarGrid数据量减少约1/3,更加适合基于大数据量的网络地学应用服务。 展开更多
关键词 三维地质结构模型 InterfaceGrid 可视化 断层建模 空间查询
在线阅读 下载PDF
过滤器数据结构研究综述 被引量:1
8
作者 王瀚橙 戴海鹏 +2 位作者 陈树森 陈志鹏 陈贵海 《计算机科学》 CSCD 北大核心 2024年第1期35-40,共6页
过滤器数据结构可以近似地判断某个元素是否属于给定集合。典型的过滤器数据结构,如布隆过滤器、布谷鸟过滤器、商过滤器,以牺牲查询准确性为代价换取更低的内存空间消耗和查询时间开销。因此,得益于空间时间高效性,过滤器数据结构现已... 过滤器数据结构可以近似地判断某个元素是否属于给定集合。典型的过滤器数据结构,如布隆过滤器、布谷鸟过滤器、商过滤器,以牺牲查询准确性为代价换取更低的内存空间消耗和查询时间开销。因此,得益于空间时间高效性,过滤器数据结构现已被广泛应用于计算机网络、物联网、数据库系统、文件系统、生物信息学、机器学习等领域的近似成员资格查询操作中。自20世纪70年代以来,过滤器数据结构受到了广泛的研究,在诸多领域取得了重要的进展,其研究思路也在不断变化。文中整理了近五十年来关于过滤器数据结构的经典研究成果,从过滤器数据结构的原理出发对已有工作进行分类总结,并比较不同工作之间的引证关系和改进思路,最后讨论了过滤器数据结构的未来研究方向。 展开更多
关键词 过滤器 近似成员资格查询 概率数据结构 布隆过滤器 布谷鸟过滤器 商过滤器
在线阅读 下载PDF
基于倒排索引的正则路径查询算法 被引量:1
9
作者 夏秀峰 孙翔天 +3 位作者 孙尧 邓国鹏 朱康 邱涛 《计算机工程与设计》 北大核心 2024年第8期2343-2349,共7页
对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快... 对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快速检索标签的相应倒排列表。设计的IRPQ算法将查询转化为面向倒排列表的查询计划树,经过优化以减少冗余列表合并操作。在真实数据集上进行了实验,其结果表明,IRPQ及其优化算法相比现有方法显著提高了查询性能。 展开更多
关键词 属性图模型 正则路径查询 倒排索引 查询计划树 树结构递归 启发式算法 查询树优化
在线阅读 下载PDF
SQL-to-text模型的组合泛化能力评估方法 被引量:1
10
作者 陈琳 范元凯 +3 位作者 何震瀛 刘晓清 杨阳 汤路民 《计算机工程》 CAS CSCD 北大核心 2024年第3期326-335,共10页
数据库的结构化查询语言(SQL)到自然语言的翻译(SQL-to-text)能提高关系数据库的易用性。近年来该领域主要使用机器学习的方法进行研究并已取得一定进展,然而现有翻译模型的能力仍不足以投入实际应用。由于组合泛化能力是SQL-to-text模... 数据库的结构化查询语言(SQL)到自然语言的翻译(SQL-to-text)能提高关系数据库的易用性。近年来该领域主要使用机器学习的方法进行研究并已取得一定进展,然而现有翻译模型的能力仍不足以投入实际应用。由于组合泛化能力是SQL-to-text模型在实际应用中提升翻译效果的必要能力,且目前缺少对此类模型组合泛化能力的研究,因此提出一种SQL-to-text模型的组合泛化能力评估方法。基于现有的SQL-to-text数据集生成大量SQL和对应的自然语言翻译(SQL-自然语言对),并按SQL-自然语言对所含SQL子句的个数将其划分为训练数据与测试数据,使测试数据中的SQL子句皆以不同的组合方式在训练数据中出现,从而得到可评估模型组合泛化能力的新数据集。评估结果表明,该方法对查询知识的使用程度较高,划分数据的方式更加合理,所得数据集符合评估组合泛化能力的需求且贴近模型的实际应用场景,受到原始数据集的限制程度更低,并证实现有模型的组合泛化能力仍需提升,其中针对SQL-to-text任务设计的关系感知图转换器模型组合泛化能力最弱,表明原有的SQL-to-text数据集对组合泛化能力的考察存在欠缺。 展开更多
关键词 结构化查询语言 组合泛化 机器翻译 数据库 长短期记忆模型
在线阅读 下载PDF
半结构化数据查询重写 被引量:16
11
作者 高军 唐世渭 +1 位作者 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2002年第2期165-171,共7页
查询重写是数据库研究的一个基本问题 ,它和查询优化 ,数据仓库 ,信息集成 ,语义缓存等问题紧密相关 .目前 Internet上存在海量的半结构化数据 ,在信息集成过程中产生了大量半结构化视图 ,如何利用物化半结构化视图来重写用户查询 ,减... 查询重写是数据库研究的一个基本问题 ,它和查询优化 ,数据仓库 ,信息集成 ,语义缓存等问题紧密相关 .目前 Internet上存在海量的半结构化数据 ,在信息集成过程中产生了大量半结构化视图 ,如何利用物化半结构化视图来重写用户查询 ,减少响应时间成为研究热点问题 .上述问题本质上是 NP问题 ,提出了一种半结构化查询重写的新方法 ,该方法在保证算法正确性和完备性的基础上 ,利用半结构化数据特点和查询子目标之间的关系 ,减少了指数空间的查询重写候选方案生成 .理论分析表明 。 展开更多
关键词 查询重写 OEM 查询包含 半结构化数据 数据库
在线阅读 下载PDF
数据集成中XML数据查询语义重写 被引量:9
12
作者 高军 唐世渭 +1 位作者 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2002年第4期435-442,共8页
查询重写是数据库研究的一个基本问题,它和查询优化、数据仓库、数据集成、语义缓存等数据库问题密切相关.为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图.用户提交查询后,系统尽可能利用中间视图层... 查询重写是数据库研究的一个基本问题,它和查询优化、数据仓库、数据集成、语义缓存等数据库问题密切相关.为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图.用户提交查询后,系统尽可能利用中间视图层中视图,而不是访问数据源来回答查询,这个问题实际可以归结为半结构化查询重写问题.考虑到中间视图层空间的有限性,已有视图应当尽可能回答更多的查询.传统查询重写方法没有考虑半结构化数据之间的约束,而根据约束可以等价变换查询,从而提高中间视图层中的表达能力.提出了一种新的半结构化查询重写的方法,该方法在保证算法正确性和完备性的基础上,利用了半结构化数据中的约束,尤其是XML文档中的路径依赖,来增强中间层物化视图的表达能力.理论分析和初步原型实验证明方法的有效性. 展开更多
关键词 数据集成 XML 数据查询 查询重写 数据库 半结构化数据
在线阅读 下载PDF
一种判断点与多边形关系的快速算法 被引量:49
13
作者 陈瑞卿 周健 虞烈 《西安交通大学学报》 EI CAS CSCD 北大核心 2007年第1期59-63,共5页
采用对多边形各边赋权值的方法,分析射线与多边形相交的不同情况,给出了使用结构化查询语言实现交点个数求解的快速解决方案.结合数据库管理系统提供的优化查询机制,通过执行一次查询求得射线与多边形的交点个数,从而快速地判断出点与... 采用对多边形各边赋权值的方法,分析射线与多边形相交的不同情况,给出了使用结构化查询语言实现交点个数求解的快速解决方案.结合数据库管理系统提供的优化查询机制,通过执行一次查询求得射线与多边形的交点个数,从而快速地判断出点与多边形的位置关系.与其他改进方法相比,该方法易于理解,计算简单,对于具有多顶点的复杂多边形,其优越性显得更为突出. 展开更多
关键词 交点 多边形 结构化查询语言 算法
在线阅读 下载PDF
轨迹大数据:数据、应用与技术现状 被引量:54
14
作者 许佳捷 郑凯 +3 位作者 池明旻 朱扬勇 禹晓辉 周晓方 《通信学报》 EI CSCD 北大核心 2015年第12期97-105,共9页
移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术... 移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术界和工业界针对轨迹管理问题开展了大量研究工作,包括轨迹数据预处理,以解决数据冗余高、精度差、不一致等问题;轨迹数据库技术,以支持有效的数据组织和高效的查询处理;轨迹数据仓库,支持大规模轨迹的统计、理解和分析;最后是知识提取,从数据中挖掘有价值的模式与规律。因此,综述轨迹大数据分析,从企业数据、企业应用、前沿技术这3个角度揭示该领域的现状。 展开更多
关键词 时空数据库 轨迹数据管理 数据索引 查询优化
在线阅读 下载PDF
F-Index:一种加速Twig查询处理的扁平结构索引 被引量:4
15
作者 周军锋 孟小峰 +1 位作者 蒋瑜 谢敏 《软件学报》 EI CSCD 北大核心 2007年第6期1429-1442,共14页
如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查... 如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查询无关的元素,在处理深度嵌套的复杂结构XML文档时具有很大的优势.提出一种新的查询算法,能够有效处理过滤后剩余元素的匹配问题.基于不同数据集的实验表明,使用F-Index进行过滤可以极大地提高查询处理的性能. 展开更多
关键词 XML 查询优化 TWIG查询 过滤 结构索引
在线阅读 下载PDF
改进的树型结构RFID防碰撞算法 被引量:20
16
作者 王雪 钱志鸿 +1 位作者 刘晓慧 程超 《通信学报》 EI CSCD 北大核心 2015年第7期129-137,共9页
将整棵大查询树分为若干分支,在每一个分支内进行标签识别,减少碰撞发生的概率。算法分为前缀确定和分支查询2个阶段,在前缀确定阶段读取所有标签前缀,每个前缀代表一个分支,依次遍历每一分支;查询过程采用后退式搜索策略和动态搜索方... 将整棵大查询树分为若干分支,在每一个分支内进行标签识别,减少碰撞发生的概率。算法分为前缀确定和分支查询2个阶段,在前缀确定阶段读取所有标签前缀,每个前缀代表一个分支,依次遍历每一分支;查询过程采用后退式搜索策略和动态搜索方式。理论分析和仿真实验表明,算法能够从查询次数、时延、吞吐率多方面改善RFID系统的整体性能。 展开更多
关键词 RFID 防碰撞 树型结构 前缀查询 后退式搜索
在线阅读 下载PDF
XML数据的路径表达式查询优化技术 被引量:28
17
作者 吕建华 王国仁 于戈 《软件学报》 EI CSCD 北大核心 2003年第9期1615-1620,共6页
路径表达式作为XML数据查询语言的核心部分,关于它的计算方法的研究成果已有很多,然而针对路径表达式本身进行优化的研究却相对较少.提出了两种针对路径表达式的优化策略:路径缩短策略和补路径策略,从而提高了XML路径查询效率.路径缩短... 路径表达式作为XML数据查询语言的核心部分,关于它的计算方法的研究成果已有很多,然而针对路径表达式本身进行优化的研究却相对较少.提出了两种针对路径表达式的优化策略:路径缩短策略和补路径策略,从而提高了XML路径查询效率.路径缩短策略根据XML文档模式信息,将路径表达式查询长度缩短,从而简化查询本身以降低需要的查询代价;而补路径策略则试图使用代价更小的等价路径表达式来替换原始查询.经过对实验数据的分析,这两种优化策略对于绝大多数路径表达式查询可以应用,并可大幅度地改进路径表达式的查询性能. 展开更多
关键词 XML 路径表达式 查询处理 查询代价 查询优化
在线阅读 下载PDF
有效的非完全结构XML查询 被引量:8
18
作者 李晓光 于戈 +2 位作者 龚剑 王大玲 鲍玉斌 《计算机学报》 EI CSCD 北大核心 2007年第1期57-67,共11页
讨论了有意义的非完全结构XML查询(NFS)结果的定义,提出了一种易于扩展的基于模式和实体的有意义判断模型———PE模型;基于PE模型,设计了具体的等价模式和等价查询项判断方法,提出了PE索引和I2P倒排索引,设计了一种有效的NFS查询算法... 讨论了有意义的非完全结构XML查询(NFS)结果的定义,提出了一种易于扩展的基于模式和实体的有意义判断模型———PE模型;基于PE模型,设计了具体的等价模式和等价查询项判断方法,提出了PE索引和I2P倒排索引,设计了一种有效的NFS查询算法来处理有意义的判断以及路径查询和关键字查询.实验表明,文中方法的查询质量和效率要优于XSEarch系统和Timber系统. 展开更多
关键词 非完全结构XML查询 有意义的查询结果 结构索引 倒排索引
在线阅读 下载PDF
基于聚类分解的高维度量空间索引B^+-Tree 被引量:23
19
作者 张军旗 周向东 +1 位作者 王梅 施伯乐 《软件学报》 EI CSCD 北大核心 2008年第6期1401-1412,共12页
为了提高索引性能,高维度量空间索引通常采用K-Means等聚类技术来获取数据的分布信息.但是,已知的工作需要根据经验来确定聚类参数,缺乏对聚类与查询性能之间关系的理论分析.提出了一种基于聚类分解的高维度量空间B^+-tree索引,通过聚... 为了提高索引性能,高维度量空间索引通常采用K-Means等聚类技术来获取数据的分布信息.但是,已知的工作需要根据经验来确定聚类参数,缺乏对聚类与查询性能之间关系的理论分析.提出了一种基于聚类分解的高维度量空间B^+-tree索引,通过聚类分解,对数据进行更细致的划分来减少查询的数据访问.对聚类与查询代价的关系进行了讨论,通过查询代价模型,给出了最小查询代价条件下的聚类分解数目等理论的计算方法.实验显示,提出的索引方法明显优于iDistance等度量空间索引,最优聚类分解数的估计接近实际最优查询时所需的聚类参数. 展开更多
关键词 高维空间 索引结构 查询代价模型 聚类分割
在线阅读 下载PDF
VA-Trie:一种用于近似k近邻查询的高维索引结构 被引量:10
20
作者 董道国 刘振中 薛向阳 《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2213-2218,共6页
近年来,随着多媒体信息检索技术的不断发展,如何实现高维特征矢量的快速相似性查询成为一个重要的研究课题·为此,人们提出了许多索引结构,包括:R-Tree及其变种、对矢量进行量化近似的VA-File、引入量化思想的A-Tree等等·从公... 近年来,随着多媒体信息检索技术的不断发展,如何实现高维特征矢量的快速相似性查询成为一个重要的研究课题·为此,人们提出了许多索引结构,包括:R-Tree及其变种、对矢量进行量化近似的VA-File、引入量化思想的A-Tree等等·从公开发表的成果看,这些索引结构在较低维数时,都能够表现出较好的查询性能;而当维数增加时,性能则急剧恶化·为了在更高维数下实现快速相似查询,可采用VA-File和A-Tree中的近似思想,并借助Trie结构来组织和管理压缩后的近似矢量,即所谓的VA-Trie·实验结果表明,在高达128维时VA-Trie仍有查询加速,其性能远好于A-Tree· 展开更多
关键词 索引结构 相似性查询 信息检索
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部