期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
XML数据中Twig查询处理与优化技术研究综述 被引量:8
1
作者 毕鑫 王国仁 +2 位作者 赵相国 袁野 张盼 《计算机科学与探索》 CSCD 2013年第9期769-782,共14页
可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布... 可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布式XML数据、不确定XML数据、图模型XML数据中的发展现状,并分析了存在的问题和挑战,最后探讨了Twig查询处理与优化技术今后的发展趋势和研究方向。 展开更多
关键词 TWIG查询 可扩展标记语言(xml) 分布式xml数据 不确定xml数据 图模型xml数据
在线阅读 下载PDF
一种高效的连续不确定XML小枝模式匹配算法 被引量:4
2
作者 张晓琳 吕庆 +1 位作者 刘立新 郑春红 《计算机应用研究》 CSCD 北大核心 2013年第2期364-366,370,共4页
针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用... 针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用相互关联的链表存储中间结果,不需要归并。理论分析与实验结果表明,该算法是一种高效的连续不确定XML查询算法。 展开更多
关键词 连续不确定xml 小枝模式匹配 过滤剪枝 非归并
在线阅读 下载PDF
一种非归并不确定XML小枝模式查询算法 被引量:2
3
作者 刘立新 张晓琳 +2 位作者 吕庆 张换香 褚艳华 《计算机科学》 CSCD 北大核心 2013年第5期198-200,228,共4页
针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的... 针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。 展开更多
关键词 不确定xml P-文档 分布节点 区间编码 小枝模式
在线阅读 下载PDF
连续不确定XML数据索引技术研究 被引量:3
4
作者 张换香 张晓琳 刘立新 《计算机应用与软件》 CSCD 北大核心 2013年第8期51-53,共3页
针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定... 针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定小枝的路径概率;CPTI值索引是一个二维表,记录cont类节点的概率信息,通过CPTI值索引过滤与查询无关的元素以减少查询中需要处理的元素数目。实验表明,此索引技术可极大地提高查询处理的性能。 展开更多
关键词 连续不确定 xml 索引 概率阈值查询
在线阅读 下载PDF
不确定XML的Top-k关键字查询算法研究 被引量:3
5
作者 张晓琳 苏龙超 +1 位作者 韩雨童 王静宇 《小型微型计算机系统》 CSCD 北大核心 2014年第12期2691-2696,共6页
目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,效率低下.针对这一问题,定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k(smallest related connected subtr... 目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,效率低下.针对这一问题,定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k(smallest related connected subtree Top-k),SRCT-Top-k查询返回概率值排在前k的最小相关联通子树,并提出基于动态Keyw ord数据仓的Pr ListTop-k算法来处理SRCT-Top-k查询.Pr List Top-k算法仅扫描一次动态Keyw ord数据仓就能构建满足特定条件下的子树,并制定了过滤策略减少了中间结果.理论分析和实验结果表明,Pr List Top-k是一种高效的不确定XML的Top-k查询算法. 展开更多
关键词 不确定xml 最小相关联通子树 TOP-K 关键字查询
在线阅读 下载PDF
基于扩展倒排索引的不确定XML关键字查询算法 被引量:4
6
作者 牛大伟 苏龙超 +1 位作者 韩雨童 张晓琳 《计算机应用与软件》 CSCD 2015年第4期247-251,共5页
现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的... 现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的相关信息,根据扩展倒排索引即可初始化动态哈希表和序号编码链表,并且Pr E算法在执行过程中利用整数的比较代替了字符串的比较。理论分析与实验结果表明,Pr E算法是一种高效的不确定XML关键字查询算法。 展开更多
关键词 不确定xml 关键字查询 扩展倒排索引 PRE
在线阅读 下载PDF
连续不确定XML数据查询处理算法 被引量:1
7
作者 张晓琳 霍伟 +1 位作者 刘立新 崔光月 《计算机工程与设计》 CSCD 北大核心 2013年第7期2426-2430,共5页
针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果... 针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果,通过构造随机样本集线性拟合目标节点中的连续分布函数,避免了对大量矩形分段的处理,有效地减少了计算量。实验结果表明,在取得理想精度的同时,该算法具有高效性。 展开更多
关键词 连续不确定xml 蒙特卡洛最小二乘 小枝模式查询 随机样本集 线性拟合
在线阅读 下载PDF
基于LSPI索引的不确定XML查询处理算法 被引量:1
8
作者 张晓琳 韩雨童 +1 位作者 苏龙超 谭跃生 《计算机应用研究》 CSCD 北大核心 2014年第7期2078-2081,2100,共5页
针对目前已有XML通配符查询处理需将文档中所有元素标签读入内存中,匹配效率低的问题,提出一种新的基于LSPI(leaf sibling of path information)索引的不确定XML包含通配符和复杂谓词的查询处理算法Prob-BooleanStarTwig。算法基于有效... 针对目前已有XML通配符查询处理需将文档中所有元素标签读入内存中,匹配效率低的问题,提出一种新的基于LSPI(leaf sibling of path information)索引的不确定XML包含通配符和复杂谓词的查询处理算法Prob-BooleanStarTwig。算法基于有效过滤策略自底向上进行模式匹配,将通配符转换成A-D关系和层次信息约束,解决传统通配符匹配问题,避免多次扫描查询模式,提高查询速度。理论分析和实验结果表明,算法的查询效率明显优于已有的算法。 展开更多
关键词 不确定xml 通配符查询 LSPI索引 小枝模式匹配
在线阅读 下载PDF
不确定XML序列匹配等价性研究 被引量:1
9
作者 张晓琳 王鹏 《计算机工程与设计》 CSCD 北大核心 2014年第5期1674-1677,1704,共5页
为了保持等价性,将序列匹配应用到不确定XML小枝模式匹配,需要重新考虑假警报和假不予考虑问题。针对这一问题,对不确定XML序列匹配中模式树序列化、子序列匹配和结构过滤的等价性进行分析,使得序列匹配应用到不确定XML小枝模式匹配的... 为了保持等价性,将序列匹配应用到不确定XML小枝模式匹配,需要重新考虑假警报和假不予考虑问题。针对这一问题,对不确定XML序列匹配中模式树序列化、子序列匹配和结构过滤的等价性进行分析,使得序列匹配应用到不确定XML小枝模式匹配的理论依据更为完备;通过实验对不确定XML序列匹配的等价性和效率进行验证。理论分析和实验结果表明,序列匹配应用到不确定XML与普通XML是等价的,具有较高的效率。 展开更多
关键词 序列匹配 小枝模式匹配 不确定xml 等价性 假警报 假不予考虑
在线阅读 下载PDF
一种基于序列的不确定XML小枝匹配方法 被引量:1
10
作者 张晓琳 王鹏 《计算机应用与软件》 CSCD 北大核心 2014年第12期48-51,共4页
针对目前不确定XML小枝模式查询处理方法中繁复的结构连接操作和不便于概率阈值过滤的缺点,提出一种新颖的基于序列的不确定XML小枝模式查询处理方法。该方法包括不确定XML序列索引的建立以及基于序列匹配的查询算法,与现有的不确定XML... 针对目前不确定XML小枝模式查询处理方法中繁复的结构连接操作和不便于概率阈值过滤的缺点,提出一种新颖的基于序列的不确定XML小枝模式查询处理方法。该方法包括不确定XML序列索引的建立以及基于序列匹配的查询算法,与现有的不确定XML查询处理方法相比不需要繁复的结构连接操作,而且可以灵活地进行三次概率阈值过滤。理论分析和实验表明,该方法便于概率阈值过滤,同时具有较高的查询效率。 展开更多
关键词 不确定xml 序列 小枝模式 概率阈值
在线阅读 下载PDF
基于概率SLCA的XML过滤 被引量:2
11
作者 张晨静 王晓玲 周傲英 《计算机学报》 EI CSCD 北大核心 2014年第9期1959-1971,共13页
不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(... 不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(MUX)关系.由于更普遍的结点依赖关系在表述和计算上的复杂性,较少有工作讨论.文中讨论概率XML模型PrXML^({exp,ind,mux})中基于SLCA语义的关键字过滤.这种模型中通过EXP结点描述更普遍的结点依赖关系.文中在定义了子树中关键字概率分布表tab及其相关的运算后,分别给出了模型中不同类型结点关键字概率分布表的计算方法,并给出了不需要构造可能世界直接求解SLCA结点概率的算法.文章通过实验评估了算法的特性和性能. 展开更多
关键词 不确定数据 概率xml 关键字过滤 SLCA 关键字概率分布表
在线阅读 下载PDF
高效的连续不确定XML数据Top-k查询算法
12
作者 张晓琳 郑春红 +1 位作者 刘立新 吕庆 《计算机工程与科学》 CSCD 北大核心 2014年第6期1101-1107,共7页
目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又... 目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又提出HPCProTJFast算法,该算法推迟了对连续节点的处理,只有在获得满足概率条件的整枝路径时才对连续节点进行访问。实验表明,在执行时间以及过滤效率上,同直接处理连续不确定数据的ProTJFast算法相比,这两种算法都要更高效,并且HPCProTJFast算法的效率更高。 展开更多
关键词 连续不确定 xml 归并 TOP-K
在线阅读 下载PDF
多维连续不确定XML数据模型及聚集查询算法
13
作者 张晓琳 崔光月 +1 位作者 刘立新 霍伟 《计算机应用与软件》 CSCD 北大核心 2014年第1期14-17,共4页
提出一种基于p-文档的连续不确定XML数据模型,支持多维连续随机变量的不确定XML数据表示。提出高效的XML聚集算法,既支持XPath表达式,又能够根据不同类型的连续函数选择合适的聚集方法。实验结果表明,该算法能够有效地处理支持多维连续... 提出一种基于p-文档的连续不确定XML数据模型,支持多维连续随机变量的不确定XML数据表示。提出高效的XML聚集算法,既支持XPath表达式,又能够根据不同类型的连续函数选择合适的聚集方法。实验结果表明,该算法能够有效地处理支持多维连续不确定XML数据的聚集查询,并且具有很好的可扩展性。 展开更多
关键词 数据模型 多维连续不确定xml聚集
在线阅读 下载PDF
RLPI索引:一种处理连续不确定XML索引
14
作者 张晓琳 郭丹丹 +2 位作者 韩雨童 郝琨 谭跃生 《计算机应用与软件》 CSCD 2016年第4期25-29,共5页
针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地... 针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地定位所需节点。RLPI值索引借鉴U树的思想,通过提前计算并存储叶子节点的相关信息,以减少查询中需处理的元素数目,并且其对满足任意连续pdf(probability density function)的不确定数据均适用。理论分析和实验结果表明,RLPI索引技术有效地提高了查询处理的性能。 展开更多
关键词 连续不确定数据 xml 索引 概率阈值范围查询
在线阅读 下载PDF
一种适用连续不确定XML数据的索引
15
作者 张晓琳 郭丹丹 郝琨 《计算机工程与科学》 CSCD 北大核心 2016年第2期305-311,共7页
针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUX... 针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUXI索引树,其中叶子节点存储连续不确定数据辅助信息。为了提高查询效率,对连续不确定数据制定了过滤策略,通过遍历索引树过滤掉不满足查询范围的子树。理论和实验结果表明,此索引技术可提高查询处理的性能。 展开更多
关键词 连续不确定xml 概率阈值范围查询 CUXI索引树 二维数据矩形 过滤
在线阅读 下载PDF
高效不确定XML复杂Twig查询处理算法
16
作者 张晓琳 韩雨童 +1 位作者 苏龙超 刘立新 《计算机工程与设计》 CSCD 北大核心 2014年第4期1258-1263,共6页
针对目前普通XML复杂Twig查询处理算法易造成大量空间和时间浪费,且不能完全适用于不确定XML的问题,提出一种基于P-文档模型的不确定XML复杂Twig查询处理算法Prob-BooleanTwig,处理包含AND,NOT和OR复杂谓词的查询模式。算法在扩展了EDe... 针对目前普通XML复杂Twig查询处理算法易造成大量空间和时间浪费,且不能完全适用于不确定XML的问题,提出一种基于P-文档模型的不确定XML复杂Twig查询处理算法Prob-BooleanTwig,处理包含AND,NOT和OR复杂谓词的查询模式。算法在扩展了EDewey编码的基础上,构建路径叶子节点索引,进行自底向上的查询模式匹配,避免了对查询模式的多次扫描。理论分析和实验结果表明,Prob-BooleanTwig算法具有高效性。 展开更多
关键词 不确定xml 复杂Twig查询 编码 路径索引 查询处理
在线阅读 下载PDF
标签劣质的XML数据上的查询处理 被引量:1
17
作者 姜国华 姜守旭 +2 位作者 王宏志 李建中 高宏 《计算机科学与探索》 CSCD 2011年第8期673-685,共13页
XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XM... XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XML文档中求出与原查询相似的所有查询结果的高效算法。通过实验证明了所提方法的有效性和效率。 展开更多
关键词 劣质数据 可扩展标记语言(xml) TWIG查询
在线阅读 下载PDF
一种基于模糊集和概率分布的不确定XML模型及其代数运算 被引量:4
18
作者 胡磊 严丽 《计算机科学》 CSCD 北大核心 2020年第7期21-30,共10页
XML作为一种信息表示和交换的事实标准已被广泛用作不同应用之间的统一数据交换格式,其在实际应用中已经发挥着重要的作用。由于现实中很多信息包含有不确定性,而经典的XML不能表示和处理不确定信息,因此有必要对经典XML模型进行扩展。... XML作为一种信息表示和交换的事实标准已被广泛用作不同应用之间的统一数据交换格式,其在实际应用中已经发挥着重要的作用。由于现实中很多信息包含有不确定性,而经典的XML不能表示和处理不确定信息,因此有必要对经典XML模型进行扩展。考虑到现实世界的复杂性,不确定信息往往同时包含有随机不确定性和模糊不确定,而概率理论和模糊集理论是处理不确定信息的有力工具,因此文中在现有的模糊XML和概率XML数据模型的基础上,综合利用概率和模糊理论建立一个新的不确定XML模型和相关代数,所提出的新的不确定性XML模型既能与现有的XML模型兼容,又能表达更复杂的不确定信息。 展开更多
关键词 xml模型 不确定数据模型 模糊集 概率分布 代数运算
在线阅读 下载PDF
具有不确定数据的XML数据编码设计
19
作者 姜岩 李欣 金鑫 《沈阳工业大学学报》 EI CAS 北大核心 2016年第1期69-73,共5页
为了解决模糊数据对XML文档中各元素造成的内容和结构上的改变,使得XML数据模型中的不确定信息能够被有效地管理,提出了一种基于前缀编码的四元组编码方案.在语法分析器XML Schema中,根据模糊数据的特征,利用增加的元素对XML文档中的模... 为了解决模糊数据对XML文档中各元素造成的内容和结构上的改变,使得XML数据模型中的不确定信息能够被有效地管理,提出了一种基于前缀编码的四元组编码方案.在语法分析器XML Schema中,根据模糊数据的特征,利用增加的元素对XML文档中的模糊元素进行约束,进而为每一个元素建立一个四元组,其参数由文档号、遍历序号、元素模糊性及组内标志符构成.通过大量的实验对比分析,验证了该编码方案的有效性,其更适用于具有较低XML树高度的XML文档. 展开更多
关键词 模糊数据 不确定信息 四元组编码 语法分析器 增加的元素 模糊性 xml树高度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部