期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于LazyDFA的XPath在XML数据流上查询优化算法 被引量:3
1
作者 张晓琳 崔敏 谭跃生 《计算机工程与应用》 CSCD 北大核心 2008年第28期125-127,139,共4页
针对XML数据流上XPath查询处理及查询优化问题,给出了一种基于lazyDFA技术的解决方案,并提出了优化算法。共享NFA状态表,通过将NFA中的状态分成共享和独享两个状态集来降低lazyDFA的内存使用量;建立状态转移表优化算法通过在lazyDFA状... 针对XML数据流上XPath查询处理及查询优化问题,给出了一种基于lazyDFA技术的解决方案,并提出了优化算法。共享NFA状态表,通过将NFA中的状态分成共享和独享两个状态集来降低lazyDFA的内存使用量;建立状态转移表优化算法通过在lazyDFA状态结构中增加一个状态转移表,来提高lazyDFA的查询速度。实验结果表明,提出的方法能够在执行效率和空间代价方面优于传统算法。 展开更多
关键词 xml数据流 XPATH lazyDFA 查询优化
在线阅读 下载PDF
XML数据流分页频繁子树挖掘研究 被引量:2
2
作者 雷向欣 杨智应 +1 位作者 黄少寅 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2012年第9期1926-1936,共11页
随着XML数据流的广泛应用,从挖掘XML数据流中发现知识具有重要的理论与应用价值.相比其他频繁模式挖掘,大型XML文档与数据流的频繁子树挖掘面临困难:XML数据流不可能整体在内存解析;对XML数据流分段挖掘必须考虑XML数据的半结构化特征等... 随着XML数据流的广泛应用,从挖掘XML数据流中发现知识具有重要的理论与应用价值.相比其他频繁模式挖掘,大型XML文档与数据流的频繁子树挖掘面临困难:XML数据流不可能整体在内存解析;对XML数据流分段挖掘必须考虑XML数据的半结构化特征等.针对上述问题,提出数据流分页频繁子树挖掘模型Tmlist.Tmlist对XML数据流进行分页,管理跨页节点及频繁候选子树的跨页增长,逐页挖掘频繁子树;频繁候选子树的增长根据根节点层次由浅至深地在最右路径加入频繁候选节点,避免以低层次为根子树的重复性递归增长;对频繁候选子树采用子树拓扑序列和最右路径共同标识,子树的增长不需要对子树前缀进行匹配,省去前缀节点存储与匹配开销;以页面最小支持度对频繁候选子树按页筛选,子树按页面衰减度衰减支持度、剪枝.Tmlist在可控误差范围内降低频繁子树挖掘的空间消耗,提高内存利用率和挖掘效率. 展开更多
关键词 xml 数据流 分页 频繁子树 数据挖掘
在线阅读 下载PDF
基于Hole-Filler模型的XML数据流上的SLCA算法 被引量:1
3
作者 霍欢 王国仁 +1 位作者 陈庆奎 彭敦陆 《计算机研究与发展》 EI CSCD 北大核心 2010年第5期886-892,共7页
与传统数据库对XML数据的处理不同,对XML数据流的处理不仅受实时性的约束,还受存储空间的限制.在XML片段无序传送的广播模型中,考虑在XML数据流上进行高效的关键字查询,进而首次提出近似SLCA算法.SLCA算法利用结构Hash表和LCA表对关键... 与传统数据库对XML数据的处理不同,对XML数据流的处理不仅受实时性的约束,还受存储空间的限制.在XML片段无序传送的广播模型中,考虑在XML数据流上进行高效的关键字查询,进而首次提出近似SLCA算法.SLCA算法利用结构Hash表和LCA表对关键字进行匹配并计算SLCA,从而避免冗余操作.同时,SLCA算法可以对匹配结果立即输出而不必等到数据流传输结束.实验结果表明,基于Hole-Filler模型的XML数据流上的SLCA算法在节省时间和空间开销方面均表现出较好的性能. 展开更多
关键词 xml 数据流 查询 最小最近公共祖先(SLCA) Hole-Filler模型
在线阅读 下载PDF
一种XML数据流之上持续查询执行器的增量维护方法 被引量:4
4
作者 高军 杨冬青 +1 位作者 王腾蛟 唐世渭 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期771-776,共6页
在XML数据流的海量持续查询处理领域中,很少有研究涉及到在查询集合发生变化的情况下,如何调整查询执行器以满足当前查询集合的问题.由于XML数据查询的数目是海量的,查询执行器重新构建的代价非常高.针对上述问题,提出了基于转换累计自... 在XML数据流的海量持续查询处理领域中,很少有研究涉及到在查询集合发生变化的情况下,如何调整查询执行器以满足当前查询集合的问题.由于XML数据查询的数目是海量的,查询执行器重新构建的代价非常高.针对上述问题,提出了基于转换累计自动机的查询执行器的增量维护方法,来完成查询集合的增量增加和删除,从而避免了执行器重构的昂贵代价.同时,利用XML文档DTD结构约束,提高了查询执行器增量维护的效率,减少了增量维护所导致的空间冗余.实验表明,该方法能够以有限空间为代价,有效完成XML数据流持续查询执行器的动态维护. 展开更多
关键词 xml 持续查询 增量维护 数据流
在线阅读 下载PDF
XML流管理研究综述 被引量:8
5
作者 杨卫东 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1721-1728,共8页
近年来,XML流管理是数据流研究领域中的一个热点研究问题.不同于传统数据库管理系统,XML数据流管理系统需要在使用少量内存的情况下随时处理在线到达的数据流;由于XML流具有递归的、层次的结构,并且用户兴趣通常用XML查询语言来表示,因... 近年来,XML流管理是数据流研究领域中的一个热点研究问题.不同于传统数据库管理系统,XML数据流管理系统需要在使用少量内存的情况下随时处理在线到达的数据流;由于XML流具有递归的、层次的结构,并且用户兴趣通常用XML查询语言来表示,因此,XML流管理技术与关系型数据流(基于元组的数据)管理技术有很大不同.综述XML流管理技术及各项研究成果;指出XML流管理系统的特点;比较了当前典型的XML数据流管理系统;系统地阐述和分析当前国内外已有的XML流数据处理方法(包括基于自动机的方法、基于索引的方法,基于序列的方法)和流处理的相关优化技术;指出尚需进一步研究的问题. 展开更多
关键词 数据流 xml XPATH XQUERY xml流管理
在线阅读 下载PDF
基于下推自动机的XML数据流递归查询研究 被引量:1
6
作者 张晓琳 李宏辉 韩剑锋 《计算机工程与设计》 CSCD 北大核心 2010年第4期763-766,共4页
针对具有子孙轴(//)和谓词([])结构特征的XPath对具有不同递归深度的XML数据流进行递归查询处理问题,提出了基于下推自动机技术的处理方法,通过将XPath各类置步转化成相对应的处理模块,由算法将各类处理模块组合起来,建立了自上而下的... 针对具有子孙轴(//)和谓词([])结构特征的XPath对具有不同递归深度的XML数据流进行递归查询处理问题,提出了基于下推自动机技术的处理方法,通过将XPath各类置步转化成相对应的处理模块,由算法将各类处理模块组合起来,建立了自上而下的树状查询模型。由于查询过程中将会发生多重匹配,从而会产生大量的匹配模式,该模型通过有效的匹配策略和缓存操作,对匹配模式进行保存及检验,成功地实现XML数据流递归查询。实验结果表明,该算法在性能上要优于传统方法。 展开更多
关键词 xml数据流 多重匹配 下推自动机 递归查询 树状查询模型
在线阅读 下载PDF
DTD上的lazyDFA XML数据流查询优化算法 被引量:1
7
作者 张晓琳 崔敏 谭跃生 《计算机工程与应用》 CSCD 北大核心 2009年第28期131-132,136,共3页
针对XML数据流上的XPath查询处理问题,基于自动机技术构造的lazyDFA查询处理器是一种有效的解决方法。为了提高lazyDFA的查询处理效率,提出了利用DTD的语义信息和结构信息对lazyDFA进行优化的算法。实验结果表明,优化算法可以有效的加快... 针对XML数据流上的XPath查询处理问题,基于自动机技术构造的lazyDFA查询处理器是一种有效的解决方法。为了提高lazyDFA的查询处理效率,提出了利用DTD的语义信息和结构信息对lazyDFA进行优化的算法。实验结果表明,优化算法可以有效的加快lazyDFA的查询速度,降低内存消耗。 展开更多
关键词 文档类型定义 lazyDFA 查询优化 xml数据流
在线阅读 下载PDF
基于自动机的XML流多查询处理 被引量:1
8
作者 张兵令 《计算机工程》 CAS CSCD 北大核心 2008年第16期63-65,共3页
XML流数据处理在研究领域引起广泛关注,该文针对XML流上的多查询处理提出一种算法,把多个查询合并为一个共享前缀的查询树,应用自动机和运行时栈相结合的方法,单遍扫描XML流处理数据流上的多个查询。该算法采用一种分层栈结构保存查询... XML流数据处理在研究领域引起广泛关注,该文针对XML流上的多查询处理提出一种算法,把多个查询合并为一个共享前缀的查询树,应用自动机和运行时栈相结合的方法,单遍扫描XML流处理数据流上的多个查询。该算法采用一种分层栈结构保存查询模式匹配候选集,利用XML节点的区间编码来确定节点之间的关系,返回整条匹配路径。 展开更多
关键词 xml数据流 前缀共享 自动机
在线阅读 下载PDF
基于路径频率树的XML流数据剪切分片技术
9
作者 霍欢 韩东红 +1 位作者 回晓云 王国仁 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第5期657-660,676,共5页
与传统数据库对XML数据的处理不同,对XML流数据的处理不仅受实时性的约束,还受存储空间的限制.在Hole-Filler模型的基础上,首先利用XML的查询统计信息,定义了路径频率树,提出了基于兄弟关系的XML流数据剪切分片策略及其算法.在此基础上... 与传统数据库对XML数据的处理不同,对XML流数据的处理不仅受实时性的约束,还受存储空间的限制.在Hole-Filler模型的基础上,首先利用XML的查询统计信息,定义了路径频率树,提出了基于兄弟关系的XML流数据剪切分片策略及其算法.在此基础上,提出了基于父子关系的XML流数据剪切分片策略及算法.这两个基于路径频率树的剪切算法有效地提高了XML片段的利用率,增强了XML片段的内聚性.实验结果表明,基于路径频率树的XML剪切算法在剪切时间、查询时间、空间消耗等方面都表现出较好的性能. 展开更多
关键词 xml 数据流 路径频率树 剪切 Hole-Filler模型
在线阅读 下载PDF
一种自适应的XML数据流质量预测策略
10
作者 刘波 杨路明 邓云龙 《系统工程与电子技术》 EI CSCD 北大核心 2009年第6期1485-1491,共7页
针对当前XML数据流质量检测存在的不足,提出了一种自适应的XML数据流质量预测方法XAFS。该方法用XML键构建的矢量矩阵作为窗口、利用矢量积小波变换多级分解与重构XML数据流、再结合最小二乘支持向量机对XML数据流质量进行预测;为了更... 针对当前XML数据流质量检测存在的不足,提出了一种自适应的XML数据流质量预测方法XAFS。该方法用XML键构建的矢量矩阵作为窗口、利用矢量积小波变换多级分解与重构XML数据流、再结合最小二乘支持向量机对XML数据流质量进行预测;为了更好的适应网络负载,采取加权与自适应窗口调整等调度策略充分保证XML数据流的质量检测。对比其它相应算法,一系列仿真实验表明所提出算法具有较高的精度与实用性,是XML数据流挖掘的一种有效方法。 展开更多
关键词 xml数据库 预测 矢量积小波变换 最小二乘支持向量机 xml数据流
在线阅读 下载PDF
XML数据流小枝匹配算法
11
作者 张晓琳 王虎 刘立新 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期42-45,共4页
针对XML数据流可能具有复杂的递归层次结构,提出一种XML数据流小枝匹配算法TwigPM.通过获取查询节点的结构关系,进行有效的剪枝操作,减少了处理时间和数据所占用的内存空间.实验结果表明,算法具有高效性.
关键词 xml数据流 小枝匹配 XPATH
在线阅读 下载PDF
XSLC:分层编码并面向查询的XML数据压缩算法
12
作者 付强 王腾蛟 +2 位作者 李红燕 杨冬青 唐世渭 《计算机科学与探索》 CSCD 2010年第2期145-152,共8页
XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XMLstream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元... XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XMLstream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境。实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法。 展开更多
关键词 可扩展标记语言 压缩 文档类型定义 数据流
在线阅读 下载PDF
基于滑动窗口的XML数据流聚类算法 被引量:4
13
作者 姚文集 高明霞 +1 位作者 毛国君 李广奎 《计算机工程》 CAS CSCD 北大核心 2010年第13期87-89,92,共4页
通过对XML数据流的聚类研究,提出一种基于滑动窗口的XML数据流聚类算法SW-XSCLS。该算法采用滑动窗口技术,以聚类特征指数直方图作为概要数据结构,能动态地淘汰"过时"的数据,较好地保存当前窗口内的数据分布状况,从而获取较... 通过对XML数据流的聚类研究,提出一种基于滑动窗口的XML数据流聚类算法SW-XSCLS。该算法采用滑动窗口技术,以聚类特征指数直方图作为概要数据结构,能动态地淘汰"过时"的数据,较好地保存当前窗口内的数据分布状况,从而获取较高质量的聚类结果。理论分析和实验结果表明,该算法可以获得较高的聚类质量和较快的处理速度。 展开更多
关键词 xml数据流 滑动窗口 聚类 指数直方图
在线阅读 下载PDF
基于下推转换机的XML流数据处理方法 被引量:4
14
作者 李文珠 廖湖声 苏航 《计算机工程与应用》 CSCD 北大核心 2016年第8期49-55,239,共8页
XML流数据在互联网领域有着广阔的应用,海量流数据的高性能处理与查询需求的多样性给对XML流数据的查询处理技术提出了更高的要求,针对XML流数据上的XPath查询,以下推转换机(Pushdown Transducer)为基础,提出一种新的查询处理方法。该... XML流数据在互联网领域有着广阔的应用,海量流数据的高性能处理与查询需求的多样性给对XML流数据的查询处理技术提出了更高的要求,针对XML流数据上的XPath查询,以下推转换机(Pushdown Transducer)为基础,提出一种新的查询处理方法。该方法支持包含PC轴、AD轴同时包含多重存在谓词、值谓词和嵌套谓词的XPath查询,覆盖XPath查询的核心部分。该方法能够满足用户复杂的查询需求,同时具有较高的性能。 展开更多
关键词 xml流数据 XPATH 下推转换机
在线阅读 下载PDF
XML数据流中祖先-后裔关系匹配算法 被引量:1
15
作者 汪万根 万常选 《计算机工程》 EI CAS CSCD 北大核心 2005年第9期101-103,共3页
在祖先-后裔关系匹配算法中,多数都是首先利用XML解析器将XML文档解析分裂为元素(或属性)列表进行存储,然后在这些分裂得到的元素(或属性)列表之间进行祖先-后裔关系的结构连接。该文的算法SSD不需要事先将源XML文档分裂为元素(或属性)... 在祖先-后裔关系匹配算法中,多数都是首先利用XML解析器将XML文档解析分裂为元素(或属性)列表进行存储,然后在这些分裂得到的元素(或属性)列表之间进行祖先-后裔关系的结构连接。该文的算法SSD不需要事先将源XML文档分裂为元素(或属性)列表进行存储,而是直接将源XML文档作为输入,采用SAX来产生XML数据流,然后基于XML数据流实现祖先-后裔关系匹配。通过分析可知,该算法适用面广,仅需要对源XML文档进行一次扫描,占用系统资源少,且具有很高的匹配效率。 展开更多
关键词 xml文档 数据流 祖先-后裔关系 SAX
在线阅读 下载PDF
一种XML数据流小枝模式查询算法 被引量:1
16
作者 白山 陶世群 《计算机工程》 CAS CSCD 2012年第6期69-71,共3页
针对传统XML文档小枝模式查询算法系统开销大的问题,提出一种XML数据流小枝模式查询算法。该算法结合SAX数据流解析技术,将层次关系队列结构应用于XML文档查询中,采用动态生成区间编码的方式,免除建立编码索引文件的步骤。实验结果表明... 针对传统XML文档小枝模式查询算法系统开销大的问题,提出一种XML数据流小枝模式查询算法。该算法结合SAX数据流解析技术,将层次关系队列结构应用于XML文档查询中,采用动态生成区间编码的方式,免除建立编码索引文件的步骤。实验结果表明,在对相关数据集进行查询时,该算法可减少I/O操作,缩短查询响应时间,提高查询效率。 展开更多
关键词 可扩展标记语言 小枝模式 区间编码 数据流 SAX解析
在线阅读 下载PDF
XML发布/订阅数据流系统基于共享的多查询连接算法 被引量:1
17
作者 李永锋 潘懋 《计算机应用》 CSCD 北大核心 2008年第12期3231-3234,共4页
XML的发布/订阅系统中的XML多查询连接,涉及到多个XML文件之间关系的订阅的处理,包括了对XPath路径模式的评测,对XML文档之间的比较计算以及对系统时间进行管理等方面。基于共享的连接算法,通过适当的组织,使得多个订阅之间相同的变量... XML的发布/订阅系统中的XML多查询连接,涉及到多个XML文件之间关系的订阅的处理,包括了对XPath路径模式的评测,对XML文档之间的比较计算以及对系统时间进行管理等方面。基于共享的连接算法,通过适当的组织,使得多个订阅之间相同的变量连接计算结果得以被重复利用,较大程度地减少了开销很大的连接计算,从而较大地提高系统效率。实验结果表明,基于共享的算法取得了良好的实际效果,能适合于百万以上订阅的场合。 展开更多
关键词 数据流 发布/订阅 xml连接
在线阅读 下载PDF
并行的XML数据流模式匹配算法
18
作者 陈冲 蒋夏军 张青平 《计算机科学与探索》 CSCD 北大核心 2015年第12期1439-1449,共11页
随着大数据时代的到来,大规模XML文件不断地涌现,其信息庞大,结构复杂,而传统的XML查询匹配技术需要大量的存储空间和预解析工作,不能有效解决XML大文件的匹配要求。针对这种现状,分析了现有经典匹配算法核心思想,并结合多线程并行相关... 随着大数据时代的到来,大规模XML文件不断地涌现,其信息庞大,结构复杂,而传统的XML查询匹配技术需要大量的存储空间和预解析工作,不能有效解决XML大文件的匹配要求。针对这种现状,分析了现有经典匹配算法核心思想,并结合多线程并行相关知识,提出了一种新的并行的XML数据流模式匹配算法,称为并行路径流算法(parallel path stream,PPS)。该算法在以流模式顺序解析XML文件的过程中,缓存以查询模式根元素为根节点的子树,以顺序链表存储节点的编码信息,在进行有效过滤后加入任务链表中,采用独特的匹配方法并行操作任务池中的各个顺序链表后得到匹配结果。实验表明,该算法能够明显减少存储空间,其过滤过程和并行操作能够有效减少匹配时间,并在查询路径长度方面具有一定优势。 展开更多
关键词 xml模式匹配 流数据处理 路径栈算法 多线程
在线阅读 下载PDF
XML数据流中的后兄弟查询算法
19
作者 汪万根 《计算机工程》 CAS CSCD 北大核心 2009年第8期107-109,共3页
针对在XML文档树模型中进行后兄弟节点查询时内存消耗大、匹配效率低等缺陷,提出一种基于XML数据流与栈的后兄弟查询算法。采用SAX解析器与结构连接方法,对XML文档中所有已知节点与后兄弟节点进行精确匹配并输出。结果表明,该算法具有... 针对在XML文档树模型中进行后兄弟节点查询时内存消耗大、匹配效率低等缺陷,提出一种基于XML数据流与栈的后兄弟查询算法。采用SAX解析器与结构连接方法,对XML文档中所有已知节点与后兄弟节点进行精确匹配并输出。结果表明,该算法具有适用范围广、占用系统资源少、匹配效率高等优势。 展开更多
关键词 SAX解析器 xml数据流 后兄弟
在线阅读 下载PDF
使用DTD优化XML数据流上的XPath查询
20
作者 王兰野 洪晓光 《计算机科学与探索》 CSCD 2010年第9期830-839,共10页
如何在XML数据流上高效地执行XPath查询,是XML数据流管理的关键问题。DTD结构信息对提高XML查询效率有很大帮助,已有的大部分算法没有利用这一资源。提出了一种使用DTD进行XML数据流查询处理的方法,具有以下特征:利用树自动机表示XPath... 如何在XML数据流上高效地执行XPath查询,是XML数据流管理的关键问题。DTD结构信息对提高XML查询效率有很大帮助,已有的大部分算法没有利用这一资源。提出了一种使用DTD进行XML数据流查询处理的方法,具有以下特征:利用树自动机表示XPath;通过XPath树自动机与DTD树匹配,预先标识不匹配查询结构的DTD节点;给出一种利用DTD的XML流索引方法DBXSI;执行查询时,根据流索引信息直接跳过某些与查询不匹配的节点及子树。实验结果表明:该方法可有效支持Xpath查询,效率优于传统算法。 展开更多
关键词 可扩展标示语言 数据流 路径查询语言 流索引 树自动机
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部