-
题名基于森林自动机处理XML流数据方法
被引量:1
- 1
-
-
作者
何志学
廖湖声
-
机构
北华航天工业学院计算机与遥感信息技术学院
北京工业大学计算机学院
-
出处
《计算机工程与设计》
北大核心
2018年第10期3092-3099,共8页
-
基金
国家自然科学基金青年基金项目(61202074)
北京市自然科学基金项目(4122011)
+1 种基金
河北省教育厅青年基金项目(QN2016248)
河北省科技计划基金项目(15210126)
-
文摘
针对流数据在线实时到达,顺序性一次访问及处理时效性高、缓存量小的需求,提出一种基于森林自动机处理XPath查询的方法。定义XPath查询到森林自动机实例的转换规则;采用栈结构和抽象语法树相结合的方式,不断接收流数据结点,驱动自动机的运行,完成结点匹配和状态转换动作;在抽象语法树中维护各状态函数之间的关系及中间结果,归约过程中获得查询结果随即输出。实验结果验证了该方法处理流数据的有效性,在标准测试数据集下,与同类方法和引擎相比,在处理效率上有近30%的提高,内存占接近于常量,较好解决了时空复杂度平衡问题,为其它方法提供了有益的参考。
-
关键词
流数据
森林自动机
查询处理
XPATH查询
XML数据
-
Keywords
streaming data
forest transducer
query processing
XPath query
XML data
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-