作为XML(extensible markup language)数据查询的核心操作,树模式查询的应用前景广泛,其研究具有重要意义。针对扩展的树模式GTP++(generalized tree pattern)提出了一种树模式描述语言XTPL(XML tree pattern language),采用指称语义方...作为XML(extensible markup language)数据查询的核心操作,树模式查询的应用前景广泛,其研究具有重要意义。针对扩展的树模式GTP++(generalized tree pattern)提出了一种树模式描述语言XTPL(XML tree pattern language),采用指称语义方式给出其完整的语义描述,使得形式化方法可以用于分析树模式查询的行为特征,有助于验证XML查询的正确性,以及提高查询处理方法的可靠性和鲁棒性。同时以路径表达式为例,以指称语义的方式给出了从路径表达式提取树模式的算法。展开更多
针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查...针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查询处理算法TDCOL(top-down SLCA computation based oncol-umn storage)来提升系统的处理性能。对于给定查询Q={k1,k2,...,km}的每个公共祖先结点,TDCOL在保证仅处理一次的情况下即可得到所有满足条件的结果,因而将时间复杂度降为O(m′|LID1|′lb|Skmaxch(v)|),其中|LID1|是Q的最短倒排表中包含的不同ID值的数目,Skmaxch(v)是所有被处理结点的包含关键字的孩子结点集中的最大集合。最后通过比较各种指标,从不同角度对TDCOL算法的性能优势进行了验证。展开更多
文摘作为XML(extensible markup language)数据查询的核心操作,树模式查询的应用前景广泛,其研究具有重要意义。针对扩展的树模式GTP++(generalized tree pattern)提出了一种树模式描述语言XTPL(XML tree pattern language),采用指称语义方式给出其完整的语义描述,使得形式化方法可以用于分析树模式查询的行为特征,有助于验证XML查询的正确性,以及提高查询处理方法的可靠性和鲁棒性。同时以路径表达式为例,以指称语义的方式给出了从路径表达式提取树模式的算法。
文摘针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查询处理算法TDCOL(top-down SLCA computation based oncol-umn storage)来提升系统的处理性能。对于给定查询Q={k1,k2,...,km}的每个公共祖先结点,TDCOL在保证仅处理一次的情况下即可得到所有满足条件的结果,因而将时间复杂度降为O(m′|LID1|′lb|Skmaxch(v)|),其中|LID1|是Q的最短倒排表中包含的不同ID值的数目,Skmaxch(v)是所有被处理结点的包含关键字的孩子结点集中的最大集合。最后通过比较各种指标,从不同角度对TDCOL算法的性能优势进行了验证。