作为XML(extensible markup language)数据查询的核心操作,树模式查询的应用前景广泛,其研究具有重要意义。针对扩展的树模式GTP++(generalized tree pattern)提出了一种树模式描述语言XTPL(XML tree pattern language),采用指称语义方...作为XML(extensible markup language)数据查询的核心操作,树模式查询的应用前景广泛,其研究具有重要意义。针对扩展的树模式GTP++(generalized tree pattern)提出了一种树模式描述语言XTPL(XML tree pattern language),采用指称语义方式给出其完整的语义描述,使得形式化方法可以用于分析树模式查询的行为特征,有助于验证XML查询的正确性,以及提高查询处理方法的可靠性和鲁棒性。同时以路径表达式为例,以指称语义的方式给出了从路径表达式提取树模式的算法。展开更多
针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查...针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查询处理算法TDCOL(top-down SLCA computation based oncol-umn storage)来提升系统的处理性能。对于给定查询Q={k1,k2,...,km}的每个公共祖先结点,TDCOL在保证仅处理一次的情况下即可得到所有满足条件的结果,因而将时间复杂度降为O(m′|LID1|′lb|Skmaxch(v)|),其中|LID1|是Q的最短倒排表中包含的不同ID值的数目,Skmaxch(v)是所有被处理结点的包含关键字的孩子结点集中的最大集合。最后通过比较各种指标,从不同角度对TDCOL算法的性能优势进行了验证。展开更多
XML is a promising technology developed in recent years. Due to its superiority in extensibility and flexibility,XML has become the language over the internet. With more and more XML documents produced,the problem exi...XML is a promising technology developed in recent years. Due to its superiority in extensibility and flexibility,XML has become the language over the internet. With more and more XML documents produced,the problem exists to transform them to other documents of various structures. This paper discusses and compares four methods to transform XML documents,then introduces XSLT,a W3C recommendation, by giving examples and outlining a project in brief.展开更多
文摘作为XML(extensible markup language)数据查询的核心操作,树模式查询的应用前景广泛,其研究具有重要意义。针对扩展的树模式GTP++(generalized tree pattern)提出了一种树模式描述语言XTPL(XML tree pattern language),采用指称语义方式给出其完整的语义描述,使得形式化方法可以用于分析树模式查询的行为特征,有助于验证XML查询的正确性,以及提高查询处理方法的可靠性和鲁棒性。同时以路径表达式为例,以指称语义的方式给出了从路径表达式提取树模式的算法。
文摘针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查询处理算法TDCOL(top-down SLCA computation based oncol-umn storage)来提升系统的处理性能。对于给定查询Q={k1,k2,...,km}的每个公共祖先结点,TDCOL在保证仅处理一次的情况下即可得到所有满足条件的结果,因而将时间复杂度降为O(m′|LID1|′lb|Skmaxch(v)|),其中|LID1|是Q的最短倒排表中包含的不同ID值的数目,Skmaxch(v)是所有被处理结点的包含关键字的孩子结点集中的最大集合。最后通过比较各种指标,从不同角度对TDCOL算法的性能优势进行了验证。
文摘XML is a promising technology developed in recent years. Due to its superiority in extensibility and flexibility,XML has become the language over the internet. With more and more XML documents produced,the problem exists to transform them to other documents of various structures. This paper discusses and compares four methods to transform XML documents,then introduces XSLT,a W3C recommendation, by giving examples and outlining a project in brief.