-
题名连续不确定XML的Top-k查询算法研究
- 1
-
-
作者
张晓琳
郑春红
刘立新
吕庆
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第3期1116-1120,共5页
-
基金
国家自然科学基金项目(61163015)
内蒙古自然科学基金重点项目(20080404Zd21)
-
文摘
为了解决连续不确定XML高效的top-k查询,提出CProTJFast算法。该算法基于P-文档模型,扩展PEDewey(probabilistic extended Dewey)编码支持连续分布类型节点的编码,采用路径概率下限值进行节点过滤,并针对连续概率密度函数制定过滤策略,从而在计算连续节点概率之前过滤掉不参与结果的节点。实验结果表明,采用连续节点过滤策略的CProTJFast算法有效地提高了连续不确定XML的top-k查询效率。
-
关键词
p-文档模型
扩展Dewey编码
连续不确定XML
TOp-K查询
过滤策略
-
Keywords
p-document model
extended Dewey coding
continuous probabilistic XML
top-k query
filtering strategy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名连续概率XML数据查询处理技术
被引量:1
- 2
-
-
作者
张晓琳
郑珍珍
刘立新
李玉峰
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2012年第12期134-139,共6页
-
基金
国家自然科学基金资助项目(61163015)
内蒙古自然科学基金重点项目(20080404Zd21)
-
文摘
目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p-文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p-文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及他们的参数;其次采用twig模式匹配找到符合用户要求的路径;然后根据要查询的连续分布类型确定概率查询应该使用符号表示法、积分法或直方图近似法:标准连续分布通过符号表示法中的参数或复杂的累积分布函数计算查询结果,满足积分条件的非标准连续分布采用积分法,其它情况采用直方图近似法。实验结果表明,该方法在概率查询的精确度以及响应时间上比现有方法更高效。
-
关键词
p-文档模型
概率XML
连续分布
查询处理
-
Keywords
p-document model
probabilistic XML
continuous distribution
query process
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-