题名 面向数据集成的一种高效一致性查询方法
被引量:3
1
作者
张晓刚
杨路明
潘久辉
机构
中南大学信息科学与工程学院
暨南大学计算机系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2014年第8期1474-1479,共6页
基金
国家自然科学基金(No.61003056)
广东省自然科学基金(No.S2012010008831)
广东省教育部产学研结合项目(No.2007B090400095)
文摘
一阶查询的SQL可表达性使得基于数据库修复的一阶查询重写方法在解决不一致数据库上的一致性查询问题上更具实际应用价值,但现有方法生成的一致性查询重写的执行效率不够理想.本文重点考虑在数据集成环境下如何有效地提高一致性查询的执行效率,同样针对合取查询类Cforest提出了基于OR-database集成模式的一致性查询重写算法ConsRewrite_OR.基于线性工作度量的查询代价分析以及Oracle 10g上的TPC-H模拟实验都充分地说明本文算法产生的一致性查询与Fuxman的查询重写相比在集成数据库上具有更好的执行效率.
关键词
一致性查询
完整性约束
修复
查询重写
不一致集成数据库
Keywords
consistent query answer ing
integrity constraints
repair
query rewriting
inconsistent integration database
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 数据集成环境下一种高效一致性聚集查询
被引量:2
2
作者
张晓刚
杨路明
潘久辉
机构
暨南大学计算机科学系
中南大学信息科学与工程学院
出处
《计算机学报》
EI
CSCD
北大核心
2014年第9期1936-1946,共11页
基金
国家自然科学基金(61402197)
广东省自然科学基金(S2012010008831)
广东省教育部产学研结合项目(2007B090400095)资助~~
文摘
对于不一致数据库上的一致性聚集查询问题,Fuxman扩展基于合取查询类C_(forest)的一阶查询重写方法并给出了查询重写算法RewriteCount和RewriteAgg来分别处理包含不同聚集函数的查询.算法产生的重写聚集查询能够使用SQL语句表达,但是其性能却不够理想.文中重点考虑在数据集成环境下如何有效地提高一致性聚集查询的整体性能,通过OR-database集成模式有效地隔离集成数据库的一致性部分和非一致新部分,并在此基础上同样针对合取查询类C_(forest)上的分组聚集查询提出了基于OR-database的一致性查询重写算法RewriteCount_OR(主要处理Count函数)和RewriteAgg_OR(主要处理Max,Min和Sum函数),后面的查询代价比较及模拟实验都表明:与Fuxman的一致性聚集查询方法相比,文中的一致性聚集查询方法在OR-database集成数据库上具有明显的性能优势.
关键词
一致性查询
聚集查询
完整性约束
修复
查询重写
不一致集成数据库
Keywords
consistent query answer ing
aggregate query
integrity constraints
repair
query rewriting
inconsistent integration database
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 不一致数据库上带信任标记的查询结果
被引量:2
3
作者
吴爱华
谈子敬
汪卫
机构
上海海事大学信息工程学院
复旦大学计算机科学技术学院
出处
《软件学报》
EI
CSCD
北大核心
2012年第5期1167-1182,共16页
基金
上海海事大学校基金(20110042)
文摘
不一致数据无法正确反映现实世界,其上的查询结果内含错误或矛盾,而现有的很多不一致数据查询处理相关研究都存在信息丢失的问题.AQA(annotation based query answer)针对这一问题采用信任标签在属性级别上区分一致和不一致数据,避免了信息丢失.但AQA假设记录在依赖左边属性上的分量可信,且只针对函数依赖一种约束,具有应用局限性.在综合约束(函数依赖、包含依赖和域约束)范围内、不确定属性任意的情况下扩展了AQA,重新审视了AQA的数据模型及其上的查询代数,讨论了任意约束在查询结果上的蕴含约束计算问题.实验结果表明,扩展后的AQA非连接类查询的性能和普通的SQL基本相同,连接查询经优化后性能接近普通SQL查询,但AQA不丢失信息,与部分同类研究相比有很大优势.
关键词
不确定数据
数据质量
一致的查询回答
完整性约束
数据清洗
Keywords
uncertain data
data quality
consistent query answer
integrity constraints
data cleaning
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 非一致性数据库关键词非聚集约束查询与性能分析
4
作者
刘波
雷刚跃
杨路明
邓云龙
机构
中南大学信息学院
湖南信息职业技术学院
中南大学湘雅三医院
出处
《计算机应用研究》
CSCD
北大核心
2007年第10期107-109,112,共4页
基金
中南大学大学生创新创业启航行动重点资助创新项目(ZB018)
文摘
在分析非一致性数据库一致性查询方法的基础上,结合非聚集约束条件,以关键词为元数据,利用B-树与二叉树的原理,提出一种新的针对非一致性数据库的查询方法。通过节点分组访问、分层迭代查询的方法,不仅解决非一致性数据库约束条件难写的问题,而且容易组合选择查询条件,有助于提高查询的灵活性与准确性。
关键词
非一致性数据库
完整性约束
修改
一致性查询
非聚集约束
Keywords
inconsistent database
integrity constraint( IC )
repair
consistent query answer (cqa)
nonaggregate constraints
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 非一致性关系数据管理研究综述
5
作者
谢东
伍锦群
陈新波
机构
湖南人文科技学院计算机科学技术系
中南大学信息科学与工程学院
娄底职业技术学院电子信息工程系
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第12期2631-2635,共5页
基金
湖南省教育厅优秀青年科研基金项目(08B040)资助
湖南省重点建设学科(计算机应用技术)项目资助
文摘
完整性约束有效地维护了数据的合法性和有效性,而越来越多的数据库应用依赖于多个独立的数据源,即使对于给定的约束,这些数据源分别是一致的,集成时就可能不一致.一致性查询应答(CQA)基于候选数据库语义,保持非一致性源数据不变,在查询时获取一致性信息.本文讨论了CQA的查询重写、概率方法、冲突图和逻辑编程等计算机制,并基于普通CQA语义进一步分析了聚集查询的范围语义;通过对CQA计算方法和聚集查询计算复杂性的比较,分析得到在实际中大部分查询是PTIME的;对于是单一函数依赖的一些聚集函数,CQA采用查询重写是PTIME的.此外总结了不同的应用领域下其他候选数据库语义,最后提出了需要进一步研究的问题.
关键词
关系数据库
非一致性关系数据
一致性查询应答
候选数据库
Keywords
relation database
inconsistent relational data
consistent query answer ing
candidate database
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于标记的不一致数据查询处理框架
6
作者
吴爱华
机构
上海海事大学信息工程学院
出处
《上海海事大学学报》
北大核心
2013年第1期84-89,共6页
基金
国家自然科学基金(61202022)
上海海事大学校基金(20110042)
文摘
为能在函数依赖范围内准确定位查询结果中的不一致数据,采用查询重写的方法建立基于标记的不一致数据查询处理框架.该框架是RDBMS与用户之间的一类中间件,以标记区分源数据和查询结果中的可信和不可信部分,可以避免信息丢失;能将任意传统SQL查询翻译成能返回带信任标记的查询结果的SQL查询集,由已有的RDBMS响应.该系统能够内嵌到现有数据库应用系统中,且用户无须掌握新查询语言.实验表明,该系统不仅在信息保存上与相关工作相比有很大优势,而且时间性能与传统查询相比相差无几.
关键词
不一致数据
数据质量
完整性约束
一致的查询回答
标记
Keywords
inconsistent data
data quality
integrity constraint
consistent query answer
annotation
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于空值修复的数据库一致性查询方法
被引量:1
7
作者
黄飞
刘杰
叶丹
机构
中国科学院软件研究所软件工程技术中心
中国科学院研究生院
中国科学技术大学计算机科学与技术系
出处
《计算机应用研究》
CSCD
北大核心
2009年第11期4146-4150,共5页
基金
国家"863"计划资助项目(2007AA01Z149
2007AA04Z148)
国家科技支撑计划基金资助项目(2006BAH02A08)
文摘
完整性约束常用来定义数据库的数据语义,违反约束的数据库实例为不一致数据库,返回含有不一致结果的查询称为不一致查询。一致性查询目的在于不修改数据库实例而从不一致数据库获取满足约束的查询结果,已有方法因其支持的约束类型有限或计算复杂度高而影响其应用范围。提出了一种基于空值修复的数据库一致性查询方法,首先将原始完整性约束转换为与查询相关的统一约束,然后根据统一约束对原SQL查询进行查询重写,重写后的查询将不一致属性值当做空值来处理以获得满足完整性约束的结果。系统实现与实验证明,该方法在多种完整性约束类型与SQL查询的组合情况下,可以获得高效稳定的性能。
关键词
一致性查询
完整性约束
结构查询语言查询重写
修复
数据库
Keywords
consistent query answer ing
integrity constraints
SQL query rewriting
repair
database
分类号
TP311
[自动化与计算机技术—计算机软件与理论]