-
题名一种企业应用集成中的数据集成方案的研究与实现
被引量:1
- 1
-
-
作者
陈晨
缪嘉嘉
李爱平
吴泉源
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与科学》
CSCD
2006年第z2期90-92,96,共4页
-
基金
国家863计划资助项目(2004AA112020,2005AA112030)
武器装备预研基金项目(51415010304KG0175)
-
文摘
本文针对企业应用集成中数据集成模式的局限,提出了一种新型的基于构件和消息代理模式的数据集成方案.首先给出该数据集成方案的体系结构,然后对数据集成中的关键技术进行研究.本方案中的数据抽取、转换和加载部分都以构件的形式集成在系统中,使得数据的抽取、转换和加载可以独立、并行执行,加快了数据集成的效率;同时,在数据抽取过程当中运用消息代理模式,通过根据匹配元组的间隔自适应调整窗口大小,有效提高了快照差分算法的效率,并通过消息构件实现数据的可靠异步传输,增强了数据集成的灵活性.实验结果表明了本方案的有效性.
-
关键词
企业应用集成
数据集成
快照差分算法
消息代理模式
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名信息集成中数据获取关键技术的研究
- 2
-
-
作者
缪嘉嘉
李爱平
贾焰
吴泉源
-
机构
国防科学技术大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z3期452-457,共6页
-
基金
国家"八六三"高技术研究发展计划基金项目(2004AA112020,2005AA112030)
国家"九七三"重点基础研究发展规划基金项目(2005CB321804)
-
文摘
信息集成是消除信息孤岛,实现信息共享,为企业决策提供支持的核心技术,而数据获取过程是信息集成系统的基础.在数据同步更新研究中,通过根据失配元组的间隔自适应调整窗口大小,在不牺牲效率的前提下有效提高快照差分算法的查全率.进一步,在相似重复记录检测方法的研究中,结合一种新的字符串距离度量算法,并利用二次聚类,提出一种高效的基于条件概率分布的相似重复记录检测方法.最后通过实验对比测试,对快照差分算法以及相似重复记录检测算法的性能和效率进行分析,理论分析和实验结果均证明了提出的改进算法是非常有效的.
-
关键词
数据集成
快照差分算法
相似重复记录检测
概率后缀树
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-