期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
一种通用的多数据库间数据抽取方法及应用 被引量:16
1
作者 刘如九 张振山 柴天佑 《北京交通大学学报》 EI CAS CSCD 北大核心 2008年第4期14-18,共5页
为方便从多个异构的数据源中抽取转换数据、并加载到目标数据库,提出一种较为通用的抽取方法,并开发了工具软件.该方法基于客户端的方案,使用数据库驱动程序屏蔽异构数据库间的差异;数据的抽取、转换和加载由数据抽取软件执行;数据的抽... 为方便从多个异构的数据源中抽取转换数据、并加载到目标数据库,提出一种较为通用的抽取方法,并开发了工具软件.该方法基于客户端的方案,使用数据库驱动程序屏蔽异构数据库间的差异;数据的抽取、转换和加载由数据抽取软件执行;数据的抽取转换基于抽取规则,抽取规则采用可视化方法编辑生成;抽取规则存储于规则库,供多次调用修改;多个抽取任务组成抽取任务队列.开发的抽取工具软件DbBridge,支持从Oracle,SQL Server,SAS,Access,Excel等数据源抽取数据.软件成功应用于某数据仓库的建立及数据迁移工作. 展开更多
关键词 数据仓库 数据抽取转换 数据迁移 关系型数据
在线阅读 下载PDF
基于关键属性比对的增量数据抽取方法 被引量:4
2
作者 刘胜 杨岳湘 +1 位作者 邓劲生 李阳 《计算机工程与应用》 CSCD 2012年第4期115-117,共3页
概述了ETL目前常用的增量数据抽取方法,在全表比对方法基础上,提出了基于关键属性比对的增量数据提取方法,描述了关键属性提取算法,并建立其模型,用实验验证了基于关键属性比对的方法优于全表比对方法和全表删除插入方法。
关键词 关键属性 增量数据抽取 全表比对 提取转换(ETL)
在线阅读 下载PDF
ETL中的数据增量抽取机制研究 被引量:35
3
作者 戴浩 杨波 《计算机工程与设计》 CSCD 北大核心 2009年第23期5552-5555,共4页
为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4... 为实现数据仓库中数据的高效更新,探讨了在数据仓库的ETL(数据的抽取、转换和装载)子系统中进行数据增量抽取时所采用的常见机制,对这些机制的原理、条件、方法以及运行效率等方面进行了详细的阐述,并从兼容性、完备性、性能和侵入性4个方面分析和比较了各种数据增量抽取机制的优劣性。最后,总结了选取数据增量抽取机制所应遵循的主要原则和标准。 展开更多
关键词 数据抽取转换与 增量抽取 数据仓库 商业智能
在线阅读 下载PDF
基于数据仓库的刑事案件决策支持系统设计 被引量:3
4
作者 王春雨 王延章 +2 位作者 叶鑫 王雪华 王娜 《计算机工程与设计》 CSCD 北大核心 2010年第4期767-771,775,共6页
为了更有效地促进情报主导警务模式的推进,对刑事案件决策支持系统进行了研究与设计。首先分析了公安刑事案件决策支持系统的总体需求,并基于数据仓库技术设计了层次化的系统体系结构;然后提出了刑事案件数据仓库模型,并基于本体-规则... 为了更有效地促进情报主导警务模式的推进,对刑事案件决策支持系统进行了研究与设计。首先分析了公安刑事案件决策支持系统的总体需求,并基于数据仓库技术设计了层次化的系统体系结构;然后提出了刑事案件数据仓库模型,并基于本体-规则、元数据-功能提出了多源、异构数据的抽取、转换与加载的整合方法,设计了系统的功能体系;最后介绍了相关成果在大连市公安局的应用示例。实践结果表明,基于数据仓库的刑事案件决策支持系统可以为领导和一线干警提供有效的决策支持。 展开更多
关键词 刑事案件 数据仓库 决策支持系统 数据抽取、转换与加载 数据
在线阅读 下载PDF
基于元数据驱动的通用数据迁移工具 被引量:10
5
作者 任庆东 李天阳 +1 位作者 袁满 许翰文 《大庆石油学院学报》 CAS 北大核心 2011年第1期76-80,119-120,共5页
为解决企业数据模型升级需要在数据库间实现数据迁移的问题,创建基于元数据驱动的通用数据迁移工具,分析数据抽取、转换和加载体系结构,采用元数据驱动技术,结合企业数据迁移需求,定义数据迁移通用框架模型体系;处理映射模式的元数据表... 为解决企业数据模型升级需要在数据库间实现数据迁移的问题,创建基于元数据驱动的通用数据迁移工具,分析数据抽取、转换和加载体系结构,采用元数据驱动技术,结合企业数据迁移需求,定义数据迁移通用框架模型体系;处理映射模式的元数据表示,实现用元数据描述与存储映射模式.该方法实现用元数据驱动数据抽取、转换和加载引擎功能,技术与功能在中国石油数据中心大型数据迁移中应用,取得良好效果. 展开更多
关键词 数据迁移 数据驱动 数据抽取、转换体系 映射模式 数据映射
在线阅读 下载PDF
调度自动化系统增强型数据仓库平台构建及应用 被引量:11
6
作者 何晓峰 王钢 李海锋 《电力系统自动化》 EI CSCD 北大核心 2008年第4期81-84,102,共5页
数据仓库是信息管理和分析型应用的有效平台。文中针对目前数据仓库不能支持实时数据存储处理和短时战术决策的局限性,提出了一种调度自动化系统增强型数据仓库平台体系结构,主要由信息一体化节点、实时数据处理中心、主动数据仓库和系... 数据仓库是信息管理和分析型应用的有效平台。文中针对目前数据仓库不能支持实时数据存储处理和短时战术决策的局限性,提出了一种调度自动化系统增强型数据仓库平台体系结构,主要由信息一体化节点、实时数据处理中心、主动数据仓库和系统管理工具等构成,从而实现了数据抽取和转换能力、实时响应性能以及对突发事件捕获能力的增强。在已投入电网运行的自开发SCUT2008电网调度自动化系统中的应用与测试,证明了其性能的增强。 展开更多
关键词 调度自动化系统 数据仓库 抽取 转换(ETL) 实时数据 主动规则
在线阅读 下载PDF
商务智能在电网调度控制系统数据分析中的应用 被引量:12
7
作者 宋鑫 郭骏 +3 位作者 尹寿垚 张勇 张哲 王茂海 《电力系统自动化》 EI CSCD 北大核心 2015年第12期93-96 145,145,共5页
为了准确定位电网调度控制运行的异常信息,需要从电网调度控制系统的大量历史信息中获取关键信息,文中从商务智能(BI)的角度提出了海量数据统计分析的解决方案。首先阐述了BI的概念及在电网调度控制系统中推广应用困难的原因,接着介绍... 为了准确定位电网调度控制运行的异常信息,需要从电网调度控制系统的大量历史信息中获取关键信息,文中从商务智能(BI)的角度提出了海量数据统计分析的解决方案。首先阐述了BI的概念及在电网调度控制系统中推广应用困难的原因,接着介绍了BI整合到电网调度控制系统中所必备的核心软件模块,最后结合智能电网调度控制系统(简称"D5000系统")的调控业务,以实例展示如何将BI融合到D5000系统中。 展开更多
关键词 智能电网调度控制系统 商务智能 星形模型 抽取转换 DASHBOARD
在线阅读 下载PDF
数字化车间多源异构质量数据集成方案研究 被引量:7
8
作者 张培 黄智源 +3 位作者 陈琨 范营营 崔冰华 于艳鹏 《现代制造工程》 CSCD 北大核心 2015年第1期59-65,共7页
针对数字化制造中多源异构质量数据信息量大且缺乏统一、规范和标准化数据管理的问题,提出一种基于面向对象技术和基于映像的数据抽取、转换和加载(Extract-Transform-Load,ETL)技术的异构数据集成方案,该方案简单实用,具有很高的通用性... 针对数字化制造中多源异构质量数据信息量大且缺乏统一、规范和标准化数据管理的问题,提出一种基于面向对象技术和基于映像的数据抽取、转换和加载(Extract-Transform-Load,ETL)技术的异构数据集成方案,该方案简单实用,具有很高的通用性,可提高异构数据的提取精度,有效地解决多源异构质量数据集成问题。 展开更多
关键词 数字化制造 多源异构 面向对象技术 映像 数据抽取 转换(ETL) 数据集成
在线阅读 下载PDF
基于任务的数据交换平台 被引量:5
9
作者 贾燚星 陈梦东 刘连忠 《计算机工程》 CAS CSCD 北大核心 2008年第19期61-63,66,共4页
上下级单位以及同级单位之间的数据交换日渐频繁,这些单位采用的数据库多种多样,数据定义在语义、内容上存在冲突,需要交换的数据格式并不固定,随着业务的变化而变化。该文设计并实现了一个基于任务的数据交换系统,以端到端交换模型为基... 上下级单位以及同级单位之间的数据交换日渐频繁,这些单位采用的数据库多种多样,数据定义在语义、内容上存在冲突,需要交换的数据格式并不固定,随着业务的变化而变化。该文设计并实现了一个基于任务的数据交换系统,以端到端交换模型为基础,使其可以支持多种数据库之间数据交换和并发的数据交换任务,并通过配置满足交换内容变化的需求。 展开更多
关键词 数据交换 交换引擎 数据抽取 数据
在线阅读 下载PDF
面向ETL的数据起源追踪系统 被引量:1
10
作者 戴超凡 王涛 《计算机工程》 CAS CSCD 北大核心 2011年第17期256-258,261,共4页
提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行... 提出一种面向提取-转换-加载(ETL)过程的数据起源追踪系统,讨论实现的关键技术,包括转换分类、元数据设计、转换序列构建、追踪流程设计以及不同转换的追踪方法。系统将追踪所需的元数据设计在包文件结构中,在逆向追踪时抽取元数据进行相关处理,构建各个层次的转换起源信息图,从而实现数据起源的追踪。 展开更多
关键词 数据起源 起源管理系统 提取-转换- 同步/异步转换
在线阅读 下载PDF
基于SOA的国家级油气资源数据库ETL系统设计与实现
11
作者 李颖 凤丽洲 +2 位作者 贾字田 姜悦 公维学 《吉林大学学报(地球科学版)》 EI CAS CSCD 北大核心 2011年第S1期414-418,共5页
针对我国油气资源数据相对多源、异构、分散的现状,根据OLAP的实际需求,采用MVC模式作为系统架构模式,实现了国家油气资源数据库数据提取、转换和加载(ETL)系统。阐述了系统所采用的基于面向对象体系结构(SOA)的5层结构模型,使用ODBC和... 针对我国油气资源数据相对多源、异构、分散的现状,根据OLAP的实际需求,采用MVC模式作为系统架构模式,实现了国家油气资源数据库数据提取、转换和加载(ETL)系统。阐述了系统所采用的基于面向对象体系结构(SOA)的5层结构模型,使用ODBC和XML技术实现数据库连接的动态映射,应用Oracle DB解决了多媒体数据处理等关键问题。 展开更多
关键词 国家级油气资源数据 面向服务的体系结构 联机分析处理 数据提取、转换
在线阅读 下载PDF
面向城市基础设施智慧管养的大数据智能融合方法 被引量:7
12
作者 刘佳俊 喻钢 胡珉 《计算机应用》 CSCD 北大核心 2017年第10期2983-2990,2998,共9页
针对运维大数据维度高、形式多样化和变化迅速等特性,为提高数据融合效率以及平台的数据统计和决策分析性能,降低抽取-转换-加载(ETL)执行时间开销和数据中心负担,面向智慧管养需求提出一种多层次任务调度(MTS)ETL框架(MTS-ETL)。首先,... 针对运维大数据维度高、形式多样化和变化迅速等特性,为提高数据融合效率以及平台的数据统计和决策分析性能,降低抽取-转换-加载(ETL)执行时间开销和数据中心负担,面向智慧管养需求提出一种多层次任务调度(MTS)ETL框架(MTS-ETL)。首先,将数据仓库分为数据临时区、数据仓储区、数据分类区和数据分析区,并根据所分区域将完整的ETL过程划分为4个层次的ETL任务调度环节,同时设计了多频率ETL运行调度以及顺序和非顺序两种ETL工作模式;接着,基于MTS-ETL框架的非顺序工作模式进行数据融合的概念建模、逻辑建模和物理建模;最后,利用Pentaho Data Integration设计ETL转换模块和工作模块以实现数据融合方法。在交通流量数据融合实验中,该方法融合136 754条数据的时间仅为28.4 s;在千量级的数据融合实验中比传统ETL方法的总平均执行时间降低了6.51%;报表分析结果表明其在融合400万条数据时依然能保证ETL过程的可靠性。所提方法能够有效融合运维大数据,提高平台统计分析性能,并维持ETL执行时间开销在较低水平。 展开更多
关键词 数据 抽取-转换- 数据融合 数据仓库 城市基础设施管养
在线阅读 下载PDF
元数据驱动ETL的研究 被引量:5
13
作者 宿芳 寿永熙 苏依拉 《计算机工程与应用》 CSCD 2012年第6期114-118,125,共6页
对原始数据的提取、转换、加载(ETL)是数据仓库开发的重要步骤。一个稳定而可靠的ETL系统取决于它的总体设计。在原有ETL基础上,提出了元数据驱动ETL的思想,利用包引擎和SQL引擎以及相关算法,对传统ETL的方法进行改进,目的是提高ETL系... 对原始数据的提取、转换、加载(ETL)是数据仓库开发的重要步骤。一个稳定而可靠的ETL系统取决于它的总体设计。在原有ETL基础上,提出了元数据驱动ETL的思想,利用包引擎和SQL引擎以及相关算法,对传统ETL的方法进行改进,目的是提高ETL系统的稳定性和可靠性,使用户通过对元数据的维护来控制ETL的执行过程。 展开更多
关键词 抽取、转换(ETL) 数据仓库 数据 SQL引擎 包引擎
在线阅读 下载PDF
作战仿真数据集成框架研究及实现 被引量:4
14
作者 高华 张宏军 +1 位作者 陈刚 赵水宁 《火力与指挥控制》 CSCD 北大核心 2009年第2期150-153,共4页
作战仿真数据的集成与整合是我军数据工程建设项目的重要内容。以ETL及消息中间件(MOM)技术为基础,设计了一种基于消息中间件的抽取、转换、传输与加载(ETTL)的作战仿真数据集成框架,分析了系统结构模型及各模块相互关系,提出了一个可... 作战仿真数据的集成与整合是我军数据工程建设项目的重要内容。以ETL及消息中间件(MOM)技术为基础,设计了一种基于消息中间件的抽取、转换、传输与加载(ETTL)的作战仿真数据集成框架,分析了系统结构模型及各模块相互关系,提出了一个可行的数据集成解决方案。介绍了一个分布式数据集成系统平台的设计与实现,并结合一个数据集成实例详细阐述了该系统在我军军事演习中的应用。 展开更多
关键词 消息中间件 抽取 转换 传输
在线阅读 下载PDF
基于子模式的关系数据到图数据ETL方法研究 被引量:4
15
作者 丁强龙 王津 张学杰 《计算机工程与应用》 CSCD 北大核心 2017年第12期76-84,共9页
图数据库在解决多层关系查询、社区发现等问题时性能优于关系数据库。然而目前大量的数据以关系数据的形式存储,如何高效完整地进行关系数据到图数据的ETL,即抽取、转换、加载,是图数据库应用领域研究的重要问题。国内外对该问题有了一... 图数据库在解决多层关系查询、社区发现等问题时性能优于关系数据库。然而目前大量的数据以关系数据的形式存储,如何高效完整地进行关系数据到图数据的ETL,即抽取、转换、加载,是图数据库应用领域研究的重要问题。国内外对该问题有了一些研究,但存在转换后的图数据质量不高、转换效率低、转换结果不利于分布式存储等问题。因此,提出基于子模式的关系数据到图数据ETL方法,改进原有ETL方法的流程和算法。该方法将关系数据库模式拆分为若干个子模式,并行进行ETL。不仅提高了ETL的效率,转换结果能满足图数据的分布式存储要求,也可以作为Spark GraphX计算框架的基础数据。最后,使用Java EE和Neo4j开发了原型系统,并进行了实验验证。结果表明,改进后的ETL方法获得了较已有方法更好的转化性能。 展开更多
关键词 数据 分布式存储 ETL(数据提取、转换) 子模式
在线阅读 下载PDF
面向煤矿安全监控的数据仓库关键技术 被引量:16
16
作者 刘海强 陈晓晶 +1 位作者 张兴华 陈向飞 《工矿自动化》 北大核心 2022年第4期31-37,113,共8页
针对煤矿安全监控系统因采用操作型数据存储方法而导致无法有效利用海量数据,且数据分析能力较差等问题,研究了面向煤矿安全监控的数据仓库关键技术。根据煤矿安全监控业务需求,提出了煤矿安全监控数据仓库的功能结构,设计了超限分析、... 针对煤矿安全监控系统因采用操作型数据存储方法而导致无法有效利用海量数据,且数据分析能力较差等问题,研究了面向煤矿安全监控的数据仓库关键技术。根据煤矿安全监控业务需求,提出了煤矿安全监控数据仓库的功能结构,设计了超限分析、调校分析、异常数据分析、测点网络中断分析和人员管理分析五大业务主题。采用事实星座模型建立了煤矿安全监控数据仓库的逻辑模型,分主题设计了事实表和维度表,采用SQL Server建立了数据仓库物理模型。根据煤矿安全监控数据仓库特点,提出了数据抽取、转换和加载策略,采用不同的数据抽取规则分主题进行数据抽取,对不同来源的数据进行格式转换、清洗和排序,在数据加载过程中进行预加载、加载和加载后处理操作。 展开更多
关键词 煤矿安全监控 数据仓库 瓦斯超限分析 调校分析 异常数据分析 测点网络中断分析 人员管理分析 数据抽取、转换
在线阅读 下载PDF
ETL综述 被引量:23
17
作者 缪嘉嘉 邓苏 刘青宝 《计算机工程》 CAS CSCD 北大核心 2004年第3期4-5,21,共3页
阐述了ETL在创建数据仓库过程中的重要地位;分析了整个ETL流程,把它分为数据源验证、数据源改造、一般性变换、装载目标表和数据聚合5个阶段。最后分析了ETL产品现状、现有ETL产品的功能特点,以及今后ETL产品的发展趋势。
关键词 抽取转换 数据仓库 数据集成 数据
在线阅读 下载PDF
一种标准的ETL的设计思想及其实现 被引量:14
18
作者 程跟上 郑洪源 丁秋林 《计算机应用研究》 CSCD 北大核心 2005年第3期101-103,共3页
元数据在数据仓库系统中占据着十分重要的地位,其中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,可以说是ETL的指挥中心。提出了以CWM元数据模型标准为基础来开发标准的ETL的设计思想,并描述了具体的开发步骤。
关键词 ETL CWM 抽取数据 转换数据 数据
在线阅读 下载PDF
基于Pentaho的商业智能系统 被引量:16
19
作者 陈荣鑫 付永钢 陈维斌 《计算机工程与设计》 CSCD 北大核心 2008年第9期2407-2409,共3页
目前多数企业在构建自己的商业智能解决方案时还是寻求专业厂商的支持。这里把目光转向开源项目,提出在企业中利用Pentaho平台,构建商业智能系统这个新思路。阐述了构建基于Pentaho的商业智能系统的一些关键技术要点,内容包括流程设计,O... 目前多数企业在构建自己的商业智能解决方案时还是寻求专业厂商的支持。这里把目光转向开源项目,提出在企业中利用Pentaho平台,构建商业智能系统这个新思路。阐述了构建基于Pentaho的商业智能系统的一些关键技术要点,内容包括流程设计,OLAP设计,ETL设计和分析界面设计等方面,同时指出了该平台的广阔应用前景。 展开更多
关键词 商业智能 Pentaho平台 联机分析处理 抽取转换与 Web组件框架
在线阅读 下载PDF
通用ETL工具的研究与实现 被引量:10
20
作者 孙安健 王星 闫晓瑜 《计算机应用与软件》 CSCD 北大核心 2012年第12期175-178,210,共5页
ETL(Extraction-Transformation-Loading)是建立数据仓库的重要一环。通用应用ETL工具应能够适应不同领域不同需求的业务,无论是针对多样化异构的数据源,还是针对复杂变化的转换逻辑,都能够给予很好的支持。研究ETL工具的技术难点,提出... ETL(Extraction-Transformation-Loading)是建立数据仓库的重要一环。通用应用ETL工具应能够适应不同领域不同需求的业务,无论是针对多样化异构的数据源,还是针对复杂变化的转换逻辑,都能够给予很好的支持。研究ETL工具的技术难点,提出一种通用ETL工具的设计框架,并对每个模块做了详细分析,在所承担项目中给出了具体实现。 展开更多
关键词 数据仓库 数据抽取 数据转换 数据
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部