-
题名数据转换过程的串行化方法
被引量:6
- 1
-
-
作者
方幼林
杨冬青
唐世渭
张卫华
余利波
付强
-
机构
北京大学计算机科学与技术系
北京大学视觉与听觉处理国家重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第17期4-6,187,共4页
-
基金
国家973重点基础研究发展规则(编号:G1999032705)
-
文摘
随着数据仓库和数据集成的发展,数据清洗的工作越来越多,用户在进行数据清洗时需要对数据的内容进行多次处理。在设计清洗的建模过程中,用户可能对同一个数据进行多次的清洗和转换处理,由于步骤多,用户往往不知道清洗和转换步骤出现错误。该文对前述问题进行论述,并针对这种清洗和转换处理中的赋值冲突和范围冲突提出解决方法。
-
关键词
数据转换
数据清洗
建模处理
-
Keywords
data tr ansformation,data cleaning,transformation modeling
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于业务规则的数据处理技术
被引量:1
- 2
-
-
作者
余晓平
刘丽娅
肖婧
-
机构
石河子大学计算机科学与技术学院
-
出处
《石河子大学学报(自然科学版)》
CAS
2009年第1期130-132,共3页
-
文摘
以整合银行数据为例,提出了数据处理的二级架构形式。指出数据处理的概念模型设计、数据源分析和数据抽取转换的方法策略。以目标数据为依据,针对数据源中存在的冗余数据和语义冲突数据、不完整数据和错误数据以及格式或定义不一致的数据分别给出清洗的业务规则,使用SQL Server的DTS工具予以实现并上线使用。
-
关键词
业务规则
概念模型
实例整合
数据抽取-清洗-转换
-
Keywords
business rules
concept model
instance integration
data extraction-cleaning-transformation
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名基于数据清洗和知识迁移的变压器故障诊断模型
被引量:17
- 3
-
-
作者
白浩
王昱力
-
机构
南方电网科学研究院有限责任公司
中国电力科学研究院武汉分院
-
出处
《电工电能新技术》
CSCD
北大核心
2020年第1期28-35,共8页
-
基金
南方电网科技项目(ZBKJXM20180220)
-
文摘
变压器是保障电网安全运行的重要基础,本文建立了一种基于数据清洗和知识迁移的变压器故障诊断模型,用于解决变压器单体故障数据少、总体数据繁杂导致诊断器泛化能力低的问题。首先,采用Tanimoto系数计算待诊断变压器与其他变压器故障的综合相似度,对辅助故障数据进行一次清洗;其次,通过剔除奇异边缘附近故障数据,对目标和辅助故障数据进行二次清洗;在两次数据清洗的基础上,以支持向量机作为迁移学习算法TrAdaBoost的基本分类算法,通过迭代不断调整目标故障数据和辅助故障数据的权重,将辅助故障数据中的有效知识迁移至故障诊断器,得到基于迁移学习的变压器故障诊断器模型。测试结果表明数据清洗和知识迁移能够有效提高诊断效率以及故障识别的准确性。
-
关键词
变压器
故障诊断模型
知识迁移
数据清洗
trAdaBoost算法
-
Keywords
transformer
fault diagnosis model
transfer learning
data cleaning
trAdaBoost algorithm
-
分类号
TM76
[电气工程—电力系统及自动化]
-