期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
国内外大数据质量研究述评 被引量:41
1
作者 刘冰 庞琳 《情报学报》 CSSCI CSCD 北大核心 2019年第2期217-226,共10页
作为前沿性研究领域,大数据质量研究是大数据研究的核心内容之一,也是各界关注的焦点问题。本文以国内外大数据质量研究文献为对象,从基本内涵、质量管理、质量评价、应用实践等角度对相关研究进行梳理与综述,分析国内外相关研究进展。... 作为前沿性研究领域,大数据质量研究是大数据研究的核心内容之一,也是各界关注的焦点问题。本文以国内外大数据质量研究文献为对象,从基本内涵、质量管理、质量评价、应用实践等角度对相关研究进行梳理与综述,分析国内外相关研究进展。研究发现,大数据质量诸方面研究均是以大数据特征为基础,以大数据质量基本属性为核心,与其应用目标及适用情境相结合,形成有别于常规数据质量理论的、具有复杂性和多维度的理论体系。同时发现,大数据质量本质研究、与技术环境和人文环境相结合研究、基于宏观视角的国家层面和战略层面研究等将是大数据质量研究领域未来的研究趋势与研究重点。 展开更多
关键词 大数据质量 大数据质量评价 大数据质量管理 大数据质量应用
在线阅读 下载PDF
全景式大数据质量评估指标框架构建研究 被引量:7
2
作者 安小米 黄婕 +4 位作者 许济沧 王丽丽 洪学海 王志强 韩新伊 《管理科学学报》 CSSCI CSCD 北大核心 2023年第5期138-153,共16页
大数据质量评估工作是促进数字经济、数字社会、数字政府高质量发展的重要保障.本研究针对当前大数据质量评估指标缺少标准化文件来源和全景式评估的相关问题,梳理出大数据质量评估的多种应用场景,以综合集成方法论为指导提出由“人理-... 大数据质量评估工作是促进数字经济、数字社会、数字政府高质量发展的重要保障.本研究针对当前大数据质量评估指标缺少标准化文件来源和全景式评估的相关问题,梳理出大数据质量评估的多种应用场景,以综合集成方法论为指导提出由“人理-事理-数理-机理”(HBDA)构成的全景式大数据质量评估视角.采用内容分析和编码方法,以大数据质量相关标准化文件丰富指标来源的代表性文献,经过3名研究人员的两轮筛选,构建出由56个指标构成的全景式大数据质量评估指标框架.采用案例研究法,开展B市国际大数据交易所、B市城市管理综合行政执法局和B市大数据中心三个实践案例研究,有效验证了该框架的正确性和可用性.所提出的HBDA视角下全景式大数据质量评估指标框架,拓展了全景式PAGE框架在大数据质量评估多场景中的应用;创新了大数据质量评估多维标准化协同的路径;对整体提升数字经济、数字社会和数字政府建设中的大数据质量具有战略意义,对增强数字国家的数据治理能力、大数据驱动的管理与决策能力具有指导意义. 展开更多
关键词 大数据质量 评估指标 框架构建 全景式框架 HBDA视角
在线阅读 下载PDF
电机全生命周期质量大数据管控系统研究 被引量:2
3
作者 张兵 苗琪琪 +1 位作者 张株瑞 刘晓冰 《计算机应用与软件》 北大核心 2022年第11期57-65,共9页
为了将电机在需求、设计、加工、装配、检测、使用和维护环节的质量大数据集成,利用大数据分析技术充分挖掘质量知识,以提升电机制造质量和服务质量。以电机生命周期为主线,给出电机全生命周期质量大数据含义及特点,利用数据挖掘、机器... 为了将电机在需求、设计、加工、装配、检测、使用和维护环节的质量大数据集成,利用大数据分析技术充分挖掘质量知识,以提升电机制造质量和服务质量。以电机生命周期为主线,给出电机全生命周期质量大数据含义及特点,利用数据挖掘、机器学习等大数据技术方法,构建电机全生命周期质量大数据管控系统,详细设计电机质量需求与设计管控子系统、电机制造质量管控子系统、电机服役质量管控子系统和电机质量大数据应用中心。湘潭电机股份有限公司开发并运行该系统,实践表明,所构建的系统实现了电机质量控制的实时化、透明化、全面化和智能化。 展开更多
关键词 质量大数据 产品生命周期 管控系统 电机
在线阅读 下载PDF
基于关联数据的一致性和时效性清洗方法 被引量:42
4
作者 杜岳峰 申德荣 +2 位作者 聂铁铮 寇月 于戈 《计算机学报》 EI CSCD 北大核心 2017年第1期92-106,共15页
数据一致性和数据时效性是大数据质量管理所关注的两个重要内容.条件函数依赖(CFDs)和时效约束(CCs)分别是用于分析数据一致性和数据时效性的有效技术手段.现实生活中的数据会夹杂一些关于一致性和时效性的潜在错误,这些错误又无法为CFD... 数据一致性和数据时效性是大数据质量管理所关注的两个重要内容.条件函数依赖(CFDs)和时效约束(CCs)分别是用于分析数据一致性和数据时效性的有效技术手段.现实生活中的数据会夹杂一些关于一致性和时效性的潜在错误,这些错误又无法为CFDs和CCs检测和修复,最终影响数据的整体质量.值得一提的是,这些数据通常是相互关联的,这种关联关系可以用来发现数据中的潜在错误.文中使用了一种条件合并的函数依赖(CCFDs)将关联数据放在一起进行处理.基于此,该文提出了一种基于关联数据的一致性和时效性清洗方法.在数据清洗过程中,数据的检测和修复是两个相互影响的过程.所以,该文设计了一种新的自动清洗框架,迭代地进行数据检测和数据修复.其次,该文对关联数据的一致性和时效性清洗的相关问题进行了分析,并且证明了关于CCFDs和CCs的最小代价修复问题是一个Σ~p_2完全(NP^(NP))问题.进而,该文采用一种启发式的修复方法对错误进行修复.为了提高修复的准确性,该文还提出了一种修复序列图的概念.最后,通过在两组真实数据上进行实验,验证了方法的实用性和高效性. 展开更多
关键词 数据一致性 数据时效性 大数据质量 关联数据 数据清洗
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部