-
题名面向开放大数据环境的动态数据保护系统
被引量:7
- 1
-
-
作者
屠要峰
牛家浩
王德政
高洪
徐进
洪科
阳方
-
机构
移动网络和移动多媒体技术国家重点实验室(中兴通讯股份有限公司)
中兴通讯股份有限公司
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第3期1213-1235,共23页
-
基金
国家重点研发计划(2021YFB3101100)。
-
文摘
大数据成为国家基础性战略资源,数据的开放共享是我国大数据战略的核心.云原生技术和湖仓一体架构正在重构大数据基础设施,并推动数据共享和价值传播.大数据产业和技术的发展都需要更强的数据安全和数据共享能力.然而,开放环境下数据的安全问题已成为制约大数据技术发展与利用的瓶颈.无论开源大数据生态还是商业大数据系统,所引发的数据安全及隐私保护问题都日益凸显.开放大数据环境下的动态数据保护系统面临着数据可用性、处理高效性和系统可扩展性等方面的挑战.提出了面向开放大数据环境的动态数据保护系统BDMasker,通过一种基于查询依赖模型(querydependencymodel)的精准查询分析及查询改写技术,能够精准感知但不改变原始业务请求,实现动态脱敏全过程对业务零影响;通过面向多引擎的统一安全策略框架,实现了动态数据保护能力的纵向扩展和在多种计算引擎中的横向扩展;利用大数据执行引擎的分布式计算能力,提升系统的数据保护处理性能.实验结果表明, BDMasker提出的精准SQL分析及改写技术是有效的,系统具有良好的扩展能力和性能表现,在TPC-DS和YCSB基准测试中,整体性能波动在3%之内.
-
关键词
大数据
数据脱敏
动态数据脱敏
SQL改写
查询依赖
-
Keywords
big data
data masking
dynamic data masking
SQL rewriting
query dependency
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-