-
题名HDVM:基于关系矩阵的关联数据压缩查询模型
被引量:3
- 1
-
-
作者
符海东
彭燊
黄莉
顾进广
-
机构
武汉科技大学
智能信息处理与实时工业系统湖北省重点实验室
国家新闻广电出版总局富媒体数字出版内容组织与知识服务重点实验室
湖北语言与智能信息处理研究基地(武汉大学)
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2018年第3期721-729,共9页
-
基金
国家自然科学基金(No.61673304,No.61272110)
国家社会科学基金重大计划(No.11&ZD189)
软件工程国家重点实验室(武汉大学)开放基金(No.SKLSE2012-09-07)
-
文摘
随着大数据时代的到来,大量的RDF数据充斥着整个数据网络.RDF(Resource Description Framework)后台引擎管理巨大的数据集时,数据集索引不能全部加载到内存中,导致系统需要执行缓慢的磁盘访问来解决SPARQL查询.本文提出了一种HDVM(Header Dictionary Vector Matrix)压缩查询模型,通过在关联数据集中提取潜在的三元组关系矩阵,以主语向量、谓语向量和宾语矩阵的模型序列化存储来减少关联数据重复出现的次数,允许SPARQL查询在压缩状态下全内存执行.实验结果表明,本文提出的模型比常用的HDT(Header-Dictionary Triples)压缩方式提高了3%~20%的压缩率,同时在三元组个数达到十亿级别的数据集上平均查询时间在400ms左右.
-
关键词
关系矩阵
关联数据
查询
压缩
-
Keywords
relation matrix
linked-data
query
compression
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-