-
题名HDVM:基于关系矩阵的关联数据压缩查询模型
被引量:3
- 1
-
-
作者
符海东
彭燊
黄莉
顾进广
-
机构
武汉科技大学
智能信息处理与实时工业系统湖北省重点实验室
国家新闻广电出版总局富媒体数字出版内容组织与知识服务重点实验室
湖北语言与智能信息处理研究基地(武汉大学)
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2018年第3期721-729,共9页
-
基金
国家自然科学基金(No.61673304,No.61272110)
国家社会科学基金重大计划(No.11&ZD189)
软件工程国家重点实验室(武汉大学)开放基金(No.SKLSE2012-09-07)
-
文摘
随着大数据时代的到来,大量的RDF数据充斥着整个数据网络.RDF(Resource Description Framework)后台引擎管理巨大的数据集时,数据集索引不能全部加载到内存中,导致系统需要执行缓慢的磁盘访问来解决SPARQL查询.本文提出了一种HDVM(Header Dictionary Vector Matrix)压缩查询模型,通过在关联数据集中提取潜在的三元组关系矩阵,以主语向量、谓语向量和宾语矩阵的模型序列化存储来减少关联数据重复出现的次数,允许SPARQL查询在压缩状态下全内存执行.实验结果表明,本文提出的模型比常用的HDT(Header-Dictionary Triples)压缩方式提高了3%~20%的压缩率,同时在三元组个数达到十亿级别的数据集上平均查询时间在400ms左右.
-
关键词
关系矩阵
关联数据
查询
压缩
-
Keywords
relation matrix
linked-data
query
compression
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名科学文献中参考文献影响力评估方法研究
被引量:1
- 2
-
-
作者
张瑜
顾进广
张铭晖
张俊
-
机构
武汉科技大学计算机科学与技术学院
智能信息处理与实时工业系统湖北省重点实验室
国家新闻广电出版总局富媒体数字出版内容组织与知识服务重点实验室
深圳证券信息有限公司
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第10期2176-2179,共4页
-
基金
国家自然科学基金项目(61272110
61602351)资助
+1 种基金
国家社会科学基金重大计划项目(11&ZD189)资助
深圳市技术攻关项目(JSGG20160229121006579)资助
-
文摘
从科技文献的若干参考文献中寻找到一篇对其最具影响力的参考文献对研究人员获取科技文献的研究目的和研究思路是十分有益的.基于文献引用关系分析科学文献与其参考文献之间的相似性和统计特征,对参考文献进行评估;使用具有人工标记训练集的分类器,通过考虑文献的相关特征从参考文献中区分出非常重要的参考文献;使用ArnetMiner和Libra下载的会议文献和期刊文献及作者信息进行了测试实验,测试结果表明,本文对参考文献影响力的评估方法效果良好.
-
关键词
科学文献
参考文献
影响力评估
逻辑回归模型
-
Keywords
scientific literature
references
influence evaluation
logistic model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-