期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种基于共享前缀的两级索引结构 被引量:1
1
作者 喻波 赵国鸿 陈曙晖 《计算机工程与科学》 CSCD 北大核心 2010年第12期113-116,121,共5页
大多数倒排索引结构并未提出词汇表的组织形式,传统的基于Hash算法组织的词汇表存在大量碰撞的索引词。本文提出一种基于共享前缀的两级索引结构,通过对汉字、英文、数字进行统一编码,把具有相同首字的索引词映射到一级索引的相同位置;... 大多数倒排索引结构并未提出词汇表的组织形式,传统的基于Hash算法组织的词汇表存在大量碰撞的索引词。本文提出一种基于共享前缀的两级索引结构,通过对汉字、英文、数字进行统一编码,把具有相同首字的索引词映射到一级索引的相同位置;二级索引使用共享前缀树的结构组织索引词,既能通过二分查找快速定位索引文件存储块的位置,又能通过共享前缀的方式减少对相同字的存储,有效地减少了索引文件占用的存储空间。实验结果表明,该结构索引文件与源文档大小的压缩比达到0.59,与顺序索引和Hash索引相比,具有较高的时空效率。 展开更多
关键词 倒排结构 两级索引 共享前缀 平衡二叉树
在线阅读 下载PDF
实时地形绘制的两级瓦片四叉树索引 被引量:2
2
作者 陆筱霞 李思昆 《系统仿真学报》 CAS CSCD 北大核心 2012年第9期1976-1979,共4页
针对地形场景绘制的海量数据管理和实时性要求,提出一种两级瓦片四叉树索引方法:首先将地形数据在水平面上进行初级方格剖分,然后在每个初级方格面片上构建瓦片四叉树,分块数据被两级索引唯一标识。以此为基础,设计了自底向上的视点扩... 针对地形场景绘制的海量数据管理和实时性要求,提出一种两级瓦片四叉树索引方法:首先将地形数据在水平面上进行初级方格剖分,然后在每个初级方格面片上构建瓦片四叉树,分块数据被两级索引唯一标识。以此为基础,设计了自底向上的视点扩散绘制数据检索算法。实验结果表明,该索引能够大幅度减少辅助信息存储,并提高绘制检索的速度。 展开更多
关键词 两级索引 瓦片四叉树 自底向上 视点扩散
在线阅读 下载PDF
基于GE码的HDFS优化方案 被引量:7
3
作者 朱媛媛 王晓京 《计算机应用》 CSCD 北大核心 2013年第3期730-733,共4页
针对Hadoop分布式文件系统(HDFS)数据容灾效率和小文件问题,提出了基于纠删码的解决方案。该方案引用了新型纠删码(GE码)的编码和译码模块,对HDFS中的文件进行编码分片,生成很多个Slice并随机均匀的分配保存到集群中,代替原来HDFS系统... 针对Hadoop分布式文件系统(HDFS)数据容灾效率和小文件问题,提出了基于纠删码的解决方案。该方案引用了新型纠删码(GE码)的编码和译码模块,对HDFS中的文件进行编码分片,生成很多个Slice并随机均匀的分配保存到集群中,代替原来HDFS系统的多副本容灾策略。该方法中引入了Slice的新概念,将Slice进行分类合保存在block中并然后通过对Slice建立二级索引来解决小文件问题;该研究方法中抛弃了三备份机制,而是在集群出现节点失效的情况下,通过收集与失效文件相关的任意70%左右的Slice进行原始数据的恢复。通过相关的集群实验结果表明,该方法在容灾效率、小文件问题、存储成本以及安全性上对HDFS作了很大的优化。 展开更多
关键词 HADOOP分布式文件系统 纠删码 数据容灾 两级索引
在线阅读 下载PDF
一种监控系统的链路跟踪型日志数据的存储设计 被引量:16
4
作者 尤勇 汪浩 +2 位作者 任天 顾胜晖 孙佳林 《软件学报》 EI CSCD 北大核心 2021年第5期1302-1321,共20页
随着软件系统越来越复杂化和分布化,为系统提供具有完善功能的监控服务显得越来越重要.APM(application performance management)系统通过采集软件系统运行时的各项指标数据来分析软件的运行状态,例如CPU、内存使用率、垃圾回收的耗时、... 随着软件系统越来越复杂化和分布化,为系统提供具有完善功能的监控服务显得越来越重要.APM(application performance management)系统通过采集软件系统运行时的各项指标数据来分析软件的运行状态,例如CPU、内存使用率、垃圾回收的耗时、QPS等指标.此外,APM系统也会在软件运行中生成各种日志数据.通常来说,它能提供的监控数据分为3种:指标统计数据、链路跟踪(tracing)数据以及离散事件记录.这些数据有助于系统或者服务的维护人员理解运行状态,从而确保系统或者服务的稳定运行.基于开源的APM监控系统——CAT系统,提出了一种针对tracing类型数据的存储设计方案,通过内存块批量写入的方式提升存储效率,并设计了两级索引以提高查询效率.从线上的真实运行数据来看,该方案在写入性能和查询性能方面均有较好的表现. 展开更多
关键词 监控系统 日志存储 两级索引
在线阅读 下载PDF
混合存储区块链中的时空关键字查询
5
作者 姜吉宁 信俊昌 +1 位作者 郝琨 黄敏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第12期1696-1704,共9页
混合区块链通过链上-链下的存储模式来支持供应链中多方协同的数据可信共享.针对现有时空关键字查询方法预先读取全部链下数据并采用B+树作为索引所导致的效率低下问题,提出一种混合存储区块链中的时空关键字查询方法.首先,设计按属性... 混合区块链通过链上-链下的存储模式来支持供应链中多方协同的数据可信共享.针对现有时空关键字查询方法预先读取全部链下数据并采用B+树作为索引所导致的效率低下问题,提出一种混合存储区块链中的时空关键字查询方法.首先,设计按属性划分的区块链存储模型,并在区块内和区块间设计B~2M-BKM两级索引结构,支持关系型查询的同时高效检索区块数据;其次,设计链上-链下时空关键字查询方法,提升查询效率.最后,在公开数据集上进行实验,验证所提出方法的有效性. 展开更多
关键词 区块链 链上-链下混合存储 两级索引结构 时空关键字查询 kD-树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部