期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
TF&B索引:一种基于结构摘要思想的时态XML索引
1
作者 乔磊 石冰 赵林 《计算机研究与发展》 EI CSCD 北大核心 2007年第z3期402-407,共6页
如何在XML文档中表达时间相关的数据、跟踪历史信息和恢复文档在以前任意时刻的状态的问题,在最近的研究中受到不少的关注,许多文献提出了不同的模型.将这一类的问题归为索引时态XML文档的问题,采用的时态XML模型保存不同时刻结点之间... 如何在XML文档中表达时间相关的数据、跟踪历史信息和恢复文档在以前任意时刻的状态的问题,在最近的研究中受到不少的关注,许多文献提出了不同的模型.将这一类的问题归为索引时态XML文档的问题,采用的时态XML模型保存不同时刻结点之间的关联关系,并不保存某些时刻的快照,在此模型上提出了一种新的索引--TF&B索引,并针对不同类型的5种TXPath查询提出了在该索引下的算法.实验的证明,这个索引比之前针对时态模型提出的索引具有更好的性能. 展开更多
关键词 Tf&b索引 时态XML 基于磁盘的f&b索引 1-索引
在线阅读 下载PDF
SAJ:以最小化空间代价为目标的F&B索引构建算法 被引量:1
2
作者 刘显敏 李建中 +2 位作者 王宏志 刘雨洋 骆吉洲 《计算机研究与发展》 EI CSCD 北大核心 2006年第z3期413-417,共5页
F&B索引及其相关技术是XML结构化索引研究方面的热点问题.利用树模型XML文档特有的结构性质,以最小化空间代价为目标,提出了一种新的F&B索引创建算法.该算法以后根顺序遍历XML文档,通过合并节点构建F&B索引,避免了将整个文... F&B索引及其相关技术是XML结构化索引研究方面的热点问题.利用树模型XML文档特有的结构性质,以最小化空间代价为目标,提出了一种新的F&B索引创建算法.该算法以后根顺序遍历XML文档,通过合并节点构建F&B索引,避免了将整个文档读入内存,极大地减少了构建索引需要的空间.理论分析和实验结果表明,该算法在创建索引过程中拥有很好的时空性能,有利于F&B索引的广泛应用. 展开更多
关键词 XML f&b索引 创建算法 空间代价
在线阅读 下载PDF
基于F&B索引的XML查询处理算法 被引量:3
3
作者 王洪强 李建中 王宏志 《计算机研究与发展》 EI CSCD 北大核心 2010年第5期866-877,共12页
XML已成为信息交换和表示的标准.对XML数据的查询将返回满足特定约束的XML节点子集.对于大文件的XML数据的查询处理通常分为两步:1.为该XML数据建立一个索引;2.在索引上完成查询处理无需访问源文档.XML索引为查询处理提供了高效的帮助,... XML已成为信息交换和表示的标准.对XML数据的查询将返回满足特定约束的XML节点子集.对于大文件的XML数据的查询处理通常分为两步:1.为该XML数据建立一个索引;2.在索引上完成查询处理无需访问源文档.XML索引为查询处理提供了高效的帮助,其中F&B索引是已知的处理分枝查询最小的索引,但快速创建F&B索引和利用F&B索引完成查询处理的算法却很少有人研究.提出了一种素数序列标记法,这种标记法不仅有助于快速地建立F&B索引,更可以高效地完成F&B索引上的查询处理.此外,还给出了F&B索引上的区间标记法与CCPI的创建过程,这两种编码创建过程无需在建立F&B索引后二次创建,仅需与F&B索引创建过程一起对文档使用SAX解析器分析一次即可得到.这样,可以在F&B索引的区间标记法上使用TwigStack算法执行查询处理,在F&B索引的CCPI标记法上使用关联路径连接算法执行查询处理.还给出了基于素数序列标记法的查询处理算法,即素数整除匹配算法,该算法可以高效地判定某节点是否有某分枝子结构.实验表明基于素数序列标记法的F&B索引创建方法比SAM算法快,在多个数据集F&B索引上素数整除匹配算法优于关联路径连接算法和TwigStack算法. 展开更多
关键词 XML 索引 f&b索引 素数序列标记法 CCPI TwigStack
在线阅读 下载PDF
用于内存数据库的Hash索引的设计与实现 被引量:21
4
作者 袁培森 皮德常 《计算机工程》 CAS CSCD 北大核心 2007年第18期69-71,共3页
电信领域已成为数据密集型行业,需要高性能的数据库系统作为支撑系统,基于磁盘的数据库系统不能满足"实时"、"近实时"访问数据库的需求,将数据库核心数据驻留在内存中,可以使用内存数据库来满足需求。Hash索引是数... 电信领域已成为数据密集型行业,需要高性能的数据库系统作为支撑系统,基于磁盘的数据库系统不能满足"实时"、"近实时"访问数据库的需求,将数据库核心数据驻留在内存中,可以使用内存数据库来满足需求。Hash索引是数据库系统中广泛使用的索引技术之一,它能够快速地访问数据,易于设计和实现。该文根据内存数据库的特点,为电信网管系统的内存数据库设计并实现了Hash索引。 展开更多
关键词 内存数据库 Hash索引 磁盘数据库系统
在线阅读 下载PDF
TVDSM:支持透明计算的虚拟磁盘存储模型 被引量:1
5
作者 王斌 郝鹏飞 +1 位作者 吴加跃 胡义香 《计算机科学与探索》 CSCD 北大核心 2018年第3期350-359,共10页
为了解决在透明计算环境下,现有虚拟磁盘镜像存储存在多用户虚拟磁盘数据冗余过度的问题,基于写时重定向(redirect-on-write,ROW)思想设计了一种树状虚拟磁盘存储模型(tree virtual disk storage model,TVDSM)。该模型将虚拟磁盘中数据... 为了解决在透明计算环境下,现有虚拟磁盘镜像存储存在多用户虚拟磁盘数据冗余过度的问题,基于写时重定向(redirect-on-write,ROW)思想设计了一种树状虚拟磁盘存储模型(tree virtual disk storage model,TVDSM)。该模型将虚拟磁盘中数据资源按共享度划分成多个层级,不同终端用户共享位于上层的系统资源以及应用软件资源,只在底层存储自身改写的数据,从而减少了虚拟磁盘存储系统中的冗余数据。同时基于位图索引技术设计并实现了一种树状的虚拟磁盘存储结构,该结构不仅能够很好地支持虚拟磁盘存储模型,而且支持将写重定向和查询定位操作以不同粒度分开实现,使得系统能够在较小共享粒度下获得较高的数据查询效率。 展开更多
关键词 透明计算 虚拟磁盘镜像 写时重定向(ROW) 位图索引
在线阅读 下载PDF
相似索引:适用于重复数据删除的二级索引 被引量:1
6
作者 张志珂 蒋泽军 +1 位作者 蔡小斌 彭成章 《计算机应用研究》 CSCD 北大核心 2013年第12期3614-3617,共4页
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除率。为了改进EB,提出了相似索引。它把相似哈希作为文件的特征,是一种适用于以小文件为主的数据负载的重... 由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除率。为了改进EB,提出了相似索引。它把相似哈希作为文件的特征,是一种适用于以小文件为主的数据负载的重复数据删除的二级索引。实验结果表明,相似索引的重复数据删除率比EB高24.8%;相似索引的内存使用量仅仅是EB的0.265%。与EB相比,相似索引需要更少的存储使用量和内存使用量。 展开更多
关键词 重复数据删除 相似哈希 相似索引 块查找磁盘瓶颈问题 二级索引
在线阅读 下载PDF
基于索引的内存相似性连接算法
7
作者 董明秀 王鹏 +2 位作者 汪洋 李秋虹 汪卫 《计算机工程》 CAS CSCD 北大核心 2016年第1期18-24,30,共8页
在传统的相似性连接算法中,精确计算和分区阶段互相独立,精确计算时需要对每个分区中的所有数据进行两两比较,计算量较大。针对该问题,设计一种新的内存索引——距离树,并在其基础上提出两结构内存相似性连接算法。根据数据的潜在分布... 在传统的相似性连接算法中,精确计算和分区阶段互相独立,精确计算时需要对每个分区中的所有数据进行两两比较,计算量较大。针对该问题,设计一种新的内存索引——距离树,并在其基础上提出两结构内存相似性连接算法。根据数据的潜在分布将其分发到不同的分区中,保证具有一定相似度的数据对分配在同个或相邻的分区内,同时通过树节点之间的位置信息保存分区阶段的计算结果,使精确计算阶段仅需对每个分区中相邻的叶节点数据进行比较计算。实验结果表明,与TOUCH算法相比,基于距离树的算法可使运行速度提高2倍~3倍,并具有更好的可扩展性。 展开更多
关键词 相似性连接 磁盘 查询 内存 索引 分区
在线阅读 下载PDF
面向批量插入优化的并行存储引擎MTPower 被引量:5
8
作者 陈虎 唐海浩 +1 位作者 廖江苗 彭江峰 《计算机学报》 EI CSCD 北大核心 2010年第8期1492-1499,共8页
针对多核处理器的特点,文章提出了一个符合MySQL接口标准的并行存储引擎MTPower.该存储引擎着重利用多核处理器的并行计算能力提升批量插入过程中的索引产生过程,主要包含存储引擎接口、并行批量线性Hash索引、并行批量B+树插入、支持... 针对多核处理器的特点,文章提出了一个符合MySQL接口标准的并行存储引擎MTPower.该存储引擎着重利用多核处理器的并行计算能力提升批量插入过程中的索引产生过程,主要包含存储引擎接口、并行批量线性Hash索引、并行批量B+树插入、支持并行访问的磁盘存储缓冲等部分.测试结果表明,在批量插入记录且需要创建Hash和B+树索引时,MTPower的性能比经典的单线程存储引擎MyISAM最高可以提高6.1倍和4.8倍;在系统中线程总数略大于处理器核数时,MTPower可以达到最佳性能;在处理器核的数量增加时,MTPower的性能也能随之提高. 展开更多
关键词 并行数据库 Hash并行索引 B+树并行索引 磁盘缓冲 多核处理器
在线阅读 下载PDF
Linux下进程安全性解决方案 被引量:1
9
作者 钟声 邱钢 孙红兵 《计算机工程与设计》 CSCD 北大核心 2007年第5期1027-1028,1218,共3页
进程的安全性对操作系统的正常运行至关重要。Linux操作系统中现有的进程安全性检测工具不能对进程进行区分,同时不具有故障恢复功能。提出记录合法进程的相关信息、建立进程“指纹”数据库,实现进程安全性检查以及恢复的方案。当进程... 进程的安全性对操作系统的正常运行至关重要。Linux操作系统中现有的进程安全性检测工具不能对进程进行区分,同时不具有故障恢复功能。提出记录合法进程的相关信息、建立进程“指纹”数据库,实现进程安全性检查以及恢复的方案。当进程被恶意修改和删除后能及时发现和修复,从而切实地保证操作系统的安全。最后就该解决方案采用的安全措施对常见的攻击方法的抗攻击效果进行分析。 展开更多
关键词 进程 过载攻击 索引节点 磁盘镜像 日志 指纹
在线阅读 下载PDF
基于改进Sparse Indexing的多负载消冗方法
10
作者 王灿 秦志光 +1 位作者 杨磊 杨皓 《电子科技大学学报》 EI CAS CSCD 北大核心 2013年第5期734-739,共6页
针对现有的Sparse Indexing方法不能有效处理小文件备份负载的问题,提出了一种以Broder扩展定理为理论依据的最小特征采样算法,该算法可以对不同形式的备份负载进行有效的特征采样。在此算法的基础上,设计了一种多负载重复数据消除方法... 针对现有的Sparse Indexing方法不能有效处理小文件备份负载的问题,提出了一种以Broder扩展定理为理论依据的最小特征采样算法,该算法可以对不同形式的备份负载进行有效的特征采样。在此算法的基础上,设计了一种多负载重复数据消除方法,该方法通过对备份负载进行特征采样,仅在内存中维护完整索引的一个很小的子集,并通过批量读入分块标识符,摊销了磁盘访问开销,提高了吞吐量。实验结果表明,该方法对混合备份负载的压缩比是Sparse Indexing的2.04倍,而吞吐量与Sparse Indexing相当。该方法适用于需要处理多种形式备份负载的高性能重复数据消除系统。 展开更多
关键词 重复数据消除 磁盘瓶颈 最小特征采样 稀疏索引 吞吐量
在线阅读 下载PDF
基于重复数据删除的远程备份系统 被引量:1
11
作者 姜涛 刘晓洁 《计算机工程与设计》 CSCD 北大核心 2012年第12期4546-4550,共5页
针对传统远程备份中大量冗余数据导致备份效率低下和存储空间浪费的问题,设计并实现了一个基于重复数据删除的远程备份系统。首先根据文件的内容用Rabin指纹将备份文件划分为变长的数据块,把每个数据块的相关信息发送到备份中心,在备份... 针对传统远程备份中大量冗余数据导致备份效率低下和存储空间浪费的问题,设计并实现了一个基于重复数据删除的远程备份系统。首先根据文件的内容用Rabin指纹将备份文件划分为变长的数据块,把每个数据块的相关信息发送到备份中心,在备份中心利用Google Bigtable及Leveldb的索引算法辅以布隆过滤器对数据块进行判重,最后只传输和存储不重复的数据块。实验结果表明,采用该系统备份相似的数据集能够有效删除其中的重复数据。对数据集进行增量备份,在增量数据变化不大时,相比Rsync备份有更少的网络流量。 展开更多
关键词 重复数据删除 变长分块 磁盘索引 远程备份 数据容灾
在线阅读 下载PDF
大数据环境下Lucene性能优化方法研究 被引量:2
12
作者 马旸 蔡冰 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第3期260-265,共6页
为提高大数据环境下的数据查询分析效率,该文结合内存计算技术和批量更新技术提出一种优化倒排索引方法——内存磁盘索引(RFDirectory)。基于Lucene实现内存和磁盘相结合的倒排表管理技术。将新增数据写入缓存中,并周期性地写入磁盘索... 为提高大数据环境下的数据查询分析效率,该文结合内存计算技术和批量更新技术提出一种优化倒排索引方法——内存磁盘索引(RFDirectory)。基于Lucene实现内存和磁盘相结合的倒排表管理技术。将新增数据写入缓存中,并周期性地写入磁盘索引结构中,从而提升倒排索引的写入性能。通过整合磁盘和内存的多分块倒排结构,为用户提供高效的数据查询分析结果。实验结果表明:在大数据环境下,RFDirectory方法的索引构建时间缩短为磁盘索引(FSDirectory)、内存索引(RAMDirectory)方法索引构建时间的50%,返回1个关键字的检索结果耗时缩短了近15%。 展开更多
关键词 大数据 LUCENE 内存计算 批量更新 倒排索引 倒排表 缓存 内存索引 磁盘索引 多分块倒排结构
在线阅读 下载PDF
面向CDP系统的视图盘构建方法 被引量:2
13
作者 周娇 《信息安全研究》 2019年第2期157-161,共5页
在传统的块级持续数据保护(continuous data protection,CDP)系统中,过去某时间点的恢复任务一旦完成,被保护磁盘当前时刻的数据状态就被完全覆盖,必须将被保护磁盘再次恢复到最新数据状态,当前工作才能得以继续进行下去.针对传统CDP系... 在传统的块级持续数据保护(continuous data protection,CDP)系统中,过去某时间点的恢复任务一旦完成,被保护磁盘当前时刻的数据状态就被完全覆盖,必须将被保护磁盘再次恢复到最新数据状态,当前工作才能得以继续进行下去.针对传统CDP系统恢复功能"一次查看,两次恢复"的问题,提出了日志盘分区技术及一种元数据层次式多级索引技术.将元数据与变动数据分别存放在日志盘的不同区域,并利用B^+树与改进B^+树将元数据区块和变动数据区块组织起来,形成元数据层次式多级索引,将过去任意时间点的数据挂载到虚拟磁盘供用户检视.经实验证明,该方法在不影响被保护磁盘当前数据状态的前提下向用户提供过去任意时间点的数据,简化了用户操作,减少了时间消耗. 展开更多
关键词 持续数据保护 日志盘分区 元数据 B^+ 索引 虚拟磁盘
在线阅读 下载PDF
计算机与档案管理 第二讲 微型计算机的软、硬件介绍
14
作者 翟玉霞 《北京档案》 北大核心 1990年第5期42-45,共4页
自1983年计算机进入档案工作以来,全国档案部门的计算机总数已经有万台之多,其中微型计算机系统在数量上占了绝对优势。一、微型计算机的硬件徽型计算机系统(简称微机或PC机)的核心是计算机的主机,它的硬件除去电源系统以外,还包括进行... 自1983年计算机进入档案工作以来,全国档案部门的计算机总数已经有万台之多,其中微型计算机系统在数量上占了绝对优势。一、微型计算机的硬件徽型计算机系统(简称微机或PC机)的核心是计算机的主机,它的硬件除去电源系统以外,还包括进行数据管理、加工和传输的中央处理器(CPU)、 展开更多
关键词 硬件介绍 中央处理器 数据管理 电源系统 数据库文件 磁盘空间 索引文件 档案工作 档案管理 存贮空间
在线阅读 下载PDF
大型数据库INFORMIX的分区设计技术
15
作者 黄砚玲 韩旭里 +2 位作者 陈雄飞 郁可 刘爱萍 《山东建材学院学报》 1998年第4期362-365,共4页
简述了大型关系数据库INFORMIX的分区设计技术原理及其实现方法,介绍进行分区的两种方式。提出了在DSS环境和OLTP环境的实际应用中如何选用这两种方式的观点。
关键词 磁盘阵列 扇出率 稠密索引 分区设计技术 数据库
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部