期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于分布式索引和目录聚合的海量小文件存储研究 被引量:5
1
作者 马灿 孟丹 熊劲 《高技术通讯》 CAS CSCD 北大核心 2012年第10期1035-1040,共6页
针对海量小文件访问问题的挑战,提出了用基于分布式索引和目录聚合的分布式文件系统——超虚拟文件系统(HVFS)来管理数十亿个小文件的方法,以支持高并发、高吞吐、低延迟的访问。重点讨论了目录索引、目录存储问题,提出了利用可扩... 针对海量小文件访问问题的挑战,提出了用基于分布式索引和目录聚合的分布式文件系统——超虚拟文件系统(HVFS)来管理数十亿个小文件的方法,以支持高并发、高吞吐、低延迟的访问。重点讨论了目录索引、目录存储问题,提出了利用可扩展哈希索引来降低延迟、提高扩展性,利用日志结构和列存储的目录聚合来提高吞吐率的方法。测试结果表明,HVFS的存储性能能够线性扩展,82节点上峰值创建速度接近百万每秒,与GIGA+相比有200%以上的提升,小文件I/O性能与OrangeFS相比有60倍以上的提升,充分验证了分布式索引和目录聚合方法的有效性。 展开更多
关键词 小文件 海量存储 分布式索引 目录聚合 分布式文件系统
在线阅读 下载PDF
搜索引擎中混合型分布式索引组织策略 被引量:1
2
作者 陈伟 刘康苗 +2 位作者 卜佳俊 陈纯 张利军 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第8期1361-1366,共6页
针对搜索引擎中索引组织策略在查询性能和可扩展性等方面存在的问题,提出了一种混合型分布式索引组织策略(Loc-Glob).该策略整合了局部和全局索引组织的基本思路,首先将搜索引擎系统的索引服务器从逻辑上分为若干个索引服务器池,索引数... 针对搜索引擎中索引组织策略在查询性能和可扩展性等方面存在的问题,提出了一种混合型分布式索引组织策略(Loc-Glob).该策略整合了局部和全局索引组织的基本思路,首先将搜索引擎系统的索引服务器从逻辑上分为若干个索引服务器池,索引数据先以局部(或全局)索引组织策略分配到索引服务器池上.然后,在索引服务器池的内部,索引继续以全局(或局部)索引组织的方式存储到各索引服务器上.混合型的索引组织策略较局部和全局索引组织策略具有更好的可扩展性.实验结果表明,该策略较全局索引组织策略在查询性能、负载均衡方面都有所提升,与局部索引组织策略的查询性能基本相当,并具备较高的负载均衡水平. 展开更多
关键词 索引 倒排索引 分布式索引组织 查询性能 负载均衡
在线阅读 下载PDF
JXTA的共享资源分布式索引SRDI
3
作者 刘班 《数字技术与应用》 2016年第9期235-235,共1页
通过对共享资源分布式索引(SRDI)服务的支持,JXSE为JXTA网络中查询请求的传播提供了一个高效的机制。集合节点维护了一个由边缘节点发布的广告的索引。当边缘节点发布了一个新广告,该节点就会使用SRDI服务,将新广告的索引保存到集合节... 通过对共享资源分布式索引(SRDI)服务的支持,JXSE为JXTA网络中查询请求的传播提供了一个高效的机制。集合节点维护了一个由边缘节点发布的广告的索引。当边缘节点发布了一个新广告,该节点就会使用SRDI服务,将新广告的索引保存到集合节点中。通过这种集合-边缘节点的层次体系,查询只在集合节点之间传播,从而在很大程度上减少了搜索一个广告所涉及的节点数目。JXTA网络的操作依赖于其解析分布式查询的能力。JXTA使用了一种称为共享资源分布式索引(SRDI)的分布式算法,以创建并维护网络中资源的一个总体索引。论述了SRDI的工作原理和简单应用实例。 展开更多
关键词 JXTA SRDI 共享资源分布式索引
在线阅读 下载PDF
基于hadoop和hbase的分布式索引集群研究 被引量:4
4
作者 万轶 向广利 《信息技术与信息化》 2015年第1期102-103,共2页
随着互联网的发展,搜索引擎要处理的数据量越来越大,为提高信息检索效率,避免传统索引的创建和维护效率不高的情况,设计了一种基于Hadoop分布式索引集群和Hbase分布式查询数据库的解决方案。利用Hadoop的分布式计算和存储框架,采用分布... 随着互联网的发展,搜索引擎要处理的数据量越来越大,为提高信息检索效率,避免传统索引的创建和维护效率不高的情况,设计了一种基于Hadoop分布式索引集群和Hbase分布式查询数据库的解决方案。利用Hadoop的分布式计算和存储框架,采用分布式倒排索引算法,分词并建立索引表,最后存储到Hbase中。通过实验证明了基于Hadoop的分布式索引集群在数据处理方面的优势。 展开更多
关键词 分布式索引 HADOOP 倒排索引 分词 HBASE
在线阅读 下载PDF
探讨集群环境下分布式索引的实现 被引量:2
5
作者 张家叶子 《中国新通信》 2018年第20期38-38,共1页
随着计算机技术的飞速发展,数据的规模越来越大,查询也趋于复杂。针对分布式存储系统上使用非主键访问数据带来的性能问题,探讨在分布式存储系统上实现索引的相关关键技术。在充分分析分布式存储特征的基础上,提出了分布式索引设计和实... 随着计算机技术的飞速发展,数据的规模越来越大,查询也趋于复杂。针对分布式存储系统上使用非主键访问数据带来的性能问题,探讨在分布式存储系统上实现索引的相关关键技术。在充分分析分布式存储特征的基础上,提出了分布式索引设计和实现的关键点,并结合分布式存储系统的特点及相关的索引技术,讨论了索引的组织形式、索引的维护和数据一致性等问题。实验结果表明,虽然辅助索引会对系统性能产生影响,但因为充分考虑了系统特征及存储特点,在不同数据规模下,该索引都能够将性能影响控制在5%以内。另外,使用冗余列的方式,能进一步将该索引的性能提升100%。 展开更多
关键词 集群环境 分布式索引 实现
在线阅读 下载PDF
分布式空间数据索引机制研究 被引量:5
6
作者 陈占龙 吴信才 +1 位作者 谢忠 吴亮 《微电子学与计算机》 CSCD 北大核心 2007年第10期54-57,共4页
在分析各种空间数据索引的基础上,研究利用分布式并行技术建立网络环境下海量空间数据的大规模索引机制的关键技术。对经典的R-树进行了改进,基于R-和散列hash表,提出了一种分布式环境下面向海量空间数据的分布式索引树结构DR-H,此索引... 在分析各种空间数据索引的基础上,研究利用分布式并行技术建立网络环境下海量空间数据的大规模索引机制的关键技术。对经典的R-树进行了改进,基于R-和散列hash表,提出了一种分布式环境下面向海量空间数据的分布式索引树结构DR-H,此索引树结构充分利用了R-树的范围查询和散列hash表的高效单key查询。经模拟实验结果表明,该分布式索引机制结构能够有效提高分布式网络环境下海量空间数据的检索性能。 展开更多
关键词 空间数据索引 分布式索引 R-树 散列hash表
在线阅读 下载PDF
基于Hadoop的分布式搜索引擎关键技术 被引量:15
7
作者 王俊生 施运梅 张仰森 《北京信息科技大学学报(自然科学版)》 2011年第4期53-56,61,共5页
实现了基于Hadoop的分布式搜索引擎,着重讨论了实现分布式搜索引擎涉及的3个关键性技术:索引表的建立、分词的处理和索引前的预处理。通过实验对比了集中式搜索引擎和分布式搜索引擎,结果表明了基于hadoop的分布式搜索引擎在处理数据方... 实现了基于Hadoop的分布式搜索引擎,着重讨论了实现分布式搜索引擎涉及的3个关键性技术:索引表的建立、分词的处理和索引前的预处理。通过实验对比了集中式搜索引擎和分布式搜索引擎,结果表明了基于hadoop的分布式搜索引擎在处理数据方面强劲的优势。 展开更多
关键词 HADOOP 分布式索引 MAP/REDUCE 索引 分词
在线阅读 下载PDF
基于Zookeeper分布式搜索引擎系统的配置文件自动更新方法、装置及系统 被引量:1
8
作者 陆小慧 刘勇 《广东通信技术》 2015年第5期18-24,共7页
文章研究并提供了一种基于zookeeper分布式搜索引擎系统的配置文件自动更新方法。通过自动检测master节点内是否形成了新的配置文件,并在检测到形成了新的配置文件后主动上传到zookeeper,并下发到各slave节点加载到内存中用于搜索任务... 文章研究并提供了一种基于zookeeper分布式搜索引擎系统的配置文件自动更新方法。通过自动检测master节点内是否形成了新的配置文件,并在检测到形成了新的配置文件后主动上传到zookeeper,并下发到各slave节点加载到内存中用于搜索任务的处理。无需管理人员在发现master节点形成了新的配置文件之后,重启master节点才将新的配置文件上传,显然降低了master节点与slave节点间配置文件同步的繁琐性,提高了设备的智能性,降低了同步成本。 展开更多
关键词 分布式索引擎系统 配置更新 zookeeper
在线阅读 下载PDF
基于Nutch和Hadoop的分布式搜索引擎探究 被引量:1
9
作者 李伟 《信息通信》 2012年第5期120-121,共2页
分析Apache开源框架Nutch和Hadoop的系统结构,利用Nutch和Hadoop设计高效、可靠、可扩展的分布式搜索引擎,来解决搜索引擎对海量数据的处理和存储问题。
关键词 NUTCH HADOOP 分布式索引
在线阅读 下载PDF
基于图形复杂度的空间矢量数据划分和索引技术
10
作者 冯霞 《科学技术创新》 2024年第24期136-139,共4页
矢量空间数据的划分存在计算性能及跨区域的问题。基于空间位置的划分虽可满足空间索引和快速查询的需求,但难以实现并行空间分析的计算负载均衡。本文提出了一种基于图形复杂度的空间矢量数据划分和索引技术,该技术基于图形复杂度,结合... 矢量空间数据的划分存在计算性能及跨区域的问题。基于空间位置的划分虽可满足空间索引和快速查询的需求,但难以实现并行空间分析的计算负载均衡。本文提出了一种基于图形复杂度的空间矢量数据划分和索引技术,该技术基于图形复杂度,结合Hilbert空间填充曲线进行矢量数据划分,并采用R树建立分布式索引,不仅提升了数据访问速度,还解决了数据倾斜导致的计算失衡问题,为矢量空间计算任务的负载均衡提供了更优支持。 展开更多
关键词 矢量数据 HILBERT曲线 分布式索引 图形复杂度
在线阅读 下载PDF
DPHI-Tree:一种新型的并行高维主存索引树
11
作者 郑炜 张科 曹俊 《西北工业大学学报》 EI CAS CSCD 北大核心 2009年第4期436-442,共7页
随着主存技术的发展,系统级分布式主存多媒体数据库存储规模不断扩大,查询越来越复杂,分布式并行索引以其高性能而逐渐成为解决此类复杂查询问题的有效手段。文章提出一种新的适合于分布式并行索引的树结构——DPHI-Tree。该索引树以B... 随着主存技术的发展,系统级分布式主存多媒体数据库存储规模不断扩大,查询越来越复杂,分布式并行索引以其高性能而逐渐成为解决此类复杂查询问题的有效手段。文章提出一种新的适合于分布式并行索引的树结构——DPHI-Tree。该索引树以B树为基础,利用PCA降维技术,将树的各层节点采用不同的维度表示,提高了缓存空间的利用率,降低了CPU负载。另外,采用标识根到节点路径的二进制编码来对节点索引,在查询数据量急剧增加时,PHI-Tree对基于树的数据随机访问具有良好性能。 展开更多
关键词 信息索引 组件原理分析 分布式高维索引 主存访问
在线阅读 下载PDF
基于WordNet的因素空间算法在搜索引擎中的应用
12
作者 郑文良 关世杰 +1 位作者 尹安琪 刘旭东 《沈阳理工大学学报》 CAS 2020年第3期49-53,共5页
为提高搜索引擎语义检索的准确性,基于P2P技术的分布式搜索引擎架构基础上,在应用层Search Pocket模块引入基于WordNet语义关系的因素空间展开与收拢算法。测试取得了比较理想的效果。结果表明,该算法增强了语义的相关性,大幅提高了检... 为提高搜索引擎语义检索的准确性,基于P2P技术的分布式搜索引擎架构基础上,在应用层Search Pocket模块引入基于WordNet语义关系的因素空间展开与收拢算法。测试取得了比较理想的效果。结果表明,该算法增强了语义的相关性,大幅提高了检索的准确性。 展开更多
关键词 分布式索引 因素空间 WORDNET
在线阅读 下载PDF
云环境下基于MKd-Tree的大规模图数据索引技术
13
作者 雷婷 《电讯技术》 北大核心 2013年第7期909-916,共8页
由于高维属性和海量数据所带来的影响,数据管理需要相当高的计算负载,传统的集中索引技术已经变得不切实际。为满足数据的快速增长、海量和高维特性的要求,实现了一个高层次的分布式树形索引结构框架MRC-Tree。基于MRC-Tree框架基础上,... 由于高维属性和海量数据所带来的影响,数据管理需要相当高的计算负载,传统的集中索引技术已经变得不切实际。为满足数据的快速增长、海量和高维特性的要求,实现了一个高层次的分布式树形索引结构框架MRC-Tree。基于MRC-Tree框架基础上,提出了两种MKd-Tree索引结构构建方法,即OMKd-Tree和MMKd-Tree。理论分析和实验结果表明,基于MRC-Tree框架的MKd-Tree索引结构构建方法具有良好的可扩展性和较高的检索效率。 展开更多
关键词 高维数据库 图数据 索引结构 分布式树形索引结构框架 Map—Reduce框架 MKd-Tree
在线阅读 下载PDF
基于Solr的异构资源集成检索框架设计与实现 被引量:3
14
作者 马凤娟 吴鹏飞 《现代情报》 CSSCI 2012年第8期133-135,共3页
针对高校图书馆异构资源集成检索需要,在介绍企业级开源搜索平台Solr分面检索、分布式索引等特色功能基础上,采用基于DC元数据标准的中介器、封装器整合机制,设计了基于Solr的分布异构资源集成整合框架,实现了分布式DC封装器和中介器,... 针对高校图书馆异构资源集成检索需要,在介绍企业级开源搜索平台Solr分面检索、分布式索引等特色功能基础上,采用基于DC元数据标准的中介器、封装器整合机制,设计了基于Solr的分布异构资源集成整合框架,实现了分布式DC封装器和中介器,从开源软件视角为高校图书馆分布异构数字资源的整合集成提供了解决方案。 展开更多
关键词 异构资源 SOLR 高校图书馆 整合 分布式索引 集成检索
在线阅读 下载PDF
面向期刊论文的搜索技术的研究与设计 被引量:5
15
作者 郭峰 韩云凤 《信息技术》 2018年第8期59-65,共7页
为了解决期刊论文的大量存储、PDF文本解析、无法快速准确搜索等问题,文章首先使用HDFS分布式系统存储大量期刊论文,其次采用PDF抽取技术将非纯文本格式的PDF期刊转换为纯文本格式,然后分析比较主流中文分词器,最后采用倒排索引、分布... 为了解决期刊论文的大量存储、PDF文本解析、无法快速准确搜索等问题,文章首先使用HDFS分布式系统存储大量期刊论文,其次采用PDF抽取技术将非纯文本格式的PDF期刊转换为纯文本格式,然后分析比较主流中文分词器,最后采用倒排索引、分布式索引和优化相关度排序算法等,分析并设计了一个面向期刊论文的搜索引擎。实验结果表明,本文有效的解决大量论文的存储和访问,缩短建立索引时间,提高了搜索结果的准确性。 展开更多
关键词 HDFS 信息抽取 倒排索引 分布式索引 相关度排序算法
在线阅读 下载PDF
SDHT: Efficient One-Hop DHT Lookup Framework for P2P Live Streaming 被引量:2
16
作者 Chen Zhuo Feng Gang +1 位作者 Zhou Yang Lu Yi 《China Communications》 SCIE CSCD 2012年第8期88-104,共17页
Video data location plays a key role for Peer-to-Peer (P2P) live streaming applications. In this paper, we propose a new one-hop Distributed Hash Table (DHT) lookup frarrework called Strearre ing-DHT (SDHT) to p... Video data location plays a key role for Peer-to-Peer (P2P) live streaming applications. In this paper, we propose a new one-hop Distributed Hash Table (DHT) lookup frarrework called Strearre ing-DHT (SDHT) to provide efficient video data location service. By adopting an enhanced events dissemination mechanism-EDRA+, the accuracy of routing table at peers can be guaranteed. More importantly, in order to enhance the perforlmnce of video data lookup operation without incurring extra overhead, we design a so-called Distributed Index Mapping and Management Mechanism (DIMM) for SDHT. Both analytical modeling and intensive simulation experiments are conducted to demonstrate the effectiveness of SDHT framework. Numerical results show that almost 90% requested video data can be retrieved within one second in SDHT based systems, and SDHT needs only 26% average bandwidth consumption when compared with similar one-hop DHT solutions such as D1HT. This indicates that SDHT framework is an appropriate data lookup solution for time-sensitive network applications such as P2P live streaming. 展开更多
关键词 PEER-TO-PEER distributed hash table streaming application live streaming EDRA
在线阅读 下载PDF
HQ-Tree: A Distributed Spatial Index Based on Hadoop 被引量:5
17
作者 FENG Jun TANG Zhixian WEI Mian XU Liming 《China Communications》 SCIE CSCD 2014年第7期128-141,共14页
In this paper,we propose a novel spatial data index based on Hadoop:HQ-Tree.In HQ-Tree,we use PR QuadTrec to solve the problem of poor efficiency in parallel processing,which is caused by data insertion order and spac... In this paper,we propose a novel spatial data index based on Hadoop:HQ-Tree.In HQ-Tree,we use PR QuadTrec to solve the problem of poor efficiency in parallel processing,which is caused by data insertion order and space overlapping.For the problem that HDFS cannot support random write,we propose an updating mechanism,called "Copy Write",to support the index update.Additionally,HQ-Tree employs a two-level index caching mechanism to reduce the cost of network transferring and I/O operations.Finally,we develop MapReduce-based algorithms,which are able to significantly enhance the efficiency of index creation and query.Experimental results demonstrate the effectiveness of our methods. 展开更多
关键词 spatial index QUADTREE HADOOP MAPREDUCE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部