期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于动态空间划分和压缩布隆过滤器相结合的分布式元数据负载均衡算法 被引量:2
1
作者 薛梅婷 俞万刚 +3 位作者 张纪林 曾艳 袁俊峰 周丽 《计算机工程与科学》 CSCD 北大核心 2024年第8期1381-1389,共9页
分布式元数据管理系统利用多个元数据服务器对大量元数据进行存储和管理。该系统将海量元数据通过不同的映射策略分配到不同的元数据服务器上,减少单台元数据服务器所处理的数据量,从而减少磁盘访问次数,进而提高整个元数据管理系统的... 分布式元数据管理系统利用多个元数据服务器对大量元数据进行存储和管理。该系统将海量元数据通过不同的映射策略分配到不同的元数据服务器上,减少单台元数据服务器所处理的数据量,从而减少磁盘访问次数,进而提高整个元数据管理系统的性能。元数据管理系统通常会使用哈希函数将元数据键映射到不同的元数据服务器中。然而,当数据特征值相似时,由于散列函数的单向性,会导致数据分布不均衡的问题,造成元数据服务器性能下降。为解决上述问题,提出了一种动态空间划分和压缩布隆过滤器相结合的元数据负载均衡算法,该算法首先构建一个哈希桶来组织元数据键,通过哈希算法将元数据键映射到不同的哈希桶中;在映射过程中,根据元数据服务器的负载情况动态调整目标哈希桶,并在上述哈希桶中有序地保存元数据键的映射信息。当访问元数据时,首先通过压缩布隆过滤器对元数据键进行预处理,然后通过二分查找在指定的哈希桶中进行元数据映射信息的查找。与近年来提出的元数据管理算法相比,所提算法在映射键发生倾斜时仍能保证元数据服务器负载均衡,并通过对比实验表明,所提算法相比最优的元数据管理算法,在内存占用仅提升2%的条件下,获得了20%的搜索性能提升。 展开更多
关键词 分布数据管理 负载均衡算法 一致性哈希 压缩布隆过滤器
在线阅读 下载PDF
BWMMS元数据分布信息缓存管理
2
作者 杨德志 许鲁 张建刚 《计算机科学》 CSCD 北大核心 2007年第10期143-145,158,共4页
BWMMS是BWFS的分布式文件系统元数据服务子系统。它充分利用系统访问负载的动态性和局部性特征,通过简单的集中决策机制管理元数据请求负载在多个元数据服务器的分布。为降低集中决策点可能的瓶颈限制,集中决策点位于元数据请求处理路... BWMMS是BWFS的分布式文件系统元数据服务子系统。它充分利用系统访问负载的动态性和局部性特征,通过简单的集中决策机制管理元数据请求负载在多个元数据服务器的分布。为降低集中决策点可能的瓶颈限制,集中决策点位于元数据请求处理路径的末端。本文介绍各个元数据服务器上用采降低时后端集中决策点的压力,提高元数据访问效率的元数据分布信息缓存,并通过测试数据评估缓存命中率时后端集中决策点和元数据访问效率的影响。 展开更多
关键词 分布式文件系统数据服务 数据分布信息管理 缓存有效性
在线阅读 下载PDF
SMDFS分布式海量小文件系统的大空间聚合存储技术 被引量:4
3
作者 严巍巍 何连跃 +1 位作者 李三霞 成颖佼 《计算机研究与发展》 EI CSCD 北大核心 2015年第S2期29-34,共6页
海量小文件聚合存储技术大多以目录或逻辑目录为单位,将小文件聚合为实际存储的大文件并建立小文件的元数据信息,实现小文件的快速访问.传统小文件聚合存储技术读写操作性能受目录结构的影响差别较大.在现有研究成果的基础上,分析不同... 海量小文件聚合存储技术大多以目录或逻辑目录为单位,将小文件聚合为实际存储的大文件并建立小文件的元数据信息,实现小文件的快速访问.传统小文件聚合存储技术读写操作性能受目录结构的影响差别较大.在现有研究成果的基础上,分析不同目录结构聚合空间的特征,提出大空间聚合存储技术和元数据分裂技术,为不同目录结构的海量小文件存储提供通用的解决方法,并基于开源分布式文件系统HDFS实现了一个分布式海量小文件系统SMDFS.测试表明,大空间聚合技术能有效支持不同目录结构的海量小文件数据,相较于SMDFS早期版本,小文件数据装载和访问性能均有很大程度的提高. 展开更多
关键词 海量小文件系统 HDFS 聚合存储 数据分裂 分布数据管理
在线阅读 下载PDF
修正Gibbs采样的有限混合模型无监督学习算法 被引量:3
4
作者 刘伟峰 韩崇昭 石勇 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第2期15-19,共5页
针对传统有限混合模型无监督学习算法不能处理参数维数变化的问题,提出了一种基于修正Gibbs采样的无监督学习算法.该算法的关键是,在每一次完全采样之后引入分布元的合并和剔除技术,即将利用均值、协方差矩阵差值的2范数作为合并的判断... 针对传统有限混合模型无监督学习算法不能处理参数维数变化的问题,提出了一种基于修正Gibbs采样的无监督学习算法.该算法的关键是,在每一次完全采样之后引入分布元的合并和剔除技术,即将利用均值、协方差矩阵差值的2范数作为合并的判断准则,最小且小于阈值的分布元权重作为剔除规则.仿真实验表明,所提算法对于参数初值的选择是不敏感的,对于分布元个数的先验信息要求得更少,它不仅可以处理维数变化问题,而且不必计算跳变概率,同时能够很好地估计出分布元个数及其参数. 展开更多
关键词 无监督学习 有限混合模型 参数维数变化 跳变 分布元管理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部