期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
混合云中面向多目标的工作流数据放置策略 被引量:1
1
作者 林兵 汪昕隆 +2 位作者 苏明辉 郑裕恒 卢宇 《计算机集成制造系统》 北大核心 2025年第1期219-234,共16页
针对混合云环境下工业软件工作流的数据放置问题,如何在保证数据安全的前提下平衡用户和服务提供商的利益,综合考虑数据的传输时延,工业软件工作流执行代价以及数据中心间的负载是一个重要的挑战。为此,提出一种安全等级分级机制,并设... 针对混合云环境下工业软件工作流的数据放置问题,如何在保证数据安全的前提下平衡用户和服务提供商的利益,综合考虑数据的传输时延,工业软件工作流执行代价以及数据中心间的负载是一个重要的挑战。为此,提出一种安全等级分级机制,并设计出一种基于改进的多目标优化进化算法(IO-MOEA)的数据放置策略。该策略在传统非支配排序遗传算法(NSGA-II)中对选择算子进行自适应改进,提高了算法的收敛性和种群的多样性,之后结合熵权法和理想解相似性排序偏好技术(TOPSIS)法,客观评估Pareto最优解集中解的优劣,从而找到最佳方案。实验结果表明,所提算法能够有效降低工业软件工作流传输时间和执行代价,同时兼顾数据中心间的负载均衡。相比于改进前的算法,改进后的IO-MOEA算法在超平面指标上提高了约3%~19%,在空间指标上改善了11%~21%。 展开更多
关键词 云计算 工业软件工作流 多目标优化 数据放置 负载均衡
在线阅读 下载PDF
混合内存架构下数据放置研究综述
2
作者 林炳辉 张建勋 乔欣雨 《计算机应用研究》 CSCD 北大核心 2024年第9期2585-2591,共7页
当前基于DRAM和NVM的混合内存系统在系统结构领域的研究前景广阔,特别是对混合内存系统进行数据放置的研究已经成为国内外研究的热点。对混合内存架构下数据放置策略进行了研究,在介绍当前常见混合内存架构的基础上,对现有数据放置策略... 当前基于DRAM和NVM的混合内存系统在系统结构领域的研究前景广阔,特别是对混合内存系统进行数据放置的研究已经成为国内外研究的热点。对混合内存架构下数据放置策略进行了研究,在介绍当前常见混合内存架构的基础上,对现有数据放置策略的设计思路进行了全面分析,主要涉及硬件/软件机制、内存访问特征、静态/动态分析、机器智能、触发方式和粒度选择等方面,并针对混合内存性能、功耗和耐久性的数据放置优化进行总结。综合分析发现,现有的混合内存数据放置策略在内存架构、数据迁移、计算成本和全局优化等方面还存在局限性,未来在架构设计以及内存管理方面的改进还有很大的研究探索空间和发展前景。 展开更多
关键词 混合内存 数据放置 非易失性存储器 研究综述
在线阅读 下载PDF
云环境下优化科学工作流执行性能的两阶段数据放置与任务调度策略 被引量:65
3
作者 刘少伟 孔令梅 +3 位作者 任开军 宋君强 邓科峰 冷洪泽 《计算机学报》 EI CSCD 北大核心 2011年第11期2121-2130,共10页
云环境中跨数据中心科学工作流的高效执行通常面临数据交互量大的问题.文中给出基于相关度的两阶段高效数据放置策略和任务调度策略:即在工作流建立阶段根据数据依赖关系图把关系紧密型数据集尽可能放置到同一数据中心;而后任务调度策... 云环境中跨数据中心科学工作流的高效执行通常面临数据交互量大的问题.文中给出基于相关度的两阶段高效数据放置策略和任务调度策略:即在工作流建立阶段根据数据依赖关系图把关系紧密型数据集尽可能放置到同一数据中心;而后任务调度策略在运行阶段将任务调度到数据依赖最大的数据中心执行,并将新产生数据集放置到相关度最高的数据中心.实验表明,该策略能有效减少跨数据中心科学工作流执行时的数据传输量,从而能有效提升科学工作流的执行效率,并能减少资源的租赁费用. 展开更多
关键词 云计算 科学工作流 数据放置 数据相关 任务调度
在线阅读 下载PDF
云计算中的数据放置与任务调度算法 被引量:22
4
作者 王强 李雄飞 王婧 《计算机研究与发展》 EI CSCD 北大核心 2014年第11期2416-2426,共11页
在海量数据的云计算中,通常面临着数据传输时间长的问题.针对目前大多数数据放置与任务调度算法存在的副本静态性和传输标准精确度的不足,提出了一种动态调整副本个数、以时间作为衡量数据传输标准的数据放置与任务调度算法.该算法根据... 在海量数据的云计算中,通常面临着数据传输时间长的问题.针对目前大多数数据放置与任务调度算法存在的副本静态性和传输标准精确度的不足,提出了一种动态调整副本个数、以时间作为衡量数据传输标准的数据放置与任务调度算法.该算法根据数据访问频率和存储大小,动态地调整副本个数,一方面减少了低访问率副本对存储空间的浪费;另一方面也减少了高访问率副本所需跨节点传输次数.考虑到节点间网络带宽的差异性,确定以数据传输时间作为传输衡量标准,提高了传输标准的精确度.实验结果表明,除了任务集和网络节点均较少的情况外,该算法均能有效地减少数据传输时间,甚至在任务集合和网络节点较多的情况下,能减少近50%的传输时间. 展开更多
关键词 云计算 数据放置 任务调度 数据传输 数据副本
在线阅读 下载PDF
MapReduce集群环境下的数据放置策略 被引量:16
5
作者 荀亚玲 张继福 秦啸 《软件学报》 EI CSCD 北大核心 2015年第8期2056-2073,共18页
MapReduce是一种适用于大规模数据密集型应用的有效编程模型,具有编程简单、易于扩展、容错性好等特点,已在并行和分布式计算领域得到了广泛且成功的应用.由于MapReduce将计算扩展到大规模的机器集群上,处理数据的合理放置成为影响MapRe... MapReduce是一种适用于大规模数据密集型应用的有效编程模型,具有编程简单、易于扩展、容错性好等特点,已在并行和分布式计算领域得到了广泛且成功的应用.由于MapReduce将计算扩展到大规模的机器集群上,处理数据的合理放置成为影响MapReduce集群系统性能(包括能耗、资源利用率、通信和I/O代价、响应时间、系统的可靠性和吞吐率等)的关键因素之一.首先,对MapReduce编程模型的典型实现——Hadoop缺省的数据放置策略进行分析,并进一步讨论了MapReduce框架下,设计数据放置策略时需考虑的关键问题和衡量数据放置策略的标准;其次,对目前MapReduce集群环境下的数据放置策略优化方法的研究与进展进行了综述和分析;最后,分析和归纳了MapReduce集群环境下数据放置策略的下一步研究工作. 展开更多
关键词 数据放置 MAPREDUCE 编程模型 能耗 负载均衡
在线阅读 下载PDF
一种改进的Hadoop数据放置策略 被引量:35
6
作者 林伟伟 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第1期152-158,共7页
采用现有的Hadoop默认数据放置策略时,若本地数据副本失效,从远程结点上恢复数据需要耗费大量数据传输时间,且随机选取数据放置结点可能会影响数据放置的负载均衡.为此,文中提出一种改进的数据放置策略.该策略基于结点网络距离与数据负... 采用现有的Hadoop默认数据放置策略时,若本地数据副本失效,从远程结点上恢复数据需要耗费大量数据传输时间,且随机选取数据放置结点可能会影响数据放置的负载均衡.为此,文中提出一种改进的数据放置策略.该策略基于结点网络距离与数据负载计算每个结点的调度评价值,据此选择一个最佳的远程数据副本的放置结点,从而既能实现数据放置的负载均衡,又能实现良好的数据传输性能.在Hadoop平台上实现了所提出的数据副本放置改进策略,结果表明,与系统默认策略相比,文中提出的策略不仅可以改进数据放置的负载均衡,而且可以减少数据副本放置的时间. 展开更多
关键词 HADOOP 数据放置 负载均衡 策略
在线阅读 下载PDF
异构Hadoop集群下自适应平衡数据存储的大数据放置策略 被引量:3
7
作者 张少辉 张中军 于来行 《现代电子技术》 北大核心 2016年第10期49-53,57,共6页
Hadoop是一种处理和存储大数据的平台,针对异构Hadoop集群下采用均等数据分配方法易降低系统计算性能的问题,提出一种自适应平衡数据存储的大数据放置策略。根据异构集群中各节点的计算能力比例,将数据分配到节点中。在任务处理过程中,... Hadoop是一种处理和存储大数据的平台,针对异构Hadoop集群下采用均等数据分配方法易降低系统计算性能的问题,提出一种自适应平衡数据存储的大数据放置策略。根据异构集群中各节点的计算能力比例,将数据分配到节点中。在任务处理过程中,根据反馈的任务完成时间信息,动态更新节点的能力比例,自适应调整数据分配,从而使异构Hadoop集群中各节点处理数据的时间大致相同,降低节点之间的数据移动量,提高了节点利用率。实验结果表明,该策略能够有效缩减任务完成时间,提高了系统的整体性能。 展开更多
关键词 异构Hadoop集群 数据放置 数据存储平台 平衡数据存储
在线阅读 下载PDF
并行面向对象数据库中的基于对象类的混合式数据放置策略 被引量:2
8
作者 王意洁 王勇军 胡守仁 《计算机学报》 EI CSCD 北大核心 1998年第S1期178-183,共6页
本文针对并行面向对象数据库的特点,结合异步并行查询执行策略[1],提出了一种基于对象类的混合式数据放置策略,理论分析和模拟结果都验证了它的实用性和有效性.
关键词 并行面向对象数据 异步并行查询执行策略 数据放置
在线阅读 下载PDF
FC-SAN中的数据放置和访问路径选择的代价模型(英文) 被引量:1
9
作者 李超 周立柱 邢春晓 《软件学报》 EI CSCD 北大核心 2004年第5期741-751,共11页
网络化存储通过引入网络的概念将存储独立于服务器甚至通信网络,已经成为传统存储方式的有力替代者.然而,FC-SAN虚拟存储方式的存储性能依赖于存储对象的某些属性,在某些情况下,其性能甚至不如传统的LAN数据共享方式.就FC-SAN虚拟存储... 网络化存储通过引入网络的概念将存储独立于服务器甚至通信网络,已经成为传统存储方式的有力替代者.然而,FC-SAN虚拟存储方式的存储性能依赖于存储对象的某些属性,在某些情况下,其性能甚至不如传统的LAN数据共享方式.就FC-SAN虚拟存储方式中的数据放置和访问路径选择对这一问题进行了研究.首先通过分析虚拟存储原理提出了一个数据访问耗时的线性模型;然后,就数据放置和访问路径选择提出了一个决策方法;并在进一步探讨这一方法的过程中,定义了虚拟存储代价当量的概念,用以评价FC-SAN虚拟存储环境中的数据放置的代价,从而为评价以及如何选择数据放置和访问路径提供了一种定量的手段.最后,在数字图书馆的一个海量存储原型系统中对上述的理论分析、各种条件进行了实验验证,并结合实际给出了虚拟存储代价当量的计算方法,验证了所提出的方法的有效性. 展开更多
关键词 网络化存储 FC-SAN 虚拟存储 数据放置 访问路径选择
在线阅读 下载PDF
流媒体服务中基于分布式代理的缓存数据放置策略 被引量:1
10
作者 郭攀红 杨扬 李新友 《计算机科学》 CSCD 北大核心 2009年第11期56-60,共5页
随着高速宽带接入技术的发展,流媒体技术的研究得到了迅速的发展,并具有广阔的应用前景。流媒体代理技术作为减轻服务器的访问负载、提高用户的访问响应速度的重要手段,已成为流媒体研究领域中的研究热点之一。针对流媒体服务中的分布... 随着高速宽带接入技术的发展,流媒体技术的研究得到了迅速的发展,并具有广阔的应用前景。流媒体代理技术作为减轻服务器的访问负载、提高用户的访问响应速度的重要手段,已成为流媒体研究领域中的研究热点之一。针对流媒体服务中的分布式代理服务器系统,提出了一种优化的缓存数据放置策略。其主要思想是将缓存数据放入某个特定的代理服务器中,使得今后访问该数据的网络传输开销最小。仿真实验表明,所提出的算法比传统的缓存数据放置算法能获得更小的传输开销和更好的可扩展性。 展开更多
关键词 分布式代理 流媒体服务 缓存技术 数据放置 算法分析
在线阅读 下载PDF
分布式计算中可靠的数据放置方法 被引量:1
11
作者 汤小春 胡杰 《计算机工程》 CAS CSCD 北大核心 2008年第23期76-78,共3页
数据放置活动在以计算为主的分布式计算中被看作是次要的任务。文章将数据放置工作与计算工作区别对待,定义分布式计算过程中的数据放置模型,给出数据放置协议和可靠的数据传输算法,使得数据放置活动在分布式计算中像计算工作一样被排... 数据放置活动在以计算为主的分布式计算中被看作是次要的任务。文章将数据放置工作与计算工作区别对待,定义分布式计算过程中的数据放置模型,给出数据放置协议和可靠的数据传输算法,使得数据放置活动在分布式计算中像计算工作一样被排列、调度、监控、管理以及检测。对数据放置方法进行了系统的评价,取得了较好的效果。 展开更多
关键词 数据放置 可靠传输 分布式计算
在线阅读 下载PDF
一种大数据放置方法 被引量:3
12
作者 张桂刚 《计算机科学》 CSCD 北大核心 2014年第6期1-4,36,共5页
数据密集型应用越来越多,如何将大数据在数据中心实现有效放置变得日益重要。研究了大数据的放置模型。影响大数据放置的因素主要有:能耗、异构节点的服务能力及具有关联计算的数据集。基于这3个因素设计了一种节能、充分考虑异构节点... 数据密集型应用越来越多,如何将大数据在数据中心实现有效放置变得日益重要。研究了大数据的放置模型。影响大数据放置的因素主要有:能耗、异构节点的服务能力及具有关联计算的数据集。基于这3个因素设计了一种节能、充分考虑异构节点服务能力及提升MapReduce处理Join连接的效率的大数据放置模型。该模型将有效实现大数据的有效放置管理,同时也为未来软件定制数据中心奠定了基础。 展开更多
关键词 数据 数据放置 节能 异构节点 关联计算
在线阅读 下载PDF
在线社交网络中有向社交超图数据放置策略
13
作者 杨文茵 王国军 《小型微型计算机系统》 CSCD 北大核心 2015年第7期1559-1564,共6页
减少访问请求开销、改善副本效益和负载均衡是提高在线社交网络数据放置性能的重要目标,当前的相关研究多侧重对某个指标进行优化,并且所使用的二元社交图未能直观有效地反映社交网络多用户交互的特性.综合考虑三个指标的相关因素,提出... 减少访问请求开销、改善副本效益和负载均衡是提高在线社交网络数据放置性能的重要目标,当前的相关研究多侧重对某个指标进行优化,并且所使用的二元社交图未能直观有效地反映社交网络多用户交互的特性.综合考虑三个指标的相关因素,提出一个有向社交超图模型,并基于该模型提出一个两阶段社交感知数据放置方案,其中包括社交超图均衡划分算法和社交性流行度感知的副本复制放置算法.使用Facebook数据集进行的实验表明,该策略比同类方案综合性能指标更优,实现了上述三个目标的平衡. 展开更多
关键词 在线社交网络 数据放置 有向社交超图 社交热度感知 数据复制 负载均衡
在线阅读 下载PDF
并行面向对象数据库中的数据放置(英文)
14
作者 王意洁 胡守仁 《国防科技大学学报》 EI CAS CSCD 1999年第5期79-82,共4页
针对并行面向对象数据库的特点,结合异步并行查询执行策略,提出了一种基于对象类的混合式数据放置策略。
关键词 面向对象数据 数据放置 数据分配 数据
在线阅读 下载PDF
异构存储感知的Ceph存储系统数据放置方法 被引量:3
15
作者 刘飞 蒋德钧 +3 位作者 张欢 陈静 王筠 熊劲 《计算机科学》 CSCD 北大核心 2017年第6期17-22,共6页
Ceph分布式存储系统正成为广泛使用的开源云环境存储解决方案。异构存储如果应用有效的数据管理策略,则能够在保持低成本的同时提供大容量和高性能存储。在Ceph中使用异构存储设备不能有效发挥异构存储设备的性能,由于数据的多个副本可... Ceph分布式存储系统正成为广泛使用的开源云环境存储解决方案。异构存储如果应用有效的数据管理策略,则能够在保持低成本的同时提供大容量和高性能存储。在Ceph中使用异构存储设备不能有效发挥异构存储设备的性能,由于数据的多个副本可以存放到不同的存储介质中,因此不同的副本组合的性能和成本都不一样。针对Ceph提出一种面向异构存储的数据放置方法,通过划分多种不同的副本组合,根据数据热度和读写比例将不同的数据放到不同的副本组合上,在提升系统性能的同时有效地控制了系统容量成本。 展开更多
关键词 异构存储 数据放置 副本 Ceph
在线阅读 下载PDF
一种基于条带的一致性散列数据放置算法 被引量:5
16
作者 魏征 窦禹 +3 位作者 高艳珍 马捷 孙凝晖 邢晶 《计算机研究与发展》 EI CSCD 北大核心 2021年第4期888-903,共16页
分布式存储系统作为数据存储的载体,广泛应用于大数据领域.纠删码存储方式相对副本方式,既具有较高的空间利用效率,又能保证数据存储的可靠性,因此被越来多的应用于存储系统当中.在EB级大规模纠删码分布式存储系统中,元数据管理成本较大... 分布式存储系统作为数据存储的载体,广泛应用于大数据领域.纠删码存储方式相对副本方式,既具有较高的空间利用效率,又能保证数据存储的可靠性,因此被越来多的应用于存储系统当中.在EB级大规模纠删码分布式存储系统中,元数据管理成本较大,位置信息等元数据查询效率影响了I O时延和吞吐量.基于位置信息记录的有中心数据放置算法需要频繁访问元数据服务器,导致性能优化受限,基于Hash映射的无中心数据放置算法越来越多地得到应用.但面向纠删码的无中心放置算法,在节点变更和数据恢复过程中,存在位置变更困难、迁移数据量大、数据恢复和迁移并发度低等问题.提出了一种基于条带的一致性Hash数据放置算法(consistent Hash data placement algorithm based on stripe,SCHash),SCHash以条带为单位放置数据,通过把数据块到节点的映射转化为条带到节点组的映射过程,减少节点变动过程中的数据迁移量,从而在恢复过程中降低了变动数据的比例,加速了恢复带宽.并基于SCHash算法设计了一种基于条带的并发I O调度恢复策略,通过避免选取同一节点的数据块进行I O操作,提升了I O并行度,通过调度恢复I O和迁移I O的执行顺序,减少了数据恢复的执行时间.相比APHash数据放置算法,SCHash在数据恢复过程中,减少了46.71%~85.28%数据的迁移.在条带内重建时,恢复带宽提升了48.16%,在条带外节点重建时,恢复带宽提升了138.44%. 展开更多
关键词 分布式文件系统 纠删码 一致性Hash 条带 数据放置 数据恢复
在线阅读 下载PDF
异构混合存储的软硬件协同数据放置策略 被引量:6
17
作者 李鸿飞 杜溢墨 +1 位作者 曾熠 王磊 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第2期64-71,共8页
分析比较当前大数据中心典型混合存储架构,针对其不能综合运用存储管理系统和存储设备优势的问题,提出软硬件协同的数据放置策略,同时考虑软件层混合存储管理系统和硬件层混合存储设备的特点,根据应用特性为数据选择合适的存储管理系统... 分析比较当前大数据中心典型混合存储架构,针对其不能综合运用存储管理系统和存储设备优势的问题,提出软硬件协同的数据放置策略,同时考虑软件层混合存储管理系统和硬件层混合存储设备的特点,根据应用特性为数据选择合适的存储管理系统和设备。面向不同应用场景,提出运行前规划存储路径的静态放置模式和运行中规划存储路径的动态放置模式。基于存储管理系统和设备性能参数建模,采用仿真方法实现各数据放置策略,并运行实际应用中的三类负载进行实验测试,结果表明采用软硬件协同的数据放置策略相比只考虑存储管理系统和存储设备的数据放置策略,性能可以提高近30%。 展开更多
关键词 数据 混合存储 非关系型数据 数据放置
在线阅读 下载PDF
分布式存储中数据放置策略的研究 被引量:5
18
作者 陈惟康 杜松 《计算机应用与软件》 CSCD 2009年第1期6-8,56,共4页
分布式存储统系统的可靠性主要取决于系统采用何种数据放置策略来保证数据在网络中各结点的有效分配。总结了设计数据放置策略所需考虑的关键问题和衡量数据放置策略的标准,重点讨论了已有的几种放置策略,在Gossip副本更新算法思想的基... 分布式存储统系统的可靠性主要取决于系统采用何种数据放置策略来保证数据在网络中各结点的有效分配。总结了设计数据放置策略所需考虑的关键问题和衡量数据放置策略的标准,重点讨论了已有的几种放置策略,在Gossip副本更新算法思想的基础上,提出一种可适应动态网络环境的基于存储转发的随机放置策略,并通过测试验证了该策略对系统可靠性和性能的影响。 展开更多
关键词 分布式 数据放置 顺序 随机 存储转发
在线阅读 下载PDF
基于随机森林的高能物理数据放置策略 被引量:1
19
作者 程振京 程耀东 +3 位作者 陈刚 汪璐 李海波 胡庆宝 《计算机工程与应用》 CSCD 北大核心 2020年第21期60-64,共5页
随着LHAASO高海拔宇宙线等高能物理实验规模的不断扩大,每年需要存储PB级的海量物理数据。高能物理海量存储系统一般采用随机的数据放置策略,没有考虑数据访问场景和服务器节点、存储设备的差异性。针对以上问题,提出一种异构存储环境... 随着LHAASO高海拔宇宙线等高能物理实验规模的不断扩大,每年需要存储PB级的海量物理数据。高能物理海量存储系统一般采用随机的数据放置策略,没有考虑数据访问场景和服务器节点、存储设备的差异性。针对以上问题,提出一种异构存储环境下基于随机森林算法的数据放置策略,根据存储设备性能差异划分快慢存储池,同时对后期文件的读写访问场景进行预测和识别,综合考虑当前设备负载为数据找到最佳的放置位置。使用真实物理实验数据验证了算法的有效性。 展开更多
关键词 随机森林 分布式存储系统 异构存储 存储池 数据放置策略 访问场景
在线阅读 下载PDF
大规模存储中的一个有效的数据放置算法 被引量:4
20
作者 谈华芳 孙丽丽 侯紫峰 《计算机工程》 CAS CSCD 北大核心 2006年第10期47-49,共3页
在大规模存储中,经常面临组件的增加和失败。为了提高可用性和可管理性,研究和比较了不同的数据定位机制,设计了一个离散的、自适应的算法。这个算法保证任何一个特定的数据对象的副本不会被放置在同一个存储节点上。并且根据存储节点... 在大规模存储中,经常面临组件的增加和失败。为了提高可用性和可管理性,研究和比较了不同的数据定位机制,设计了一个离散的、自适应的算法。这个算法保证任何一个特定的数据对象的副本不会被放置在同一个存储节点上。并且根据存储节点的能力公平地分布数据对象到存储节点上。当新的存储节点加入系统或已存在的节点退出系统时,需重新分布的数据对象被尽可能地减少。算法中没有集中控制点,保证了系统的可扩展性。 展开更多
关键词 大规模存储 数据对象放置 存储节点
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部