期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
Using multi-threads to hide deduplication I/O latency with low synchronization overhead 被引量:1
1
作者 朱锐 秦磊华 +1 位作者 周敬利 郑寰 《Journal of Central South University》 SCIE EI CAS 2013年第6期1582-1591,共10页
Data deduplication, as a compression method, has been widely used in most backup systems to improve bandwidth and space efficiency. As data exploded to be backed up, two main challenges in data deduplication are the C... Data deduplication, as a compression method, has been widely used in most backup systems to improve bandwidth and space efficiency. As data exploded to be backed up, two main challenges in data deduplication are the CPU-intensive chunking and hashing works and the I/0 intensive disk-index access latency. However, CPU-intensive works have been vastly parallelized and speeded up by multi-core and many-core processors; the I/0 latency is likely becoming the bottleneck in data deduplication. To alleviate the challenge of I/0 latency in multi-core systems, multi-threaded deduplication (Multi-Dedup) architecture was proposed. The main idea of Multi-Dedup was using parallel deduplication threads to hide the I/0 latency. A prefix based concurrent index was designed to maintain the internal consistency of the deduplication index with low synchronization overhead. On the other hand, a collisionless cache array was also designed to preserve locality and similarity within the parallel threads. In various real-world datasets experiments, Multi-Dedup achieves 3-5 times performance improvements incorporating with locality-based ChunkStash and local-similarity based SiLo methods. In addition, Multi-Dedup has dramatically decreased the synchronization overhead and achieves 1.5-2 times performance improvements comparing to traditional lock-based synchronization methods. 展开更多
关键词 multi-thread MULTI-CoRE parallel data deduplication
在线阅读 下载PDF
海洋环流模式的并行I/O优化研究
2
作者 李云龙 祝子杰 +4 位作者 孟祥飞 朱小谦 林鹏飞 刘海龙 李庚 《计算机工程与应用》 CSCD 北大核心 2024年第17期263-271,共9页
极端气象日益加剧,严重影响人类的生产生活。如何有效应对未来极端环境变化,更关乎国际竞争。因此,发展高精度高分辨率的地球系统模式推动气候变化研究至关重要。随着模式精度和分辨率的不断提高,I/O性能已成为制约模式计算效率和可扩... 极端气象日益加剧,严重影响人类的生产生活。如何有效应对未来极端环境变化,更关乎国际竞争。因此,发展高精度高分辨率的地球系统模式推动气候变化研究至关重要。随着模式精度和分辨率的不断提高,I/O性能已成为制约模式计算效率和可扩展性的瓶颈。选取典型的海洋环流模式LICOM3作为研究对象,基于天河HPC系统,详细测试和分析了模式的I/O逻辑过程,发现在3K进程规模下I/O可占整体运行时间一半以上,是限制模式计算性能的关键因素。为此,设计并实现了主要输出过程的MPI-IO并行优化方案,显著提升了模式运行效率,基本解决了模式I/O瓶颈。测试结果表明,MPI-IO并行优化方案将输出时间占比从48.58%降到2.44%,将输出带宽提升到6.21 GB/s,约是原程序的14倍。此外,进一步分析了影响并行I/O性能的因素,以期为相关工作提供参考和指导。 展开更多
关键词 并行i/o优化 海洋环流模式 MPI-Io
在线阅读 下载PDF
Heuristic file sorted assignment algorithm of parallel I/O on cluster computing system
3
作者 陈志刚 曾碧卿 +3 位作者 熊策 邓晓衡 曾志文 刘安丰 《Journal of Central South University of Technology》 EI 2005年第5期572-577,共6页
A new file assignment strategy of parallel I/O, which is named heuristic file sorted assignment algorithm was proposed on cluster computing system. Based on the load balancing, it assigns the files to the same disk ac... A new file assignment strategy of parallel I/O, which is named heuristic file sorted assignment algorithm was proposed on cluster computing system. Based on the load balancing, it assigns the files to the same disk according to the similar service time. Firstly, the files were sorted and stored at the set I in descending order in terms of their service time, then one disk of cluster node was selected randomly when the files were to be assigned, and at last the continuous files were taken orderly from the set I to the disk until the disk reached its load maximum. The experimental results show that the new strategy improves the performance by 20.2% when the load of the system is light and by 31.6% when the load is heavy. And the higher the data access rate, the more evident the improvement of the performance obtained by the heuristic file sorted assignment algorithm. 展开更多
关键词 cluster computing parallel i/o file sorted assignment variance of service time
在线阅读 下载PDF
提高可扩展并行机群并行I/O效率的一个方法 被引量:11
4
作者 龙翔 李忠泽 +1 位作者 高小鹏 李未 《计算机研究与发展》 EI CSCD 北大核心 2000年第6期650-656,共7页
随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分... 随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分配时,使各计算结点间的通信量最小,从而达到提高系统并行I/O效率的目的. 展开更多
关键词 可扩展并行机群 并行i/o效率 算法
在线阅读 下载PDF
科学计算双路并行I/O优化方法 被引量:2
5
作者 曹立强 莫则尧 +2 位作者 沈卫超 夏芳 陈军 《计算机学报》 EI CSCD 北大核心 2015年第5期1035-1043,共9页
科学计算数据集由数据和元数据组成.一般条件下,数据的尺寸较大,元数据尺寸较小.传统的高性能计算机并行文件系统可以高效率地读写大块连续数据,但是无法高效率地读写大量较小块的元数据.一旦大块数据和小块元数据两类读写特征混杂在一... 科学计算数据集由数据和元数据组成.一般条件下,数据的尺寸较大,元数据尺寸较小.传统的高性能计算机并行文件系统可以高效率地读写大块连续数据,但是无法高效率地读写大量较小块的元数据.一旦大块数据和小块元数据两类读写特征混杂在一起,元数据将较严重地干扰并行I/O,造成性能的下降.为此,文中提出数据与元数据分治的双路并行I/O方法.该方法在高层I/O库中建立内存文件系统与并行文件系统两级存储,在存储资源之间并行迁移科学计算元数据.一方面降低较频繁读写元数据的I/O延迟,另一方面改变科学计算数据的存储特征与存储模式,从而提高科学计算应用、尤其是数据分析与可视化等读入密集型应用的I/O效率.测试表明,双路并行I/O方法可提高写性能8%~13%,提高读性能89%到1.01倍. 展开更多
关键词 并行i/o 高层i/o 性能优化 数据格式 双路并行i/o
在线阅读 下载PDF
并行I/O技术研究 被引量:8
6
作者 刘敏 王意洁 《计算机应用研究》 CSCD 北大核心 2003年第8期29-31,共3页
从分析提高I/O性能的途径开始,对在分布主存的高性能计算机中利用存储系统并行性来完成数据访问的并行文件系统所涉及到的问题进行了分析和探讨,最后介绍了几个著名的并行文件系统。
关键词 并行i/o 并行文件系统 高性能计算
在线阅读 下载PDF
高性能计算中的并行I/O技术 被引量:2
7
作者 李东升 卢凯 +1 位作者 李铭 卢锡城 《计算机科学》 CSCD 北大核心 2002年第5期1-3,共3页
1 引言 高性能计算能力已经日益成为一个国家经济、科技与国防实力的重要组成部分.由于科学工程计算和大规模商业事务处理需求的牵引,高性能计算中对I/O处理能力的要求简直是无止境的.大规模多媒体应用要求大容量快速存储系统支持,多用... 1 引言 高性能计算能力已经日益成为一个国家经济、科技与国防实力的重要组成部分.由于科学工程计算和大规模商业事务处理需求的牵引,高性能计算中对I/O处理能力的要求简直是无止境的.大规模多媒体应用要求大容量快速存储系统支持,多用户事务处理环境要求快速I/O支持实时访同,而一些重大挑战性科学计算课题更是追求计算机系统具有3T性能(即要求能提供1 Teraflops计算能力、1 Terabyte主存容量和1 Terabyte/s I/O带宽). 展开更多
关键词 高性能计算 并行i/o技术 并行计算机 体系结构
在线阅读 下载PDF
具有分布式并行I/O接口的分布式并行服务器系统的性能研究 被引量:17
8
作者 刘心松 《电子学报》 EI CAS CSCD 北大核心 2002年第12期1808-1810,共3页
分布式并行是多年来的一个研发热点,但其研发仅限于分布式并行系统的内部.服务器和外界(如客户机)的交互仅通过一条通道(如一台计算机)完成,这一瓶颈限制了系统可靠性/可用性,加速比与效率,系统频带和I/O响应速度等.本文提出的具有分布... 分布式并行是多年来的一个研发热点,但其研发仅限于分布式并行系统的内部.服务器和外界(如客户机)的交互仅通过一条通道(如一台计算机)完成,这一瓶颈限制了系统可靠性/可用性,加速比与效率,系统频带和I/O响应速度等.本文提出的具有分布式并行I/O接口的分布式并行服务器使其中的各节点机均可直接与众多客户机交互作用,设计保证80%以上的客户请求均一次直接发往能提供服务的服务器中的节点机,仅有少量请求需要在节点问进行动态负载再调度.这是一种面向宽带的宽带网络服务器.本文的重点是将这种服务器与单机、镜像/双机热备份、群集服务器进行性能比较.结果表明,具有这种I/O接口的分布式并行服务器性能最佳.这种服务器的第一个版本已经研发成功,投入使用,并将进入市场. 展开更多
关键词 分布式并行 i/o接口 服务器 宽带网络 可靠性 加速比
在线阅读 下载PDF
并行文件系统Lustre细粒度I/O性能优化 被引量:3
9
作者 李林林 吴万国 孙良旭 《计算机工程与应用》 CSCD 2012年第17期88-92,共5页
并行文件系统Lustre粗粒度I/O性能良好,细粒度I/O性能相对粗粒度I/O比较低下,因此优化细粒度I/O性能成为提高系统整体I/O性能的关键问题。在研究和分析了Lustre的I/O访问模式、细粒度I/O服务流程和页面替换算法等方面后,提出了细粒度优... 并行文件系统Lustre粗粒度I/O性能良好,细粒度I/O性能相对粗粒度I/O比较低下,因此优化细粒度I/O性能成为提高系统整体I/O性能的关键问题。在研究和分析了Lustre的I/O访问模式、细粒度I/O服务流程和页面替换算法等方面后,提出了细粒度优先(Fine Grained First,FGF)LRU算法。在OST端及Client端的页高速缓存中最大程度地保留细粒度I/O的页面,降低细粒度I/O引起的页面下沉速度,延长细粒度I/O页面在主存中的时间,进而减少对磁盘的访问次数,降低磁盘访问开销。通过对实验数据的对比和分析,验证了FGF-LRU算法的有效性。在不影响粗粒度I/O性能的情况下,提高了细粒度I/O性能,最终实现提高系统整体I/O性能。 展开更多
关键词 并行文件系统 LUSTRE 细粒度 输入/输出(i/o)
在线阅读 下载PDF
EPP协议下高速数字I/O设计及应用 被引量:2
10
作者 王风云 田新诚 +1 位作者 梁兴忠 蔡春伟 《仪表技术与传感器》 CSCD 北大核心 2004年第8期19-20,23,共3页
在计算机的各种外部接口中,并行端口的速度最快。EPP(EnhancedParallelPort)是IEEE1248协议定义的增强型并行端口。EPP协议是与SPP兼容且能完成双向数据传输的协议,具有传输速率高、编程方便等优点。介绍了有关EPP的基本知识,包括EPP的... 在计算机的各种外部接口中,并行端口的速度最快。EPP(EnhancedParallelPort)是IEEE1248协议定义的增强型并行端口。EPP协议是与SPP兼容且能完成双向数据传输的协议,具有传输速率高、编程方便等优点。介绍了有关EPP的基本知识,包括EPP的数据传输方式,并给出EPP协议下的16路高速数字I/O的软、硬件设计及其应用。在Visu alC++中,提供了 inp()和 outp()函数,可以直接控制和读写并行端口,软件设计简捷。 展开更多
关键词 EPP协议 并行口 计算机 数据传输 编程 输入输出接口
在线阅读 下载PDF
一种集群计算系统中并行I/O文件存储分配策略 被引量:2
11
作者 曾碧卿 陈志刚 +1 位作者 刘安丰 曾志文 《小型微型计算机系统》 CSCD 北大核心 2005年第5期873-876,共4页
现代计算机系统性能已经由受限于CPU转变为受限于I/ O,近年来研究人员对高性能计算中的并行I/ O问题进行了深入研究.本论文的主要工作是对集群计算中的并行I/ O子系统进行研究,提出一种文件拆分与存储分配的新策略,即:已知知识的文件拆... 现代计算机系统性能已经由受限于CPU转变为受限于I/ O,近年来研究人员对高性能计算中的并行I/ O问题进行了深入研究.本论文的主要工作是对集群计算中的并行I/ O子系统进行研究,提出一种文件拆分与存储分配的新策略,即:已知知识的文件拆分与分配方法(KKFDA) ,该方法保证文件存储方式与访问方式的一致性,达到了提高文件访问时的本地命中率、缩短访盘响应时间的目的.算法设计与实验证明了方法的有效性. 展开更多
关键词 集群计算系统 并行i/o 文件拆分 数据分配
在线阅读 下载PDF
集群计算系统中并行I/O访问的自适应调度策略 被引量:1
12
作者 曾碧卿 陈志刚 +1 位作者 刘安丰 吕西红 《计算机工程》 EI CAS CSCD 北大核心 2005年第2期72-73,98,共3页
现代计算机系统的性能已经由受限于CPU转变为受限于I/O,因此,并行I/O是缓解这一难题的有效方法。文章通过对集群计算系统中I/O调度策略的研究,提出了一种新的自适应平等划分的I/O调度策略,并将它们与已经存在的调度策略进行比较。实验... 现代计算机系统的性能已经由受限于CPU转变为受限于I/O,因此,并行I/O是缓解这一难题的有效方法。文章通过对集群计算系统中I/O调度策略的研究,提出了一种新的自适应平等划分的I/O调度策略,并将它们与已经存在的调度策略进行比较。实验结果表明了所提出策略的优越性。 展开更多
关键词 集群计算 并行i/o 自适应调度 CPU 调度策略 i/o调度 访问 性能 实验结果 划分
在线阅读 下载PDF
基于Linux的SMP机群环境中并行I/O模型研究 被引量:1
13
作者 曾碧卿 陈志刚 +1 位作者 吕西红 刘安丰 《计算机工程与应用》 CSCD 北大核心 2004年第26期79-81,共3页
提出了一个基于数据通路的波浪推进式并行I/O模型框架,并在基于Linux的SMP机群系统中,根据波浪推进式并行I/O模型框架对各个数据通路进行建模,具体分析了这个波浪推进式并行I/O模型,从思路上解决了刻画并行I/O性能的并行I/O模型问题。
关键词 SMP机群 并行i/o模型
在线阅读 下载PDF
LONWORKS与RS-232的互连适配器的设计开发 被引量:1
14
作者 任清珍 杨显娇 黄天戍 《电测与仪表》 北大核心 2002年第7期44-47,共4页
Lonworks技术中的核心是神经元芯片,本文详述了神经元芯片的一种I/O应用模式———并行口I/O模式,并介绍了基于此I/O模式设计开发的Lonworks协议与RS-232标准转换的互连适配器。
关键词 互连适配器 RS-232 设计开发 LoNWoRKS 神经元芯片 并行口i/o模式
在线阅读 下载PDF
应用层并行I/O效率研究 被引量:2
15
作者 张娟 陆林生 《计算机应用》 CSCD 北大核心 2009年第1期9-11,15,共4页
针对划分计算空间到多个计算区域(zone)这类问题,采用基于计算区域组织I/O时,首先需选择计算区域的主进程;其次当某一进程是两个计算区域的主进程时需指定计算区域数据访问先后顺序。设计了多级极大独立集算法实现上述过程。该算法利用... 针对划分计算空间到多个计算区域(zone)这类问题,采用基于计算区域组织I/O时,首先需选择计算区域的主进程;其次当某一进程是两个计算区域的主进程时需指定计算区域数据访问先后顺序。设计了多级极大独立集算法实现上述过程。该算法利用图论中的连通图以及极大独立集概念规定了每个计算区域进行数据访问的进程以及优先级。经样例分析,采用此种方法达到I/O并行度最高,并实现在并行度最高情况下通信量最小。 展开更多
关键词 并行i/o 连通图 极大独立集 矩阵
在线阅读 下载PDF
HPPHM:多维数据并行I/O存储新策略及其性能研究 被引量:1
16
作者 陈志刚 曾碧卿 《通信学报》 EI CSCD 北大核心 2007年第4期57-64,共8页
针对大型多维数据集合中数据存储访问效率较低的缺陷而进行了相应的研究,通过采用并行I/O技术,将多维数据在分布式系统的多个磁盘之间进行分布存储,通过循环拆分法将已有的数据从适用于二维数据扩展到了多维数据中,并通过对循环法进行... 针对大型多维数据集合中数据存储访问效率较低的缺陷而进行了相应的研究,通过采用并行I/O技术,将多维数据在分布式系统的多个磁盘之间进行分布存储,通过循环拆分法将已有的数据从适用于二维数据扩展到了多维数据中,并通过对循环法进行理论分析,对多维数据存储访问进行研究,提出了一种新的启发式多维数据循环策略,即基于访问步长值Hi与访问长度M互质的启发式策略(HPPHM),实验表明了新算法在并行度和顽健性等性能方面都具有优越性。 展开更多
关键词 多维数据 并行i/o 存储访问
在线阅读 下载PDF
一个面向I/O密集型并行应用的性能模型 被引量:1
17
作者 陈永然 齐星云 窦文华 《计算机研究与发展》 EI CSCD 北大核心 2007年第4期707-713,共7页
近几年,性能模型作为一种新的并行系统性能分析方法,得到学术界和工业界的广泛重视.给出了一个开放式性能模型框架结构PMPS(n)并实现了该框架下的一个面向I/O密集型并行应用模型PMPS(3),使用该模型分析了各种NPB程序在PⅣ机群系统上的性... 近几年,性能模型作为一种新的并行系统性能分析方法,得到学术界和工业界的广泛重视.给出了一个开放式性能模型框架结构PMPS(n)并实现了该框架下的一个面向I/O密集型并行应用模型PMPS(3),使用该模型分析了各种NPB程序在PⅣ机群系统上的性能.实验结果表明,对存储密集型应用,PMPS(3)模型与PERC模型预测结果相当;对I/O密集型应用性能的预测,PMPS(3)模型优于PERC模型.进一步分析发现,应用的数据相关、控制相关和操作重叠会影响模型预测结果.实验结果还说明了PMPS(n)性能模型具有很好的扩展性. 展开更多
关键词 性能模型 机器轮廓 应用特征 褶合方法 i/o密集型 并行系统
在线阅读 下载PDF
并行PC系统结构及其I/O性能评价 被引量:1
18
作者 李之棠 赵振龙 +1 位作者 黄辉龙 李非 《计算机工程与科学》 CSCD 2002年第4期71-73,77,共4页
传统的微 /小型计算机采用共享总线结构 ,其带宽、扩展性、可用性、可靠性等受到限制 ,因此 ,总线形成了系统内部通信瓶颈。并行PC结构是一种新型的、以交换网络为中心的、高效的系统结构 ,它解决了传统PC机存在的不足和缺陷。本文对并... 传统的微 /小型计算机采用共享总线结构 ,其带宽、扩展性、可用性、可靠性等受到限制 ,因此 ,总线形成了系统内部通信瓶颈。并行PC结构是一种新型的、以交换网络为中心的、高效的系统结构 ,它解决了传统PC机存在的不足和缺陷。本文对并行PC系统结构作了介绍 ,然后采用M/M/1排队模型 ,针对传统PC和并行PC的I/O性能进行了评价与比较 ,最后给出结论及建议。 展开更多
关键词 并行PC系统 结构 i/o性能 评价
在线阅读 下载PDF
并行科学计算应用中采样数据的聚集I/O 被引量:1
19
作者 曹立强 罗红兵 《计算机工程与科学》 CSCD 北大核心 2018年第9期1534-1539,共6页
采样数据的并行I/O制约一些并行应用的运行效率。设计、实现了采样数据的聚集并行I/O方法。该方法在客户端部署采样数据缓存,然后合并数据到输出进程,再存储到文件。为了保障并行程序长时间运行过程中采样数据的存储一致性,该方法在JAS... 采样数据的并行I/O制约一些并行应用的运行效率。设计、实现了采样数据的聚集并行I/O方法。该方法在客户端部署采样数据缓存,然后合并数据到输出进程,再存储到文件。为了保障并行程序长时间运行过程中采样数据的存储一致性,该方法在JASMIN框架中监测应用程序的运行状态,当并行程序发生负载平衡或者重启动时刷新或者恢复数据。I/O过程中,进一步使用HDF5的分块I/O提高列存储数据的读写效率。测试表明,新方法不仅具有较好的可扩展性,还能在具有负载平衡与重启动等复杂功能的并行应用中提高采样数据的并行I/O效率7.5倍以上。 展开更多
关键词 科学计算 采样数据 并行i/o 性能优化 聚合缓存
在线阅读 下载PDF
多通道组合阵列存储系统结构与并行I/O设计
20
作者 贺再红 周炎涛 《计算机工程与科学》 CSCD 北大核心 2009年第7期68-71,101,共5页
本文基于开放硬件平台和软件环境提出了一种集成式多通道组合阵列存储系统结构;设计了多个阵列适配卡分条和卡上多个磁盘分条的两级并行数据组织和分布方式,以提高I/O访问的并发性;提出了一种将来自主机的I/O命令并行分散到多个阵列通... 本文基于开放硬件平台和软件环境提出了一种集成式多通道组合阵列存储系统结构;设计了多个阵列适配卡分条和卡上多个磁盘分条的两级并行数据组织和分布方式,以提高I/O访问的并发性;提出了一种将来自主机的I/O命令并行分散到多个阵列通道上的调度方法。实验表明,在10Gb/s的Infiniband主机接口通道下,组合阵列的I/O性能基本上是多个阵列适配卡I/O带宽的线性叠加。 展开更多
关键词 分布式冗余校验磁盘阵列 多通道组合 二级分条 并行i/o 多线程并行
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部