期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
科学计算应用程序单核指令级优化研究 被引量:4
1
作者 罗红兵 张晓霞 +1 位作者 王伟 武林平 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1263-1269,共7页
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面... 尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面之一.以基于JASMIN(J adaptive structured meshes applications infrastructure)框架实现的Euler程序为例,探讨了科学计算应用程序在Intel Xeon微处理器平台上的具体性能问题和指令级并行性能优化方法,并较大幅度地优化了Euler程序的单核性能.程序优化后,二维和三维两个物理模型计算的总运行时间比优化前减少了21%~34%,核心模块Gas1dapproxy的执行时间缩短了50%以上.性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进. 展开更多
关键词 性能分析 性能优化 XEON 指令级优化 科学计算程序
在线阅读 下载PDF
基于面向对象的粒子类模拟并行计算研究 被引量:6
2
作者 曹小林 张爱清 莫则尧 《计算机研究与发展》 EI CSCD 北大核心 2007年第10期1647-1651,共5页
针对经典分子动力学和PIC方法等粒子类模拟方法具有粒子动态移动、粒子计算局部性好等共性,首先,提出了粒子量数据片对象.该对象是单网格片上的一团粒子,其中网格片是包含多个网格单元的矩形区域.然后,设计了并行算法,包括对象之间的粒... 针对经典分子动力学和PIC方法等粒子类模拟方法具有粒子动态移动、粒子计算局部性好等共性,首先,提出了粒子量数据片对象.该对象是单网格片上的一团粒子,其中网格片是包含多个网格单元的矩形区域.然后,设计了并行算法,包括对象之间的粒子迁移和数据交换以及动态负载平衡.最后,在JASMIN框架上具体实现,进而开发了并行经典分子动力学程序和并行PIC程序.在64个处理器上实测表明,并行PIC程序模拟包含3百万个网格、2千万个粒子的复杂物理模型时,获得了80%的并行效率. 展开更多
关键词 面向对象 粒子类模拟方法 粒子量数据片 动态负载平衡
在线阅读 下载PDF
剖析高性能存储系统中的存储区域网络
3
作者 夏芳 陈虹 +1 位作者 宋磊 张侠 《计算机工程与设计》 CSCD 北大核心 2005年第7期1740-1743,共4页
高性能存储系统(HighPerformanceStorageSystem,简称HPSS)是专门为高性能计算机环境设计、管理和访问超大规模数据的层次化并行存储系统,可以在高性能计算机、磁盘、网络磁盘阵列、磁带库之间迁移大型的数据对象,支持高效的串、并行输入... 高性能存储系统(HighPerformanceStorageSystem,简称HPSS)是专门为高性能计算机环境设计、管理和访问超大规模数据的层次化并行存储系统,可以在高性能计算机、磁盘、网络磁盘阵列、磁带库之间迁移大型的数据对象,支持高效的串、并行输入/输出及远程数据并行传输,数据传输速度只受底层计算机、网络和存储设备的限制。对HPSS以网络为中心体系结构进行了深入的研究与剖析,描述了目前存储区域网络(SAN)技术在HPSS中的应用情况,得出有助于构建高性能计算环境存储系统的看法和结论。 展开更多
关键词 高性能存储系统 存储区域网络 层次存储
在线阅读 下载PDF
JADLib-科学计算数据高层I/O软件库 被引量:6
4
作者 夏芳 陈虹 +1 位作者 宋磊 沈卫超 《计算机工程与科学》 CSCD 北大核心 2009年第A01期227-230,285,共5页
JADLib是为满足大规模复杂结构数据的存储与共享需求而研制的科学数据I/O软件库。其目标是设计并实现管理科学计算网格数据的数据存储模型,支持多种复杂结构数据的表示与操作,应用程序接口直观、易掌握,文件格式统一、可直接可视化,提... JADLib是为满足大规模复杂结构数据的存储与共享需求而研制的科学数据I/O软件库。其目标是设计并实现管理科学计算网格数据的数据存储模型,支持多种复杂结构数据的表示与操作,应用程序接口直观、易掌握,文件格式统一、可直接可视化,提供并行I/O、数居子集访问、压缩存储等高性能存储机制,支持多类科学计算程序跨平台使用,目前已应用到惯性约束聚变、高功率微波、计算流体力学、材料科学等多个研究领域中。实际应用表明,JADLib对于解决数值模拟软件数据存储及后处理分析所面临的I/O效率与组织管理问题具有很好的应用效果。 展开更多
关键词 科学计算 数据管理 数据存储 数据共享
在线阅读 下载PDF
科学计算双路并行I/O优化方法 被引量:2
5
作者 曹立强 莫则尧 +2 位作者 沈卫超 夏芳 陈军 《计算机学报》 EI CSCD 北大核心 2015年第5期1035-1043,共9页
科学计算数据集由数据和元数据组成.一般条件下,数据的尺寸较大,元数据尺寸较小.传统的高性能计算机并行文件系统可以高效率地读写大块连续数据,但是无法高效率地读写大量较小块的元数据.一旦大块数据和小块元数据两类读写特征混杂在一... 科学计算数据集由数据和元数据组成.一般条件下,数据的尺寸较大,元数据尺寸较小.传统的高性能计算机并行文件系统可以高效率地读写大块连续数据,但是无法高效率地读写大量较小块的元数据.一旦大块数据和小块元数据两类读写特征混杂在一起,元数据将较严重地干扰并行I/O,造成性能的下降.为此,文中提出数据与元数据分治的双路并行I/O方法.该方法在高层I/O库中建立内存文件系统与并行文件系统两级存储,在存储资源之间并行迁移科学计算元数据.一方面降低较频繁读写元数据的I/O延迟,另一方面改变科学计算数据的存储特征与存储模式,从而提高科学计算应用、尤其是数据分析与可视化等读入密集型应用的I/O效率.测试表明,双路并行I/O方法可提高写性能8%~13%,提高读性能89%到1.01倍. 展开更多
关键词 并行I/O 高层I/O库 性能优化 数据格式 双路并行I/O
在线阅读 下载PDF
有向图并行计算中一种新的结点调度算法 被引量:6
6
作者 张爱清 莫则尧 《计算机学报》 EI CSCD 北大核心 2009年第11期2178-2186,共9页
在基于有向图的并行计算中,给定图剖分后,如何设计结点调度方案使得并行执行时间最短,是典型的NP完全问题.针对此问题,文中提出一种新的基于顺逆交替迭代技术的启发式调度算法,并给出该算法的并行实现.严格的理论推导证明,新算法在一定... 在基于有向图的并行计算中,给定图剖分后,如何设计结点调度方案使得并行执行时间最短,是典型的NP完全问题.针对此问题,文中提出一种新的基于顺逆交替迭代技术的启发式调度算法,并给出该算法的并行实现.严格的理论推导证明,新算法在一定的假设条件下,从任何初始调度方案出发,均可以单调收敛.在数百个处理器上的并行数值实验表明,与常用的调度算法相比,新算法可在付出很少的开销代价下显著提高整体并行效率. 展开更多
关键词 有向图 并行计算 结点调度算法 顺逆交替迭代技术
在线阅读 下载PDF
大规模并行计算机作业调度评价 被引量:3
7
作者 罗红兵 张晓霞 魏勇 《计算机工程与应用》 CSCD 北大核心 2006年第10期79-83,共5页
大规模并行计算机的作业调度直接关系到其计算能力的发挥,因而相应的研究具有十分重要的意义。论文通过对国外现有作业调度评价体系的研究,建立了更能反映并行作业特点的作业调度策略评价体系,在此基础上设计并实现了一个作业模拟调度... 大规模并行计算机的作业调度直接关系到其计算能力的发挥,因而相应的研究具有十分重要的意义。论文通过对国外现有作业调度评价体系的研究,建立了更能反映并行作业特点的作业调度策略评价体系,在此基础上设计并实现了一个作业模拟调度环境。模拟调度环境采用事件驱动的工作模式,支持FCFS、大作业优先、小作业优先、长作业优先、短作业优先、GANG等调度策略。模拟测试结果表明,GANG调度策略优于所有测试的空间共享调度策略;同时在空间共享调度策略中,短作业优先策略和大作业优先策略具有较好的性能。 展开更多
关键词 大规模并行计算机 作业调度 调度评价
在线阅读 下载PDF
基于R的并行统计计算 被引量:2
8
作者 宋磊 尹俊平 陈虹 《计算机科学》 CSCD 北大核心 2013年第3期95-99,共5页
随着统计分析中数据规模和复杂性的不断增加,高性能计算也开始在金融、经济和管理等统计计算主导的领域中发挥重要的作用。将对基于R的统计分析中并行计算技术的发展现状和最新进展做一个综述,重点从用户的角度考察R在不同体系结构计算... 随着统计分析中数据规模和复杂性的不断增加,高性能计算也开始在金融、经济和管理等统计计算主导的领域中发挥重要的作用。将对基于R的统计分析中并行计算技术的发展现状和最新进展做一个综述,重点从用户的角度考察R在不同体系结构计算平台上并行统计计算的实现。一个人造和真实应用的测试表明了其应用效果。 展开更多
关键词 R 统计分析 高性能计算 并行统计计算
在线阅读 下载PDF
MPI集合通信性能可扩展性研究与分析 被引量:4
9
作者 罗红兵 张晓霞 《计算机科学与探索》 CSCD 北大核心 2017年第2期252-261,共10页
集合通信性能是影响并行程序并行效率的重要因素之一,但对于大规模并行计算机上不同类别集合通信的评测和理论分析仍较为缺乏,许多应用程序的通信模块设计和使用不合理。基于某国产并行机平台,利用IMB测试程序,对各典型MPI(message pass... 集合通信性能是影响并行程序并行效率的重要因素之一,但对于大规模并行计算机上不同类别集合通信的评测和理论分析仍较为缺乏,许多应用程序的通信模块设计和使用不合理。基于某国产并行机平台,利用IMB测试程序,对各典型MPI(message passing interface)集合通信性能进行了分析,并基于现有通信模型和算法进行理论拟合。结果显示:不同类别的MPI集合通信操作的性能差异很大,并且许多集合通信的性能在超大规模下与理论差距很大。一方面反映出现有理论和模型的不足;另一方面也体现出,无论是集合通信的优化,还是基于集合通信的特征进行应用程序的通信模块设计,仍然大有可为。 展开更多
关键词 集合通信 通信性能 可扩展性
在线阅读 下载PDF
面向大规模科学计算的可视分析模式 被引量:1
10
作者 王弘堃 肖丽 +2 位作者 邵京云 廖丽 艾志玮 《计算机工程与科学》 CSCD 北大核心 2012年第8期142-146,共5页
可视分析是大规模科学计算重要的辅助工具,面对不断增长的计算规模,需要高分辨率显示来提高可视化结果的可信度。合理配置可视化硬件系统,建立拥有独立研究、团队讨论、专家会诊模式的协调可视分析环境,结合具有对比、查询和多变量分析... 可视分析是大规模科学计算重要的辅助工具,面对不断增长的计算规模,需要高分辨率显示来提高可视化结果的可信度。合理配置可视化硬件系统,建立拥有独立研究、团队讨论、专家会诊模式的协调可视分析环境,结合具有对比、查询和多变量分析能力的并行分布可视分析软件平台,为大规模科学计算提供有效的辅助分析环境,提高研究效率。 展开更多
关键词 可视分析 大屏幕投影 科学计算
在线阅读 下载PDF
超级计算机作业运行稳定性分析
11
作者 罗红兵 曹小林 +2 位作者 曹立强 武林平 莫则尧 《计算机工程与科学》 CSCD 北大核心 2009年第11期91-93,105,共4页
通过作业日志分析和考核实验方式,对超级计算机并行作业运行稳定性进行了分析。日志分析结果表明,并行作业运行的稳定性会随作业执行时间的增长、作业使用CPU数的增多而下降;当并行作业的计算量达到105CPU小时量级,超过20%的作业会因系... 通过作业日志分析和考核实验方式,对超级计算机并行作业运行稳定性进行了分析。日志分析结果表明,并行作业运行的稳定性会随作业执行时间的增长、作业使用CPU数的增多而下降;当并行作业的计算量达到105CPU小时量级,超过20%的作业会因系统故障而中止。考核实验结果表明,使用数千CPU的并行作业很容易受到多种因素的干扰而中止,很难持续运行超过24小时。最后给出了有关超级计算机稳定性改进、系统管理使用和并行程序研制的几点建议。 展开更多
关键词 超级计算机 并行作业 稳定性
在线阅读 下载PDF
Alltoall通信性能模型研究
12
作者 罗红兵 张晓霞 魏勇 《计算机科学与探索》 CSCD 北大核心 2018年第4期559-566,共8页
Alltoall是一种重要的MPI(message passing interface)集合通信类别,是影响许多并行程序并行效率的重要因素。但对于大规模并行计算机上Alltoall集合通信的评测和理论分析仍较为缺乏,导致许多应用程序的通信模块设计和使用不合理。首先... Alltoall是一种重要的MPI(message passing interface)集合通信类别,是影响许多并行程序并行效率的重要因素。但对于大规模并行计算机上Alltoall集合通信的评测和理论分析仍较为缺乏,导致许多应用程序的通信模块设计和使用不合理。首先,开展了MPI基本通信性能的测试和分析,发现随着MPI进程数的增加,其性能波动也增加,而这种波动源自网络竞争。为此,在传统的Alltoall性能评估模型中引入了网络竞争因素,新模型不仅考虑传统的通信带宽和通信延迟参数,还考虑了通信竞争因素。某国产并行机平台上的测试结果显示:引入网络竞争模型的新Alltoall性能评估模型可以较为准确地预估Alltoall性能,体现出网络竞争开销对Alltoall性能的影响。 展开更多
关键词 集合通信 通信性能 Alltoall
在线阅读 下载PDF
基于硬件事件的并行程序指令级性能模型与应用
13
作者 罗红兵 武林平 《计算机工程与科学》 CSCD 北大核心 2013年第11期175-181,共7页
当前,应用程序持续运行性能与高性能计算机峰值性能的差距有扩大的趋势,许多实际应用程序的性能通常只能达到机器峰值性能的5%~10%,甚至更低,如何优化并行应用成为高性能计算领域关注的焦点.从如何利用硬件事件进行程序指令级优化入... 当前,应用程序持续运行性能与高性能计算机峰值性能的差距有扩大的趋势,许多实际应用程序的性能通常只能达到机器峰值性能的5%~10%,甚至更低,如何优化并行应用成为高性能计算领域关注的焦点.从如何利用硬件事件进行程序指令级优化入手,提出一种基于硬件事件的性能模型,揭示出程序性能与程序特征、微处理器特征的关系.基于该性能模型,在Intel Xeon微处理器平台上对Euler等程序进行优化,gas1dapproxy等性能热点模块的执行时间可以缩短12%~61%.性能优化实验表明:使用该性能模型可以降低用户进行指令级并行性能优化的难度,指导用户选择正确的性能优化方向. 展开更多
关键词 性能分析 性能优化 性能模型 指令级并行
在线阅读 下载PDF
有向图并行计算中的多目标剖分算法 被引量:3
14
作者 金光浩 莫则尧 《计算机学报》 EI CSCD 北大核心 2005年第12期2045-2051,共7页
在以离散网格为基础的某些数值模拟中,网格间的数据依赖关系可以抽象为有向图.如何剖分这些有向图成多个子图,将各子图对应的数值模拟任务映射到不同的处理机,是该类数值模拟并行计算的基础.剖分算法中,需要综合考虑连通性、并行度、负... 在以离散网格为基础的某些数值模拟中,网格间的数据依赖关系可以抽象为有向图.如何剖分这些有向图成多个子图,将各子图对应的数值模拟任务映射到不同的处理机,是该类数值模拟并行计算的基础.剖分算法中,需要综合考虑连通性、并行度、负载平衡、通信开销四个目标.文章在传统有向图剖分算法的基础上,提出了一个权衡这四个目标的有向图多目标剖分区域分解算法.应用于二维非结构网格上的柱对称中子输运并行计算中,通量扫描并行算法在该区域剖分算法上获得的并行效率比原来的无向图区域剖分算法高50%以上. 展开更多
关键词 有向图 图剖分 并行计算
在线阅读 下载PDF
地下水流模拟参数估值的并行计算 被引量:1
15
作者 刘兴伟 程汤培 邵景力 《计算机工程与设计》 北大核心 2016年第1期189-194,共6页
为解决大规模地下水流数值模拟参数估值计算时间过长的问题,基于粗粒度任务分解方法,采用消息传递接口(message passing interface,MPI)实现地下水流模拟程序MODFLOW中参数估值灵敏度分析部分的并行。利用多个分区规模的模型验证并行... 为解决大规模地下水流数值模拟参数估值计算时间过长的问题,基于粗粒度任务分解方法,采用消息传递接口(message passing interface,MPI)实现地下水流模拟程序MODFLOW中参数估值灵敏度分析部分的并行。利用多个分区规模的模型验证并行程序的正确性和有效性,对不同参数规模下的加速比情况进行分析,分析结果表明,对16个参数问题进行参数估值,并行程序在1~16个进程下得到了1.74~8.32的加速比,在8进程下取得了5.91的超线性加速,有效提高了地下水流数值模拟参数估值计算速度。 展开更多
关键词 并行计算 消息传递接口 加速比 参数估值 地下水流模拟程序 地下水数值模拟
在线阅读 下载PDF
面向数值模拟数据的HDF5性能优化 被引量:10
16
作者 沈卫超 曹立强 +1 位作者 夏芳 宋磊 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期314-318,共5页
大规模数值模拟数据对可视化分析提出了挑战,I/O是影响可视化交互性能的重要因素.HDF5是科学计算领域广泛采用的存储格式,介绍了HDF5的抽象数据模型、数据读写流程,并使用典型数值模拟数据测试了HDF5的读性能.测试发现HDF5的数据集定位... 大规模数值模拟数据对可视化分析提出了挑战,I/O是影响可视化交互性能的重要因素.HDF5是科学计算领域广泛采用的存储格式,介绍了HDF5的抽象数据模型、数据读写流程,并使用典型数值模拟数据测试了HDF5的读性能.测试发现HDF5的数据集定位开销较大.根据数值模拟数据的数据块以整数有规律编号的特点,通过在HDF5中增加数据块视图对象来提高读性能.测试表明,该方法可显著加速数据的读取性能. 展开更多
关键词 数值模拟 大规模数据场 HDF5 科学数据管理
在线阅读 下载PDF
三维等离子体粒子模拟程序的数据模型和I/O性能改进 被引量:4
17
作者 陈虹 张侠 +2 位作者 夏芳 张爱清 宋磊 《计算机工程与应用》 CSCD 北大核心 2004年第20期104-107,110,共5页
文章围绕强激光与等离子体相互作用三维数值模拟程序LARED-P数据输出存在的问题,给出了基于HDF5格式的数据模型,通过将计算结果进行重新组织和管理,实现了数据的实时压缩存储和高性能并行I/O,获得了较好的空间存储效率和时间效率,同时,... 文章围绕强激光与等离子体相互作用三维数值模拟程序LARED-P数据输出存在的问题,给出了基于HDF5格式的数据模型,通过将计算结果进行重新组织和管理,实现了数据的实时压缩存储和高性能并行I/O,获得了较好的空间存储效率和时间效率,同时,程序提供了灵活的数据搜索机制,能够在程序运行过程中提取数据子集,满足了可视化系统准实时读入数据的需求。 展开更多
关键词 数据管理 数值模拟 HDF5 数据模型
在线阅读 下载PDF
并行应用程序的远程实时跟踪可视化系统的设计及实现 被引量:3
18
作者 艾志玮 金其杰 +1 位作者 王弘堃 肖丽 《计算机研究与发展》 EI CSCD 北大核心 2004年第5期853-860,共8页
并行应用程序的远程实时跟踪可视化技术通过实现对并行应用程序的实时监控 ,帮助科研人员更进一步地了解和控制并行数值模拟的计算过程 介绍一个面向并行应用程序的远程实时跟踪可视化系统 该系统远程实时访问运行在分布存储并行机上... 并行应用程序的远程实时跟踪可视化技术通过实现对并行应用程序的实时监控 ,帮助科研人员更进一步地了解和控制并行数值模拟的计算过程 介绍一个面向并行应用程序的远程实时跟踪可视化系统 该系统远程实时访问运行在分布存储并行机上的并行程序中的变量 ,将计算的中间结果实时地显示在客户端图形工作站上 ,从而实现程序的远程实时跟踪 从设计目标、体系结构及其实现等几个方面来介绍该系统 ,着重讲述该系统中的核心部分———数据传输模块的实现 。 展开更多
关键词 并行处理 可视化 实时跟踪
在线阅读 下载PDF
基因序列分析软件Hmmpfam的可扩展并行性能优化 被引量:4
19
作者 陈军 赵文辉 +1 位作者 莫则尧 李晓梅 《软件学报》 EI CSCD 北大核心 2004年第2期170-178,共9页
基于MPI(message passing interface)平台实现了HMMER软件包核心程序之一Hmmpfam的大规模并行计算.该版本针对原PVM(parallel virtual machine)并行版本在并行规模扩大后,master易成为通信瓶颈的问题,对通信结构进行了优化,提出了一种... 基于MPI(message passing interface)平台实现了HMMER软件包核心程序之一Hmmpfam的大规模并行计算.该版本针对原PVM(parallel virtual machine)并行版本在并行规模扩大后,master易成为通信瓶颈的问题,对通信结构进行了优化,提出了一种新的三层通信结构,在序列和HMM模型的两个层次上实现了并行化,并分别提供了有效的负载平衡策略,同时优化了I/O性能,在700多台处理机上达到95%的效率. 展开更多
关键词 并行计算 基因序列分析 HMMER
在线阅读 下载PDF
激光成丝不稳定性并行数值模拟研究 被引量:1
20
作者 陈军 莫则尧 +1 位作者 李斌 郑春阳 《高技术通讯》 CAS CSCD 北大核心 2007年第2期148-152,共5页
实现了三维非线性流体力学与激光传播耦合的并行数值模拟程序,用来研究高强度激光在稀疏等离子体中的激光成丝不稳定性。并行数值实验结果表明,该程序在64台处理机上取得了较好的并行加速比,且能定性模拟激光成丝现象。
关键词 激光等离子体相互作用 成丝不稳定性 流体力学 并行计算
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部