为了开展雷达天文科学研究,将射电望远镜接收的雷达回波信号进行采集和记录,研究基于SNAP(Smart Network ADC(Analog to Digital Converter)Processor)硬件实验板和快速存储服务器设计并开发了雷达天文基带数据采集与记录系统.该系统采...为了开展雷达天文科学研究,将射电望远镜接收的雷达回波信号进行采集和记录,研究基于SNAP(Smart Network ADC(Analog to Digital Converter)Processor)硬件实验板和快速存储服务器设计并开发了雷达天文基带数据采集与记录系统.该系统采用CASPER(Collaboration for Astronomy Signal Processing and Electronics Research)提供的图形化FPGA(Field Programmable Gate Array)开发工具流,设计了双通道、256 MHz带宽信号采集和VDIF(VLBI(Very Long Baseline Interferometry)Data Interchange Format)基带数据输出固件程序;基于HASHPIPE(High Availability SHared PIPeline Engine)多线程管理引擎开发了双万兆以太网口实时基带数据存储程序,存储带宽达到1 GB/s;最后编写了VDIF格式到雷达天文格式的转换程序.经过脉冲星信号观测实验检测,该系统准确、可靠.展开更多
为提高代数多重网格(algebraic multigrid,AMG)并行算法的可扩展性能,提出一种基于聚集粗化和最大独立集算法的混合并行粗化算法。在每个进程内部独立实现聚集粗化,在此基础上,进程间采用PMIS(parallel maximum independent set)算法对...为提高代数多重网格(algebraic multigrid,AMG)并行算法的可扩展性能,提出一种基于聚集粗化和最大独立集算法的混合并行粗化算法。在每个进程内部独立实现聚集粗化,在此基础上,进程间采用PMIS(parallel maximum independent set)算法对边界点进行修正。针对现代多核处理器,结合细粒度的并行编程模型,实现MPI+OpenMP混合编程并行算法。数值实验结果验证了该算法的有效性,对于求解二维五点Laplace方程在集群"元"上并行规模达到256核,相对于AGMG软件包求解总时间提高了74%,测试结果优于hypre软件包,可扩展到128核心。展开更多
计算流体动力学(computational fluid dynamics,CFD)是高性能计算重要应用领域之一,其计算涉及大量数据访问.在大规模并行计算情况下,串行I/O的性能与计算能力不匹配,I/O成为性能瓶颈.并行I/O是解决这一问题的主要途径之一.针对一个真...计算流体动力学(computational fluid dynamics,CFD)是高性能计算重要应用领域之一,其计算涉及大量数据访问.在大规模并行计算情况下,串行I/O的性能与计算能力不匹配,I/O成为性能瓶颈.并行I/O是解决这一问题的主要途径之一.针对一个真实多区结构网格CFD并行程序HOSTA(high-order simulator for aerodynamics),基于HDF5(hierarchical data format v5)数据存储格式及其并行I/O编程接口,实现了其主要数据的并行I/O.在一套有6个I/O服务器结点的高性能计算机系统上,采用实际CFD算例进行了性能测试.对一个三角翼算例,并行I/O相对于串行I/O的性能加速比达到21.27,最高获得5.81GBps的I/O吞吐率,并使程序整体性能提高10%以上;对一个网格规模更大的简单翼型算例,并行I/O最高获得了6.72GBps的I/O吞吐率.展开更多
文摘为了开展雷达天文科学研究,将射电望远镜接收的雷达回波信号进行采集和记录,研究基于SNAP(Smart Network ADC(Analog to Digital Converter)Processor)硬件实验板和快速存储服务器设计并开发了雷达天文基带数据采集与记录系统.该系统采用CASPER(Collaboration for Astronomy Signal Processing and Electronics Research)提供的图形化FPGA(Field Programmable Gate Array)开发工具流,设计了双通道、256 MHz带宽信号采集和VDIF(VLBI(Very Long Baseline Interferometry)Data Interchange Format)基带数据输出固件程序;基于HASHPIPE(High Availability SHared PIPeline Engine)多线程管理引擎开发了双万兆以太网口实时基带数据存储程序,存储带宽达到1 GB/s;最后编写了VDIF格式到雷达天文格式的转换程序.经过脉冲星信号观测实验检测,该系统准确、可靠.
文摘为提高代数多重网格(algebraic multigrid,AMG)并行算法的可扩展性能,提出一种基于聚集粗化和最大独立集算法的混合并行粗化算法。在每个进程内部独立实现聚集粗化,在此基础上,进程间采用PMIS(parallel maximum independent set)算法对边界点进行修正。针对现代多核处理器,结合细粒度的并行编程模型,实现MPI+OpenMP混合编程并行算法。数值实验结果验证了该算法的有效性,对于求解二维五点Laplace方程在集群"元"上并行规模达到256核,相对于AGMG软件包求解总时间提高了74%,测试结果优于hypre软件包,可扩展到128核心。
文摘计算流体动力学(computational fluid dynamics,CFD)是高性能计算重要应用领域之一,其计算涉及大量数据访问.在大规模并行计算情况下,串行I/O的性能与计算能力不匹配,I/O成为性能瓶颈.并行I/O是解决这一问题的主要途径之一.针对一个真实多区结构网格CFD并行程序HOSTA(high-order simulator for aerodynamics),基于HDF5(hierarchical data format v5)数据存储格式及其并行I/O编程接口,实现了其主要数据的并行I/O.在一套有6个I/O服务器结点的高性能计算机系统上,采用实际CFD算例进行了性能测试.对一个三角翼算例,并行I/O相对于串行I/O的性能加速比达到21.27,最高获得5.81GBps的I/O吞吐率,并使程序整体性能提高10%以上;对一个网格规模更大的简单翼型算例,并行I/O最高获得了6.72GBps的I/O吞吐率.