期刊文献+
共找到138篇文章
< 1 2 7 >
每页显示 20 50 100
DNA-based方法及其在研究动物食物组成中的应用 被引量:2
1
作者 马秀慧 王志坚 《四川动物》 CSCD 北大核心 2012年第3期497-503,共7页
了解动物的食物组成是研究生态系统的多样性和生态系统功能的基本要求,在动物生态学的研究中至关重要。DNA-based方法包括样本采集、DNA提取、PCR扩增、序列比对分析等一系列步骤,实验的成败取决于标记基因的选择、引物的设计及每个步... 了解动物的食物组成是研究生态系统的多样性和生态系统功能的基本要求,在动物生态学的研究中至关重要。DNA-based方法包括样本采集、DNA提取、PCR扩增、序列比对分析等一系列步骤,实验的成败取决于标记基因的选择、引物的设计及每个步骤的优化。文章综述了DNA-based方法的各个基本步骤及其优化方法,并对该方法在今后用于国内相关研究的可能性进行展望,关注用于研究国内三峡大坝这个大型水域生态系统的可能性,期望推动国内该领域的研究。 展开更多
关键词 dna-based方法 食物 目标基因 生态系统 三峡大坝
在线阅读 下载PDF
太空超算:概念、挑战及应用
2
作者 龚春叶 董皓 +4 位作者 包为民 李超 朱浩 王之 孟祥飞 《宇航学报》 北大核心 2025年第7期1263-1273,共11页
太空超算是指在地球外太空建立的超级计算系统,具备科学计算、智能计算和大数据处理能力。随着“后摩尔时代”的到来,以及能源技术与航天技术的快速发展,面对人类太空移民的迫切需求,太空超算有望成为引领未来科技发展的战略制高点。太... 太空超算是指在地球外太空建立的超级计算系统,具备科学计算、智能计算和大数据处理能力。随着“后摩尔时代”的到来,以及能源技术与航天技术的快速发展,面对人类太空移民的迫切需求,太空超算有望成为引领未来科技发展的战略制高点。太空超算作为新概念产品,面临着体系架构技术、兆瓦级太空发电及储能技术、散热技术、通信技术、可靠性技术、运维技术、可重复使用运载技术、低成本技术和可持续运营等挑战。太空超算在支撑天数天算和太空基地运营,牵引天电天用、可重复使用运载及太空信息技术发展等方面发挥着重要应用价值。预计投资数十亿元量级,可在未来5年左右建成P级太空超算验证系统,30年左右形成产业化运营;人类将从卫星、空间站时代进入太空信息时代,对太空的开发和利用将登上新台阶。 展开更多
关键词 超级计算 太空超算 太空电力 太空基地 太空信息
在线阅读 下载PDF
一种集成于超算作业调度系统应用的并行参数优化方法
3
作者 张文帅 李会民 +1 位作者 李京 潘必才 《计算机工程》 北大核心 2025年第7期59-67,共9页
随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率... 随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率影响很大。随着计算规模与复杂度的提升,多个并行参数的可配置空间越来越大,用户越来越难以确定最佳的并行参数值。这类运行时优化问题在科学计算应用中较为普遍,但相关的研究与解决方法比较少见。以VASP(Vienna Ab initio Simulation Package)应用为例,首先分析了该应用的多层并行结构,展示了不同并行参数配置引发的巨大运行速度差异。然后提出了一个基于约化并行效率指标的全自动运行优化方法,其不仅可以帮助用户简单快捷地确定最佳应用并行参数,而且可以帮助用户确定最佳的计算资源使用量,使应用可以高效率地扩展到大规模的并行计算中。最后将该优化方法与计算集群作业调度系统相融合应用于用户提交的真实VASP计算作业。统计结果表明,该方法显著提升了作业运行速度与超算资源的使用效率,具有很好的工程应用前景。 展开更多
关键词 并行计算 作业调度 运行时优化 超级计算 VASP应用
在线阅读 下载PDF
基于国产异构众核处理器的等值线与等值面提取算法优化
4
作者 张元胤 肖敏广 +3 位作者 刘志勇 翁灵玲 陈志广 卢宇彤 《计算机工程与科学》 北大核心 2025年第2期200-209,共10页
MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-300... MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-3000处理器上,由于片上缓存空间有限,从核访存带宽限制等问题,导致计算效率低下;另外,由于编程模型的特殊性,现有软件与方法无法直接在MT-3000上运行。为了充分发挥国产超算系统在可视化领域的计算效能,基于MT-3000的微体系结构对等值线网格序列算法和等值面移动立方体算法分别提出了新的并行化算法。新方法采用向量指令、流水线实现存算重叠等技术,更加适应异构众核架构,从而达到加速算法执行的目的。实验结果表明,2种算法的加速比均达到4以上,并且随着从核的增多,算法的执行时间近呈线性下降,这证明所提算法具有良好的可扩展性。 展开更多
关键词 数据过滤 等值线 等值面 并行计算 异构 众核 国产超算系统
在线阅读 下载PDF
MTTorch:面向MT-3000芯片和Transformer模型的PyTorch算子库实现与优化
5
作者 王昊天 孙羽菲 +4 位作者 隋轶丞 王嘉豪 石昌青 方建滨 张玉志 《软件学报》 北大核心 2025年第8期3896-3916,共21页
随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTo... 随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTorch扩展库——MTTorch,其核心是一个多核并行的算子库,对Transformer类模型训练过程中的核心算子进行向量化实现和优化.同时,针对MT-3000架构特性,提出了面向多核DSP的高性能规约算法及乒乓算法,显著提升了算子的运算性能.MTTorch还具有很好的通用性,对于不同版本的PyTorch都可以动态链接库的形式进行加载,不改变PyTorch的原生实现.大量实验证明,实现的核心算子在MT-3000芯片上有着很好的性能,在单DSP簇上可以达到8倍的加速效果.利用MTTorch在多节点执行训练任务时有着接近线性的加速比,极大地提升了Transformer类模型在MT-3000芯片上的训练效率. 展开更多
关键词 PyTorch 高性能计算 Transformer模型 天河超级计算机 CPU+DSP异构计算 软件生态
在线阅读 下载PDF
大型研究基础设施如何影响能源效率?——来自国家超算中心的证据
6
作者 丁烨旻 余泳泽 +1 位作者 胡鹏 朱子政 《产经评论》 北大核心 2025年第4期39-53,共15页
大型研究基础设施作为驱动技术前沿突破的关键载体,其能源效率影响机制尚未得到系统性阐释。以国家超算中心为典型样本,基于2001—2021年中国91个城市的面板数据,运用多期DID模型,实证检验大型研究基础设施对能源效率的多维度影响机制... 大型研究基础设施作为驱动技术前沿突破的关键载体,其能源效率影响机制尚未得到系统性阐释。以国家超算中心为典型样本,基于2001—2021年中国91个城市的面板数据,运用多期DID模型,实证检验大型研究基础设施对能源效率的多维度影响机制。结果显示:国家超算中心获批通过“抑制—促进”双重路径作用于所在城市能源效率,其高能耗属性引致的直接能源消耗效应形成效率抑制,而通过产业数字化转型(结构效应)与全要素生产率跃升(技术效应)产生的间接促进效应显著占优,最终呈现正向净效应。使用空间DID模型进一步研究发现,国家超算中心获批能够显著促进周边城市能源效率的提升。国家超算中心获批对能源效率的多重作用机制为平衡大型研究基础设施能耗约束与可持续发展目标提供了理论依据与政策优化路径,应从削弱超算中心的能源消耗效应,发挥超算中心的结构效应和技术效应入手,促进产业数字化转型和技术创新,提升能源效率。 展开更多
关键词 国家超算中心 能源效率 产业数字化 全要素生产率
在线阅读 下载PDF
面向国产超算的操作系统评测与优化
7
作者 高亦沁 罗智宇 +1 位作者 王一超 林新华 《计算机科学》 北大核心 2025年第5期11-24,共14页
超级计算机是“国之重器”,我国在“十四五”期间建设后E级国产超算,支撑关系国计民生的重大计算应用。操作系统作为超算核心系统软件之一,其开销将影响超算整机的运行性能,因此操作系统测评成为新一代国产超算技术路线的重要研究课题... 超级计算机是“国之重器”,我国在“十四五”期间建设后E级国产超算,支撑关系国计民生的重大计算应用。操作系统作为超算核心系统软件之一,其开销将影响超算整机的运行性能,因此操作系统测评成为新一代国产超算技术路线的重要研究课题之一。openEuler在搭载了鲲鹏处理器的系统上有良好的性能与兼容性,但尚未在超算领域有过大规模应用,因此需要对其性能进行全面评测,并对存在的性能瓶颈进行优化。文中的工作分为两个部分。1)对openEuler在超算系统上的性能开展了评测,并以CentOS为参考对象进行了对比。结果表明,在运行非集合通信密集型应用时,openEuler的性能与CentOS相当。然而,在使用OpenMPI进行Allreduce等集合通信操作时,openEuler的性能会降低最多76.83%,并导致千核规模下通信密集型应用的性能降低最多23.01%。2)基于在评测过程中发现的MPI集合通信性能问题,提出了一种性能建模与优化方法。该方法基于点对点通信的霍克尼模型,为集合通信各实现算法进行建模,以预测不同进程数量和消息大小下的通信时间,从而选择合适的集合通信实现算法。所提方法可通过OpenMPI的MCA接口在运行时动态调整实现算法的选择。优化后,openEuler上的科学计算应用性能提升显著,运行时间最多缩短了26%。 展开更多
关键词 高性能计算 国产超级计算机 操作系统 性能评测 集合通信性能
在线阅读 下载PDF
轻质量大算力“天算计划”底层数据平台设计与应用
8
作者 肖舸 刘艺博 《中国空间科学技术(中英文)》 北大核心 2025年第2期33-41,共9页
空间太阳能开发与利用的设想正在逐步成为现实,对于星地能量传输支撑的用能方式,损耗以及对环境的影响不可避免。若能将这些原本会损耗的电能加以利用产生价值,就能有效提升空间太阳能电站电能的利用效率。在太空中建立轻质量、大算力... 空间太阳能开发与利用的设想正在逐步成为现实,对于星地能量传输支撑的用能方式,损耗以及对环境的影响不可避免。若能将这些原本会损耗的电能加以利用产生价值,就能有效提升空间太阳能电站电能的利用效率。在太空中建立轻质量、大算力、高效能的数据处理中心,直接使用空间太阳能电站的一部分电能,对来自卫星、地面站等数据源的空间数据进行计算处理的“天算计划”理念应运而生。天算计划的工程实现,必须解决如何在有限硬件资源下提供尽可能高的底层数据能力支撑这一问题,目前少见有效的解决方案。设计了“软超算”平台,基于高性能实时数据库软件NoSQLt,充分发挥其体量小巧、跨平台支持能力强、性能不依赖硬件的特点,直接把数据库作为数据载体,提供高并发、高吞吐的数据支持能力,以软件能力充分发挥硬件算力,从而利用部署在太空中有限的硬件资源实现高效率的数据处理功能。基于NoSQLt的诸多应用案例已经证明了软超算平台的可行性,在普通台式机和树莓派4B硬件平台上,分别实现了530万笔/秒和115万笔/秒的数值型数据的并发吞吐能力,提出了“单位吞吐能力”这一新的数据中心能耗评估指标。通过验证测试证明了NoSQLt数据库在有限硬件资源下的高效性,为将来天算计划的落地应用提供了底层能力保障。 展开更多
关键词 空间太阳能电站 天算计划 数据库 时空数据 软超算
在线阅读 下载PDF
国家级超算布局、数智创新生态系统韧性和低空经济领域技术创新——基于BERTopic模型和双重机器学习的实证研究
9
作者 吕鲲 潘均柏 谢珠约 《工业技术经济》 北大核心 2025年第6期37-46,共10页
为验证国家级超算布局如何通过驱动数智创新生态系统韧性提升间接影响低空经济领域技术创新成果数量、质量及技术部门多元化发展,本文基于BERTopic主题模型从低空经济领域发明专利文本中提取出系统架构与智能控制等20个细分技术主题,以... 为验证国家级超算布局如何通过驱动数智创新生态系统韧性提升间接影响低空经济领域技术创新成果数量、质量及技术部门多元化发展,本文基于BERTopic主题模型从低空经济领域发明专利文本中提取出系统架构与智能控制等20个细分技术主题,以及飞行器导航与控制系统等5个技术大类主题(技术部门);构建包括遗传繁衍、结构冗余、功能升级、栖息适应、锁定破解5个维度的数智创新生态系统韧性评价体系,采用双重机器学习模型对2011~2023年30个省域的面板数据进行实证分析,结论如下:(1)国家级超算布局能够显著促进区域在低空经济领域的技术创新数量和技术创新质量;(2)国家级超算布局能够通过促进数智创新生态系统韧性,间接促进低空经济领域飞行器导航与控制系统、飞行器激光与光电检测技术、结构动力与任务执行系统、智能巡检与监控系统4个技术大类主题的技术创新,但对消防救援无人机系统这一典型场景驱动的技术创新作用不显著;(3)遗传繁衍等5个维度都能够在国家级超算布局和低空经济领域技术创新之间发挥机制效应,但部分机制路径当前不具备可推广性。 展开更多
关键词 国家级超算布局 数智创新生态系统韧性 低空经济 BERTopic主题模型 双重机器学习模型 因果中介效应 技术创新 技术异质性
在线阅读 下载PDF
基于ZYNQ芯片的基板管理控制器设计与实现 被引量:3
10
作者 马柯帆 李宝峰 +3 位作者 周悦锦 武园园 余永兰 多瑞华 《计算机工程与科学》 CSCD 北大核心 2024年第2期217-223,共7页
随着超算、云计算等数据中心的大规模发展,主板的架构日益复杂,成本控制越来越严苛,常用的基板管理控制器(BMC)设计方案可扩展功能有限,迫切需要设计一种低成本且高效的BMC方案。提出一种基于Vivado和Yocto Project的集成开发平台,选用X... 随着超算、云计算等数据中心的大规模发展,主板的架构日益复杂,成本控制越来越严苛,常用的基板管理控制器(BMC)设计方案可扩展功能有限,迫切需要设计一种低成本且高效的BMC方案。提出一种基于Vivado和Yocto Project的集成开发平台,选用XILINX ZYNQ系列FPGA芯片,采用其内部硬核ARM运行的OpenBMC方案。该设计通过AXI总线扩展外设,可扩展性强、灵活性高,从而实现BMC与FPGA的双重管理二合一,节约了主板的空间与成本。 展开更多
关键词 ZYNQ 超算 OpenBMC 云计算 FPGA
在线阅读 下载PDF
基于超算的多模式计算融合支撑系统 被引量:1
11
作者 卢宇彤 陈志广 《中山大学学报(自然科学版)(中英文)》 CAS CSCD 北大核心 2024年第6期150-160,共11页
复杂的科学工程计算应用要求在数值模拟、大数据处理、人工智能3种计算模式之间实现融合,而这3种计算模式具有不同的负载特征,它们在执行、调度、数据访问方面具有显著的差异,传统的超级计算机不能同时高效地支撑以上3种计算模式。我们... 复杂的科学工程计算应用要求在数值模拟、大数据处理、人工智能3种计算模式之间实现融合,而这3种计算模式具有不同的负载特征,它们在执行、调度、数据访问方面具有显著的差异,传统的超级计算机不能同时高效地支撑以上3种计算模式。我们重构了超级计算机的并行文件系统、并行通信系统、资源管理与作业调度系统等系统软件,并设计了基于超算的大数据处理框架和人工智能推理框架,支持在高性能计算应用中融合大数据和人工智能计算模式,形成了基于超算环境的多模式计算融合支撑系统。应用表明,所研发的融合支撑系统能够支持3种计算模式的耦合,且在性能上表现出显著的优势,为复杂的科学工程计算应用提供了完善的运行环境。 展开更多
关键词 多模式融合计算 超级计算机 科学工程计算
在线阅读 下载PDF
面向深度神经网络大规模分布式数据并行训练的MC^(2)能耗模型 被引量:1
12
作者 魏嘉 张兴军 +2 位作者 王龙翔 赵明强 董小社 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期2985-3004,共20页
深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性... 深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性能计算平台过量能耗方面起着至关重要的作用.目前,大部分的能耗模型都是从设备的角度出发对单个设备或多个设备构成的集群进行能耗建模,由于缺乏从能耗角度对分布式并行DNN应用进行分解剖析,导致罕有针对分布式DNN应用特征进行建模的能耗模型.针对目前最常用的DNN分布式数据并行训练模式,从DNN模型训练本质特征角度出发,提出了“数据预处理(materials preprocessing)-前向与反向传播(computing)-梯度同步与更新(communicating)”三阶段MC^(2)能耗模型,并通过在国产E级原型机天河三号上使用最多128个MT节点和32个FT节点训练经典的VGG16和ResNet50网络以及最新的Vision Transformer网络验证了模型的有效性和可靠性.实验结果表明,MC^(2)与真实能耗测量结果相差仅为2.84%,相较4种线性比例能耗模型以及AR,SES,ARIMA时间预测模型准确率分别提升了69.12个百分点,69.50个百分点,34.58个百分点,13.47个百分点,5.23个百分点,22.13个百分点,10.53个百分点.通过使用的模型可以在超算平台得到DNN模型的各阶段能耗和总体能耗结果,为评估基于能耗感知的DNN大规模分布式数据并行训练及推理各阶段任务调度、作业放置、模型分割、模型裁剪等优化策略的效能提供了基础. 展开更多
关键词 深度神经网络 能耗模型 大规模分布式训练 数据并行 超级计算机
在线阅读 下载PDF
面向天河新一代超算系统通用处理器的性能分析工具集
13
作者 冯文韬 栾钟治 +1 位作者 杨海龙 钱德沛 《计算机学报》 EI CSCD 北大核心 2024年第2期423-440,共18页
天河新一代超算系统是继天河2号后天河系列的新一代超算系统.该系统拟采用通用处理器配合加速器的混合异构架构,其中通用处理器采用ARM架构.目前,面向ARM架构处理器的性能分析工具仍不够完善,而面向新一代超算的性能分析工具更是较为匮... 天河新一代超算系统是继天河2号后天河系列的新一代超算系统.该系统拟采用通用处理器配合加速器的混合异构架构,其中通用处理器采用ARM架构.目前,面向ARM架构处理器的性能分析工具仍不够完善,而面向新一代超算的性能分析工具更是较为匮乏,实用性和效率还难以满足编程人员的需求.本文针对天河新一代超算系统的通用处理器,设计开发了一套性能分析工具集,包含缓存冲突检测、伪共享检测和内存缺陷检测三个子工具.工具集可以在天河新一代超算系统的普通用户权限下分析系统单节点内以及数据并行性较高的多节点程序的性能问题,并可以解决程序的内存问题.本文使用min-write、缓存行对齐填充、线程访问隔离等多种性能优化策略来提高工具性能,采用以上策略的工具的运行时间可至多减少至原先的1/20,同时使用新颖的红区检测法和红区隐藏与恢复机制来降低工具报告的假错误率.本文还开发了配套的可视化界面,使用户可以对程序的性能分析数据进行可视化的分析和处理,提高了工具的实用性和易用性.工具对程序执行带来的额外时间开销是40~100倍,额外内存开销是100~200倍,正确性和实用性得以保证,可以提高天河新一代超算系统的编程效率和程序性能. 展开更多
关键词 性能分析工具 天河新一代超算系统 伪共享检测 内存缺陷检测 程序优化
在线阅读 下载PDF
面向超级计算机系统的可视化综述 被引量:1
14
作者 吕斐 陈长建 +2 位作者 张嘉鹏 冯冼 唐卓 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第3期321-335,共15页
随着科技飞速发展,超级计算机系统不断向着更大规模迈进,给系统使用和维护带来困难.可视化技术以直观易懂的方式展示超级计算机系统的运行状态、异常情况等,让用户更加深入地理解系统内部运行机制,有助于更好地使用和优化系统.通过文献... 随着科技飞速发展,超级计算机系统不断向着更大规模迈进,给系统使用和维护带来困难.可视化技术以直观易懂的方式展示超级计算机系统的运行状态、异常情况等,让用户更加深入地理解系统内部运行机制,有助于更好地使用和优化系统.通过文献调研,分析了超级计算机系统可视化的相关工作,并根据系统使用流程将其分为状态监控、性能优化和系统维护3个方面.分析表明,可视化在状态监控方面可帮助分析系统运行时内部进程和数据的状态;在性能优化方面可帮助定位性能瓶颈并优化;在系统维护方面可帮助发现运行异常以及对异常溯源.最后,详细阐述了未来超级计算机系统可视化在大规模数据处理、全局优化、下游任务迁移等方向上面临的机遇和挑战. 展开更多
关键词 超级计算机 可视化 状态监控 性能优化 系统维护
在线阅读 下载PDF
云化的智算中心万卡集群创新与实践 被引量:2
15
作者 丁宏庆 张鹏飞 +6 位作者 牛红韦华 李志勇 周丹媛 丁国强 李攀攀 李道通 张久仙 《电信科学》 北大核心 2024年第12期125-135,共11页
为解决智算中心超大规模算力集群算力可用率低、国产技术成熟度低、大规模组网效率存在瓶颈、运营运维复杂等问题,提出了一种基于云计算技术构建智算中心万卡集群的系统。采用18432块神经网络处理单元(neural processing unit,NPU)卡和... 为解决智算中心超大规模算力集群算力可用率低、国产技术成熟度低、大规模组网效率存在瓶颈、运营运维复杂等问题,提出了一种基于云计算技术构建智算中心万卡集群的系统。采用18432块神经网络处理单元(neural processing unit,NPU)卡和优化后的基于以太网的远程直接内存访问(remote direct memory access,RDMA)网络构建云化的智算中心万卡集群,结合软件定义网络(software defined network,SDN)技术实现RDMA网络租户隔离,实现了链路负载均衡误差小于10%,集群All-Reduce带宽达35 GB/s以上。采用优化后的分布式存储协议,实现模型断点恢复时长缩短为原来的1/2。验证结果表明,经过软硬件协同优化,国产化的NPU万卡集群不仅能够满足千亿参数大模型训练的需求,未来更可以支撑万亿参数大模型训练任务。 展开更多
关键词 超级计算集群 智算中心 万卡集群 人工智能
在线阅读 下载PDF
一种面向通用计算设备的自动流水线并行训练框架
16
作者 钟震宇 林勇良 +3 位作者 王昊天 李东闻 孙羽菲 张玉志 《计算机科学》 CSCD 北大核心 2024年第12期129-136,共8页
训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现。现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备。为支持大规模深度神经网络的高效训... 训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现。现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备。为支持大规模深度神经网络的高效训练,实现了一种通用的自动流水线并行分布式训练框架。本框架通过结合基于流水线并行的模型并行策略与神经网络模型自动拆分算法,实现了在包括国内新一代超级计算机在内的通用计算机集群上,对大规模神经网络模型与训练数据进行自动并行化处理和训练,显著减轻单个计算节点的内存和计算压力。该框架无需人工调整,可以自动高效地在多节点分布式环境中部署深度神经网络,不仅适用于超级计算机等高性能计算机集群,还可以部署到其他通用的分布式计算环境中,为大规模神经网络的自动化分布式训练提供支持。 展开更多
关键词 流水线并行 深度神经网络 超级计算机 MPI 并行计算
在线阅读 下载PDF
面向大数据应用挑战的超级计算机设计 被引量:15
17
作者 廖湘科 谭郁松 +3 位作者 卢宇彤 谢旻 周恩强 黄杰 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第1期3-16,共14页
在大数据时代,大数据处理给面向高性能计算设计的超级计算机带来计算、存储、通信、编程等软硬件体系结构方面的挑战.对此在分析目前主流学术界和工业界相关研究成果的基础上,介绍了天河二号超级计算机系统针对大数据处理应用所采用的... 在大数据时代,大数据处理给面向高性能计算设计的超级计算机带来计算、存储、通信、编程等软硬件体系结构方面的挑战.对此在分析目前主流学术界和工业界相关研究成果的基础上,介绍了天河二号超级计算机系统针对大数据处理应用所采用的新型异构多态体系结构、自主定制高速互连网络、混合层次式存储系统、混合计算框架等多种优化措施,为大数据时代的超级计算机设计提供有意义的参考. 展开更多
关键词 大数据 超级计算机 天河二号
在线阅读 下载PDF
高性能计算技术在气象领域的应用 被引量:28
18
作者 赵立成 沈文海 +5 位作者 肖华东 王彬 孙婧 魏敏 李娟 沈瑜 《应用气象学报》 CSCD 北大核心 2016年第5期550-558,共9页
高性能计算通过应用超级计算机与并行处理技术解决复杂的计算问题,是信息技术发展比较迅猛的领域之一。气象应用始终是高性能计算的重要领域,高性能计算技术有效地解决了高分辨率、高精度气象数值预报模式发展限制,在气象预报预测业务... 高性能计算通过应用超级计算机与并行处理技术解决复杂的计算问题,是信息技术发展比较迅猛的领域之一。气象应用始终是高性能计算的重要领域,高性能计算技术有效地解决了高分辨率、高精度气象数值预报模式发展限制,在气象预报预测业务中发挥着核心支撑作用。数十年以来,由于数值天气模式研究和业务运行对计算资源的强烈需求,国内外气象领域高性能计算机及应用迅速发展起来。气象领域对高性能计算能力及系统的可靠性需求日益提升。高性能计算技术将与气象预报应用日益融合,相互影响促进,不断创新发展。为满足气象预报预测业务和科研工作需求,中国气象部门将进一步提升高性能计算能力,并致力于优化集约高性能计算系统布局,高效管理计算资源,发挥最大效益。 展开更多
关键词 高性能计算 气象数值模式 超级计算机
在线阅读 下载PDF
超级计算系统互连网络带内管理的实现与评测 被引量:8
19
作者 曹继军 肖立权 +2 位作者 王克非 庞征斌 陈琳 《计算机学报》 EI CSCD 北大核心 2016年第9期1717-1732,共16页
互连网络是超级计算系统的关键部件,其易管理性将直接影响整个系统的RAS特性(可靠性、可用性和服务性)."天河二号"超级计算系统采用了定制的高速互连网络,该网络由大约5856块网络交换芯片NRC和18 304块网络接口芯片NIC构成,... 互连网络是超级计算系统的关键部件,其易管理性将直接影响整个系统的RAS特性(可靠性、可用性和服务性)."天河二号"超级计算系统采用了定制的高速互连网络,该网络由大约5856块网络交换芯片NRC和18 304块网络接口芯片NIC构成,其互连规模极其巨大.为了实现对系统内众多网络芯片及其端口的高效率配置和监控等管理操作,该互连网络采用了基于带内的网络管理技术.该文描述了带内网络管理的设计与实现,具体包括网络管理功能、网络管理总体结构、带内管理描述符格式与报文处理流程、管理软件的总体框架等.基于部署在国家超级计算广州中心的实际系统,该文对"天河二号"互连网络带内的管理进行了测试,测试结果证明了带内管理的高效性. 展开更多
关键词 超级计算系统 互连网络 带内管理 天河二号
在线阅读 下载PDF
xGrid:面向交叉学科研究的网格原型 被引量:4
20
作者 刘鹏 李三立 +3 位作者 黄震春 都志辉 何川 陈渝 《小型微型计算机系统》 CSCD 北大核心 2004年第4期481-484,共4页
x Grid是一种面向交叉学科研究的网格 .它把分散在各地的高性能计算机、海量存储器、贵重仪器和数据库等用中间件软件有机粘合在一起 ,形成一个信息处理基础设施 ,为各地的科技工作者提供单一映像的虚拟资源平台 .同时 ,x Grid提供了多... x Grid是一种面向交叉学科研究的网格 .它把分散在各地的高性能计算机、海量存储器、贵重仪器和数据库等用中间件软件有机粘合在一起 ,形成一个信息处理基础设施 ,为各地的科技工作者提供单一映像的虚拟资源平台 .同时 ,x Grid提供了多种手段支持交叉学科的科研和教学活动 ,包括 Web使用界面、应用模板库、可视化支撑平台和协同工作工具等 .本文详细讨论了 x 展开更多
关键词 交叉学科研究 网格 xGrid 高性能计算机 GLOBUS
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部