期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于国产异构众核处理器的等值线与等值面提取算法优化
1
作者 张元胤 肖敏广 +3 位作者 刘志勇 翁灵玲 陈志广 卢宇彤 《计算机工程与科学》 北大核心 2025年第2期200-209,共10页
MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-300... MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-3000处理器上,由于片上缓存空间有限,从核访存带宽限制等问题,导致计算效率低下;另外,由于编程模型的特殊性,现有软件与方法无法直接在MT-3000上运行。为了充分发挥国产超算系统在可视化领域的计算效能,基于MT-3000的微体系结构对等值线网格序列算法和等值面移动立方体算法分别提出了新的并行化算法。新方法采用向量指令、流水线实现存算重叠等技术,更加适应异构众核架构,从而达到加速算法执行的目的。实验结果表明,2种算法的加速比均达到4以上,并且随着从核的增多,算法的执行时间近呈线性下降,这证明所提算法具有良好的可扩展性。 展开更多
关键词 数据过滤 等值线 等值面 并行计算 异构 众核 国产超算系统
在线阅读 下载PDF
结构网格CFD应用程序在天河超级计算机上的高效并行与优化 被引量:5
2
作者 王勇献 张理论 +3 位作者 车永刚 徐传福 刘巍 程兴华 《电子学报》 EI CAS CSCD 北大核心 2015年第1期36-44,共9页
对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能... 对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性. 展开更多
关键词 计算流体力学 多区结构网格 并行计算 天河计算机 CPU+MIC异构计算
在线阅读 下载PDF
遗传-分布估计算法求解化工生产中一类带多工序的异构并行机调度问题 被引量:14
3
作者 李作成 钱斌 +2 位作者 胡蓉 罗蓉娟 张桂莲 《化工学报》 EI CAS CSCD 北大核心 2014年第3期981-992,共12页
针对化工生产中广泛存在的一类带多工序的异构并行机调度问题,即部分产品需多工序加工,同时不同产品间带序相关设置时间的异构并行机调度问题(heterogeneous parallel machine scheduling problem with multiple operations and sequenc... 针对化工生产中广泛存在的一类带多工序的异构并行机调度问题,即部分产品需多工序加工,同时不同产品间带序相关设置时间的异构并行机调度问题(heterogeneous parallel machine scheduling problem with multiple operations and sequence-dependent setup times,HPMSP_MOSST),提出了一种遗传-分布估计算法(genetic algorithm-estimation of distribution algorithm,GA-EDA),用于优化最早完工时间(makespan)。首先,提出了一种基于GA的概率模型训练机制,用来提高概率模型在算法进化初期的信息积累量,进而提高搜索的效率;其次,设计了一种有效的GA与EDA混合策略,使得算法的全局探索和局部开发能力得到合理平衡。计算机模拟验证了GA-EDA的有效性和鲁棒性。 展开更多
关键词 异构并行机 多工序 遗传算法 分布估计算法 优化 概率模型 计算机模拟
在线阅读 下载PDF
一种暂态稳定约束TTC评估的分布式并行计算方法 被引量:9
4
作者 石立宝 郭子健 +1 位作者 倪以信 姚良忠 《电力系统自动化》 EI CSCD 北大核心 2009年第6期44-48,共5页
在预想故障集下,针对大规模互联电力系统的暂态稳定约束最大输电能力(TTC)评估问题,提出了一种基于任务级的分布式并行计算方法——优化的工作站群的计算方法。该分布式并行计算方法把异构分布式计算资源加以融合,实现有效的动态负载均... 在预想故障集下,针对大规模互联电力系统的暂态稳定约束最大输电能力(TTC)评估问题,提出了一种基于任务级的分布式并行计算方法——优化的工作站群的计算方法。该分布式并行计算方法把异构分布式计算资源加以融合,实现有效的动态负载均衡,从而最大化利用系统的整体计算性能,具有良好的动态扩展性与容错性。应用所提出的方法对具有1101个母线和97台发电机的中国某实际电网进行了测试。测试结果表明,该分布式并行计算方法是实用有效的。 展开更多
关键词 暂态稳定 极限传输容量 优化的工作站群 异构分布式系统 分布式并行计算
在线阅读 下载PDF
面向高性能数值计算的并行计算模型DRAM(h) 被引量:16
5
作者 张云泉 《计算机学报》 EI CSCD 北大核心 2003年第12期1660-1670,共11页
提出了一个基于存储层次的新并行计算模型DRAM (h) ,并在该模型下对两个经典并行数值计算算法的不同实现形式 :四种形式并行下三角方程求解 (PTRS)和六种形式无列选主元并行LU分解 (PLU) ,进行了分析 .模型分析表明 ,具有近乎相同时间... 提出了一个基于存储层次的新并行计算模型DRAM (h) ,并在该模型下对两个经典并行数值计算算法的不同实现形式 :四种形式并行下三角方程求解 (PTRS)和六种形式无列选主元并行LU分解 (PLU) ,进行了分析 .模型分析表明 ,具有近乎相同时间和空间复杂性的同一算法不同实现形式 ,在该模型下会有完全不同的存储复杂度 .作者在日立公司SR2 2 0 1MPP并行机、曙光 3 0 0 0超级服务器和中国科学院科学与工程计算国家重点实验室(LSEC)的 12 8节点LinuxCluster等三种并行计算平台上对模型分析结果进行了实验验证 .结果表明 ,该模型分析在绝大多数情况下都能较好地与不同实验平台上的实验结果吻合 .个别出现偏差的分析结果 ,在根据计算平台的存储层次特点修改模型分析的假定后 ,也能够进行解释 .这说明了该模型对不同形式的算法实现进行存储访问模式区分的有效性 .对在计算模型中加入指令 /线程级并行的可行性和方法的研究是下一步的工作 . 展开更多
关键词 存储器 并行计算模型 高性能数值计算 DRAM(h) 计算模型 存储复杂性
在线阅读 下载PDF
基于网络的异构型超级计算 被引量:1
6
作者 窦勇 周兴铭 《计算机工程与科学》 CSCD 1994年第1期13-18,共6页
实现基于网络的异构型超级计算具有巨大的潜力,它可以充分开发应用问题的固有并行性以及网络所集合的巨大计算资源。本文论述了异构型计算的特点和相关的问题,并介绍了两个具有代表性的异构型计算软件。
关键词 超级计算机 并行计算 网络互连
在线阅读 下载PDF
元计算的灵活构架
7
作者 曾志勇 曾国荪 陆鑫达 《江西师范大学学报(自然科学版)》 CAS 2001年第1期24-28,共5页
元计算机就是一个用软件连接起来的像PC一样容易使用的异构网络计算资源 ,近年来发展非常迅速 .文章首先讨论了它的发展背景 ,接着介绍了元系统在国内外的发展和研究的情况 ,并在此基础之上给出了一个灵活的实例———IceT .
关键词 并行分布计算 异构计算 元计算 IceT 异构网络系统 元系统 计算资源 构架
在线阅读 下载PDF
一种包含Transputer的异构型分布式并行计算系统的架构
8
作者 陈德来 王晨 张德富 《小型微型计算机系统》 CSCD 北大核心 1996年第2期1-5,共5页
本文针对PVM不支持Transputer的不足,介绍了基于TCP/IP的Transputer异构型分布式并行计算系统(T-DPCS)的软硬件架构。从通信协议的选择、Transputer共享支持软件、分布式协同软件架构... 本文针对PVM不支持Transputer的不足,介绍了基于TCP/IP的Transputer异构型分布式并行计算系统(T-DPCS)的软硬件架构。从通信协议的选择、Transputer共享支持软件、分布式协同软件架构和通信函数库的实现等4个方面详细地阐述了实现TDPCS的方案,并进行了原型实现。 展开更多
关键词 并行计算 异构型 分布式计算机
在线阅读 下载PDF
国产超算平台分析城市环境电磁射线传播的并行计算研究 被引量:3
9
作者 王大鹏 李岷轩 +2 位作者 陈贵齐 王楠 张玉 《微波学报》 CSCD 北大核心 2019年第4期52-55,共4页
基于国产'神威·太湖之光'超级计算机平台,研究了适用于国产众核架构的一致性几何绕射理论方法的并行计算。该方法可用于城市环境电磁射线传播的高效分析以及以射线传播为基础的电磁态势预测。以260个异构核为基准,其并行... 基于国产'神威·太湖之光'超级计算机平台,研究了适用于国产众核架构的一致性几何绕射理论方法的并行计算。该方法可用于城市环境电磁射线传播的高效分析以及以射线传播为基础的电磁态势预测。以260个异构核为基准,其并行方案在4160个异构核时的并行效率达到了99%以上。数值结果表明该并行方法能够在国产众核平台中快速高效地解决城市某区域的电磁场传播预测问题,并为后续安全、高效地开展城市电磁态势预测分析提供支撑。 展开更多
关键词 国产超算平台 并行计算 一致性几何绕射理论 电磁场分布
在线阅读 下载PDF
异构机群系统上近似串匹配并行算法 被引量:1
10
作者 范大娟 钟诚 许莉莉 《计算机工程》 CAS CSCD 北大核心 2008年第3期141-144,共4页
基于可分负载理论的最优原则,在假定正文串分配顺序固定的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情况,提出一种异构机群计算环境下的最优正文串分配策略,给出最优正文串分配的闭合解。对于节点具有不同计算速度、... 基于可分负载理论的最优原则,在假定正文串分配顺序固定的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情况,提出一种异构机群计算环境下的最优正文串分配策略,给出最优正文串分配的闭合解。对于节点具有不同计算速度、通信能力、存储容量的异构机群系统,建立正文串最优分配的线性规划模型。针对几种特殊情况讨论正文串的最优分配顺序。实验结果表明,与平均分配正文串策略以及按照从处理机能力分配正文串策略相比,利用该策略进行近似串匹配并行处理所需时间分别缩短了10%~40%和5%~20%。 展开更多
关键词 近似串匹配 并行算法 异构机群系统 可分负载 分配策略
在线阅读 下载PDF
申威异构众核处理器架构下结构瞬态有限元并行算法 被引量:1
11
作者 喻高远 楼云锋 +1 位作者 李俊杰 金先龙 《振动与冲击》 EI CSCD 北大核心 2023年第6期152-158,共7页
根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newma... 根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newmark-HHT算法的基础上构建了大规模复杂结构系统的瞬态并行求解体系,不仅实现了计算过程中大量数据的分布式存储,显著改善了数据的内存访存效率;而且实现了计算过程的两层并行,有效改善了通信效率。因此,该计算方法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提升结构瞬态大规模并行计算效率。最后通过典型数值算例验证了该方法的正确性和有效性,并将其应用于某高层建筑,实现其上千万自由度、数万核的结构瞬态并行计算。 展开更多
关键词 异构众核 分布式存储 分层通信 大规模瞬态分析 并行计算
在线阅读 下载PDF
面向异构超算的结构分析高效并行计算方法 被引量:1
12
作者 丁峻宏 苗新强 李根国 《计算机工程与科学》 CSCD 北大核心 2020年第12期2133-2140,共8页
为充分利用异构超算众核环境下的高效计算性能,提出一种针对有限元结构力学分析的多层次多粒度协同并行计算方法。该方法将每个计算作业从结点间、设备间和核间3个层次进行划分。每个计算作业被分解映射到异构超算的各硬件层面运行,在... 为充分利用异构超算众核环境下的高效计算性能,提出一种针对有限元结构力学分析的多层次多粒度协同并行计算方法。该方法将每个计算作业从结点间、设备间和核间3个层次进行划分。每个计算作业被分解映射到异构超算的各硬件层面运行,在有效处理CPU与MIC之间负载均衡问题的基础上显著降低了异构超算的通信成本。在“天河二号”上开展了针对几个大规模工程案例的计算测试,所启动的CPU+MIC核数总计达39000个,计算模型有限元规模超过1亿单元。测试结果表明,该方法进行有限元结构分析大规模并行计算时能够获得良好的加速比和并行计算效率,实现了有限元结构分析与异构众核计算平台的优化适配,可为同类应用问题的并行移植和性能优化提供借鉴与参考。 展开更多
关键词 并行计算 异构超算 结构分析 负载均衡
在线阅读 下载PDF
异构机群系统上并行计算双序列的最长公共子序列
13
作者 许莉莉 魏鹰 +1 位作者 罗海鹏 张林才 《计算机应用研究》 CSCD 北大核心 2010年第5期1669-1671,1682,共4页
针对处理机节点具有不同计算速度、不同通信能力的情况,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,提出一种存储受限异构机群系统的序列串最优分配线性规划模型,给出相应的序列串最优分配方法。实验结果表明,基于最... 针对处理机节点具有不同计算速度、不同通信能力的情况,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,提出一种存储受限异构机群系统的序列串最优分配线性规划模型,给出相应的序列串最优分配方法。实验结果表明,基于最优序列串分配方法的双序列最长公共子序列并行算法优于平均分配序列串算法,获得了较好的加速,并具有良好的可扩展性。 展开更多
关键词 双序列的最长公共子序列 并行算法 异构机群系统 可分负载 分配策略
在线阅读 下载PDF
异构系统中基于可用性的粒子群任务调度算法
14
作者 李大普 陈光喜 李肯立 《计算机工程与科学》 CSCD 北大核心 2012年第6期44-49,共6页
任务调度技术是并行分布式系统中的关键技术之一,对系统的性能起着重要作用,但通常情况下大型系统的任务调度问题属于NP问题。而现代启发式生物进化算法是找出很多NP问题近似解的有效方法。本文将粒子群算法应用于基于可用性的网格系统... 任务调度技术是并行分布式系统中的关键技术之一,对系统的性能起着重要作用,但通常情况下大型系统的任务调度问题属于NP问题。而现代启发式生物进化算法是找出很多NP问题近似解的有效方法。本文将粒子群算法应用于基于可用性的网格系统调度中,提出了一种调度算法,对算法的性能进行了理论分析和模拟实验。结果表明:和最近文献中的基于可用性的调度算法SSAC相比,所提出的新算法在保证系统资源具有同样的可用性条件下,能够产生更好的调度长度。 展开更多
关键词 并行与分布式处理 异构系统 任务调度 可用性 粒子群算法
在线阅读 下载PDF
面向国产异构众核架构的CFD非结构网格计算并行优化方法 被引量:1
15
作者 陈鑫 李芳 +5 位作者 丁海昕 孙唯哲 刘鑫 陈德训 叶跃进 何香 《计算机科学》 CSCD 北大核心 2022年第6期99-107,共9页
神威太湖之光在2016-2018年度全球超算top500榜单中排名第一,峰值性能为125.4 PFlops,其计算能力主要归功于国产SW26010众核处理器。由于CFD非结构网格计算存在拓扑关系复杂、离散访存问题严重、存在强相关的线化方程求解等问题,导致CF... 神威太湖之光在2016-2018年度全球超算top500榜单中排名第一,峰值性能为125.4 PFlops,其计算能力主要归功于国产SW26010众核处理器。由于CFD非结构网格计算存在拓扑关系复杂、离散访存问题严重、存在强相关的线化方程求解等问题,导致CFD非结构网格计算一直是国产众核超级计算机移植与优化的难题。为充分发挥国产异构众核架构的计算效能,首先,提出了一种数据重构模型,提高了数据的局部性和可并行性,使得数据结构更加适应众核架构的特点;然后,针对非结构网格数据存放的无序性导致的离散访存问题,提出了一种基于信息关系预存的离散访存优化方法,将离散访存转化为连续访存;最后,对于存在强相关的线化方程求解问题,引入了从核阵列流水线并行的思想,实现了众核并行。优化后CFD非结构网格计算的整体性能相比原始版本提升了4.19倍,相比通用CPU提升了1.2倍,并扩展到62.4万计算核心的并行规模,能保持64.5%的并行效率。 展开更多
关键词 计算流体力学 异构众核 神威超级计算机 非结构网格 并行计算
在线阅读 下载PDF
基于申威异构众核处理器架构的模态并行算法
16
作者 喻高远 马志强 +1 位作者 李俊杰 金先龙 《振动与冲击》 EI CSCD 北大核心 2022年第3期224-230,共7页
根据国产申威异构众核处理器架构特点,提出了一种结构有限元模态分层通信并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下重大装备系统级模态分析的并行效率具有重要意义。该方法在分层通信策略和加速子空间迭代法的基础... 根据国产申威异构众核处理器架构特点,提出了一种结构有限元模态分层通信并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下重大装备系统级模态分析的并行效率具有重要意义。该方法在分层通信策略和加速子空间迭代法的基础上构建了大规模模态分析并行计算体系,不仅实现了计算过程和数据通信的分层,有效提高了通信效率;而且实现了计算数据的分布式存储,显著改善了数据访存效率。将并行计算体系应用于某超深钻机制动系统主体结构和某跨江隧道,实现了上千万自由度、数万核的模态分析并行计算;结合算例对该算法的正确性和有效性进行了评估。结果表明,该算法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提高重大装备系统级模态并行计算效率。 展开更多
关键词 异构众核 分布式存储 分层通信 大规模模态分析 并行计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部