期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于国产异构众核处理器的等值线与等值面提取算法优化
1
作者 张元胤 肖敏广 +3 位作者 刘志勇 翁灵玲 陈志广 卢宇彤 《计算机工程与科学》 北大核心 2025年第2期200-209,共10页
MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-300... MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-3000处理器上,由于片上缓存空间有限,从核访存带宽限制等问题,导致计算效率低下;另外,由于编程模型的特殊性,现有软件与方法无法直接在MT-3000上运行。为了充分发挥国产超算系统在可视化领域的计算效能,基于MT-3000的微体系结构对等值线网格序列算法和等值面移动立方体算法分别提出了新的并行化算法。新方法采用向量指令、流水线实现存算重叠等技术,更加适应异构众核架构,从而达到加速算法执行的目的。实验结果表明,2种算法的加速比均达到4以上,并且随着从核的增多,算法的执行时间近呈线性下降,这证明所提算法具有良好的可扩展性。 展开更多
关键词 数据过滤 等值线 等值面 并行计算 异构 众核 国产超算系统
在线阅读 下载PDF
暂态稳定分布式仿真计算的改进算法 被引量:13
2
作者 王成山 张家安 《电力系统自动化》 EI CSCD 北大核心 2004年第14期28-32,99,共6页
电网互联和电力系统市场化发展趋势对暂态稳定分布式计算提出了要求。文中研究了电力非线性网络暂态稳定分布式仿真算法的计算效率问题,指出算法的瓶颈主要是子系统边界值的迭代求解计算,提出了改善非线性网络分布式求解效率的交接变量... 电网互联和电力系统市场化发展趋势对暂态稳定分布式计算提出了要求。文中研究了电力非线性网络暂态稳定分布式仿真算法的计算效率问题,指出算法的瓶颈主要是子系统边界值的迭代求解计算,提出了改善非线性网络分布式求解效率的交接变量估计法,进行了数值验证,并与适于线性网络求解的并行处理方法、已有的电力网络暂态稳定初值估计法和交接变量调节法进行了比较。数值实验表明,文中提出的方法可在较大程度上稳定地改善暂态稳定分布式仿真分析的计算效率,与电力市场条件有一定的适应性。 展开更多
关键词 电力系统 非线性网络 暂态稳定仿真 分布式计算 并行算法
在线阅读 下载PDF
一类求解非线性方程组算法的并行性能分析 被引量:10
3
作者 杨庚 《计算机学报》 EI CSCD 北大核心 2000年第10期1035-1039,共5页
讨论了一类求解非线性方程组算法的并行性能 .与传统的算法不同之处是用一个块对角矩阵作为迭代矩阵 ,且该矩阵可由一个仅包含向量内积和矩阵与向量乘积的递推关系简便计算得到 .在对算法进行描述之后 ,分析了算法的并行执行过程 ,给出... 讨论了一类求解非线性方程组算法的并行性能 .与传统的算法不同之处是用一个块对角矩阵作为迭代矩阵 ,且该矩阵可由一个仅包含向量内积和矩阵与向量乘积的递推关系简便计算得到 .在对算法进行描述之后 ,分析了算法的并行执行过程 ,给出了算法的并行加速比和对存储的需求分析 ,数值计算表明理论分析与数值结果相符合 ,算法具有较好的并行度和较低的存储要求 . 展开更多
关键词 非线性方程组 数值计算 算法 并行性能
在线阅读 下载PDF
面向高性能数值计算的并行计算模型DRAM(h) 被引量:16
4
作者 张云泉 《计算机学报》 EI CSCD 北大核心 2003年第12期1660-1670,共11页
提出了一个基于存储层次的新并行计算模型DRAM (h) ,并在该模型下对两个经典并行数值计算算法的不同实现形式 :四种形式并行下三角方程求解 (PTRS)和六种形式无列选主元并行LU分解 (PLU) ,进行了分析 .模型分析表明 ,具有近乎相同时间... 提出了一个基于存储层次的新并行计算模型DRAM (h) ,并在该模型下对两个经典并行数值计算算法的不同实现形式 :四种形式并行下三角方程求解 (PTRS)和六种形式无列选主元并行LU分解 (PLU) ,进行了分析 .模型分析表明 ,具有近乎相同时间和空间复杂性的同一算法不同实现形式 ,在该模型下会有完全不同的存储复杂度 .作者在日立公司SR2 2 0 1MPP并行机、曙光 3 0 0 0超级服务器和中国科学院科学与工程计算国家重点实验室(LSEC)的 12 8节点LinuxCluster等三种并行计算平台上对模型分析结果进行了实验验证 .结果表明 ,该模型分析在绝大多数情况下都能较好地与不同实验平台上的实验结果吻合 .个别出现偏差的分析结果 ,在根据计算平台的存储层次特点修改模型分析的假定后 ,也能够进行解释 .这说明了该模型对不同形式的算法实现进行存储访问模式区分的有效性 .对在计算模型中加入指令 /线程级并行的可行性和方法的研究是下一步的工作 . 展开更多
关键词 存储器 并行计算模型 高性能数值计算 DRAM(h) 计算模型 存储复杂性
在线阅读 下载PDF
现代超级计算机系统 被引量:3
5
作者 胡守仁 《计算机学报》 EI CSCD 北大核心 1991年第1期47-56,共10页
本文论述了现代超级计算机系统发展的基本情况,深入分析了现代超级计算机系统的分类、特点与发展趋势。最后展望了90年代的发展前景。
关键词 超级计算机 巨型计算机 计算机
在线阅读 下载PDF
一类非线性发展方程的AGE-3方法和并行计算
6
作者 那顺布和 苏志勋 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第3期464-468,共5页
为研究适合在并行计算机上高效率解一类非线性发展方程的计算方法,给出了一类非线性发展方程,并对其应用古典显格式、古典隐格式以及Saul′yev型非对称差分格式,构造了求解这一类非线性发展方程的交替分组显示AGE-3方法.并且证明了该方... 为研究适合在并行计算机上高效率解一类非线性发展方程的计算方法,给出了一类非线性发展方程,并对其应用古典显格式、古典隐格式以及Saul′yev型非对称差分格式,构造了求解这一类非线性发展方程的交替分组显示AGE-3方法.并且证明了该方法的无条件稳定性以及具有并行性兼顾的结果.数值实验说明该方法具有良好的并行性、有效性,且误差小、精度高,宜于直接在并行计算机上使用. 展开更多
关键词 非线性发展方程 非对称差分格式 并行计算机 无条件稳定性 计算方法 数值实验 并行性 高效率 显格式 隐格式 古典 求解
在线阅读 下载PDF
非线性扩散方程的显式并行计算
7
作者 迟利华 刘杰 《计算机工程》 CAS CSCD 北大核心 2010年第21期25-27,共3页
在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该... 在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该方法在4核Xeon处理器构成的分布共享集群系统上可扩展到1024个CPU核,相对于64个CPU核,其加速比为7.06。 展开更多
关键词 OpenMP编程模型 多核集群系统 非线性扩散方程 并行计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部