期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向GPU平台的并行结构化稀疏三角方程组求解器 被引量:1
1
作者 陈道琨 杨超 +1 位作者 刘芳芳 马文静 《软件学报》 EI CSCD 北大核心 2023年第11期4941-4951,共11页
稀疏三角线性方程组求解(SpTRSV)是预条件子部分的重要操作,其中结构化SpTRSV问题,在以迭代方法求解偏微分方程组的科学计算程序中,是一种较为常见的问题类型,而且通常是科学计算程序的需要解决的一个性能瓶颈.针对GPU平台,目前以CUSPA... 稀疏三角线性方程组求解(SpTRSV)是预条件子部分的重要操作,其中结构化SpTRSV问题,在以迭代方法求解偏微分方程组的科学计算程序中,是一种较为常见的问题类型,而且通常是科学计算程序的需要解决的一个性能瓶颈.针对GPU平台,目前以CUSPARSE为代表的商用GPU数学库,采用分层调度(level-scheduling)方法并行化SpTRSV操作.该方法不仅预处理耗时较长,而且在处理结构化SpTRSV问题时会出现较为严重GPU线程闲置问题.针对结构化SpTRSV问题,提出一种面向结构化SpTRSV问题的并行算法.该算法利用结构化SpTRSV问题的特殊非零元分布规律进行任务划分,避免对输入问题的非零元结构进行预处理分析.并对现有分层调度方法的逐元素处理策略进行改进,在有效缓解GPU线程闲置问题的基础上,还隐藏了部分矩阵非零元素的访存延迟.还根据算法的任务划分特点,采用状态变量压缩技术,显著提高算法状态变量操作的缓存命中率.在此基础上,还结合谓词执行等GPU硬件特性,对算法实现进行全面的优化.所提算法在NVIDIA V100 GPU上的实测性能,相比CUSPARSE平均有2.71倍的加速效果,有效访存带宽最高可达225.2 GB/s.改进后的逐元素处理策略,配合针对GPU硬件的一系列调优手段,优化效果显著,将算法的有效访存带宽提高了约1.15倍. 展开更多
关键词 稀疏三角线性方程组求解(SpTRSV) 模板计算 结构化网格 GPU 异构并行算法
在线阅读 下载PDF
三角形方程组的一种分布式并行算法 被引量:7
2
作者 骆志刚 李晓梅 胡庆丰 《计算机工程与设计》 CSCD 北大核心 2000年第6期54-59,共6页
提出了分布式环境下求解三角形方程组的一种新的并行算法,该算法基于将系数矩阵和右端项分块,并将其以块行卷帘方式分布存储在各处理器的局部存储器,利用通信与计算重叠的技术,取得了比块列扫描算法好的效果,当方程组具有多重右端... 提出了分布式环境下求解三角形方程组的一种新的并行算法,该算法基于将系数矩阵和右端项分块,并将其以块行卷帘方式分布存储在各处理器的局部存储器,利用通信与计算重叠的技术,取得了比块列扫描算法好的效果,当方程组具有多重右端项时,效果尤为突出。文中给出了在 YH3M 计算机上该算法的数值试验结果及其与块列扫描算法的数值比较结果。 展开更多
关键词 分布式存储 三角方程组 并行算法 矩阵块
在线阅读 下载PDF
三角形方程组的一种分布式并行算法 被引量:5
3
作者 张学波 李晓梅 《计算机工程与科学》 CSCD 2003年第5期69-71,共3页
本文提出了一种在分布式存储环境下求解三角形方程组的并行算法,该算法将系数矩阵及右端项以行卷帘方式分布存储到各处理机中。算法中引入了一个一维p阶向量F,该向量的循环传送使处理机间的通信次数明显下降,同时该算法还采用了计算与... 本文提出了一种在分布式存储环境下求解三角形方程组的并行算法,该算法将系数矩阵及右端项以行卷帘方式分布存储到各处理机中。算法中引入了一个一维p阶向量F,该向量的循环传送使处理机间的通信次数明显下降,同时该算法还采用了计算与通信重叠的技术。理论分析与数值实验表明,该算法较列扫描并行算法优越。 展开更多
关键词 三角方程组 分布式并行算法 线性方程组 并行计算机 数值计算
在线阅读 下载PDF
局域网上求解三角形方程组的一种并行算法 被引量:1
4
作者 尚月强 《计算机工程与应用》 CSCD 北大核心 2007年第19期61-63,共3页
针对基于PVM的由桌面PC机联网而成的网络并行计算环境中,处理机的运算速度较快而处理机间的通信相对较慢的实际情况,给出了一种局域网求解三角形方程组的并行算法,该算法将三角形方程组的系数矩阵及右端项按行分块,然后将分块的系数矩... 针对基于PVM的由桌面PC机联网而成的网络并行计算环境中,处理机的运算速度较快而处理机间的通信相对较慢的实际情况,给出了一种局域网求解三角形方程组的并行算法,该算法将三角形方程组的系数矩阵及右端项按行分块,然后将分块的系数矩阵及右端项按卷帘方式存储在各处理机,通过循环传送已求出的解的部分分量以减少处理机间的通信开销,实现较容易。并在1-4台桌面PC机联成的局域网,PVM 3.4 on Windows 2000,VC 6.0并行计算平台上编程对该算法进行了数值试验,试验结果表明该算法是有效的。 展开更多
关键词 三角方程组 并行算法 网络并行环境
在线阅读 下载PDF
同伦方法求解混合三角多项式方程组
5
作者 于妍 惠淑荣 鄢东姝 《沈阳农业大学学报》 CAS CSCD 北大核心 2007年第3期446-448,共3页
解混合三角多项式方程组时,一般利用变元替换以及添加多个二次方程将原问题转化为不含三角函数的多项式方程组,然后求解,但这样会增大问题的规模导致计算量增大。利用同伦方法直接求解混合三角多项式方程组,不需要将原方程组进行转化,... 解混合三角多项式方程组时,一般利用变元替换以及添加多个二次方程将原问题转化为不含三角函数的多项式方程组,然后求解,但这样会增大问题的规模导致计算量增大。利用同伦方法直接求解混合三角多项式方程组,不需要将原方程组进行转化,从而不会增大问题的规模,节省计算时间。 展开更多
关键词 混合三角多项式方程组 同伦方法 Bezout数
在线阅读 下载PDF
基于服务器并行求解三角形方程组的设计与实现
6
作者 刘青昆 邢芳 《计算机工程与设计》 CSCD 北大核心 2010年第18期4005-4008,共4页
针对在实际应用中超出内存容量的大规模矩阵不可调入的问题,设计并实现了一种面向A矩阵连续划分的、子文件大小可调节的求解三角形方程组的并行方案。理论上只要在不超过硬盘容量的前提下,该算法可以在小规模内存条件下求解任意规模的... 针对在实际应用中超出内存容量的大规模矩阵不可调入的问题,设计并实现了一种面向A矩阵连续划分的、子文件大小可调节的求解三角形方程组的并行方案。理论上只要在不超过硬盘容量的前提下,该算法可以在小规模内存条件下求解任意规模的矩阵。最后给出在Altix3700服务器上基于ABEEM模型的数值实验,实验结果表明了该算法的有效性。 展开更多
关键词 ABEEM模型 分布式存储 三角方程组 并行算法 MPI 矩阵划分
在线阅读 下载PDF
机械工程中两类非线性方程组的完全解 被引量:13
7
作者 李团结 贾建援 胡雪梅 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2005年第1期71-74,102,共5页
研究了机械工程中常见两类非线性方程组全部解的获取问题.对于非线性多项式方程组,给出了应用同伦法无需选取初值求其全部复数解或实数解的数值算法.对于三角函数超越方程组,基于牛顿迭代法提出了一个数值方法,无需选取初值就可求出三... 研究了机械工程中常见两类非线性方程组全部解的获取问题.对于非线性多项式方程组,给出了应用同伦法无需选取初值求其全部复数解或实数解的数值算法.对于三角函数超越方程组,基于牛顿迭代法提出了一个数值方法,无需选取初值就可求出三角函数超越方程组在指定搜索区间的全部实数解.最后给出了数值实例证明了这些方法的正确性. 展开更多
关键词 非线性多项式方程组 同伦法 三角函数超越方程组 数值方法 完全解
在线阅读 下载PDF
镜象阵及其应用
8
作者 林思佐 《现代电力》 1989年第S1期73-78,共6页
镜象阵是计算方法中很有用的一种矩阵。本文介绍镜象阵及其在计算方法理论中的某些应用。
关键词 三角方程组 次对角线 三角 单位向量 对角阵 方程组 最小二乘问题 三角 消去法 正交变换
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部