期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
带状稀疏矩阵乘法及高效GPU实现 被引量:4
1
作者 刘丽 陈长波 《计算机应用》 CSCD 北大核心 2023年第12期3856-3867,共12页
稀疏-稠密矩阵乘法(SpMM)广泛应用于科学计算和深度学习等领域,提高它的效率具有重要意义。针对具有带状特征的一类稀疏矩阵,提出一种新的存储格式BRCV(Banded Row Column Value)以及基于此格式的SpMM算法和高效图形处理单元(GPU)实现... 稀疏-稠密矩阵乘法(SpMM)广泛应用于科学计算和深度学习等领域,提高它的效率具有重要意义。针对具有带状特征的一类稀疏矩阵,提出一种新的存储格式BRCV(Banded Row Column Value)以及基于此格式的SpMM算法和高效图形处理单元(GPU)实现。由于每个稀疏带可以包含多个稀疏块,所提格式可看成块稀疏矩阵格式的推广。相较于常用的CSR(Compressed Sparse Row)格式,BRCV格式通过避免稀疏带中列下标的冗余存储显著降低存储复杂度;同时,基于BRCV格式的SpMM的GPU实现通过同时复用稀疏和稠密矩阵的行更高效地利用GPU的共享内存,提升SpMM算法的计算效率。在两种不同GPU平台上针对随机生成的带状稀疏矩阵的实验结果显示,BRCV的性能不仅优于cuBLAS(CUDA Basic Linear Algebra Subroutines),也优于基于CSR和块稀疏两种不同格式的cuSPARSE。其中,相较于基于CSR格式的cuSPARSE,BRCV的最高加速比分别为6.20和4.77。此外,将新的实现应用于图神经网络(GNN)中的SpMM算子的加速。在实际应用数据集上的测试结果表明,BRCV的性能优于cuBLAS和基于CSR格式的cuSPARSE,且在大多数情况下优于基于块稀疏格式的cuSPARSE。其中,相较于基于CSR格式的cuSPARSE,BRCV的最高加速比为4.47。以上结果表明BRCV可以有效提升SpMM的效率。 展开更多
关键词 带状稀疏矩阵 稀疏存储格式 稀疏矩阵乘法 图形处理单元 共享内存
在线阅读 下载PDF
基于稀疏带状矩阵的二维图像重建 被引量:2
2
作者 杨海蓉 方红 +1 位作者 张成 潘根安 《计算机工程与应用》 CSCD 2013年第10期184-187,共4页
压缩传感(Compressed Sensing,CS)是数据采样同时实现压缩的新理论、新技术。针对大图像重构时采用的测量矩阵维数高,所需存储空间过大的问题,引入稀疏带状概念,提出了稀疏带状测量矩阵,可减少测量矩阵独立随机元,根据图像按列逐步处理... 压缩传感(Compressed Sensing,CS)是数据采样同时实现压缩的新理论、新技术。针对大图像重构时采用的测量矩阵维数高,所需存储空间过大的问题,引入稀疏带状概念,提出了稀疏带状测量矩阵,可减少测量矩阵独立随机元,根据图像按列逐步处理的方式,测量矩阵维数大大降低。实验结果表明基于稀疏带状测量矩阵的逐列图像重构算法在保证重建质量的情况下,计算速度也大大提升。 展开更多
关键词 压缩传感 循环矩阵 稀疏带状矩阵
在线阅读 下载PDF
稀疏带状测量矩阵在压缩感知ISAR成像中的应用
3
作者 谭歆 冯晓毅 王保平 《红外与激光工程》 EI CSCD 北大核心 2013年第11期3137-3143,共7页
将压缩感知(CS)理论用于逆合成孔径雷达(ISAR)成像,可以有效利用缺损的雷达回波数据,解决了因数据缺损造成成像质量下降的问题。目前压缩感知中常用的高斯或伯努利等随机测量矩阵独立随机元数目过多,存储空间过大,从而导致硬件实现成本... 将压缩感知(CS)理论用于逆合成孔径雷达(ISAR)成像,可以有效利用缺损的雷达回波数据,解决了因数据缺损造成成像质量下降的问题。目前压缩感知中常用的高斯或伯努利等随机测量矩阵独立随机元数目过多,存储空间过大,从而导致硬件实现成本过高。所构造的稀疏带状测量矩阵,通过将测量矩阵进行带状循环移位置零稀疏化,可大幅减少测量矩阵中非零元素数目,降低系统采样要求,节约硬件实现成本,使得压缩感知ISAR成像工程化更容易实现。最后通过仿真和微波暗室实验数据验证了点目标模型下稀疏带状测量矩阵进行ISAR成像的可行性和有效性。 展开更多
关键词 压缩感知 ISAR成像 稀疏带状测量矩阵 微波暗室实验 点目标模型
在线阅读 下载PDF
基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 被引量:7
4
作者 王迎瑞 任江勇 田荣 《计算机科学》 CSCD 北大核心 2013年第3期46-49,共4页
以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有"带状"、稀疏的特点。针对"带状"稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法"bDIA"。基于nVidia的GTX280系列GPU对其进行了... 以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有"带状"、稀疏的特点。针对"带状"稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法"bDIA"。基于nVidia的GTX280系列GPU对其进行了测试,结果显示:与CUSP支持的5种常见稀疏矩阵存储格式和算法相比较,所提出的bDIA格式以及相应的spMV算法的单双精度浮点效率均可以提高1倍以上,并突破了该系列GPU在spMV计算时4%的单精度浮点效率上限和22.2%的双精度浮点效率上限;应用于共轭梯度(CG)与稳定双共轭梯度(BiCGStab)求解器,相对于DIA格式均有1.5倍左右的加速。 展开更多
关键词 带状稀疏矩阵向量乘 bDIA 广义有限元 GPU CG求解器优化
在线阅读 下载PDF
图像重建中的非常稀疏循环矩阵 被引量:3
5
作者 杨海蓉 方红 +2 位作者 张成 韦穗 潘根安 《计算机工程与应用》 CSCD 2012年第18期206-211,共6页
测量矩阵是压缩传感理论的关键要素之一。针对目前大部分工作中所用的高斯等随机测量矩阵独立随机变元过多,不利于物理实现的问题,引入稀疏带状和稀疏列的概念,形成稀疏带状随机、托普利兹和循环矩阵以及稀疏列随机、循环矩阵,随机变元... 测量矩阵是压缩传感理论的关键要素之一。针对目前大部分工作中所用的高斯等随机测量矩阵独立随机变元过多,不利于物理实现的问题,引入稀疏带状和稀疏列的概念,形成稀疏带状随机、托普利兹和循环矩阵以及稀疏列随机、循环矩阵,随机变元个数减少约三分之一。采用通用的模拟实验方法,验证此类稀疏矩阵对于真实图像的重建效果及对0-1信号的成功重建概率均与随机高斯矩阵相当。 展开更多
关键词 压缩传感 托普利兹矩阵 循环矩阵 稀疏带状矩阵 稀疏矩阵
在线阅读 下载PDF
弹性力学问题的局部Petrov-Galerkin方法 被引量:72
6
作者 龙述尧 《力学学报》 EI CSCD 北大核心 2001年第4期508-518,共11页
提出了弹性力学平面问题的局部Petrov-Galerkin方法,这是一种真正的无网格方法.    这种方法采用移动最小二乘近似函数作为试函数,并且采用移动最小二乘近似函数的权函数作    为加权残值法加权函数;同时这... 提出了弹性力学平面问题的局部Petrov-Galerkin方法,这是一种真正的无网格方法.    这种方法采用移动最小二乘近似函数作为试函数,并且采用移动最小二乘近似函数的权函数作    为加权残值法加权函数;同时这种方法只包含中心在所考虑点处的规则局部区域上以及局部边    界上的积分;所得系统矩阵是一个带状稀疏矩阵,该方法可以容易推广到求解非线性问题以及    非均匀介质的力学问题.还计算了两个弹性力学平面问题的例子,给出了位移和能量的索波列    夫模及其相对误差.所得计算结果证明:该方法是一种具有收敛快、精度高、简便有效的通用    方法;在工程中具有广阔的应用前景. 展开更多
关键词 局部Petrov-Galerkin方程 移动最小二乘近似函数 索波列夫模 带状稀疏矩阵 非线性力学 平面问题 弹性力学
在线阅读 下载PDF
几何非线性问题的无网格法分析 被引量:1
7
作者 熊渊博 龙述尧 胡德安 《机械强度》 EI CAS CSCD 北大核心 2006年第1期83-87,共5页
用局部PetrovGalerkin方法求解几何非线性问题,这是一种真正的无网格方法。这种方法采用移动最小二乘近似函数作为试函数;只包含中心在所考虑点处的规则局部区域上以及局部边界上的积分;所得系统矩阵是一个带状稀疏矩阵。该方法可以容... 用局部PetrovGalerkin方法求解几何非线性问题,这是一种真正的无网格方法。这种方法采用移动最小二乘近似函数作为试函数;只包含中心在所考虑点处的规则局部区域上以及局部边界上的积分;所得系统矩阵是一个带状稀疏矩阵。该方法可以容易推广到求解非线性问题以及非均匀介质力学问题。在涉及几何非线性问题的数值方法中,通常都采用增量和迭代分析的方法。本文从虚功原理出发,用移动最小二乘近似函数的权函数替代虚位移,并在整个分析过程中所有变量的表达格式都是采用全拉格朗日格式。数值算例表明,无网格局部PetrovGalerkin方法在求解几何非线性问题时仍具有很好的精度。 展开更多
关键词 几何非线性问题 虚功原理 全拉格朗日格式 移动最小二乘法 局部PETROV-GALERKIN方法 无网格局部PETROV-GALERKIN方法 移动最小二乘近似函数 无网格法 局部区域 带状稀疏矩阵
在线阅读 下载PDF
基于双频GPS观测的简化动力学最小二乘批处理精密定轨 被引量:2
8
作者 王文彬 刘荣芳 《空间科学学报》 CAS CSCD 北大核心 2014年第4期460-467,共8页
星载双频GPS载波相位和伪距观测量已成为低轨卫星获取精确三维位置和速度信息的主要方式.本文以非差消电离载波相位和伪距组合作为观测量,应用简化动力学最小二乘批处理方法进行地球低轨卫星的精密定轨,并给出完整定轨流程.采用逐段常... 星载双频GPS载波相位和伪距观测量已成为低轨卫星获取精确三维位置和速度信息的主要方式.本文以非差消电离载波相位和伪距组合作为观测量,应用简化动力学最小二乘批处理方法进行地球低轨卫星的精密定轨,并给出完整定轨流程.采用逐段常量的经验加速度对动力学模型误差进行补偿,描述了经验加速度敏感矩阵及稀疏带状矩阵求逆的有效计算方法.利用GRACE-A卫星GPS观测数据对定轨位置精度进行分析,结果显示,三维位置定轨精度优于5 cm,经验加速度在径向、切向和法向上的补偿水平不超过40 nm·s^(-2),大气阻力系数和辐射光压系数的估计值符合物理实际,星载接收机钟差大致呈线性并具有短周期小波动. 展开更多
关键词 低轨卫星精密定轨 消电离组合 简化动力学 最小二乘批处理 经验加速度 稀疏带状矩阵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部