检索结果-维普期刊中文期刊服务平台

基于GPU对角稀疏矩阵向量乘法的动态划分算法: 1; 作者涂进兴李志雄黄建强《计算机应用》 CSCD 北大核心 2024年第11期3521-3529,共9页; 在图形处理器(GPU)上实现对角稀疏矩阵向量乘法(SpMV)可以充分利用GPU的并行计算能力,并加速矩阵向量乘法;然而,相关主流算法存在零元填充数据多、计算效率低的问题。针对上述问题,提出一种对角SpMV算法DIA-Dynamic(DIAgonal-Dynamic)... 展开更多; 关键词图形处理器对角稀疏矩阵稀疏矩阵向量乘法动态划分共享内存; 在线阅读下载PDF 职称材料

选择粗化函数优化并行稀疏矩阵向量乘法: 2; 作者叶纬材《中山大学学报（自然科学版）》 CAS CSCD 北大核心 2012年第5期50-53,共4页; 讨论了如何分划稀疏矩阵的非零元素以减少并行矩阵向量乘法的通信代价。通过以粗化函数为工具,统一现有的数据分划方法;提出一种基于行列分划为初解的粗化函数选取方法,在理论上的证明其运行效率与分划质量不逊于一维数据分划方法;实验... 展开更多; 关键词选择粗化函数数据分划并行稀疏矩阵向量乘法; 在线阅读下载PDF 职称材料

SparseMode:用于高效SpMV向量化代码生成的稀疏编译框架: 3; 作者王昊天丁岩 +2 位作者何贤浩肖国庆阳王东《计算机研究与发展》北大核心 2025年第6期1443-1454,共12页; 稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是数值计算中的核心操作,广泛应用于科学计算、工程模拟以及机器学习中.SpMV的性能优化主要受限于不规则的稀疏模式,传统的优化通常依赖手动设计存储格式、计算策略和内存... 展开更多; 关键词稀疏矩阵向量乘法编译器稀疏模式高性能计算向量化; 在线阅读下载PDF 职称材料

TEB:GPU上矩阵分解重构的高效SpMV存储格式被引量：2: 4; 作者王宇华张宇琪 +2 位作者何俊飞徐悦竹崔环宇《计算机科学与探索》 CSCD 北大核心 2024年第4期1094-1108,共15页; 稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的... 展开更多; 关键词稀疏矩阵向量乘法(SpMV) 重新排序 CSR格式负载均衡存储格式图形处理器(GPU); 在线阅读下载PDF 职称材料

基于HYB格式SpMV在新一代申威架构上的实现与优化被引量：1: 5; 作者王鑫彭健《计算机工程与科学》 CSCD 北大核心 2023年第10期1754-1762,共9页; 稀疏矩阵与稠密向量乘SpMV在高性能计算领域有着广泛的应用。稀疏矩阵因其非零元素分布的稀疏性和不规则性,使得运算的并行化较稠密矩阵难度更大。因此,稀疏矩阵向量乘法的性能优化一直都是高性能计算领域中的研究重点。基于稀疏矩阵的... 展开更多; 关键词申威众核处理器稀疏矩阵向量乘法最大类间方差法并行计算; 在线阅读下载PDF 职称材料

一种用于图形渲染的高性能SpMV专用加速器结构被引量：1: 6; 作者邓军勇马青青《小型微型计算机系统》 CSCD 北大核心 2021年第3期584-588,共5页; 图形渲染中涉及的几何变换、投影变换、视口变换等需要大量稀疏矩阵向量乘法(Sparse Matrix-Vector Multiplication,SpM V)运算,如何实现SpMV高性能计算成为了图形处理器设计中的关键性问题之一,然而,当前的SpMV运算存在并行度较差,资... 展开更多; 关键词图形渲染稀疏矩阵向量乘法并行度矩阵列向量的线性组合; 在线阅读下载PDF 职称材料

题名基于GPU对角稀疏矩阵向量乘法的动态划分算法: 1; 作者涂进兴李志雄黄建强; 机构青海大学计算机技术与应用学院青海省智能计算与应用实验室(青海大学); 出处《计算机应用》 CSCD 北大核心 2024年第11期3521-3529,共9页; 基金国家自然科学基金资助项目(62062059) 青海省科技计划项目(2022-ZJ-701)。; 文摘在图形处理器(GPU)上实现对角稀疏矩阵向量乘法(SpMV)可以充分利用GPU的并行计算能力,并加速矩阵向量乘法;然而,相关主流算法存在零元填充数据多、计算效率低的问题。针对上述问题,提出一种对角SpMV算法DIA-Dynamic(DIAgonal-Dynamic)。首先,设计一种全新的动态划分策略,根据矩阵的不同特征进行分块,在保证GPU高计算效率的同时大幅减少零元填充,去除冗余计算量;其次,提出一种对角稀疏矩阵存储格式BDIA(Block DIAgonal)存储分块数据,并调整数据布局,提高GPU上的访存性能;最后,基于GPU的底层进行条件分支优化,以减少分支判断,并使用动态共享内存解决向量的不规则访问问题。DIA-Dynamic与前沿Tile SpMV算法相比,平均加速比达到了1.88;与前沿BRCSD(Diagonal Compressed Storage based on Row-Blocks)-Ⅱ算法相比,平均零元填充减少了43%,平均加速比达到了1.70。实验结果表明,DIA-Dynamic能够有效提高GPU上对角SpMV的计算效率,缩短计算时间,提升程序性能。; 关键词图形处理器对角稀疏矩阵稀疏矩阵向量乘法动态划分共享内存; Keywords Graphics Processing Unit(GPU) diagonal sparse matrix Sparse Matrix Vector multiplication(SpMV) dynamic partition shared memory; 分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名选择粗化函数优化并行稀疏矩阵向量乘法: 2; 作者叶纬材; 机构中山大学数学与计算科学学院//广东省计算科学重点实验室; 出处《中山大学学报（自然科学版）》 CAS CSCD 北大核心 2012年第5期50-53,共4页; 基金广东省计算科学重点实验室资助项目计算科学科研团队资助项目; 文摘讨论了如何分划稀疏矩阵的非零元素以减少并行矩阵向量乘法的通信代价。通过以粗化函数为工具,统一现有的数据分划方法;提出一种基于行列分划为初解的粗化函数选取方法,在理论上的证明其运行效率与分划质量不逊于一维数据分划方法;实验数据表明,该方法产生分划质量超过一维数据分划方法的结果,接近甚至超过二维细粒度方上法的结果。; 关键词选择粗化函数数据分划并行稀疏矩阵向量乘法; Keywords selected contraction function data partitioning parallel sparse matrix-vector multiplica-tion; 分类号 O241.83 [理学—计算数学]; 在线阅读下载PDF 职称材料

题名SparseMode:用于高效SpMV向量化代码生成的稀疏编译框架: 3; 作者王昊天丁岩何贤浩肖国庆阳王东; 机构湖南大学信息科学与工程学院; 出处《计算机研究与发展》北大核心 2025年第6期1443-1454,共12页; 基金国家重点研发计划项目(2023YFB3001805) 国家自然科学基金项目(62321003,62227808) 中国博士后科学基金项目(2024M750879,BX20240111)。; 文摘稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是数值计算中的核心操作,广泛应用于科学计算、工程模拟以及机器学习中.SpMV的性能优化主要受限于不规则的稀疏模式,传统的优化通常依赖手动设计存储格式、计算策略和内存访问模式.现有张量编译器如TACO和TVM通过领域特定语言(domain specific language,DSL)可实现高性能算子生成,减轻开发人员繁琐的手动优化工作,但对稀疏计算的优化支持尚显不足,难以根据不同的稀疏模式自适应优化性能.为了解决这些问题,提出了名为SparseMode的稀疏编译框架,能够依据矩阵的稀疏模式为SpMV计算生成高效的向量化代码,并根据硬件平台的特性自适应地调整优化策略.该编译框架首先设计了领域专属语言SpMV-DSL,能够简洁高效地表达SpMV的稀疏矩阵和计算操作.然后提出了基于稀疏模式感知的方法,根据SpMV-DSL定义的矩阵存储格式和非零元素分布动态选择计算策略.最后通过稀疏模式分析和调度优化生成高效并行的SpMV算子代码,以充分利用SIMD指令提升性能.在不同硬件平台上的SpMV实验结果表明,SparseMode生成的SpMV算子代码相较于现有的TACO和TVM张量编译器实现了最高2.44倍的加速比.; 关键词稀疏矩阵向量乘法编译器稀疏模式高性能计算向量化; Keywords SpMV compilers sparse patterns high performance computing vectorization; 分类号 TP314 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名TEB:GPU上矩阵分解重构的高效SpMV存储格式被引量：2: 4; 作者王宇华张宇琪何俊飞徐悦竹崔环宇; 机构哈尔滨工程大学计算机科学与技术学院; 出处《计算机科学与探索》 CSCD 北大核心 2024年第4期1094-1108,共15页; 基金国家自然科学基金(62072135)。; 文摘稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的计算冗余,节约存储空间,但存在着负载不均衡的问题,浪费了计算资源。针对上述问题,对近年来效果良好的存储格式进行了研究,提出了一种逐行分解重组存储格式——TEB(threshold-exchangeorder block)格式。该格式采用启发式阈值选择算法确定合适分割阈值,并结合基于重排序的行归并算法,对稀疏矩阵进行重构分解,使得块与块之间非零元个数尽可能得相近,其次结合CUDA(computer unified device architecture)线程技术,提出了基于TEB存储格式的子块间并行SpMV算法,能够合理分配计算资源,解决负载不均衡问题,从而提高SpMV并行计算效率。为了验证TEB存储格式的有效性,在NVIDIA Tesla V100平台上进行实验,结果表明TEB相较于PBC(partition-block-CSR)、AMF-CSR(adaptive multi-row folding of CSR)、CSR-Scalar(compressed sparse row-scalar)和CSR5(compressed sparse row 5)存储格式,在SpMV的时间性能方面平均可提升3.23、5.83、2.33和2.21倍;在浮点计算性能方面,平均可提高3.36、5.95、2.29和2.13倍。; 关键词稀疏矩阵向量乘法(SpMV) 重新排序 CSR格式负载均衡存储格式图形处理器(GPU); Keywords sparse matrix-vector multiplication(SpMV) reorder compressed sparse row(CSR)format load balancing storage format graphics processing unit(GPU); 分类号 TP301 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于HYB格式SpMV在新一代申威架构上的实现与优化被引量：1: 5; 作者王鑫彭健; 机构江南大学物联网工程学院; 出处《计算机工程与科学》 CSCD 北大核心 2023年第10期1754-1762,共9页; 文摘稀疏矩阵与稠密向量乘SpMV在高性能计算领域有着广泛的应用。稀疏矩阵因其非零元素分布的稀疏性和不规则性,使得运算的并行化较稠密矩阵难度更大。因此,稀疏矩阵向量乘法的性能优化一直都是高性能计算领域中的研究重点。基于稀疏矩阵的HYB存储格式,面向国产新一代申威异构众核处理器SW26010P,设计了一种并行SpMV算法及其性能优化方案。并针对HYB存储格式的阈值选取难点,提出了一种多次迭代最大类间方差的方法,以确定HYB格式的阈值。实验结果表明,相比主核上的串行算法,并行SpMV算法可以获得23.36的平均加速比和34.85的最高加速比。; 关键词申威众核处理器稀疏矩阵向量乘法最大类间方差法并行计算; Keywords Sunway many-core architecture sparse matrix vector multiplication(SpMV) Otsu method parallel computing; 分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名一种用于图形渲染的高性能SpMV专用加速器结构被引量：1: 6; 作者邓军勇马青青; 机构西安邮电大学电子工程学院; 出处《小型微型计算机系统》 CSCD 北大核心 2021年第3期584-588,共5页; 基金国家自然科学基金项目(61602377,61772417,61634004,61272120,61802304)资助陕西省国际科技合作计划项目(2018KW-006)资助 +1 种基金陕西省重点研发计划(2017GY-060)资助。; 文摘图形渲染中涉及的几何变换、投影变换、视口变换等需要大量稀疏矩阵向量乘法(Sparse Matrix-Vector Multiplication,SpM V)运算,如何实现SpMV高性能计算成为了图形处理器设计中的关键性问题之一,然而,当前的SpMV运算存在并行度较差,资源占用较多等问题.为提升硬件运算的性能,本文基于矩阵列向量的线性组合,充分利用数据的并行性,设计了一种专用加速器结构.实验表明,在XC6VLX550T开发板上与其他两种结构相比,速度分别能够提高28%、37%,资源占用率分别减少约48%、18%,应用于图形渲染中的变换操作后,速度分别能够提高28%、30%,资源占用率分别最高减少约48%、60%.; 关键词图形渲染稀疏矩阵向量乘法并行度矩阵列向量的线性组合; Keywords graphics rendering sparse matrix-vector multiplication parallelism linear combination of matrix column vectors; 分类号 TP302 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于GPU对角稀疏矩阵向量乘法的动态划分算法	涂进兴李志雄黄建强	《计算机应用》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
2	选择粗化函数优化并行稀疏矩阵向量乘法	叶纬材	《中山大学学报（自然科学版）》 CAS CSCD 北大核心	2012	0	在线阅读下载PDF 职称材料
3	SparseMode:用于高效SpMV向量化代码生成的稀疏编译框架	王昊天丁岩何贤浩肖国庆阳王东	《计算机研究与发展》北大核心	2025	0	在线阅读下载PDF 职称材料
4	TEB:GPU上矩阵分解重构的高效SpMV存储格式	王宇华张宇琪何俊飞徐悦竹崔环宇	《计算机科学与探索》 CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料
5	基于HYB格式SpMV在新一代申威架构上的实现与优化	王鑫彭健	《计算机工程与科学》 CSCD 北大核心	2023	1	在线阅读下载PDF 职称材料
6	一种用于图形渲染的高性能SpMV专用加速器结构	邓军勇马青青	《小型微型计算机系统》 CSCD 北大核心	2021	1	在线阅读下载PDF 职称材料