期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向稀疏计算的领域特定语言设计与实现 被引量:1
1
作者 胡燕婷 郑启龙 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1241-1248,共8页
在稀疏计算领域应用模型的开发过程中,低层次的编程接口需要用户对底层硬件和算法模型同时具有全面、深入的了解.这种要求造成了稀疏计算领域的高门槛特性,不利于非专业人员的开发工作.为了降低稀疏计算领域的学习门槛,简化稀疏计算编程... 在稀疏计算领域应用模型的开发过程中,低层次的编程接口需要用户对底层硬件和算法模型同时具有全面、深入的了解.这种要求造成了稀疏计算领域的高门槛特性,不利于非专业人员的开发工作.为了降低稀疏计算领域的学习门槛,简化稀疏计算编程,提高编程的效率,本文提出了一种基于领域特定语言的解决方案,命名为Sparse Computing Programming Solutions:SCPS.SCPS设计和实现了专门的语法规则体系Sparse Computation by Domain Language:SCDL,并配备了相应的语法检查器.其次,SCPS会根据用户对数据和任务的划分进行代码优化,通过代码自动生成器将用户编写的应用模型转换为相关硬件的计算代码.为了提供良好的跨平台特性,代码生成器最终将生成相应模型的OpenCL代码.大规模的实验结果表明,使用SCDL语言构建的代码量仅为对应OpenCL代码的1/15,有效地提高了稀疏计算编程的效率.同时,实验证明了与串行代码相比,自动生成的代码能够达到优化的效果. 展开更多
关键词 领域特定语言 稀疏计算 语法检查 代码自动生成 OPENCL
在线阅读 下载PDF
稀疏计算层析成像重构中迭代去噪方法的分析
2
作者 李宏霄 陈晓冬 +2 位作者 李俊威 汪毅 郁道银 《光子学报》 EI CAS CSCD 北大核心 2015年第5期148-154,共7页
研究了稀疏计算层析成像重构中的迭代去噪模型及其求解算法,理论推导及模拟实验验证了代数重构技术的抑噪能力.根据稀疏计算层析成像成像过程的噪音特征,提出了基于欧氏范数不等式约束和基于无穷范数不等式约束的去噪模型.提出了基于凸... 研究了稀疏计算层析成像重构中的迭代去噪模型及其求解算法,理论推导及模拟实验验证了代数重构技术的抑噪能力.根据稀疏计算层析成像成像过程的噪音特征,提出了基于欧氏范数不等式约束和基于无穷范数不等式约束的去噪模型.提出了基于凸集投影方法求解去噪模型的算法,并给出了算法推导过程.结果表明:欧氏范数去噪模型优于无穷范数去噪模型,代数重构技术具有抑制噪音的作用. 展开更多
关键词 医用光学 迭代方法 稀疏计算层析成像 重构去噪方法 凸集投影方法
在线阅读 下载PDF
STT-MRAM绝对差值原位计算驱动的轻量型AdderNet电路设计
3
作者 王黎勋 张跃军 +2 位作者 李琪康 张会红 温亮 《电子与信息学报》 北大核心 2025年第9期3252-3261,共10页
随着人工智能研究的不断深入,卷积神经网络(Convolutional Neural Networks, CNN)在资源受限环境中的部署需求不断上升。然而,受限于冯·诺依曼架构,CNN加速器随着部署模型深度增加,卷积核逐层堆叠所引发的乘累加运算呈现超线性增... 随着人工智能研究的不断深入,卷积神经网络(Convolutional Neural Networks, CNN)在资源受限环境中的部署需求不断上升。然而,受限于冯·诺依曼架构,CNN加速器随着部署模型深度增加,卷积核逐层堆叠所引发的乘累加运算呈现超线性增长趋势。为此,该文提出一种基于自旋转移矩磁性随机存储器(Spin Transfer Torque-Magnetoresistive Random Access Memory, STT-MRAM)的轻量型加法神经网络(AdderNet)加速电路设计方案。该方案首先将L1范数引入存算一体架构,提出STT-MRAM绝对差值原位计算方法,以轻量级加法取代乘累加运算;其次,设计基于磁阻状态映射的可配置全加器,结合稀疏优化策略,跳过零值参与的冗余逻辑判断;最后,进一步构建支持单周期进位链更新的并行全加器阵列,实现高效的卷积核映射与多核L1范数并行计算。实验结果显示,在CIFAR-10数据集上,该加速器实现90.66%的识别准确率,仅较软件模型下降1.18%,同时在133 MHz频率下达到32.31 GOPS的最大吞吐量与494.56 GOPS/W的峰值能效。 展开更多
关键词 磁性随机存储器 加法神经网络 稀疏计算 硬件加速器 人工智能
在线阅读 下载PDF
基于FPGA的稀疏卷积神经网络加速器设计 被引量:1
4
作者 李宁 肖昊 《电子测量技术》 北大核心 2024年第5期1-8,共8页
剪枝是一种减少卷积神经网络权重和计算量的有效方法,为CNN的高效部署提供了解决方案。但是,剪枝后的稀疏CNN中权重的不规则分布使硬件计算单元之间的计算负载各不相同,降低了硬件的计算效率。文章提出一种细粒度的CNN模型剪枝方法,该... 剪枝是一种减少卷积神经网络权重和计算量的有效方法,为CNN的高效部署提供了解决方案。但是,剪枝后的稀疏CNN中权重的不规则分布使硬件计算单元之间的计算负载各不相同,降低了硬件的计算效率。文章提出一种细粒度的CNN模型剪枝方法,该方法根据硬件加速器的架构将整体权重分成若干个局部权重组,并分别对每一组局部权重进行独立剪枝,得到的稀疏CNN在加速器上实现了计算负载平衡。此外,设计一种具有高效PE结构和稀疏度可配置的稀疏CNN加速器并在FPGA上实现,该加速器的高效PE结构提升了乘法器的吞吐率,同时可配置性使其可灵活地适应不同稀疏度的CNN计算。实验结果表明,提出的剪枝算法可将CNN的权重参数减少50%~70%,同时精度损失不到3%。相比于密集型加速器,提出的加速器最高可实现3.65倍的加速比;与其他的稀疏型加速器研究相比,本研究的加速器在硬件效率上提升28%~167%。 展开更多
关键词 卷积神经网络 硬件加速器 稀疏计算 FPGA
在线阅读 下载PDF
基于高预测性的稀疏矩阵向量乘法并行计算优化 被引量:2
5
作者 夏天 付格林 +2 位作者 曲劭儒 罗中沛 任鹏举 《计算机研究与发展》 EI CSCD 北大核心 2023年第9期1973-1987,共15页
稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一.在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分... 稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一.在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分析收敛等计算要求.受限于SpMV本身的高度随机性和稀疏性所导致的数据局部性极差、缓存效率极低、计算模式非常不规则等问题,导致其计算负载成为当前高性能处理器的优化难点和研究热点.基于现代高性能超标量乱序处理器的架构特征,深入研究SpMV的各类性能瓶颈,并且提出从提升可预测性和降低程序复杂度的角度进行全面的性能优化.其核心思想是:通过构建串行访问的数据结构,提升数据访问的规律性和局部性,大幅度优化数据预取效率和缓存利用效率;通过构建规则的分支跳转条件,提升程序的分支预测准确率,有效提升程序执行效率;通过灵活运用SIMD指令集,有效提升计算资源利用率.通过对以上特性的优化,该方法可以显著缓解性能瓶颈,大幅度提升处理器资源、缓存资源和访存带宽的利用率,并且获得与主流商用计算库MKL相比平均2.6倍的加速比,相比于现有最先进算法获得平均1.3倍的加速比. 展开更多
关键词 矩阵向量乘法 稀疏矩阵计算 矩阵格式 分支预测 数据预取
在线阅读 下载PDF
基于双连通分量覆盖图的稀疏大图最大流并行加速方法 被引量:2
6
作者 刘扬 魏蔚 许贺洋 《西北工业大学学报》 EI CAS CSCD 北大核心 2018年第5期955-962,共8页
最大流问题是图论中重要的基础性问题,大规模网络中的最大流加速已成为重要研究方向,已有工作包括并行计算加速和图缩减加速2种思路,但仍有较大改进空间:(1)图缩减和并行计算2种加速思路并未充分融合,导致各自加速效果受限;(2)已有加速... 最大流问题是图论中重要的基础性问题,大规模网络中的最大流加速已成为重要研究方向,已有工作包括并行计算加速和图缩减加速2种思路,但仍有较大改进空间:(1)图缩减和并行计算2种加速思路并未充分融合,导致各自加速效果受限;(2)已有加速算法对常见的多次最大流求解支持不足,导致多次计算间存在大量冗余工作;(3)已有加速算法往往需涉及出入度和边容量等多个条件,计算复杂度偏高。针对上述问题,提出了一种基于优化子图的最大流并行加速方法,通过识别原始大图的双连通分量并建立覆盖图,可将任意最大流问题分解为独立的子问题,并行求解快速获取最大流精确解;覆盖图的构建仅涉及节点之间连接关系,具较低的时间复杂度。在基准图上的测试结果表明,算法可显著缩短稀疏大图中最大流计算时间。 展开更多
关键词 计算复杂度 图理论 最大流问题 稀疏计算 双联通分量 覆盖图 并行计算
在线阅读 下载PDF
稀疏矩阵向量乘法在申威众核架构上的性能优化 被引量:15
7
作者 李亿渊 薛巍 +4 位作者 陈德训 王欣亮 许平 张武生 杨广文 《计算机学报》 EI CSCD 北大核心 2020年第6期1037-1051,共15页
计算机数值模拟是现代科学和技术发展的重要触发力量.在数值模拟中,求解大规模稀疏线性方程组是非常重要的一个环节.迭代求解过程中稀疏矩阵向量乘法是耗时最长的计算核心之一,存在严重的数据局部性差、写冲突、负载不均衡等问题.因此,... 计算机数值模拟是现代科学和技术发展的重要触发力量.在数值模拟中,求解大规模稀疏线性方程组是非常重要的一个环节.迭代求解过程中稀疏矩阵向量乘法是耗时最长的计算核心之一,存在严重的数据局部性差、写冲突、负载不均衡等问题.因此,稀疏矩阵向量乘法已经成为了当前性能优化的难点和研究热点.本文面向国产众核处理器架构,以申威26010国产众核处理器为平台,针对稀疏矩阵向量乘法,在线程级和指令级并行层面上进行细粒度的并行算法设计和优化实现.其核心思想是,将众核架构设计精巧的矩阵分层分块技术用于矩阵存储、访问和任务调度,在保证右端向量数据复用的同时有效实现了负载均衡,避免了申威26010上因频繁缓存判断和细粒度访问导致的潜在性能问题.通过对SuiteSparse矩阵集合中的2710个算例的测试,该算法可以获得与主核上的串行算法相比11.7倍的平均加速和55倍的最高加速. 展开更多
关键词 申威众核处理器 并行计算 矩阵向量乘法 矩阵格式 稀疏矩阵计算
在线阅读 下载PDF
基于偏好相似度的混合信任推荐模型
8
作者 谭文安 沈腾腾 孙勇 《太原理工大学学报》 CAS 北大核心 2016年第1期62-67,共6页
针对P2P网络中可信数据不完整的问题,提出了将局部可信度与全局可信度相结合的基于偏好相似度推荐的混合信任模型(Preference Similarity Recommendation Trust,PSRTrust),借助相似随机游走策略修复稀疏的可信度矩阵;对不合理假设呈现po... 针对P2P网络中可信数据不完整的问题,提出了将局部可信度与全局可信度相结合的基于偏好相似度推荐的混合信任模型(Preference Similarity Recommendation Trust,PSRTrust),借助相似随机游走策略修复稀疏的可信度矩阵;对不合理假设呈现power-law分布进行合理化改进;并给出了可信数据的分布式存储和计算的分布式方法。仿真实验表明,PSRTrust模型有效地提高了在可信数据不完整情况下的交易成功率,并且在遏制恶意节点影响上有一定提高。 展开更多
关键词 对等网络 可信度 稀疏可信度计算 偏好相似度 分布式哈希表
在线阅读 下载PDF
Traffic danger detection by visual attention model of sparse sampling
9
作者 夏利民 刘涛 谭论正 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第10期3916-3924,共9页
A method to detect traffic dangers based on visual attention model of sparse sampling was proposed. The hemispherical sparse sampling model was used to decrease the amount of calculation which increases the detection ... A method to detect traffic dangers based on visual attention model of sparse sampling was proposed. The hemispherical sparse sampling model was used to decrease the amount of calculation which increases the detection speed. Bayesian probability model and Gaussian kernel function were applied to calculate the saliency of traffic videos. The method of multiscale saliency was used and the final saliency was the average of all scales, which increased the detection rates extraordinarily. The detection results of several typical traffic dangers show that the proposed method has higher detection rates and speed, which meets the requirement of real-time detection of traffic dangers. 展开更多
关键词 traffic dangers visual attention model sparse sampling Bayesian probability model multiscale saliency
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部