期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
多通道气体流量计算机的研制 被引量:3
1
作者 王健军 杨江 刘涵 《计算机应用》 CSCD 北大核心 2012年第A02期203-205,231,共4页
针对目前流量计算机存在成本过高、计算速度较慢等问题,研制了基于内含矢量浮点单元VFP的S3C6410嵌入式微处理器、Linux操作系统和通过内部串行总线联接多达12个流量采样输入通道的气体流量计算机。主要阐述了该流量计算机的硬件和软件... 针对目前流量计算机存在成本过高、计算速度较慢等问题,研制了基于内含矢量浮点单元VFP的S3C6410嵌入式微处理器、Linux操作系统和通过内部串行总线联接多达12个流量采样输入通道的气体流量计算机。主要阐述了该流量计算机的硬件和软件的设计。测试结果表明所设计的气体流量计算机能满足计量精度和实时性的要求。 展开更多
关键词 流量计算机 S3C6410 矢量浮点单元 压缩因子
在线阅读 下载PDF
基于GPU的稀疏矩阵存储格式优化研究 被引量:6
2
作者 杨世伟 蒋国平 +1 位作者 宋玉蓉 涂潇 《计算机工程》 CAS CSCD 北大核心 2019年第9期23-31,39,共10页
稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提... 稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提高SpMV在GPU平台上的并行性,并设计基于快速分段求和算法的GPU内核函数,保证计算结果的确定性及其在不同GPU平台上的再现性。实验结果表明,BRCP存储格式具有较高的计算效率,相比BRC存储格式可减少并行环境中的SpMV计算误差,并提高PageRank排序的准确率。 展开更多
关键词 稀疏矩阵向量乘 计算统一设备架构 图形处理器 存储格式 浮点运算
在线阅读 下载PDF
一种低延迟高吞吐率的浮点整型乘累加单元 被引量:1
3
作者 沈俊 沈海斌 虞玉龙 《计算机工程》 CAS CSCD 2013年第6期91-94,102,共5页
针对目前浮点运算单元在处理向量点乘运算时存在数据相关性的问题,提出一种低延迟单周期的累加单元结构。该结构用于7级流水的可配置乘累加单元,可兼容双精度浮点、双单精度浮点以及32位有符号数,且能对后置模块进行操作数隔离与门控时... 针对目前浮点运算单元在处理向量点乘运算时存在数据相关性的问题,提出一种低延迟单周期的累加单元结构。该结构用于7级流水的可配置乘累加单元,可兼容双精度浮点、双单精度浮点以及32位有符号数,且能对后置模块进行操作数隔离与门控时钟的低功耗处理。在Viterx-4平台上实验结果表明,该结构具有高性能、低延迟、单周期完成数据吞吐等特点,与使用Xilinx浮点IP的设计面积相比,时间积减少30%以上。 展开更多
关键词 浮点运算单元 乘累加 向量点乘 双精度 双单精度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部