期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向存算一体架构中Tanh激活函数的绝对值电路设计 被引量:4
1
作者 顾晓峰 管其冬 虞致国 《电子与信息学报》 EI CSCD 北大核心 2023年第9期3350-3358,共9页
基于存算一体(CIM)架构的激活函数模拟实现方式使得神经网络变得更加接近非线性模型,针对其中Tanh函数负值难处理的问题,该文提出一种高速、高精度绝对值运算电路。该电路将输入电压经过比较器结果判断选择是否输出,利用反相比例取反电... 基于存算一体(CIM)架构的激活函数模拟实现方式使得神经网络变得更加接近非线性模型,针对其中Tanh函数负值难处理的问题,该文提出一种高速、高精度绝对值运算电路。该电路将输入电压经过比较器结果判断选择是否输出,利用反相比例取反电路控制负压输入并转换为正压通过开关输出,实现了离散输出功能的绝对值运算处理。与传统利用二极管全波整流绝对值电路相比,该电路有效避免了二极管难集成的问题,且速度快、功耗低、整体面积小。基于55 nm CMOS工艺进行设计,结果表明,在50 ns工作时钟周期下,经过绝对值电路转化后的输出电压与输入电压误差控制在1%以内,比较器的输出延时为5 ns,零点区域放大电压误差小于400μV。在1.2 V电源电压下,功耗为670μW,版图面积为4447μm^(2)。 展开更多
关键词 存算一体架构 绝对值电路 Tanh激活函数 神经网络
在线阅读 下载PDF
基于Chiplet的三维集成计算与存储架构
2
作者 单光宝 凡翔 +1 位作者 郑彦文 曹会华 《电子与封装》 2024年第9期1-11,共11页
5G通信、人工智能、物联网技术的蓬勃发展对计算与存储系统架构提出了更高需求。传统二维计算与存储架构无法满足当下计算密集型应用对延时、带宽和能效的需求。基于Chiplet的三维集成架构可以有效解决传统二维计算与存储系统性能优化... 5G通信、人工智能、物联网技术的蓬勃发展对计算与存储系统架构提出了更高需求。传统二维计算与存储架构无法满足当下计算密集型应用对延时、带宽和能效的需求。基于Chiplet的三维集成架构可以有效解决传统二维计算与存储系统性能优化面临的诸多瓶颈。回顾了基于Chiplet的计算与存储架构,介绍了单片多核、异构多核及基于Chiplet的三维集成架构,概述了基于Chiplet的主流存储架构与新兴的存算一体架构,并对计算架构与存储架构分别进行了比较与讨论。给出了基于Chiplet的三维集成计算与存储架构设计面临的挑战和未来发展方向。 展开更多
关键词 Chiplet 三维集成 架构 架构 存算一体架构
在线阅读 下载PDF
并行规约与扫描原语在ReRAM架构上的性能优化
3
作者 金洲 段懿洳 +2 位作者 伊恩鑫 戢昊男 刘伟峰 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第5期80-91,共12页
规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已... 规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力。提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能。相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级。分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%。 展开更多
关键词 规约 扫描 RERAM 存算一体架构 并行计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部