期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于混合基的类浮点可变点FFT处理器的ASIC实现
1
作者
潘于
田映辉
+3 位作者
刘志哲
陈涛
张伟
申奇
《现代电子技术》
北大核心
2024年第1期163-170,共8页
为了对数字信号处理领域中的核心算法快速傅里叶变换(FFT)进行加速,需要设计专门的FFT处理器。由于在数字信号处理领域经常使用不同点数的FFT,提出一种采用基2-基4混合基的点数可配置的FFT处理器实现方案。同时,为了提高运算精度且不增...
为了对数字信号处理领域中的核心算法快速傅里叶变换(FFT)进行加速,需要设计专门的FFT处理器。由于在数字信号处理领域经常使用不同点数的FFT,提出一种采用基2-基4混合基的点数可配置的FFT处理器实现方案。同时,为了提高运算精度且不增加硬件资源与实现复杂度,首次提出类浮点数据格式。该类浮点数据格式采用浮点数据的设计思想表示整数型数据,使得在运算过程中低位数据得到有效利用,提高了运算精度和数据的动态范围。实验结果表明,该类浮点FFT处理器比传统pipelined FFT处理器以及经典块浮点FFT处理器具有更优的PPA性能。与经典块浮点FFT进行精度比较,对于小数值输入数据二者精度一致,对于大数值输入数据,类浮点FFT处理器比块浮点FFT处理器有更高的精度,因此是实现FFT处理器的一种有效方案。
展开更多
关键词
快速傅里叶变换
可变点
混合基
类浮点
块浮点
高精度
流水线型
在线阅读
下载PDF
职称材料
一种节省资源的矩阵运算单元硬件微架构设计
2
作者
潘于
田映辉
+2 位作者
张伟
杨建磊
申奇
《现代电子技术》
北大核心
2024年第5期160-166,共7页
为了实现人工智能和高性能计算在不同应用领域下的快速运算,需借助人工智能加速器(NPU)或者通用图形处理器(GPGPU)对其进行加速。由于矩阵运算是人工智能和高性能计算的核心运算,文中提出一种节省资源的矩阵运算单元架构的实现方案。通...
为了实现人工智能和高性能计算在不同应用领域下的快速运算,需借助人工智能加速器(NPU)或者通用图形处理器(GPGPU)对其进行加速。由于矩阵运算是人工智能和高性能计算的核心运算,文中提出一种节省资源的矩阵运算单元架构的实现方案。通过对矩阵运算单元中每个子运算单元中的乘法器和加法器数量进行扩展,并将输入数据按行列广播到矩阵运算单元上的各个子运算单元可实现对矩阵运算的加速。通过利用PE矩阵之间的数据共享,采用新型的PE矩阵互联方案,可达到在减少带宽资源的同时提升算力的目的。与现有NPU或GPGPU的矩阵运算实现方案相比,所提方案使用更少的加法器和寄存器即可实现相同的算力,且在更低的时钟延迟和带宽消耗下即可完成对相同规模矩阵运算的加速。
展开更多
关键词
人工智能
高性能计算
矩阵运算
节省资源
低时钟延迟
GPGPU
在线阅读
下载PDF
职称材料
题名
基于混合基的类浮点可变点FFT处理器的ASIC实现
1
作者
潘于
田映辉
刘志哲
陈涛
张伟
申奇
机构
海光信息技术股份有限公司
拓维电子科技(上海)
有限公司
中国联通智能城市研究院
出处
《现代电子技术》
北大核心
2024年第1期163-170,共8页
文摘
为了对数字信号处理领域中的核心算法快速傅里叶变换(FFT)进行加速,需要设计专门的FFT处理器。由于在数字信号处理领域经常使用不同点数的FFT,提出一种采用基2-基4混合基的点数可配置的FFT处理器实现方案。同时,为了提高运算精度且不增加硬件资源与实现复杂度,首次提出类浮点数据格式。该类浮点数据格式采用浮点数据的设计思想表示整数型数据,使得在运算过程中低位数据得到有效利用,提高了运算精度和数据的动态范围。实验结果表明,该类浮点FFT处理器比传统pipelined FFT处理器以及经典块浮点FFT处理器具有更优的PPA性能。与经典块浮点FFT进行精度比较,对于小数值输入数据二者精度一致,对于大数值输入数据,类浮点FFT处理器比块浮点FFT处理器有更高的精度,因此是实现FFT处理器的一种有效方案。
关键词
快速傅里叶变换
可变点
混合基
类浮点
块浮点
高精度
流水线型
Keywords
FFT
configurable point
mixed⁃radix
floating⁃point like
block⁃floating⁃point
high⁃precision
pipeline
分类号
TN911-34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一种节省资源的矩阵运算单元硬件微架构设计
2
作者
潘于
田映辉
张伟
杨建磊
申奇
机构
海光信息技术股份有限公司
北京航空航天大学
中国联通智能城市研究院
出处
《现代电子技术》
北大核心
2024年第5期160-166,共7页
文摘
为了实现人工智能和高性能计算在不同应用领域下的快速运算,需借助人工智能加速器(NPU)或者通用图形处理器(GPGPU)对其进行加速。由于矩阵运算是人工智能和高性能计算的核心运算,文中提出一种节省资源的矩阵运算单元架构的实现方案。通过对矩阵运算单元中每个子运算单元中的乘法器和加法器数量进行扩展,并将输入数据按行列广播到矩阵运算单元上的各个子运算单元可实现对矩阵运算的加速。通过利用PE矩阵之间的数据共享,采用新型的PE矩阵互联方案,可达到在减少带宽资源的同时提升算力的目的。与现有NPU或GPGPU的矩阵运算实现方案相比,所提方案使用更少的加法器和寄存器即可实现相同的算力,且在更低的时钟延迟和带宽消耗下即可完成对相同规模矩阵运算的加速。
关键词
人工智能
高性能计算
矩阵运算
节省资源
低时钟延迟
GPGPU
Keywords
artificial intelligence
high performance computing
matrix operation
resource⁃efficient
low clock latency
GPGPU
分类号
TN02-34 [电子电信—物理电子学]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于混合基的类浮点可变点FFT处理器的ASIC实现
潘于
田映辉
刘志哲
陈涛
张伟
申奇
《现代电子技术》
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
一种节省资源的矩阵运算单元硬件微架构设计
潘于
田映辉
张伟
杨建磊
申奇
《现代电子技术》
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部