期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向点云识别的最近邻搜索硬件加速器
1
作者 陈立 李桢旻 马宇晴 《合肥工业大学学报(自然科学版)》 北大核心 2025年第2期179-184,共6页
动态图卷积神经网络(dynamic graph convolutional neural network,DGCNN)作为点云识别主流算法之一,主要由边缘卷积层构成,而最近邻搜索操作占据边缘卷积层63%的计算时间。文章针对现有的最近邻搜索加速器准确率较低、速度较慢的问题,... 动态图卷积神经网络(dynamic graph convolutional neural network,DGCNN)作为点云识别主流算法之一,主要由边缘卷积层构成,而最近邻搜索操作占据边缘卷积层63%的计算时间。文章针对现有的最近邻搜索加速器准确率较低、速度较慢的问题,设计一种面向点云识别的最近邻搜索硬件加速器。该加速器采用基于点云分割的并行双调流水排序结构进行2轮双调排序,并用曼哈顿距离替代欧氏距离衡量点与点距离的远近。实验结果表明,在同样的实验环境配置下,相较于其他点云最近邻搜索加速器,文章设计的最近邻搜索加速器速度提升了3.6倍。 展开更多
关键词 最近邻搜索 硬件加速器 边缘卷积 双调排序 曼哈顿距离
在线阅读 下载PDF
高能效低延迟的BNN硬件加速器设计
2
作者 周培培 杜高明 +1 位作者 李桢旻 王晓蕾 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第12期1655-1661,共7页
针对二值化神经网络(binary neural network,BNN)硬件设计过程中大量0值引发计算量增加以及BNN中同一权值数据与同一特征图数据多次重复运算导致计算周期和计算功耗增加的问题,文章分别提出全0值跳过方法和预计算结果缓存方法,有效减少... 针对二值化神经网络(binary neural network,BNN)硬件设计过程中大量0值引发计算量增加以及BNN中同一权值数据与同一特征图数据多次重复运算导致计算周期和计算功耗增加的问题,文章分别提出全0值跳过方法和预计算结果缓存方法,有效减少网络的计算量、计算周期和计算功耗;并基于现场可编程门阵列(field programmable gate array,FPGA)设计一款BNN硬件加速器,即手写数字识别系统。实验结果表明,使用所提出的全0值跳过方法和预计算结果缓存方法后,在100 MHz的频率下,设计的加速器平均能效可达1.81 TOPs/W,相较于其他BNN加速器,提升了1.27~4.34倍。 展开更多
关键词 二值化神经网络(BNN) 权值共享 重复运算 现场可编程门阵列(FPGA) 硬件加速器
在线阅读 下载PDF
基于分时重用行卷积查找表的BNN加速器 被引量:1
3
作者 杜高明 陈邦溢 +1 位作者 王晓蕾 李桢旻 《微电子学与计算机》 2021年第9期84-92,共9页
二值化神经网络(Binary Neural Network, BNN)具有单比特数据位宽的特点,可以很好地解决传统卷积神经网络中存在大量数据量以及计算量的问题.为了进一步加速BNN的正向推导并降低所需功耗,提出一种基于FPGA的完全二值化卷积神经网络加速... 二值化神经网络(Binary Neural Network, BNN)具有单比特数据位宽的特点,可以很好地解决传统卷积神经网络中存在大量数据量以及计算量的问题.为了进一步加速BNN的正向推导并降低所需功耗,提出一种基于FPGA的完全二值化卷积神经网络加速器,其中输入图片以及边缘填充都进行了二值化处理,并且通过分时重用行卷积查找表的方式跳过其中的冗余计算.在Xilinx的ZCU102 FPGA开发板上对所设计的加速器进行评估,结果表明加速器的运算速度可以达到3.1 TOP/s,并且可以达到144.2 GOPS/KLUT的资源效率转换比以及3 507.8 GOPS/W的能效转换比. 展开更多
关键词 BNN 完全二值化 行卷积查找表 分时重用 FPGA
在线阅读 下载PDF
一种高性能极化码SC译码器设计
4
作者 王晓蕾 戴吴骏 +2 位作者 杜高明 李桢旻 张多利 《电子科技》 2022年第8期14-20,共7页
针对极化码SC译码器存在的高延时、低吞吐率、低资源效率等问题,文中提出了一种高性能SC译码器硬件架构。通过剪枝冻结比特结点的方式化简SC译码二叉树,设计跨周期的PE单元存储模块,并在译码最后一个阶段利用2b-SC算法,保证译码器具有... 针对极化码SC译码器存在的高延时、低吞吐率、低资源效率等问题,文中提出了一种高性能SC译码器硬件架构。通过剪枝冻结比特结点的方式化简SC译码二叉树,设计跨周期的PE单元存储模块,并在译码最后一个阶段利用2b-SC算法,保证译码器具有较低的延时和较高的吞吐率。采用资源复用的方法,提高译码器资源效率。测试结果表明,文中所提出的译码器周期为330,吞吐率为388.85 Mbit·s-1,资源效率为2.204 Mbit·s-1·kGE-1。与其他SC译码器的对比试验表明,该高性能SC译码器的延时、吞吐率、资源效率均得到了有效改善。此外,该译码器的功耗较低,应用前景良好。 展开更多
关键词 极化码 串行抵消 延时 功耗 吞吐率 资源效率 资源复用 专用集成电路
在线阅读 下载PDF
基于通道差值模型的导向滤波去雾算法及其FPGA实现 被引量:2
5
作者 曹红芳 王晓蕾 +2 位作者 杜高明 李桢旻 倪伟 《电子科技》 2023年第8期1-6,共6页
计算机视觉系统受到有雾天气的影响会导致捕获的图像质量较差。为了解决该问题,文中提出了一种基于通道差值模型的导向滤波去雾算法及其FPGA(Field Programmable Gate Array)设计。通过分离雾天图像的亮通道与暗通道得到通道差值模型,... 计算机视觉系统受到有雾天气的影响会导致捕获的图像质量较差。为了解决该问题,文中提出了一种基于通道差值模型的导向滤波去雾算法及其FPGA(Field Programmable Gate Array)设计。通过分离雾天图像的亮通道与暗通道得到通道差值模型,并将该模型作为导向滤波的引导图对雾天图像进行平滑处理,最后进行高升压滤波操作得到去雾图像,设计硬件架构并在FPGA上实现。实验结果表明,去雾后的图像场景照度均匀,纹理信息恢复程度较好且颜色保真度高,对于480×270大小的图像,电路综合频率为108.448 MHz,吞吐量为323.47 MB·s^(-1),完成整个去雾过程花费时间为0.0012 s。实验结果证明文中所提算法及其硬件设计能够有效提高图像可见度和去雾速度。 展开更多
关键词 去雾 通道差值模型 导向滤波 高升压滤波 频率 吞吐量 图像处理 FPGA
在线阅读 下载PDF
一种高性能RLWE加密处理器的设计与实现 被引量:1
6
作者 王春华 李斌 +1 位作者 杜高明 李桢旻 《电子科技》 2022年第11期13-20,共8页
RLWE加密方案是后量子时代格密码系统中最有潜力的候选方案之一。针对RLWE加密处理器存在的高延迟、低吞吐率的问题,文中提出了一种高性能RLWE加密处理器硬件架构。该结构采用了两个NTT模块和4个蝶形模块的并行结构。在预计算和后计算... RLWE加密方案是后量子时代格密码系统中最有潜力的候选方案之一。针对RLWE加密处理器存在的高延迟、低吞吐率的问题,文中提出了一种高性能RLWE加密处理器硬件架构。该结构采用了两个NTT模块和4个蝶形模块的并行结构。在预计算和后计算过程中,利用4个蝶形模块中的乘法器进行并行计算。在加密过程中,NTT运算与密文计算并行处理。在NTT以及INTT运算的处理过程中,将数据的读写过程及计算过程进行乒乓操作,从而隐藏数据的读写周期,降低RLWE加密处理器的延迟,提高了RLWE加密处理器的吞吐率。设计资源复用的硬件架构,在加密、解密过程复用蝶形模块中的乘法器和加法器,INTT复用NTT的电路结构,从而降低加密处理器硬件资源消耗。在Spartan-6 FPGA开发平台上实现了参数为n=256,q=65537的加密处理器。实验结果表明,文中提出的加密时间仅为12.18μs,吞吐率为21.01 Mbit·s^(-1),解密时间仅为8.65μs,吞吐率为29.60 Mbit·s^(-1)。与其他加密处理器的对比实验表明,文中所提出的加密处理器的延迟和吞吐率均得到了改善。 展开更多
关键词 后量子 现场可编程门阵列 环上带错学习 加密 吞吐率 延迟 并行 资源复用
在线阅读 下载PDF
一种低延迟同态加密电路设计
7
作者 徐鹏飞 李桢旻 +1 位作者 王晓蕾 杜高明 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第8期1046-1050,共5页
为了解决同态加密方案加密所需时间太长的问题,文章基于改进的脉动阵列技术提出一种优化的硬件架构对GSW(Gentry-Sahai-Waters)全同态加密算法中的加密部分进行硬件加速。GSW全同态加密算法在不同的安全等级下选取的安全参数不同,若安... 为了解决同态加密方案加密所需时间太长的问题,文章基于改进的脉动阵列技术提出一种优化的硬件架构对GSW(Gentry-Sahai-Waters)全同态加密算法中的加密部分进行硬件加速。GSW全同态加密算法在不同的安全等级下选取的安全参数不同,若安全等级越高,则安全参数数值越大,对于所需的硬件资源开销也会越大。为了能够在有限的硬件资源中完成硬件设计,选取安全等级为20位,分别对位宽为2、4、8、10 bit明文数据进行加密,并将硬件设计所需加密时间与CPU加速该算法时间进行对比。另外,为了降低由于访问存储器带来的额外功耗以及提高数据利用率,提出一种数据拼接及复用方法,最终基于现场可编程逻辑门阵列(field programmable gate array, FPGA)硬件实现GSW全同态加密算法。实验结果表明,相比于软件实现,该设计方法可以缩短97.26%的加密时间。 展开更多
关键词 同态加密 脉动阵列 访存优化 数据拼接及复用 低延迟
在线阅读 下载PDF
炼油装置腐蚀介质安全管理软件设计与应用
8
作者 陶建涛 李桢旻 +2 位作者 李涛 张洁 张莹 《石油化工腐蚀与防护》 CAS 2017年第4期48-50,共3页
针对劣质原油造成的设备腐蚀加剧问题,结合炼油企业实际生产需要,开发了腐蚀介质安全管理软件。从炼油装置层面和炼油全工艺层面对腐蚀介质分布、数据变化、异常数据预警等进行系统分析和安全管理;基于Oracle数据库进行了数据结构设计,... 针对劣质原油造成的设备腐蚀加剧问题,结合炼油企业实际生产需要,开发了腐蚀介质安全管理软件。从炼油装置层面和炼油全工艺层面对腐蚀介质分布、数据变化、异常数据预警等进行系统分析和安全管理;基于Oracle数据库进行了数据结构设计,将硫、氮、氧、氯和环烷酸等腐蚀介质数据全部录入数据库。该系统软件集成了数据存储、管理和查询功能,从腐蚀介质角度为炼油企业设备防腐蚀与检维修工作提供决策依据。 展开更多
关键词 腐蚀介质 安全管理 数据库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部