期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
zk-SNARK中数论变换的硬件加速方法研究 被引量:3
1
作者 赵海旭 柴志雷 +2 位作者 花鹏程 王锋 丁冬 《计算机科学与探索》 CSCD 北大核心 2024年第2期538-552,共15页
简洁非交互式零知识证明能够生成长度固定的证明并快速进行验证,极大地推动了零知识证明在数字签名、区块链及分布式存储等领域的应用。但其证明的生成过程极其耗时且需要被频繁调用,其中数论变换是证明生成过程的主要运算之一。然而现... 简洁非交互式零知识证明能够生成长度固定的证明并快速进行验证,极大地推动了零知识证明在数字签名、区块链及分布式存储等领域的应用。但其证明的生成过程极其耗时且需要被频繁调用,其中数论变换是证明生成过程的主要运算之一。然而现有的通用数论变换硬件加速方法难以满足其在简洁非交互式零知识证明中大规模、高位宽的要求。针对该问题,提出一种数论变换多级流水硬件计算架构。针对高位宽计算需求对高位模运算进行优化,设计了低时延蒙哥马利模乘单元;为了加速大规模计算,通过二维子任务划分将大规模数论变换任务划分为小规模独立子任务,并通过消除数据依赖实现了子任务间计算流水;在子任务多轮蝶形运算之间采用数据重排机制,有效缓解了访存需求并实现了不同步长蝶形运算间的计算流水。所提出的数论变换计算架构可以根据现场可编程门阵列(FPGA)片上资源灵活扩展,方便部署在不同规模的FPGA上以获得最大加速效果。所提出的硬件架构使用高层次综合(HLS)开发并基于OpenCL框架在AMD Xilinx Alveo U50实现了整套异构加速系统。实验结果表明,相比于PipeZK中的数论变换加速模块,该方法获得了1.95倍的加速比;在运行当前主流的简洁非交互式零知识证明开源项目bellman时,相比于AMD Ryzen 95900X单核及12核分别获得了27.98倍和1.74倍的加速比,并分别获得了6.9倍、6倍的能效提升。 展开更多
关键词 现场可编程门阵列(FPGA) 简洁非交互式零知识证明(zk-SNARK) 模乘 数论变换 硬件加速
在线阅读 下载PDF
PreNTT:面向zk-SNARK的数论变换计算并行加速方法
2
作者 丁冬 李正权 柴志雷 《计算机应用研究》 CSCD 北大核心 2024年第10期3059-3067,共9页
简洁非交互式零知识证明(zk-SNARK)由于具备证明验证过程简捷快速的优点,已在加密货币等众多领域得到广泛应用。但其证明生成过程所需计算仍复杂耗时,影响了进一步的应用拓展。针对zk-SNARK证明生成过程中的主要计算瓶颈——数论变换(NT... 简洁非交互式零知识证明(zk-SNARK)由于具备证明验证过程简捷快速的优点,已在加密货币等众多领域得到广泛应用。但其证明生成过程所需计算仍复杂耗时,影响了进一步的应用拓展。针对zk-SNARK证明生成过程中的主要计算瓶颈——数论变换(NTT),提出了一种基于GPU的NTT计算加速方法PreNTT。首先,提出了基于预计算的NTT并行计算方法,利用预计算与旋转因子次幂算法优化,减少NTT并行计算开销,并结合动态预计算,进一步提高NTT计算效率。其次,通过“动态自适应计算核调度”,可以根据NTT输入规模自适应地分配GPU片上资源,提升了大规模NTT任务的计算能效。然后,通过核外整体数据混洗和核内局部数据混洗相结合的方式,避免了访存冲突。最后,使用CUDA多流技术执行数据传输和计算过程,对预计算时间进行了有效隐藏。实验结果表明:基于PreNTT实现的zk-SNARK系统,与目前业界最先进的系统Bellperson相比,NTT模块运行时间获得了全规模最低1.7倍的加速比,最高加速比为9倍。PreNTT能够有效提高NTT算法并行度,降低zk-SNARK运算时间开销。 展开更多
关键词 简洁非交互式零知识证明 数论变换 GPU 并行计算 加速
在线阅读 下载PDF
NTT——数论变换算法在图像压缩技术中的应用研究 被引量:7
3
作者 张虹 张小飞 《计算机学报》 EI CSCD 北大核心 2000年第8期887-892,共6页
提出了一种全新的图像数据压缩算法 ,即数论变换 (Number Theory Transformation,NTT)算法 .证明了在以正整数 p为模的整数环 Zp 上 NTT是线性正交变换 ,以及在 Zp 上具有卷积特性等 .设计了具有 FFT类型的快速算法 ,该算法可采用移位... 提出了一种全新的图像数据压缩算法 ,即数论变换 (Number Theory Transformation,NTT)算法 .证明了在以正整数 p为模的整数环 Zp 上 NTT是线性正交变换 ,以及在 Zp 上具有卷积特性等 .设计了具有 FFT类型的快速算法 ,该算法可采用移位操作实现 ,其速度优于 DCT变换 .最后通过实例比较 ,说明了该算法在图像数据压缩中表现出运算速度快、精度高和压缩效果好等优点 .NTT算法的研究 。 展开更多
关键词 图像压缩 NTT 数论变换算法 多媒体 图像处理
在线阅读 下载PDF
应用于格密码的可重构多通道数论变换硬件设计 被引量:6
4
作者 刘冬生 赵文定 +2 位作者 刘子龙 张聪 刘星杰 《电子与信息学报》 EI CSCD 北大核心 2022年第2期566-572,共7页
针对不同格密码体制带来的数论变换参数多样性,以及数论变换的性能优化设计,该文提出一种基于随机存取存储器(RAM)的可重构多通道数论变换单元。在数论变换单元设计中,在按时间抽取的基础上改进多通道架构,并提出一种优化地址分配方法... 针对不同格密码体制带来的数论变换参数多样性,以及数论变换的性能优化设计,该文提出一种基于随机存取存储器(RAM)的可重构多通道数论变换单元。在数论变换单元设计中,在按时间抽取的基础上改进多通道架构,并提出一种优化地址分配方法。最后基于Xilinx Artix-7现场可编程逻辑门阵列(FPGA)平台进行原型实现,结果显示,所设计的数论变换单元消耗的资源为1744 Slices, 16 DSP,完成1次多项式乘法的时间为2.01μs(n=256), 3.57μs(n=512), 6.71μs(n=1024)和13.43μs(n=2048),支持256~2048的不同参数n和13~32 bit模q的可重构配置,工作频率最高可达232 MHz。 展开更多
关键词 格密码 多项式乘法 数论变换 硬件实现
在线阅读 下载PDF
数论变换算法(NTT)应用于图像压缩技术 被引量:1
5
作者 张虹 张小飞 《煤炭学报》 EI CAS CSCD 北大核心 2000年第z1期158-164,共7页
提出了一种全新的图像数据压缩算法 ,即数论变换 (NTT ,NumberTheoryTransforma tion)算法 .证明了在以正整数 p为模的整数环Zp 上NTT是线性正交变换 ,以及在Zp 上具有卷积特性等 .设计了具有FFT类型的快速算法 ,该算法可采用移位操作实... 提出了一种全新的图像数据压缩算法 ,即数论变换 (NTT ,NumberTheoryTransforma tion)算法 .证明了在以正整数 p为模的整数环Zp 上NTT是线性正交变换 ,以及在Zp 上具有卷积特性等 .设计了具有FFT类型的快速算法 ,该算法可采用移位操作实现 ,其速度优于DCT(离散余弦 )变换 .最后通过实例比较 ,说明了该算法在图像数据压缩中表现出运算速度快、精度高和压缩效果好等优点 .NTT算法的研究 。 展开更多
关键词 图像压缩技术 数论变换 多媒体数据 DCT
在线阅读 下载PDF
数论变换在异步保密机中的应用 被引量:1
6
作者 曹秀英 《通信学报》 EI CSCD 北大核心 1999年第12期75-80,共6页
本文讨论了数论变换在异步保密系统中的应用。首先对数论变换应用后系统所出现的问题进行了描述,然后分析,讨论了这些问题产生的原因,并针对输入信号动态范围的扩展,数论变换非线性控制等提出了相应的解决方法。
关键词 数论变换 异步保密机 保密通信
在线阅读 下载PDF
长序列线性卷积的数论变换算法
7
作者 王殊 姚天任 《电子学报》 EI CAS CSCD 北大核心 1992年第8期97-100,共4页
本文提出一种利用数论变换计算长序列线性卷积的算法。它利用较短的数论变换对长序列卷积进行分段计算,减少了数论变换处理中移位操作的位数;用适当的字长就能完成较长的卷积计算,因而显著缩短了卷积执行时间。
关键词 数论变换 长序列 线性卷积 计算
在线阅读 下载PDF
数论变换算法中的几个问题
8
作者 聂景楠 《信号处理》 CSCD 北大核心 1994年第4期228-232,254,共6页
本文讨论了数论变换的参数选取以及素数模在计算机上算法实现的问题,指出模取素数时数论变换(NTT)也可以保留FNT速度快、精度高的主要优点,同时也改进了其字长选取不灵活的缺憾,使得数论变换也可直接用于长序列卷积的快速计算。
关键词 数论变换 卷积 费马数变换 算法
在线阅读 下载PDF
用弗马数论变换作语音信号自相关分析
9
作者 徐士林 代礼荣 《信号处理》 CSCD 北大核心 1993年第1期22-28,47,共8页
线性预测编码(LPC)是语音信号处理的一种强有力的分析技术.此时把信号看作非平稳随机过程,用自相关函数来计算短时预测参数.求解线性方程组的方法是简便的,但自相关系数的计算是十分繁重的,从而影响了处理的速度和实时性.为了提高计算速... 线性预测编码(LPC)是语音信号处理的一种强有力的分析技术.此时把信号看作非平稳随机过程,用自相关函数来计算短时预测参数.求解线性方程组的方法是简便的,但自相关系数的计算是十分繁重的,从而影响了处理的速度和实时性.为了提高计算速度,本文选用快速弗马数论变换(FFNT)计算自相关系数.计算机仿真表明,它快于和优于直接法.本文中的FNT具有与FFT相同的结构,因而很便于用硬件实现。 展开更多
关键词 语音信号 弗马数论变换 自相关
在线阅读 下载PDF
用于全同态加密的数论变换乘法蝶形运算优化及实现 被引量:6
10
作者 华斯亮 张惠国 王书昶 《电子与信息学报》 EI CSCD 北大核心 2021年第5期1381-1388,共8页
全同态加密(FHE)可以真正从根本上解决云计算时将数据及其操作委托给第三方时的数据安全问题。针对全同态加密中占较大比例的大整数乘法运算优化需求,该文提出一种数论变换乘法蝶形运算的操作数合并算法,利用取模操作的快速算法,分别可... 全同态加密(FHE)可以真正从根本上解决云计算时将数据及其操作委托给第三方时的数据安全问题。针对全同态加密中占较大比例的大整数乘法运算优化需求,该文提出一种数论变换乘法蝶形运算的操作数合并算法,利用取模操作的快速算法,分别可将基16和基32运算单元的操作数减少到43.8%和39.1%。在此基础上,设计并实现了数论变换基32运算单元的硬件设计架构,在SMIC 90 nm工艺下的综合结果显示,电路的最高工作频率为600 MHz,面积1.714 mm^(2)。实验结果表明,该优化算法提升了数论变换乘法蝶形运算的计算效率。 展开更多
关键词 全同态加密 大整数乘法 数论变换 蝶形运算
在线阅读 下载PDF
一种用于小模数多项式乘法快速数论变换的扩域方法 被引量:3
11
作者 殷彦昭 乌力吉 +2 位作者 张向民 徐科 杨维 《密码学报》 CSCD 2021年第2期260-272,共13页
在基于Ring-LWE体系的格密码算法中,快速数论变换是加速多项式环乘法的常见方法,但该方法对于系数域模数小于多项式长度的多项式环乘法不适用.本文通过对多项式系数域构造扩域,扩大系数域的阶数,使小模数的多项式环乘法也能够使用快速... 在基于Ring-LWE体系的格密码算法中,快速数论变换是加速多项式环乘法的常见方法,但该方法对于系数域模数小于多项式长度的多项式环乘法不适用.本文通过对多项式系数域构造扩域,扩大系数域的阶数,使小模数的多项式环乘法也能够使用快速数论变换来加速.扩域上的有限域乘法会带来额外的计算开支,但快速NTT变换的使用可以带来指数级的加速效果,总体来说节省更多的计算复杂度.常见的快速数论变换使用与快速傅里叶变换相似的折半定理,进行基2的快速变换,而系数域构造扩域后由于其阶数无法满足基2变换的条件,本文通过将多项式长度进行质因子分解来推导复合基的快速数论变换,最终为小模数多项式环乘法提供可观的加速效果. 展开更多
关键词 格密码 Ring-LWE 快速数论变换 扩域
在线阅读 下载PDF
抗量子格密码体制的快速数论变换算法研究综述 被引量:7
12
作者 陶云亭 孔凡玉 +1 位作者 于佳 徐秋亮 《信息网络安全》 CSCD 北大核心 2021年第9期46-51,共6页
量子计算机的迅速发展给传统的RSA密码、ECC等公钥密码体制带来严重的安全威胁。在抗量子公钥密码体制中,基于格的密码体制是重要的研究类型之一,对算法快速实现的研究具有重要意义。快速数论变换算法是格密码体制的核心运算,其运算效... 量子计算机的迅速发展给传统的RSA密码、ECC等公钥密码体制带来严重的安全威胁。在抗量子公钥密码体制中,基于格的密码体制是重要的研究类型之一,对算法快速实现的研究具有重要意义。快速数论变换算法是格密码体制的核心运算,其运算效率是实现格密码算法的关键。文章主要对格密码体制中的快速数论变换算法的研究进展,特别是近年来在各种CPU平台上的软件实现方法的进展进行分析和综述,对快速数论变换算法在蝶形结构、负包卷积、取模运算等方面的改进算法进行分析和总结。 展开更多
关键词 抗量子密码体制 格密码体制 快速数论变换
在线阅读 下载PDF
一种新的多项式环上的数论变换算法 被引量:1
13
作者 张瀚丰 周子健 +1 位作者 杨智超 屈龙江 《密码学报》 CSCD 2023年第3期539-553,共15页
得益于易并行、速度快、方案平均意义下的安全性可建立在最坏情况的底层困难问题上等特点,格密码被认为是最有希望成为后量子密码标准的方案.在基于多项式环上格困难问题构造的密码方案中,数论变换算法是加速多项式乘法、提升密码方案... 得益于易并行、速度快、方案平均意义下的安全性可建立在最坏情况的底层困难问题上等特点,格密码被认为是最有希望成为后量子密码标准的方案.在基于多项式环上格困难问题构造的密码方案中,数论变换算法是加速多项式乘法、提升密码方案运行效率的关键技术手段之一.目前已有的方法只对形如Zq[x]/(x^(n)±1)的多项式环适用,且安全参数n被限制为2的方幂.本文给出新多项式环n Zq[x]/(x^(n)-xn/2+1)上的数论变换及其上元素相乘的公式,并借助蝶形算法给出了变换公式的计算复杂度.结合Karatsuba算法,扩展了n=c·2^(k)情形下数论变换的参数选取范围,并优化了计算复杂度. 展开更多
关键词 数论变换算法 多项式环 格密码
在线阅读 下载PDF
抗量子密码中快速数论变换的硬件设计与实现 被引量:2
14
作者 肖昊 赵延睿 +1 位作者 胡越 刘笑帆 《信息网络安全》 CSCD 北大核心 2023年第4期72-79,共8页
快速数论变换(Number Theoretic Transform,NTT)是抗量子密码算法的关键部分,其计算性能对系统的运行速度至关重要。相比经典的NTT算法,高基NTT算法可以达到更好的计算性能。针对高基NTT硬件实现过程中计算流程冗长、控制逻辑复杂的问题... 快速数论变换(Number Theoretic Transform,NTT)是抗量子密码算法的关键部分,其计算性能对系统的运行速度至关重要。相比经典的NTT算法,高基NTT算法可以达到更好的计算性能。针对高基NTT硬件实现过程中计算流程冗长、控制逻辑复杂的问题,文章基于流水线结构提出一种高性能的基-4 NTT硬件架构。首先,基于经典NTT算法,推导出利于硬件实现的基-4递归NTT,简化了高基算法的计算流程;然后,提出一种单路延迟反馈结构,对计算流程进行有效的流水线分割,降低了硬件架构的复杂度;最后,利用两级蝶形运算耦合实现基-4蝶形单元,并使用移位与加法优化约简计算过程,节省了硬件资源开销。文章以抗量子密码方案Falcon为例,在Xilinx Artix-7 FPGA上实现了所提出的NTT硬件架构。实验结果表明,与其他相关的设计相比,文章提出的设计方案在计算性能和硬件开销等方面表现更好。 展开更多
关键词 抗量子密码 快速数论变换 硬件加速 现场可编程门阵列
在线阅读 下载PDF
素阶数域上的高效格基数字签名方案 被引量:1
15
作者 董怡帆 方博越 +1 位作者 梁志闯 赵运磊 《软件学报》 北大核心 2025年第2期776-804,共29页
随着量子计算的快速发展,特别是Shor量子算法及其变体的优化进步,当前基于大整数分解和离散对数问题的经典公钥密码体制将面临颠覆性的影响.为了应对量子攻击,学界开始对后量子密码学的研究,其中基于格的后量子密码方案因其在安全、效... 随着量子计算的快速发展,特别是Shor量子算法及其变体的优化进步,当前基于大整数分解和离散对数问题的经典公钥密码体制将面临颠覆性的影响.为了应对量子攻击,学界开始对后量子密码学的研究,其中基于格的后量子密码方案因其在安全、效率、带宽等方面的均衡表现和良好的可扩展性而成为后量子密码的主流技术路线.目前,基于格的后量子密码方案大多使用分圆环,尤其是二次幂分圆环作为底层代数结构.但分圆环中具有丰富的子域、自同构、环同态等代数结构,容易遭受针对性攻击.基于具有“高安全性、素数阶、大Galois群和惰性模数”特点的素阶数域,设计出后量子数字签名方案Dilithium-Prime,并给出推荐参数集.然而,素阶数域的一个显著缺点是无法直接使用快速数论变换(NTT)算法进行高效的多项式乘法,导致素阶数域上的密码方案性能较差.为此,设计素阶数域上的NTT算法和小多项式乘法,实现素阶数域上高效的多项式乘法.最后,为方案的关键算法设计常数时间无分支实现方法,给出方案的C语言实现,并与其他方案进行对比.实验结果表明,在同一安全等级下,与分圆环上的数字签名方案CRYSTALS-Dilithium推荐参数相比,Dilithium-Prime方案的公钥尺寸、私钥尺寸、签名尺寸分别降低1.8%、10.2%、1.8%,签名算法效率提高11.9%,密钥生成算法、验证算法所需时间分别为CRYSTALS-Dilithium方案的2.0倍和2.5倍,但不同于CRYSTALS-Dilithium,Dilithium-Prime方案具有抵抗针对分圆环的密码攻击的优越特性;与2023年韩国后量子密码算法竞赛中提出的基于素阶数域的签名方案NCC-Sign推荐参数相比,在相同的安全等级和带宽条件下,Dilithium-Prime方案的密钥生成算法、签名算法、验证算法的速度分别提升至4.2倍、35.3倍、7.2倍,实现兼顾高效性和安全性的素阶数域签名算法. 展开更多
关键词 后量子密码 格密码 素阶数域 数字签名方案 快速数论变换 小多项式乘法
在线阅读 下载PDF
后量子密码CRYSTALS-Dilithium的高性能实现
16
作者 方伟钿 蒲金伟 +2 位作者 谢家兴 郑欣 熊晓明 《小型微型计算机系统》 北大核心 2025年第5期1273-1280,共8页
CRYSTALS-Dilithium作为后量子密码标准化竞赛的获胜选手之一,被官方首推为传统公钥转型过渡的格数字签名方案.针对目前算法存在的纯硬件方案少和性能不足等问题,提出一种部署在FPGA端的高性能协处理器.本设计调用2层4组并排的CT和GS蝶... CRYSTALS-Dilithium作为后量子密码标准化竞赛的获胜选手之一,被官方首推为传统公钥转型过渡的格数字签名方案.针对目前算法存在的纯硬件方案少和性能不足等问题,提出一种部署在FPGA端的高性能协处理器.本设计调用2层4组并排的CT和GS蝶形对,采用多级流水线、算子可重构和关键路径优化等技术,避免过长的流水线等待,实现高效的多项式运算单元.完全硬件化哈希、采样和特殊函数等单元,并在狭小的设计空间里组合并优化各模块调度.实验结果表明,所提出的系统工作频率为157MHz,执行最高安全等级的密钥生成、签名和验签仅需64.1us、304.0us和59.4us,相比同平台的硬件协处理器,全流程速度提升约69%. 展开更多
关键词 后量子密码学 数字签名 多项式乘法器 数论变换
在线阅读 下载PDF
素阶数域上的高效紧凑NTRU密钥封装方案
17
作者 梁志闯 赵旭阳 +1 位作者 方博越 赵运磊 《软件学报》 北大核心 2025年第2期747-775,共29页
基于格(特别是NTRU格)设计后量子密钥封装方案是格密码领域的主流方向之一.现有多数格密码方案基于分圆环构造,但分圆环饱含丰富的代数结构导致这些方案容易遭受相关攻击.一个可选的且更安全的代数结构是大Galois群、素数阶、基于素理... 基于格(特别是NTRU格)设计后量子密钥封装方案是格密码领域的主流方向之一.现有多数格密码方案基于分圆环构造,但分圆环饱含丰富的代数结构导致这些方案容易遭受相关攻击.一个可选的且更安全的代数结构是大Galois群、素数阶、基于素理想的数域(简称为素阶数域).NTRU-Prime是一个基于素阶数域的备受青睐的NTRU密钥封装方案,且早已经在国际标准OpenSSH中默认应用.旨在设计出比NTRU-Prime性能更优的素阶数域上NTRU密钥封装方案.首先,梳理分圆环的安全隐患,特别是针对2次幂分圆环的系列攻击,同时展示出素阶数域在抵御这些攻击方面的安全优势.接着,基于素阶数域提出NTRU密钥封装方案CNTR-Prime,并给出详细的相关分析和参数集.然后,提出一种伪梅森数不完整NTT,它能有效计算CNTR-Prime中关于素阶数域的多项式乘法.此外,还提出一种改进的伪梅森数约减算法,并将它应用在伪梅森数不完整NTT中.它在软件实现方面比Barrett约减快2.6%,在硬件实现方面比Montgomery约减和Barrett约减快2–6倍.最后,提供CNTR-Prime的C语言实现,并与其他同类方案进行全面对比.结果表明,与SNTRU-Prime相比,CNTR-Prime在安全强度、带宽和实现效率上有优势,其中CNTR-Prime-761的经典和量子安全强度都比SNTRU-Prime-761的高19 bit,密文尺寸降低8.3%,密钥生成算法、密钥封装算法和解封装算法分别快25.3倍、10.8倍和2.0倍.实际上,CNTR-Prime-653的经典和量子安全强度已可与SNTRU-Prime-761相媲美,且CNTR-Prime-653的带宽降低13.8%,密钥生成算法、密钥封装算法和解封装算法分别快33.9倍、12.6倍和2.3倍.所提工作可为后续同类型的格密码方案的设计、分析和优化实现提供重要参考. 展开更多
关键词 格密码 后量子密码 数论研究单元(NTRU) 素阶数域 密钥封装方案 数论变换 模约减 软件实现
在线阅读 下载PDF
快速Fermat数变换软件(FFNT)的研制与优化
18
作者 潘晏仲 高亚南 《西安交通大学学报》 EI CAS CSCD 北大核心 1991年第6期109-112,共4页
<正> 本世纪七十年代初,Rader、Agaarwal、Burrus等人提出了构造整数模M剩余类环Z_M上的离散型Fourier变换(DFT),即数论变换.它比快速Fourier变换(FFT)具有许多优越性,这已为大家公认.在数论变换中,比较简单又实用的一种便是快速F... <正> 本世纪七十年代初,Rader、Agaarwal、Burrus等人提出了构造整数模M剩余类环Z_M上的离散型Fourier变换(DFT),即数论变换.它比快速Fourier变换(FFT)具有许多优越性,这已为大家公认.在数论变换中,比较简单又实用的一种便是快速Fermat数变换(简记FFNT).1976年美国麻省理工学院林肯研究室作出了一个FFNT硬件,其字长为16位,序列长度为64(见文献[1]).1987年4月本文第一作者研制成功了FFNT软件,其字长为36,序列长度可在2~m,m=2,3,…,7中任意选取(见文献[2]). 展开更多
关键词 数论变换 FFNT 软件包 FNT
在线阅读 下载PDF
面向格密码的可配置基-4 NTT硬件优化与实现
19
作者 周清雷 韩贺茹 +1 位作者 李斌 刘宇航 《通信学报》 EI CSCD 北大核心 2024年第10期163-179,共17页
针对数论变换(NTT)优化格密码算法中的多项式乘法问题,以及NTT设计趋向多应用场景的需求,提出了一种面向格密码的可配置基-4 NTT硬件结构。通过分析基-4 NTT/INTT(Inverse NTT)算法流程,设计了高效的现场可编程门阵列(FPGA)整体结构。... 针对数论变换(NTT)优化格密码算法中的多项式乘法问题,以及NTT设计趋向多应用场景的需求,提出了一种面向格密码的可配置基-4 NTT硬件结构。通过分析基-4 NTT/INTT(Inverse NTT)算法流程,设计了高效的现场可编程门阵列(FPGA)整体结构。该结构具备参数化的运行时可配置性和满足多样化需求的编译时可配置性,以流水线方式构建基-4 NTT统一化蝶形单元,并对模除、模约减等关键模块进行优化,提高了计算效率和可配置性。此外,提出可配置多RAM存储优化设计方案及数据存储分配算法,以避免内存冲突、提高数据访问效率。与相关方案的对比及分析表明,以Dilithium算法为例,所提方案不仅具有较高的工作频率,还实现了面积上高达54.3%的优化和吞吐量高达2倍的提升,能够充分发挥FPGA的计算优势。 展开更多
关键词 数论变换 格密码 多项式乘法 现场可编程门阵列 蝶形单元
在线阅读 下载PDF
Dilithium算法的FPGA高效扩展性优化 被引量:1
20
作者 燕云飞 李斌 +3 位作者 魏源鑫 张博林 马添翼 周清雷 《计算机科学》 CSCD 北大核心 2024年第S01期826-834,共9页
为提高Dilithium在实际应用中的运行效率,提出了一种Dilithium算法的现场可编程门阵列(Field Programmable Gate Array,FPGA)高效扩展性优化实现。具体在以下几个方面进行优化:将KOA(Karatsuba-Offman-Algorithm)算法与快速模约减算法... 为提高Dilithium在实际应用中的运行效率,提出了一种Dilithium算法的现场可编程门阵列(Field Programmable Gate Array,FPGA)高效扩展性优化实现。具体在以下几个方面进行优化:将KOA(Karatsuba-Offman-Algorithm)算法与快速模约减算法相结合,构成快速模乘单元,优化数论转换(Number TheoreticTransform,NTT)实现的大量多项式乘法;采用多RAM(Random Access Memory)存取参与运算的多项式系数,根据Dilithium算法的特点,设计了一种多项式系数读取策略,以快速、正确地读取RAM中的多项式系数。针对方案中的采样和散列工作,分析了SHAKE算法系列的特点,设计了一种低延迟可扩展的Keccak硬件架构,使得其能够根据输入信号的不同执行不同的SHAKE算法。实验结果表明,所提方案在频率方面相比其他方案提升了60.7%~131.9%,兼顾硬件的资源消耗和执行效率。 展开更多
关键词 Dilithium算法 现场可编程门阵列 数论变换 硬件实现
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部