-
题名Aigis密钥封装算法多平台高效实现与优化
被引量:4
- 1
-
-
作者
沈诗羽
何峰
赵运磊
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第10期2238-2252,共15页
-
基金
国家自然科学基金项目(U1536205,61472084)
国家重点研发计划项目(2017YFB0802000)
+2 种基金
上海市科技创新行动计划项目(16DZ1100200)
上海市科学技术发展基金项目(16JC1400801)
山东省重点研发计划项目(2017CXG0701,2018CXGC0701)。
-
文摘
量子计算技术快速发展带来的新挑战使得后量子密码(post-quantum cryptography,PQC)成为当前密码学界研究热点.基于格的密码方案因其安全高效的特性,已经成为后量子公钥密码的主流之一.Aigis密钥封装算法(Aigis-enc)是我国学者自主设计的基于模格上非对称错误学习(A-MLWE)问题的后量子密码算法,是中国密码学会举办的全国密码算法设计竞赛公钥密码算法一等奖获奖算法之一.为了应对量子攻击,维护国家网络空间的长远安全,为未来国家后量子密码算法标准的制定和实际部署贡献力量,对我国自行研发的优秀后量子密码算法进行优化具有重要意义.工作重点关注Aigis-enc算法在不同平台的实现优化,包含高性能平台的快速并行实现与嵌入式低功耗平台的紧凑实现.具体而言,运用单指令多数据流(single instruction multiple data,SIMD)指令,充分优化了Aigis-enc现有AVX2实现,并提供了其首个ARM Cortex-M4平台的轻量级紧凑实现.实现包含4个关键优化点:降低Montgomery约减与Barrett约减汇编指令数目,提升了约减效率;使用裁剪层数的数论变换并优化指令流水调度,加速多项式乘法运算并减少了预计算表存储需求;提供了多项式序列化与反序列化的并行汇编指令实现,加快了编码解码与加解密过程;结合on-the-fly计算与空间复用优化算法存储空间.实验结果表明:提出的优化技术在8核Intel Core i7处理器上可将Aigis-enc算法原始AVX2实现提升25%,且大幅减少了其在ARM Cortex-M4平台的预计算表存储、代码尺寸与运行堆栈占用,对算法的实际应用有重要现实意义.
-
关键词
后量子密码
格密码
密钥封装机制
avx2并行优化
嵌入式轻量级实现
-
Keywords
post-quantum cryptography
lattice cryptography
key encapsulation mechanism
avx2 parallel optimization
embedded lightweight implementation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于NTRU格的密钥封装机制高效软件优化实现
- 2
-
-
作者
郑婕妤
宋振宇
朱浩亮
赵运磊
林璟锵
范晶
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机研究与发展》
2025年第9期2330-2347,共18页
-
基金
国家重点研发计划项目(2022YFB2701601)
密码科学技术全国重点实验室面上项目(MMKFKT202227)
+2 种基金
上海市科学技术委员会基金项目(21DZ2200500)
上海市协同创新基金项目(XTCX-KJ-2023-54)
上海市科委区块链关键技术攻关专项基金(23511100300)。
-
文摘
NTRU格是构建实用后量子格基密钥封装机制的重要选择.格密码的软件优化工程实现对于后量子密码后续的应用部署具有重要意义. CTRU是中国学者提出的基于NTRU格的格密码密钥封装机制.目前CTRU方案只有CTRU-768完成了C和AVX2实现,且有进一步的优化空间,并且CTRU-768的实现无法直接扩展到CTRU-512和CTRU-1 024方案上.完成了CTRU-512和CTRU-1 024及其变体CNTR-512和CNTR-1 024的优化参考C实现和对应AVX2并行优化实现,并对已有的CTRU-768方案的参考实现和AVX2实现进行优化.采用混合基数论变换(NTT)加速多项式环乘法,并使用Karatsuba算法加速分解后的小度数多项式环乘法.此外,结合中心Barrett约减,提出在逆向NTT中进行基于索引的延迟约减.对于CTRU-1 024下较为耗时的多项式求逆,引入了Bernstein快速求逆算法.进一步地,提供了更加高效的AVX2优化实现方案,利用Intel提出的单指令多数据(SIMD)指令集AVX2,加速了CTRU中的性能瓶颈.采用层融合和系数置乱技术减少实现过程中的存取指令.此外,对Bernstein快速多项式求逆算法进行了向量化优化实现.对耗时SHA-3哈希模块进行AVX2汇编实现.相较于最新的CTRU-768 AVX2实现,AVX2优化实现性能提升了8%~11%.对于CTRU方案,与参考实现相比,AVX2优化实现在3个方案上的性能提升均非常显著.对于CTRU方案,与参考实现相比,提出的AVX2优化实现在CTRU-512,CTRU-768,CTRU-1 024这3个方案上的性能提升均十分显著,密钥生成、密钥封装、密钥解封装的性能提升幅度分别为56%~91%,74%~90%,70%~83%.
-
关键词
后量子密码
NTRU格
密钥封装机制
avx2并行优化
软件实现
-
Keywords
post-quantum cryptography
NTRU lattice
key encapsulation mechanism
avx2 parallel optimization
software implementation
-
分类号
TP391
[自动化与计算机技术]
-