期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于数据流架构的NTT蝶式计算加速
1
作者 石泓博 范志华 +4 位作者 李文明 张志远 穆宇栋 叶笑春 安学军 《计算机研究与发展》 北大核心 2025年第6期1547-1561,共15页
全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限... 全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限等问题,导致其在实际应用中的性能严重受限.其中,快速数论变换(number theoretic transform,NTT)作为FHE中关键的基础算子,其性能对整个系统的效率具有决定性影响.针对NTT中的核心计算模式--蝶式(butterfly)计算,提出一种基于数据流计算模型的NTT加速架构.首先,设计面向NTT蝶式计算的RVFHE扩展指令集,定制高效的模乘与模加/模减运算单元,以提升模运算处理效率.其次,提出一种NTT数据重排方法,并结合结构化的蝶式地址生成策略,以降低跨行列数据交换的控制复杂度与访问冲突.最后,设计融合数据流驱动机制的NTT加速架构,通过数据依赖触发方式实现高效的片上调度与数据复用,从而充分挖掘操作级并行性.实验结果表明,与NVIDIA GPU相比,提出的架构获得了8.96倍的性能提升和8.53倍的能效提升;与现有的NTT加速器相比,所提架构获得了1.37倍的性能提升. 展开更多
关键词 数据流 全同态加密 NTT算法 蝶式计算 RISC-V指令集
在线阅读 下载PDF
LogP模型上一类蝶式计算的通信策略
2
作者 陈国良 许锦波 《计算机学报》 EI CSCD 北大核心 1997年第8期695-701,共7页
本文研究LogP模型上一类蝶式计算中的通信问题.以FFT的并行计算为例,通过仔细安排消息的发送顺序,使得由有限带宽引起的延迟与局部计算重叠,在g-logg+1≤logp(p为处理器数,g为带宽因子)的条件下,只要输入... 本文研究LogP模型上一类蝶式计算中的通信问题.以FFT的并行计算为例,通过仔细安排消息的发送顺序,使得由有限带宽引起的延迟与局部计算重叠,在g-logg+1≤logp(p为处理器数,g为带宽因子)的条件下,只要输入长度n满足最基本的要求(n≥2p2),g便被完全隐含于局部计算中,算法时间复杂度可达到最优.最后与文献[1]的结果比较,分析了它们的优缺点及各自的适用范围. 展开更多
关键词 蝶式计算 LOGP模型 通信 算法
在线阅读 下载PDF
一种基于二叉胖树模型的并行FFT算法 被引量:1
3
作者 魏文红 高大利 《计算机应用》 CSCD 北大核心 2007年第4期795-797,共3页
二叉胖树网络结构是一种易于实现蝶式计算的网络拓扑结构,基于这一特点,首先构造了一种二叉胖树的逻辑模型,并提出了一种基于该模型的并行快速傅立叶变换算法。该算法使得进程间有良好的负载平衡,相对于串行算法来说,大大降低了时间复... 二叉胖树网络结构是一种易于实现蝶式计算的网络拓扑结构,基于这一特点,首先构造了一种二叉胖树的逻辑模型,并提出了一种基于该模型的并行快速傅立叶变换算法。该算法使得进程间有良好的负载平衡,相对于串行算法来说,大大降低了时间复杂度。在集群系统和MPI环境下,给出了该算法的实现及实验数据分析。 展开更多
关键词 二叉胖树 蝶式计算 快速傅立叶变换 并行计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部