期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于数据流架构的NTT蝶式计算加速
1
作者
石泓博
范志华
+4 位作者
李文明
张志远
穆宇栋
叶笑春
安学军
《计算机研究与发展》
北大核心
2025年第6期1547-1561,共15页
全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限...
全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限等问题,导致其在实际应用中的性能严重受限.其中,快速数论变换(number theoretic transform,NTT)作为FHE中关键的基础算子,其性能对整个系统的效率具有决定性影响.针对NTT中的核心计算模式--蝶式(butterfly)计算,提出一种基于数据流计算模型的NTT加速架构.首先,设计面向NTT蝶式计算的RVFHE扩展指令集,定制高效的模乘与模加/模减运算单元,以提升模运算处理效率.其次,提出一种NTT数据重排方法,并结合结构化的蝶式地址生成策略,以降低跨行列数据交换的控制复杂度与访问冲突.最后,设计融合数据流驱动机制的NTT加速架构,通过数据依赖触发方式实现高效的片上调度与数据复用,从而充分挖掘操作级并行性.实验结果表明,与NVIDIA GPU相比,提出的架构获得了8.96倍的性能提升和8.53倍的能效提升;与现有的NTT加速器相比,所提架构获得了1.37倍的性能提升.
展开更多
关键词
数据流
全同态加密
NTT算法
蝶式计算
RISC-V指令集
在线阅读
下载PDF
职称材料
LogP模型上一类蝶式计算的通信策略
2
作者
陈国良
许锦波
《计算机学报》
EI
CSCD
北大核心
1997年第8期695-701,共7页
本文研究LogP模型上一类蝶式计算中的通信问题.以FFT的并行计算为例,通过仔细安排消息的发送顺序,使得由有限带宽引起的延迟与局部计算重叠,在g-logg+1≤logp(p为处理器数,g为带宽因子)的条件下,只要输入...
本文研究LogP模型上一类蝶式计算中的通信问题.以FFT的并行计算为例,通过仔细安排消息的发送顺序,使得由有限带宽引起的延迟与局部计算重叠,在g-logg+1≤logp(p为处理器数,g为带宽因子)的条件下,只要输入长度n满足最基本的要求(n≥2p2),g便被完全隐含于局部计算中,算法时间复杂度可达到最优.最后与文献[1]的结果比较,分析了它们的优缺点及各自的适用范围.
展开更多
关键词
蝶式计算
LOGP模型
通信
算法
在线阅读
下载PDF
职称材料
一种基于二叉胖树模型的并行FFT算法
被引量:
1
3
作者
魏文红
高大利
《计算机应用》
CSCD
北大核心
2007年第4期795-797,共3页
二叉胖树网络结构是一种易于实现蝶式计算的网络拓扑结构,基于这一特点,首先构造了一种二叉胖树的逻辑模型,并提出了一种基于该模型的并行快速傅立叶变换算法。该算法使得进程间有良好的负载平衡,相对于串行算法来说,大大降低了时间复...
二叉胖树网络结构是一种易于实现蝶式计算的网络拓扑结构,基于这一特点,首先构造了一种二叉胖树的逻辑模型,并提出了一种基于该模型的并行快速傅立叶变换算法。该算法使得进程间有良好的负载平衡,相对于串行算法来说,大大降低了时间复杂度。在集群系统和MPI环境下,给出了该算法的实现及实验数据分析。
展开更多
关键词
二叉胖树
蝶式计算
快速傅立叶变换
并行
计算
在线阅读
下载PDF
职称材料
题名
基于数据流架构的NTT蝶式计算加速
1
作者
石泓博
范志华
李文明
张志远
穆宇栋
叶笑春
安学军
机构
处理器芯片全国重点实验室(中国科学院计算技术研究所)
中国科学院大学计算机科学与技术学院
出处
《计算机研究与发展》
北大核心
2025年第6期1547-1561,共15页
基金
国家重点科技发展计划(2023YFB4503500)
北京市新星计划(20220484054,20230484420)
+1 种基金
北京市自然科学基金项目(L234078)
中国科学院青年创新促进会资助项目。
文摘
全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限等问题,导致其在实际应用中的性能严重受限.其中,快速数论变换(number theoretic transform,NTT)作为FHE中关键的基础算子,其性能对整个系统的效率具有决定性影响.针对NTT中的核心计算模式--蝶式(butterfly)计算,提出一种基于数据流计算模型的NTT加速架构.首先,设计面向NTT蝶式计算的RVFHE扩展指令集,定制高效的模乘与模加/模减运算单元,以提升模运算处理效率.其次,提出一种NTT数据重排方法,并结合结构化的蝶式地址生成策略,以降低跨行列数据交换的控制复杂度与访问冲突.最后,设计融合数据流驱动机制的NTT加速架构,通过数据依赖触发方式实现高效的片上调度与数据复用,从而充分挖掘操作级并行性.实验结果表明,与NVIDIA GPU相比,提出的架构获得了8.96倍的性能提升和8.53倍的能效提升;与现有的NTT加速器相比,所提架构获得了1.37倍的性能提升.
关键词
数据流
全同态加密
NTT算法
蝶式计算
RISC-V指令集
Keywords
dataflow
full homomorphic encryption(FHE)
NTT algorithm
butterfly computation
RISC-V instruction set
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
LogP模型上一类蝶式计算的通信策略
2
作者
陈国良
许锦波
机构
中国科学技术大学计算机科学与技术系
出处
《计算机学报》
EI
CSCD
北大核心
1997年第8期695-701,共7页
基金
国家教委博士点基金
文摘
本文研究LogP模型上一类蝶式计算中的通信问题.以FFT的并行计算为例,通过仔细安排消息的发送顺序,使得由有限带宽引起的延迟与局部计算重叠,在g-logg+1≤logp(p为处理器数,g为带宽因子)的条件下,只要输入长度n满足最基本的要求(n≥2p2),g便被完全隐含于局部计算中,算法时间复杂度可达到最优.最后与文献[1]的结果比较,分析了它们的优缺点及各自的适用范围.
关键词
蝶式计算
LOGP模型
通信
算法
Keywords
Butterfly computation, FFT permutation, in-driven.
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种基于二叉胖树模型的并行FFT算法
被引量:
1
3
作者
魏文红
高大利
机构
华南理工大学计算机科学与工程学院
泉州师范学院计算机系
出处
《计算机应用》
CSCD
北大核心
2007年第4期795-797,共3页
文摘
二叉胖树网络结构是一种易于实现蝶式计算的网络拓扑结构,基于这一特点,首先构造了一种二叉胖树的逻辑模型,并提出了一种基于该模型的并行快速傅立叶变换算法。该算法使得进程间有良好的负载平衡,相对于串行算法来说,大大降低了时间复杂度。在集群系统和MPI环境下,给出了该算法的实现及实验数据分析。
关键词
二叉胖树
蝶式计算
快速傅立叶变换
并行
计算
Keywords
binary fat tree
butterfly computing
Fast Fourier Transform (FFT)
parallel computing
分类号
TP393.02 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于数据流架构的NTT蝶式计算加速
石泓博
范志华
李文明
张志远
穆宇栋
叶笑春
安学军
《计算机研究与发展》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
LogP模型上一类蝶式计算的通信策略
陈国良
许锦波
《计算机学报》
EI
CSCD
北大核心
1997
0
在线阅读
下载PDF
职称材料
3
一种基于二叉胖树模型的并行FFT算法
魏文红
高大利
《计算机应用》
CSCD
北大核心
2007
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部