期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
多维可扩展流体系结构研究与评测 被引量:2
1
作者 吴伟 文梅 +7 位作者 伍楠 何义 杨乾明 管茂林 荀长庆 任巨 柴俊 张春元 《电子学报》 EI CAS CSCD 北大核心 2008年第5期899-905,共7页
MASA(Multiple-dimension scalable Stream Architecture)是一种可在多个维度扩展的流体系结构.本文对该体系结构的扩展性进行了深入探讨,分析了簇内、簇间和多核扩展的VLSI资源开销,并通过一组测试程序评测了MASA的性能.结果表明,三个... MASA(Multiple-dimension scalable Stream Architecture)是一种可在多个维度扩展的流体系结构.本文对该体系结构的扩展性进行了深入探讨,分析了簇内、簇间和多核扩展的VLSI资源开销,并通过一组测试程序评测了MASA的性能.结果表明,三个扩展维度形成有利互补,使得MASA流体系结构可支持扩展到单片内集成上千个ALU. 展开更多
关键词 处理器 流体系结构 扩展性 并行处理
在线阅读 下载PDF
流体系结构指令存储器优化设计研究 被引量:3
2
作者 管茂林 何义 +2 位作者 杨乾明 张春元 伍楠 《电子学报》 EI CAS CSCD 北大核心 2012年第7期1379-1385,共7页
针对流体系结构中VLIW代码体积对指令存储器的容量和功耗带来的问题,本文通过分析流处理器的指令特征,提出了一种新的VLIW分域压缩技术.在此基础上,本文为流体系结构设计了分布式的片上指令存储器,并提出了SIMD流水的执行模式.实验结果... 针对流体系结构中VLIW代码体积对指令存储器的容量和功耗带来的问题,本文通过分析流处理器的指令特征,提出了一种新的VLIW分域压缩技术.在此基础上,本文为流体系结构设计了分布式的片上指令存储器,并提出了SIMD流水的执行模式.实验结果证明,该技术减少了38%的片外指令访存,降低约65%的片上指令存储器空间需求;分布式指令存储器减少了约37%的片上指令存储器面积,使得MASA的系统面积降低了8.92%,并降低了61%的指令存储器功耗. 展开更多
关键词 流体系结构 分布式指令存储器 VLIW压缩
在线阅读 下载PDF
面向分布式流体系结构的多副本积极容错技术 被引量:2
3
作者 李鑫 林宇斐 郭晓威 《计算机工程与科学》 CSCD 北大核心 2015年第12期2233-2241,共9页
随着互联网环境下计算系统规模的不断扩大,分布式流体系结构的可靠性问题面临着严峻的挑战。以多模冗余容错技术为基础,针对软错误提出了一种面向分布式流体系结构的多副本积极容错技术TREFT,利用三个程序副本进行高效的检错与纠错。在... 随着互联网环境下计算系统规模的不断扩大,分布式流体系结构的可靠性问题面临着严峻的挑战。以多模冗余容错技术为基础,针对软错误提出了一种面向分布式流体系结构的多副本积极容错技术TREFT,利用三个程序副本进行高效的检错与纠错。在分布式流体系结构原型系统上的实验结果表明,该技术能有效提高系统的可靠性,具有较低的容错成本,平均增加10.77%的容错开销。 展开更多
关键词 分布式流体系结构 容错技术 三模冗余
在线阅读 下载PDF
数据流Eager传输:一种分布式流体系结构中的性能优化技术 被引量:2
4
作者 李鑫 郭晓威 林宇斐 《计算机工程与科学》 CSCD 北大核心 2015年第11期2035-2044,共10页
分布式流体系结构扩展了分布式环境下的流计算模型,可在互联网上为大数据计算应用提供高效低成本的运行环境。互联网中较长的通信开销制约了计算性能。提出了一种数据流Eager传输的性能优化技术,以挖掘计算与通信之间的并行性,隐藏通信... 分布式流体系结构扩展了分布式环境下的流计算模型,可在互联网上为大数据计算应用提供高效低成本的运行环境。互联网中较长的通信开销制约了计算性能。提出了一种数据流Eager传输的性能优化技术,以挖掘计算与通信之间的并行性,隐藏通信延迟。在分布式流体系结构原型系统中实现了该技术。实验结果表明,应用程序采用该优化技术之后的平均时间开销减少了19.58%,表明该优化技术能够显著提高应用的性能,具有良好的应用前景。 展开更多
关键词 分布式流体系结构 性能优化 数据Eager传输技术
在线阅读 下载PDF
分布式流体系结构及其编程模型与资源管理 被引量:1
5
作者 李鑫 杨学军 徐新海 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第6期110-115,共6页
利用互联网资源提供大数据计算服务面临着资源异构性、动态性与通信长延迟等方面的挑战,现有分布式计算模型仍存在一些不足。运用流计算模型提出分布式流体系结构,包括分布式流编程模型与资源管理等,能够高效支持多种并行执行模式。在10... 利用互联网资源提供大数据计算服务面临着资源异构性、动态性与通信长延迟等方面的挑战,现有分布式计算模型仍存在一些不足。运用流计算模型提出分布式流体系结构,包括分布式流编程模型与资源管理等,能够高效支持多种并行执行模式。在10个CPU-GPU异构结点上实现了原型系统,仿真实验验证了7个不同的测试用例。实验结果表明,与本地串行计算相比,分布式流体系结构可以平均提高39倍计算性能,具有较大的应用潜力。 展开更多
关键词 流体系结构 大数据 编程模型 分布式计算
在线阅读 下载PDF
流体系结构抽象模型研究 被引量:1
6
作者 文梅 李海燕 +2 位作者 伍楠 张春元 李礼 《计算机工程与科学》 CSCD 2006年第7期123-126,共4页
流体系结构在新兴的体系结构中备受关注。鉴于多种多样的流体系结构的存在,本文提出了一个流体系结构的抽象模型。本项工作对开发应用在多种流体系结构上的可移植性具有重要意义。
关键词 流体系结构 硬件结构模型 程序设计模型 应用
在线阅读 下载PDF
流体系结构密码处理器存储系统的研究与设计 被引量:2
7
作者 朱玉飞 戴紫彬 +1 位作者 徐进辉 李功丽 《电子学报》 EI CAS CSCD 北大核心 2017年第12期2957-2964,共8页
以信息安全设备的密码应用需求为基础,融合流体系结构处理器基本架构,设计出流体系结构密码处理器.文章主要研究和设计影响该处理器性能的瓶颈——流存储系统.此系统针对专用密码处理器的存储特点,并采用可配置化设计,满足密码应用对处... 以信息安全设备的密码应用需求为基础,融合流体系结构处理器基本架构,设计出流体系结构密码处理器.文章主要研究和设计影响该处理器性能的瓶颈——流存储系统.此系统针对专用密码处理器的存储特点,并采用可配置化设计,满足密码应用对处理器存储系统灵活高效的要求.同时,该设计将层次化-分布-分体式存储、多数据通道流水并行化访存、流访存调度策略相结合,优化存储系统的访存效率,以提高该处理器的整体性能.研究结果表明,相比于典型密码处理器的存储设计,该设计的访存效率最高可提升约6倍. 展开更多
关键词 密码处理器 流体系结构处理器 存储系统 可配置
在线阅读 下载PDF
可重构密码流体系结构模拟器设计与实现 被引量:1
8
作者 王寿成 严迎建 +2 位作者 徐进辉 李功丽 朱玉飞 《计算机工程与设计》 北大核心 2016年第11期2923-2927,共5页
面向可重构密码流处理器RCSP,设计并实现基于SystemC语言的全系统模拟器RCSPSim,提出模拟器的硬件资源建模方法、指令集及译码方案和性能统计方案,实现对RCSP处理器的高效精确模拟。RCSPSim能够准确实现密码算法,进行详细的吞吐率评测,... 面向可重构密码流处理器RCSP,设计并实现基于SystemC语言的全系统模拟器RCSPSim,提出模拟器的硬件资源建模方法、指令集及译码方案和性能统计方案,实现对RCSP处理器的高效精确模拟。RCSPSim能够准确实现密码算法,进行详细的吞吐率评测,为实际处理器开发和优化提供重要的评估和借鉴作用。在单簇(核)前提下,与其它结构的专用密码处理器相比较,RCSPSim在实现典型密码算法时具有较高的吞吐率,验证了可重构密码流体系结构的性能优势。 展开更多
关键词 可重构技术 密码处理器 流体系结构 SYSTEMC 模拟器
在线阅读 下载PDF
配置流驱动计算体系结构指导下的ASIP设计 被引量:3
9
作者 李勇 王志英 +1 位作者 赵学秘 岳虹 《计算机研究与发展》 EI CSCD 北大核心 2007年第4期714-721,共8页
为了兼顾嵌入式处理器设计中的灵活性与高效性,提出配置流驱动计算体系结构.在体系结构设计中将软/硬件界面下移,使功能单元之间的互连网络对编译器可见,并由编译器来完成传输路由,从而支持复杂但更为高效的互连网络.在该体系结构指导下... 为了兼顾嵌入式处理器设计中的灵活性与高效性,提出配置流驱动计算体系结构.在体系结构设计中将软/硬件界面下移,使功能单元之间的互连网络对编译器可见,并由编译器来完成传输路由,从而支持复杂但更为高效的互连网络.在该体系结构指导下,提出一种支持段式可重构互连网络的专用指令集处理器(ASIP)设计方法.该方法应用到密码领域的3类ASIP设计中表明,与简单总线互连相比,在不影响性能的前提下,可平均节约53%的互连功耗和38.7%的总线数量,从而达到减少总线数量、降低互连功耗的目的. 展开更多
关键词 配置驱动计算体系结构 传输触发体系结构 专用指令集处理器 嵌入式处理器
在线阅读 下载PDF
一种异构多核处理器的并行流存储结构 被引量:7
10
作者 邓让钰 陈海燕 +7 位作者 窦强 徐炜遐 谢伦国 戴泽福 李永进 夏军 罗莉 张民选 《电子学报》 EI CAS CSCD 北大核心 2009年第2期312-317,共6页
异构多核处理器可结合多种处理器体系结构的优势,既保留传统通用体系结构的灵活性,又拥有大量计算资源,可提供更高的峰值计算性能.YHFT64-3异构多核处理器中浮点处理部件18套,峰值计算能力强大,设计与之相匹配的存储系统是一项重大挑战... 异构多核处理器可结合多种处理器体系结构的优势,既保留传统通用体系结构的灵活性,又拥有大量计算资源,可提供更高的峰值计算性能.YHFT64-3异构多核处理器中浮点处理部件18套,峰值计算能力强大,设计与之相匹配的存储系统是一项重大挑战.针对YHFT64-3处理器,本文提出了一种并行流层次存储结构,深入阐述了如何体现应用特点、支持并行数据流处理的存储系统的设计思想和方法,从多个层次实现对并行数据流的挖掘或捕获.测试结果表明,这种存储结构体现了应用特点,能够较好地发挥YHFT64-3处理器的性能,同频情况下(500MHz),YHFT64-3比YHFT64-2性能高2—3个数量级,与1.6GHz的Itanium2性能相当,但代价更低. 展开更多
关键词 异构多核处理器 流体系结构 预取 存储调度 优化的锁步执行模型
在线阅读 下载PDF
梅森素数并行求解算法的流式实现 被引量:1
11
作者 伍楠 吴伟 +3 位作者 文梅 杨乾明 柴俊 张春元 《计算机工程与科学》 CSCD 2007年第11期53-55,59,共4页
本文以数论中的Lucas-Lehmer检验法为基础,提出了梅森素数并行求解算法在FT64流处理器上的流式实现,并通过重设流记录的大小对程序进行了优化。评测数据表明,在FT64上运行该应用的时间平均比1.5GHz Itanium2快2.5倍。本文为梅森素数求... 本文以数论中的Lucas-Lehmer检验法为基础,提出了梅森素数并行求解算法在FT64流处理器上的流式实现,并通过重设流记录的大小对程序进行了优化。评测数据表明,在FT64上运行该应用的时间平均比1.5GHz Itanium2快2.5倍。本文为梅森素数求解问题寻找了一条可行的加速方法,同时证实了流体系结构在高性能计算领域的极大潜力。本文提出的流式算法以及各种优化手段,对于其他科学计算领域中的计算密集型问题在流体系结构上的映射有极大的借鉴意义。 展开更多
关键词 流体系结构 Lucas-Lehmer检验法 梅森素数 高性能计算 处理器
在线阅读 下载PDF
流处理器技术研究与发展 被引量:1
12
作者 杨学军 晏小波 唐滔 《计算机工程与科学》 CSCD 2008年第4期113-117,共5页
高性能计算技术在过去十年中不断向前发展,但片外存储、通信延迟等问题一直得不到本质改善,线延迟和功耗问题也越来越突出。高性能计算领域正在寻求能够解决这一问题的新型处理器体系结构。流处理器是在众多新兴的处理器体系结构中发展... 高性能计算技术在过去十年中不断向前发展,但片外存储、通信延迟等问题一直得不到本质改善,线延迟和功耗问题也越来越突出。高性能计算领域正在寻求能够解决这一问题的新型处理器体系结构。流处理器是在众多新兴的处理器体系结构中发展非常迅速、被学界和业界广泛关注的一种新型处理器,它在数字处理、多媒体以及图像等领域已取得很好的效果。本文分析了当前流行的几种流处理器,指出了流体系结构在科学计算领域的应用前景和所面临的挑战。 展开更多
关键词 流体系结构 科学计算 处理器
在线阅读 下载PDF
二维拉格朗日和欧拉结合法在流处理器MASA上的实现与评测
13
作者 张春元 文梅 +2 位作者 伍楠 荀长庆 吴伟 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第4期43-48,共6页
现代半导体工艺技术的发展使得在单芯片上放置数百个运算单元成为可能,但是全局片上片外带宽受限。通用处理器体系结构不能较好地适应变化,仍然依靠全局片上结构,少量的运算单元。而流体系结构拥有大量的运算单元、鲜明的存储层次,使得... 现代半导体工艺技术的发展使得在单芯片上放置数百个运算单元成为可能,但是全局片上片外带宽受限。通用处理器体系结构不能较好地适应变化,仍然依靠全局片上结构,少量的运算单元。而流体系结构拥有大量的运算单元、鲜明的存储层次,使得在有限的片外带宽下,用高的本地带宽来满足大量运算单元的需求。首先介绍了原型MASA流体系结构,然后给出了爆轰流体力学中的二维拉格朗日和欧拉结合法(Ygx2)在流体系结构上实现的实例研究,最后用时钟精确的模拟器来评测应用的运行性能,结果表明Ygx2应用在500MHz的MASA上运行结果与1.6GHz的Iantium2的比较快近4倍,证实了流体系结构在高性能计算领域的极大潜力。 展开更多
关键词 流体系结构 Ygx2 高性能计算
在线阅读 下载PDF
高清H.264变换编码的流式实现
14
作者 苏华友 伍楠 +3 位作者 文梅 任巨 吴伟 张春元 《计算机工程与科学》 CSCD 北大核心 2011年第8期148-153,共6页
H.264作为新一代视频编码标准,具有很好的性能,但计算复杂度比较高。Storm处理器是一款面向媒体应用和信号处理的高效能流处理器,在媒体处理方面具有很好的应用前景。针对H.264对计算性能的要求,本文给出了高清H.264(1080P)变换编码在St... H.264作为新一代视频编码标准,具有很好的性能,但计算复杂度比较高。Storm处理器是一款面向媒体应用和信号处理的高效能流处理器,在媒体处理方面具有很好的应用前景。针对H.264对计算性能的要求,本文给出了高清H.264(1080P)变换编码在Storm-SP16 G160流处理器上的流式实现。本文根据不同算法的数据流特征,结合具体的流化过程详细介绍了并行粒度选择以及数据流组织、规范化处理等流化技术。实验结果表明:编码的流式实现具有很好的性能,按照此编码效率加速整个程序可满足实时要求。提供了一种不同于硬件加速的程序加速方法,对其他媒体应用在流处理器上的映射具有很大的借鉴意义。 展开更多
关键词 处理器 H.264视频编码 变换编码 流体系结构
在线阅读 下载PDF
流处理器延迟隐藏机制的优化及实现
15
作者 李礼 文梅 +2 位作者 伍楠 李海燕 张春元 《计算机工程与科学》 CSCD 2007年第3期74-76,共3页
流体系结构在新兴的高性能计算机体系结构中备受关注,通过多种技术途径,流处理器能广泛深入地挖掘程序各种并行性。本文首先介绍流处理器访存延迟隐藏的技术,然后引入“链接”思想以进一步优化访存延迟隐藏机制,最后讨论了“链接”机制... 流体系结构在新兴的高性能计算机体系结构中备受关注,通过多种技术途径,流处理器能广泛深入地挖掘程序各种并行性。本文首先介绍流处理器访存延迟隐藏的技术,然后引入“链接”思想以进一步优化访存延迟隐藏机制,最后讨论了“链接”机制在流处理器上的实现。 展开更多
关键词 流体系结构 延迟隐藏 链接
在线阅读 下载PDF
多媒体基准测试程序中的流并行性分析 被引量:2
16
作者 周丽萍 安虹 +1 位作者 徐光 王耀彬 《计算机科学》 CSCD 北大核心 2009年第5期287-290,共4页
在分析多媒体基准测试程序Mediabench特征的基础上,以Imagine流处理器为例讨论了流体系结构对多媒体应用所提供的软硬件支持,并且利用流编程模型对多媒体应用中存在的流并行性进行了详细的剖析,最后通过对3个典型的多媒体应用进行流并... 在分析多媒体基准测试程序Mediabench特征的基础上,以Imagine流处理器为例讨论了流体系结构对多媒体应用所提供的软硬件支持,并且利用流编程模型对多媒体应用中存在的流并行性进行了详细的剖析,最后通过对3个典型的多媒体应用进行流并行程序设计,在Imagine的时钟精确模拟器Isim上测试得到了多媒体应用在流体系结构上可以获得的加速性能。 展开更多
关键词 多媒体基准测试程序 流体系结构 并行性
在线阅读 下载PDF
面向分组密码的四维度并行处理架构研究
17
作者 王寿成 李功丽 +1 位作者 严迎建 徐进辉 《电子学报》 EI CAS CSCD 北大核心 2017年第10期2457-2463,共7页
通过对分组密码算法加密特征的分析,将分组密码算法的并行性划分为分组内同操作并行性、分组内异操作并行性、分组间同操作并行性和分组间异操作并行性等四维度并行性,并根据此提出了基于Amdahl定律的分组密码四维度并行处理模型FDPM.... 通过对分组密码算法加密特征的分析,将分组密码算法的并行性划分为分组内同操作并行性、分组内异操作并行性、分组间同操作并行性和分组间异操作并行性等四维度并行性,并根据此提出了基于Amdahl定律的分组密码四维度并行处理模型FDPM.该模型能够指导分组密码处理架构设计,为架构资源配置和并行性开发提供整体建议.以FDPM为依据,提出了一种面向分组密码的可重构流处理架构RCSA,该架构能够有效开发分组密码处理的并行性,在提高密码处理性能的同时也能提高资源利用率.通过算法映射结果分析,证明了FDPM模型的正确性与RCSA架构的高效性. 展开更多
关键词 分组密码 AMDAHL定律 四维度并行处理 流体系结构 加速比
在线阅读 下载PDF
Understanding pollution dynamics in large-scale peer-to-peer IPTV system 被引量:2
18
作者 王海舟 陈兴蜀 +1 位作者 王文贤 郝正鸿 《Journal of Central South University》 SCIE EI CAS 2012年第8期2203-2217,共15页
With the great commercial success of several IPTV (internet protocal television) applications, PPLive has received more and more attention from both industry and academia. At present, PPLive system is one of the most ... With the great commercial success of several IPTV (internet protocal television) applications, PPLive has received more and more attention from both industry and academia. At present, PPLive system is one of the most popular instances of IPTV applications which attract a large number of users across the globe; however, the dramatic rise in popularity makes it more likely to become a vulnerable target. The main contribution of this work is twofold. Firstly, a dedicated distributed crawler system was proposed and its crawling performance was analyzed, which was used to evaluate the impact of pollution attack in P2P live streaming system. The measurement results reveal that the crawler system with distributed architecture could capture PPLive overlay snapshots with more efficient way than previous crawlers. To the best of our knowledge, our study work is the first to employ distributed architecture idea to design crawler system and discuss the crawling performance of capturing accurate overlay snapshots for P2P live streaming system. Secondly, a feasible and effective pollution architecture was proposed to deploy content pollution attack in a real-world P2P live streaming system called PPLive, and deeply evaluate the impact of pollution attack from following five aspects:dynamic evolution of participating users, user lifetime characteristics, user connectivity-performance, dynamic evolution of uploading polluted chunks and dynamic evolution of pollution ratio. Specifically, the experiment results show that a single polluter is capable of compromising all the system and its destructiveness is severe. 展开更多
关键词 peer-to-peer technology internet protocol television active measurement distributed crawler pollution attack PPLIVE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部