期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
配置流驱动计算体系结构指导下的ASIP设计 被引量:3
1
作者 李勇 王志英 +1 位作者 赵学秘 岳虹 《计算机研究与发展》 EI CSCD 北大核心 2007年第4期714-721,共8页
为了兼顾嵌入式处理器设计中的灵活性与高效性,提出配置流驱动计算体系结构.在体系结构设计中将软/硬件界面下移,使功能单元之间的互连网络对编译器可见,并由编译器来完成传输路由,从而支持复杂但更为高效的互连网络.在该体系结构指导下... 为了兼顾嵌入式处理器设计中的灵活性与高效性,提出配置流驱动计算体系结构.在体系结构设计中将软/硬件界面下移,使功能单元之间的互连网络对编译器可见,并由编译器来完成传输路由,从而支持复杂但更为高效的互连网络.在该体系结构指导下,提出一种支持段式可重构互连网络的专用指令集处理器(ASIP)设计方法.该方法应用到密码领域的3类ASIP设计中表明,与简单总线互连相比,在不影响性能的前提下,可平均节约53%的互连功耗和38.7%的总线数量,从而达到减少总线数量、降低互连功耗的目的. 展开更多
关键词 配置流驱动计算体系结构 传输触发体系结构 专用指令集处理器 嵌入式处理器
在线阅读 下载PDF
一种流处理器体系结构MASA及其在流体力学计算中的评测 被引量:3
2
作者 伍楠 文梅 +4 位作者 何义 荀长庆 任巨 柴俊 张春元 《计算机学报》 EI CSCD 北大核心 2008年第1期133-141,共9页
提出了面向科学计算的64位流体系结构——MASA,它具有强局域性、并行性、解耦合访存操作和计算操作等特征,特别适合于计算密集型的并行应用.作者使用时钟精确的模拟器评测了流体力学中的典型应用在MASA上的运行性能,结果表明MASA在500MH... 提出了面向科学计算的64位流体系结构——MASA,它具有强局域性、并行性、解耦合访存操作和计算操作等特征,特别适合于计算密集型的并行应用.作者使用时钟精确的模拟器评测了流体力学中的典型应用在MASA上的运行性能,结果表明MASA在500MHz的情况下能够获得比1.6GHz的Iantium2近4倍的加速,证实了流体系结构在高性能计算领域的极大潜力. 展开更多
关键词 处理器 体系结构 科学计算 Ygx2 MASA
在线阅读 下载PDF
面向混杂流计算的适应性存储器体系结构 被引量:1
3
作者 张萌 赵磊 +1 位作者 樊晓桠 田杭沛 《西北工业大学学报》 EI CAS CSCD 北大核心 2012年第6期961-967,共7页
可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结... 可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结构能够同时适应混杂流计算中流数据以及标量数据的存储需求;采用了适应性动态存储资源分配策略和适应性动态地址映射策略解决地址映射冲突问题;通过全硬件支持非规则流、条件流的存储与访问,混合数据替换策略能够充分挖掘数据的生产者-消费者局部性及时间、空间局部性。验证评估实验表明,相对Cache以及SPM(Scratchpad Memory),DAMS Cache算法的适应性较好,面向混杂流计算的性能较优。 展开更多
关键词 片内高速缓存 计算体系结构 计算机硬件 计算机仿真 计算机软件 数据处理 高效率 微处理器芯片 多处理系统 优化 资源配置 调度 结构框图 DAMS动态地址映射
在线阅读 下载PDF
面向普适计算设备的软件体系结构 被引量:2
4
作者 王济勇 赵海 +1 位作者 林涛 王金东 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第4期333-336,共4页
互为目的和手段的通信与计算是面向普适计算设备软件体系结构的核心问题,借鉴嵌入式Internet、网格计算、Jini的实现思想,针对其核心问题提出了一个满足动态和静态双重可配置性的面向普适计算设备的软件体系结构,以及配置和裁剪其内容... 互为目的和手段的通信与计算是面向普适计算设备软件体系结构的核心问题,借鉴嵌入式Internet、网格计算、Jini的实现思想,针对其核心问题提出了一个满足动态和静态双重可配置性的面向普适计算设备的软件体系结构,以及配置和裁剪其内容使其能够运行于特定资源限制和功能性能要求系统的软件开发平台·旨在解决普适计算的设备与其提供服务的多样性与嵌入其中的计算机系统资源受限的矛盾,为普适计算的上层服务提供设备级软件体系结构上的技术保证,实现普适计算设备间互为目的和手段的通信与协作计算· 展开更多
关键词 普适计算 软件体系结构 嵌入式INTERNET 网格计算 双重可配置
在线阅读 下载PDF
对推理机体系结构的研究及层次型包驱动结构HPDM的设计 被引量:1
5
作者 方滨兴 刘佳葳 +1 位作者 胡铭曾 王文敏 《计算机学报》 EI CSCD 北大核心 1989年第9期641-649,共9页
本文对推理机的结构进行了全面的探讨,并指出了并行模型及核心语言对体系结构所施加的影响。文中作者给出了一个基于包驱动执行机制的推理机概念性的方案HPDM,该方案的硬件构成是层次型网状多处理机系统,本文最后对该结构进行了性能评价。
关键词 推理机 体系结构 计算 驱动
在线阅读 下载PDF
分布式流体系结构及其编程模型与资源管理 被引量:1
6
作者 李鑫 杨学军 徐新海 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第6期110-115,共6页
利用互联网资源提供大数据计算服务面临着资源异构性、动态性与通信长延迟等方面的挑战,现有分布式计算模型仍存在一些不足。运用流计算模型提出分布式流体系结构,包括分布式流编程模型与资源管理等,能够高效支持多种并行执行模式。在10... 利用互联网资源提供大数据计算服务面临着资源异构性、动态性与通信长延迟等方面的挑战,现有分布式计算模型仍存在一些不足。运用流计算模型提出分布式流体系结构,包括分布式流编程模型与资源管理等,能够高效支持多种并行执行模式。在10个CPU-GPU异构结点上实现了原型系统,仿真实验验证了7个不同的测试用例。实验结果表明,与本地串行计算相比,分布式流体系结构可以平均提高39倍计算性能,具有较大的应用潜力。 展开更多
关键词 体系结构 大数据 编程模型 分布式计算
在线阅读 下载PDF
流体系结构密码处理器存储系统的研究与设计 被引量:2
7
作者 朱玉飞 戴紫彬 +1 位作者 徐进辉 李功丽 《电子学报》 EI CAS CSCD 北大核心 2017年第12期2957-2964,共8页
以信息安全设备的密码应用需求为基础,融合流体系结构处理器基本架构,设计出流体系结构密码处理器.文章主要研究和设计影响该处理器性能的瓶颈——流存储系统.此系统针对专用密码处理器的存储特点,并采用可配置化设计,满足密码应用对处... 以信息安全设备的密码应用需求为基础,融合流体系结构处理器基本架构,设计出流体系结构密码处理器.文章主要研究和设计影响该处理器性能的瓶颈——流存储系统.此系统针对专用密码处理器的存储特点,并采用可配置化设计,满足密码应用对处理器存储系统灵活高效的要求.同时,该设计将层次化-分布-分体式存储、多数据通道流水并行化访存、流访存调度策略相结合,优化存储系统的访存效率,以提高该处理器的整体性能.研究结果表明,相比于典型密码处理器的存储设计,该设计的访存效率最高可提升约6倍. 展开更多
关键词 密码处理器 体系结构处理器 存储系统 配置
在线阅读 下载PDF
一个基于事件驱动的面向服务计算平台 被引量:45
8
作者 刘家红 吴泉源 《计算机学报》 EI CSCD 北大核心 2008年第4期588-599,共12页
基于请求/响应调用模型的面向服务体系结构(Service-Oriented Architecture,SOA)的实现存在通信耦合程度高,协同能力不足的问题.事件驱动体系结构特别适合于松耦合通信和应用需要感知支持的环境.在面向服务的计算平台中提供事件驱动支持... 基于请求/响应调用模型的面向服务体系结构(Service-Oriented Architecture,SOA)的实现存在通信耦合程度高,协同能力不足的问题.事件驱动体系结构特别适合于松耦合通信和应用需要感知支持的环境.在面向服务的计算平台中提供事件驱动支持,可满足计算平台的松耦合通信与协同需求.文中给出了面向服务计算平台中事件驱动的框架,针对需高效处理事件流上复合事件的需求,在框架中设计了基于SEDA模型的并发事件处理与基于事件代数的事件流处理机制.在事件代数中给出了上下文语义和相应的检测算法,以实现高效事件流处理.实验表明,设计的事件驱动面向服务计算平台具有松耦合通信、协同计算、高效事件流处理和复合事件处理的特点,适应了目前动态多变的大规模分布式计算环境的需求,有着广阔的应用前景. 展开更多
关键词 面向服务的计算平台 事件驱动体系结构 事件处理 事件代数 复合事件处理
在线阅读 下载PDF
基于云计算与物联网技术的港口物流综合服务平台架构研究 被引量:14
9
作者 韩海雯 齐德昱 封斌 《计算机科学》 CSCD 北大核心 2013年第06A期232-235,261,共5页
世界贸易量的不断攀升对港口物流及相关业务提出了新的发展要求。物联网技术在数据自动采集和位置全面感知方面有着天然的优势,云计算平台能够提供强大的资源利用与数据存储处理能力,SOA架构则可实现灵活的服务组合和系统构建。这3种技... 世界贸易量的不断攀升对港口物流及相关业务提出了新的发展要求。物联网技术在数据自动采集和位置全面感知方面有着天然的优势,云计算平台能够提供强大的资源利用与数据存储处理能力,SOA架构则可实现灵活的服务组合和系统构建。这3种技术在港口物流及相关业务中的综合应用能够满足港口物流在用户数量、用户需求、业务范围、业务复杂度方面不断扩大的需求,推动其从信息平台向服务平台升级。针对当前物流信息平台存在的不足,提出构建港口物流综合服务平台的完整架构,阐述了架构各层的组成及功能目标,详细研究了物联网技术、云计算技术和SOA架构在平台各层构建中发挥的作用。 展开更多
关键词 港口物 面向服务的体系结构 计算 物联网
在线阅读 下载PDF
基于U/S/W体系结构的快速响应CAE技术 被引量:4
10
作者 吴淑芳 王宗彦 +2 位作者 黄飞 王乔 秦慧斌 《计算机集成制造系统》 EI CSCD 北大核心 2014年第2期343-350,共8页
为更好地解决中小企业快速响应市场需求和客户要求的问题,针对产品快速响应设计的特点,提出快速响应CAE分析方法。在该方法中,构建了多客户机、双服务器、多工作站的网络体系结构;研究了产品概念设计阶段CAE分析技术,将产品CAE分析过程... 为更好地解决中小企业快速响应市场需求和客户要求的问题,针对产品快速响应设计的特点,提出快速响应CAE分析方法。在该方法中,构建了多客户机、双服务器、多工作站的网络体系结构;研究了产品概念设计阶段CAE分析技术,将产品CAE分析过程划分为产品研发的CAE分析和产品定制的CAE分析两个过程;在此基础上,研究了基于多客户机、双服务器、多工作站体系结构的快速响应CAE分析与系统建立方法。以桥式起重机为对象进行了实例验证,结果表明,该技术实现了快速响应CAE分析和分析驱动设计,使企业资源得到了合理利用。 展开更多
关键词 体系结构 快速响应 计算机辅助工程 分析驱动设计 有限元分析 特征模型
在线阅读 下载PDF
数据驱动并行计算的3层软件架构设计及应用 被引量:3
11
作者 张爱清 莫则尧 杨章 《计算机研究与发展》 EI CSCD 北大核心 2014年第11期2538-2546,共9页
数据驱动并行计算是科学与工程计算中普遍存在的一类计算,其执行通常依赖于数据流有向图.在实际应用中,结点调度、数据通信和数值计算紧耦合并发执行,较难解耦编程,这给应用软件的协同研制和代码复用带来困难.借助于统一形式的数据流有... 数据驱动并行计算是科学与工程计算中普遍存在的一类计算,其执行通常依赖于数据流有向图.在实际应用中,结点调度、数据通信和数值计算紧耦合并发执行,较难解耦编程,这给应用软件的协同研制和代码复用带来困难.借助于统一形式的数据流有向图并行算法框架,分无环有向图调度、无环有向图建模和数值计算3个层次,设计了软件体系结构,实现于并行自适应结构网格应用支撑软件(J parallel adaptive structured mesh applications infrastructure,JASMIN)框架的通量扫描积分构件中,有力地支持了结点调度、数据通信和数值计算的解耦编程.研究成果成功应用于科学计算中典型的中子输运计算,典型的代码开销测试和2 048个处理器核的并行性能测试表明,软件架构及其构件化实现是有效的. 展开更多
关键词 数据驱动 并行计算 无环有向图 JASMIN框架 软件体系结构 解耦
在线阅读 下载PDF
基于算粒感知的可重构体系结构 被引量:3
12
作者 沈来信 王伟 《计算机工程》 CAS CSCD 2013年第9期114-118,共5页
高性能计算要解决的应用任务复杂多样,不同的应用任务具有不同的计算特征,在不同体系结构下计算效率差异巨大。为此,通过感知应用任务的计算-存储-通信(PMC)的资源需求,得到其PMC算粒,分配与其匹配的体系结构,使用超图描述应用任务程序... 高性能计算要解决的应用任务复杂多样,不同的应用任务具有不同的计算特征,在不同体系结构下计算效率差异巨大。为此,通过感知应用任务的计算-存储-通信(PMC)的资源需求,得到其PMC算粒,分配与其匹配的体系结构,使用超图描述应用任务程序结构和体系结构,利用超图同构原理构造超混合异构体系结构模型。实验结果表明,在应用任务的算粒感知驱动下,可重构体系结构模型具有计算效率高和能耗低的特点。 展开更多
关键词 高性能计算 体系结构 感知 计算-存储-通信算粒 超图 算粒驱动
在线阅读 下载PDF
支持MDD的体系结构模型的形式化语义 被引量:1
13
作者 侯金奎 马军 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第6期109-113,119,共6页
为解决模型驱动开发中模型映射关系的定义和模型转换的正确性验证等方面存在的问题,利用范畴理论形式化描述软件体系结构模型及其间的关系,使之具有严格的语义。态射合成被用来追踪构件模型之间的关联和映射关系,不同抽象层次的体系结... 为解决模型驱动开发中模型映射关系的定义和模型转换的正确性验证等方面存在的问题,利用范畴理论形式化描述软件体系结构模型及其间的关系,使之具有严格的语义。态射合成被用来追踪构件模型之间的关联和映射关系,不同抽象层次的体系结构模型之间的一致性由函子来维持。范畴理论支持图形化建模,可以使模型中的构件关系以及结构特征可视化,有利于对模型转换的理解和追踪。应用研究表明,该方法不仅可为验证模型之间映射规则的正确性提供依据,还能为模型转换的具体实现提供理论指导。 展开更多
关键词 计算机软件 模型驱动开发 模型映射 软件体系结构 形式化语义
在线阅读 下载PDF
自动网格体系在柱体绕流大涡模拟中的适用性评估 被引量:5
14
作者 张宇鑫 曹曙阳 操金鑫 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第4期542-550,共9页
为了评估基于snappyHexMesh方法生成的自动网格体系在二维柱体绕流大涡模拟中的适用性,比较了该自动网格体系与人工网格体系对于Re为3900圆柱绕流和Re为22000方柱绕流的数值模拟结果。通过设置合理的计算域以及数值格式,采用snappyHexM... 为了评估基于snappyHexMesh方法生成的自动网格体系在二维柱体绕流大涡模拟中的适用性,比较了该自动网格体系与人工网格体系对于Re为3900圆柱绕流和Re为22000方柱绕流的数值模拟结果。通过设置合理的计算域以及数值格式,采用snappyHexMesh自动网格以及人工网格的算例都表现出良好的数值稳定性。将不同网格体系的数值模拟结果与物理试验结果进行对比,结果表明,采用snappyHexMesh网格可以提高数值求解效率;圆柱绕流对网格体系的变化比较敏感,不同密度的snappyHexMesh网格会显著影响圆柱气动力特征以及尾流区域的流场结果;snappyHexMesh网格体系可以准确预测方柱绕流,在方柱绕流大涡模拟中具有相较于圆柱绕流更好的适用性。 展开更多
关键词 计算体力学 自动网格体系 柱体绕 大涡模拟 气动力特征 结构
在线阅读 下载PDF
计算社会科学发展演变及学科框架与学科结构 被引量:2
15
作者 俞立平 冉嘉睿 +1 位作者 罗宇舟 买买提依明·祖农 《重庆大学学报(社会科学版)》 CSSCI 北大核心 2023年第2期124-139,共16页
数据驱动为计算社会科学在社会科学研究的兴起与发展提供了极大施展空间,提升了社会科学研究的深度与广度,有效契合科学研究的复杂性需求。探究计算社会科学发展演变、学科框架与学科结构的界定对于计算社会科学的发展具有重要意义。本... 数据驱动为计算社会科学在社会科学研究的兴起与发展提供了极大施展空间,提升了社会科学研究的深度与广度,有效契合科学研究的复杂性需求。探究计算社会科学发展演变、学科框架与学科结构的界定对于计算社会科学的发展具有重要意义。本文通过收集、整理计算社会科学领域国内外文献,厘清计算社会科学的概念,进而梳理计算社会科学的学科演进趋势、研究范式、研究方法及研究应用;并从数字人文的学科结构入手,分析教育部学科门类分类体系,在此基础上对计算社会科学的学科界定、学科结构进行研究,进一步分析其与方法、技术类学科的关系,进而从学科角度思考计算社会科学的学科框架与学科结构。研究结论:第一,计算社会科学国外论文数量领先于国内论文数量,我国计算社会科学研究尚处于起步阶段。第二,计算社会科学国内外研究侧重点不同。国内计算社会科学研究聚焦于人工智能、复杂系统、传播理论等新兴主题,更加重视数据驱动过程中数据质量的分析,强调通过建模仿真、社会网络分析、数据挖掘等方法论的使用。而国外计算社会科学以数据科学为核心,聚焦于社交媒体、社会网络与复杂系统,强调通过社会网络分析、基于Agent建模、机器学习、自然语言处理等方法使用。第三,计算社会科学是传统社会科学学科下二级学科的集合,不能将其设为一级学科,要严格区分数字人文与计算社会科学。第四,计算社会科学研究领域有一定限制,高度也存在一定不足。第五,方法与技术类学科是计算社会科学的重要支撑,但作为社会科学方法与技术的学科不宜设立计算社会科学二级学科,如管理科学与工程、信息资源管理。 展开更多
关键词 计算社会科学 学科框架 学科体系 学科结构 大数据 社会科学 数据驱动
在线阅读 下载PDF
处理器互联体系结构的一些特点分析 被引量:1
16
作者 王恩东 秦济龙 《科学技术与工程》 2011年第30期7419-7424,共6页
介绍目前计算机工业界最新的处理器互联总线的最新进展。以QuickPath为例简要地叙述其现有的研究应用状况和介绍QuickPath体系结构的特点,及其这种新总线接口将给未来服务器体系结构带来影响的一些推测;并介绍在高端容错大型计算机高可... 介绍目前计算机工业界最新的处理器互联总线的最新进展。以QuickPath为例简要地叙述其现有的研究应用状况和介绍QuickPath体系结构的特点,及其这种新总线接口将给未来服务器体系结构带来影响的一些推测;并介绍在高端容错大型计算机高可靠性及可重构架构系统设计中的一些相关考虑。 展开更多
关键词 高性能计算 处理器互联 片外 可重配置 QuickPath Hyper-Transport 多处理器 计算体系结构 可靠性 SERDES
在线阅读 下载PDF
水压缸活塞环密封流动阻力研究 被引量:8
17
作者 秦本科 薄涵亮 郑文祥 《原子能科学技术》 EI CAS CSCD 北大核心 2005年第3期236-239,共4页
根据控制棒水压驱动机构水压缸活塞环密封结构的特点,分析了水压缸活塞环的泄漏途径,建立了活塞环密封泄漏流阻的理论计算模型,并结合水压缸活塞环密封处的压差计算模型,推导出水压缸密封结构的流阻计算公式。利用控制棒水压驱动机构单... 根据控制棒水压驱动机构水压缸活塞环密封结构的特点,分析了水压缸活塞环的泄漏途径,建立了活塞环密封泄漏流阻的理论计算模型,并结合水压缸活塞环密封处的压差计算模型,推导出水压缸密封结构的流阻计算公式。利用控制棒水压驱动机构单缸性能实验的结果,拟合求得了流阻公式中的系数,并将公式计算流阻与实验结果进行了对比。结果表明:在实验工况下,二者吻合得很好。研究结果为控制棒水压驱动机构水压缸活塞环密封结构的设计和分析提供了理论基础。 展开更多
关键词 活塞环 压缸 动阻力 密封结构 驱动机构 理论计算模型 控制棒 密封泄漏 计算公式 性能实验 公式计算 理论基础 研究结果 水压 结合水
在线阅读 下载PDF
面向实时流处理的多核多线程处理器访存队列 被引量:3
18
作者 田杭沛 高德远 +1 位作者 樊晓桠 朱怡安 《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1634-1641,共8页
针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策... 针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策略减少访存延迟.实验证明,该访存队列可控制最大访存延迟,与顺序访存相比,存储器具备更高的带宽,与传统的乱序访存相比较,可以充分满足计算的实时性需求,而存储器有效带宽基本不受影响,解决了多核多线程处理器承担实时流计算的基础难题. 展开更多
关键词 计算体系结构 实时处理 多核多线程处理器 访存队列 窗口优化
在线阅读 下载PDF
高带宽远程内存结构中的预取研究 被引量:2
19
作者 许建卫 陈明宇 包云岗 《计算机科学》 CSCD 北大核心 2005年第8期15-20,共6页
高速电路和光互联技术的发展极大地提高了网络的速度与带宽。因而,突破高性能计算机 CPU与内存紧耦合的传统结构成为可能,CPU与内存的耦合不再受距离的限制,这必将引起体系结构的变革。文[1]提出 DSAG结构——CPU与内存在空间上分离,每... 高速电路和光互联技术的发展极大地提高了网络的速度与带宽。因而,突破高性能计算机 CPU与内存紧耦合的传统结构成为可能,CPU与内存的耦合不再受距离的限制,这必将引起体系结构的变革。文[1]提出 DSAG结构——CPU与内存在空间上分离,每个CPU节点上仅留少量内存,将海量内存放在远程统一管理作为内存服务器,CPU节点和内存服务器之间通过高速网络互连。这种新的体系结构带来了更好的共享性和可扩展性,但同时也对我们解决CPU和内存之间的不平衡性问题带来了挑战。为了降低DSAG这种远程内存结构增加的访存时延,我们考虑到CPU正常访存没有充分利用网络的高带宽,因此可以利用剩余的网络带宽来进行远程内存数据的预取。本论文在应用程序执行时记录本地(相对于远程内存)不命中的地址信息,以页对齐分析其中存在的页框流(Page Frame Stream)的统计特征,并提出可基于页框流的预取机制可降低访存延迟、提升系统性能的观点。最后我们采用模拟的方法验证了观点的可行性与正确性,进一步提出了三种预取策略,比较并分析影响预取效果的因素。 展开更多
关键词 DSAG结构 页框 内存结构 预取策略 高带宽 远程 高性能计算 网络互连 高速电路 体系结构
在线阅读 下载PDF
梅森素数并行求解算法的流式实现 被引量:1
20
作者 伍楠 吴伟 +3 位作者 文梅 杨乾明 柴俊 张春元 《计算机工程与科学》 CSCD 2007年第11期53-55,59,共4页
本文以数论中的Lucas-Lehmer检验法为基础,提出了梅森素数并行求解算法在FT64流处理器上的流式实现,并通过重设流记录的大小对程序进行了优化。评测数据表明,在FT64上运行该应用的时间平均比1.5GHz Itanium2快2.5倍。本文为梅森素数求... 本文以数论中的Lucas-Lehmer检验法为基础,提出了梅森素数并行求解算法在FT64流处理器上的流式实现,并通过重设流记录的大小对程序进行了优化。评测数据表明,在FT64上运行该应用的时间平均比1.5GHz Itanium2快2.5倍。本文为梅森素数求解问题寻找了一条可行的加速方法,同时证实了流体系结构在高性能计算领域的极大潜力。本文提出的流式算法以及各种优化手段,对于其他科学计算领域中的计算密集型问题在流体系结构上的映射有极大的借鉴意义。 展开更多
关键词 体系结构 Lucas-Lehmer检验法 梅森素数 高性能计算 处理器
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部