期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
DNA序列拼接的分布式并行处理 被引量:3
1
作者 方小永 骆志刚 《计算机工程与科学》 CSCD 2005年第2期71-73,77,共4页
针对分布式存储环境,本文提出一种DNA序列拼接的并行算法,分别对序列拼接中OVERLAP、LAYOUT 和CONSENSUS阶段的串行处理过程和并行算法进行了描述,并给出了算法复杂性分析。数值试验结果表明,算法是高 效的。
关键词 生物信息学 基因组计划 DNA序列 分布式并行处理
在线阅读 下载PDF
基于高速网络的广域高性能并行与分布式计算 被引量:6
2
作者 卢锡城 肖侬 刘波 《计算机工程与科学》 CSCD 1998年第3期1-5,共5页
本文试图说明以下观点:越来越多的高性能应用要求利用地理上分布的、各式各样的计算和数据资源。这些应用希望能够通过高速网络将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等连接并集... 本文试图说明以下观点:越来越多的高性能应用要求利用地理上分布的、各式各样的计算和数据资源。这些应用希望能够通过高速网络将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等连接并集成起来,形成一个网络虚拟计算机(称为元计算机),来实现应用计算问题。这种元计算实质上就是基于高速网络的广域高性能并行与分布式计算。 展开更多
关键词 广域 元计算 计算机网络 并行计算 分布式计算
在线阅读 下载PDF
多核数字信号处理器并行矩阵转置算法优化 被引量:6
3
作者 裴向东 王庆林 +4 位作者 廖林玉 李荣春 梅松竹 刘杰 庞征斌 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期57-66,共10页
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强... 矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 展开更多
关键词 多核DSP 矩阵转置 并行算法 算法优化
在线阅读 下载PDF
一种利用并行复算实现的OpenMP容错机制 被引量:7
4
作者 富弘毅 丁滟 +1 位作者 宋伟 杨学军 《软件学报》 EI CSCD 北大核心 2012年第2期411-427,共17页
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决... 基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性. 展开更多
关键词 容错 OPENMP 并行复算 数据流分析
在线阅读 下载PDF
异构并行系统能耗优化分析模型 被引量:4
5
作者 王桂彬 杨学军 +1 位作者 唐滔 徐新海 《软件学报》 EI CSCD 北大核心 2012年第6期1382-1396,共15页
随着处理器功耗不断增大,功耗问题逐渐成为高性能计算机系统设计与实现的首要问题.当前,异构系统已成为高性能计算机的发展趋势之一.与传统同构体系结构相比,异构体系结构具有更高的理论峰值性能和能效,但是如何在满足应用性能的条件下... 随着处理器功耗不断增大,功耗问题逐渐成为高性能计算机系统设计与实现的首要问题.当前,异构系统已成为高性能计算机的发展趋势之一.与传统同构体系结构相比,异构体系结构具有更高的理论峰值性能和能效,但是如何在满足应用性能的条件下充分发掘异构系统的能效优势,仍是一个挑战性问题.通过将应用程序抽象为由串行段和并行段组成的一般程序模型,建立了异构并行系统能耗优化模型.通过分析方法依次给出并行段以及全程序(多程序段)能耗最优时处理器间满足的关系,分别给出了时间约束下能耗最优的处理器频率选择算法.最后,以CPU-GPU异构系统为平台,通过8个典型应用程序验证了方法的有效性. 展开更多
关键词 异构系统 低功耗优化 任务调度 动态电压/频率调节
在线阅读 下载PDF
分布交互式仿真计算机系统的研究与实现 被引量:6
6
作者 凌云翔 刘晓建 +1 位作者 王召福 金士尧 《计算机工程与科学》 CSCD 1999年第1期14-18,共5页
本文结合国内外仿真系统的研制情况,对适应现代仿真需求的仿真平台的课题进行了需求分析,并介绍了基于HLA/RTI的分布交互仿真计算机系统YH-NI/NR的体系结构、底层通信网络、运行支持系统。
关键词 仿真计算机 体系结构 HLA 仿真系统
在线阅读 下载PDF
云计算环境下的容错并行Skyline查询算法研究 被引量:4
7
作者 王媛 王意洁 +1 位作者 邓瑞鹏 裴晓强 《计算机科学与探索》 CSCD 2011年第9期804-814,共11页
云计算为分布并行Skyline查询提供强大存储能力和计算能力的同时,其大规模数据中心固有的故障频发特性给可靠Skyline查询处理带来极大挑战。现有研究致力于提高Skyline算法的响应时间、渐进性、负载均衡等各项性能,不能保证故障情况下... 云计算为分布并行Skyline查询提供强大存储能力和计算能力的同时,其大规模数据中心固有的故障频发特性给可靠Skyline查询处理带来极大挑战。现有研究致力于提高Skyline算法的响应时间、渐进性、负载均衡等各项性能,不能保证故障情况下查询继续正确执行。为此,提出一种容错并行Skyline查询算法(fault-tolerant parallel Skyline,FTPS)。该算法通过故障监测和任务迁移,使得能够在查询过程中及时发现故障,并将故障节点的计算任务迁移到副本节点,保证查询的正确执行。理论分析和实验证明,FTPS算法能够在不影响正常Skyline查询处理性能的情况下获取较好的容错处理性能。 展开更多
关键词 SKYLINE查询 分布并行计算 云计算 数据中心 容错
在线阅读 下载PDF
单芯片多处理器的性能优势 被引量:11
8
作者 黄光奇 周兴铭 《计算机工程与科学》 CSCD 2001年第1期35-38,64,共5页
本文以一个面积为 30 0 mm2左右的芯片设计为目标 ,描述了三种不同的芯片结构 :一种超标量结构 ,两种单芯片多处理器结构。模拟结果表明 ,由于超标量技术本身的局限性 ,单芯片多处理器结构相对于超标量结构具有明显的性能优势 ,对并行... 本文以一个面积为 30 0 mm2左右的芯片设计为目标 ,描述了三种不同的芯片结构 :一种超标量结构 ,两种单芯片多处理器结构。模拟结果表明 ,由于超标量技术本身的局限性 ,单芯片多处理器结构相对于超标量结构具有明显的性能优势 ,对并行性的开发更加有效。 展开更多
关键词 单芯片多处理器 超标量 执行时间 集成电路 微处理器
在线阅读 下载PDF
分布式系统的可信性研究 被引量:5
9
作者 胡华平 金士尧 王召福 《计算机工程与科学》 CSCD 1998年第1期48-53,共6页
本文首先介绍了构造高可信性计算机系统的技术与方法,然后对分布式系统(含分布式实时系统)的可信性研究现状与存在的问题进行了综述。针对存在的问题,给出了作者在该方面已开发的研究工作及成果,并对今后的研究工作进行了展望。
关键词 分布式系统 可信性 容错 分布式计算机
在线阅读 下载PDF
多核数字信号处理器矩阵乘卷积算法性能评测 被引量:2
10
作者 王庆林 裴向东 +4 位作者 廖林玉 王浩旭 李荣春 梅松竹 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期86-94,共9页
矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提... 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv。该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能。实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速。 展开更多
关键词 多核数字信号处理器 卷积神经网络 卷积算法 算法优化
在线阅读 下载PDF
并行计算系统度量指标综述 被引量:8
11
作者 王之元 杨学军 《计算机工程与科学》 CSCD 北大核心 2010年第10期44-48,共5页
系统度量指标的研究一直是并行系统和应用设计的重要问题。本文首先通过对国内外并行计算系统度量指标的分析,将当前并行计算系统度量指标分为单一的计算性能度量指标和多要素综合的高效能度量指标两种。其次,总结了这些度量指标的研究... 系统度量指标的研究一直是并行系统和应用设计的重要问题。本文首先通过对国内外并行计算系统度量指标的分析,将当前并行计算系统度量指标分为单一的计算性能度量指标和多要素综合的高效能度量指标两种。其次,总结了这些度量指标的研究现状,并指出这些度量指标研究中存在的一些问题以及需要考虑的难点。由于并行计算系统正在逐渐从"高性能"走向"高效能",本文主要考虑当前大规模并行计算系统的可靠性和能耗要素对系统的影响,从系统可扩展角度建立了可靠并行加速比和能耗并行加速比模型,并进一步扩展为度量并行计算系统效能的综合指标模型。最后指出了未来并行计算系统度量的研究方向。 展开更多
关键词 并行计算系统 度量指标 系统评价
在线阅读 下载PDF
大规模并行计算机系统性能测评体系 被引量:2
12
作者 刘杰 迟利华 +3 位作者 蒋杰 徐涵 晏益慧 胡庆丰 《计算机工程与科学》 CSCD 北大核心 2013年第3期25-30,共6页
复杂的大规模并行计算机系统需要能客观反映系统性能的测评方法,单个指标难以全面评价系统的性能特点。从用户需求出发,给出了大规模并行计算机系统用户适用性概念,利用适用性概念,建立了大规模系统性能测评体系,包括总体适用性、分项... 复杂的大规模并行计算机系统需要能客观反映系统性能的测评方法,单个指标难以全面评价系统的性能特点。从用户需求出发,给出了大规模并行计算机系统用户适用性概念,利用适用性概念,建立了大规模系统性能测评体系,包括总体适用性、分项适用性、适用性概念、准则和Benchmark程序。整个测评体系尽量消除主观因素,做到客观定量,利用测评体系,借助性能分析数据获取工具,在得到量化的分项适用性的基础上,通过权重公式可以求出总体适用性,根据总体适用性的大小来判断不同大规模计算机系统是否满足用户的需求。 展开更多
关键词 性能测评 大规模并行计算机系统 用户适用性
在线阅读 下载PDF
大规模并行计算机系统硬件故障容错技术综述 被引量:6
13
作者 富弘毅 杨学军 《计算机工程与科学》 CSCD 北大核心 2010年第10期38-43,53,共7页
计算机系统的容错是一个不容忽视的问题。近年来,随着系统结构的复杂性增加,半导体制造工艺的发展,线宽的降低以及集成度的提高,从用户桌面系统到分布式计算环境,乃至大规模并行计算机系统,功耗和可靠性问题都很突出。本文首先介绍了计... 计算机系统的容错是一个不容忽视的问题。近年来,随着系统结构的复杂性增加,半导体制造工艺的发展,线宽的降低以及集成度的提高,从用户桌面系统到分布式计算环境,乃至大规模并行计算机系统,功耗和可靠性问题都很突出。本文首先介绍了计算机系统可靠性和容错技术的基本概念、基本方法和基本思想,然后回顾了近些年来一些具有代表性的硬件故障检测技术和硬件故障恢复技术,其中重点介绍了针对大规模并行计算机系统提出的容错方法。本文还介绍了我们在先前的研究工作中提出的一种优化的故障恢复技术,称为容错并行算法。最后,总结了一些可能的研究方向。 展开更多
关键词 大规模并行计算 容错技术 可靠性
在线阅读 下载PDF
多核处理器Cache一致性协议关键技术研究 被引量:5
14
作者 黄安文 张民选 《计算机工程与科学》 CSCD 北大核心 2009年第A01期104-108,共5页
多核处理器规模的不断扩大和核间通信机制的日益复杂,使得Cache一致性维护变得更加困难。本文从多核处理器Cache一致性问题的产生背景出发,分析监听协议、目录协议、Token协议和Hammer协议的实现机制以及在多核环境中的优缺点,分别从一... 多核处理器规模的不断扩大和核间通信机制的日益复杂,使得Cache一致性维护变得更加困难。本文从多核处理器Cache一致性问题的产生背景出发,分析监听协议、目录协议、Token协议和Hammer协议的实现机制以及在多核环境中的优缺点,分别从一致性协议与片上互连结构协同设计、面向低功耗应用的协议优化策略、Cache一致性协议验证及容错机制等角度考虑,对未来多核处理器Cache一致性协议设计的发展趋势和技术挑战进行详细分析与讨论。 展开更多
关键词 CACHE一致性 片上互连 低功耗 验证 容错
在线阅读 下载PDF
能耗并行加速比:高性能计算系统综合性能的有效度量 被引量:2
15
作者 王之元 胡庆丰 陈娟 《计算机工程与科学》 CSCD 北大核心 2009年第11期113-116,共4页
随着并行系统规模的扩大,高性能计算系统运行时消耗的能耗也在急剧增长,过高的能耗也给系统的可靠性、稳定性等方面带来严峻挑战。在这种情形下,能耗问题受到了前所未有的关注。因此,设计和研究高性能计算系统,需要在考虑高计算性能的... 随着并行系统规模的扩大,高性能计算系统运行时消耗的能耗也在急剧增长,过高的能耗也给系统的可靠性、稳定性等方面带来严峻挑战。在这种情形下,能耗问题受到了前所未有的关注。因此,设计和研究高性能计算系统,需要在考虑高计算性能的同时兼顾系统低能耗的要求,这为高性能计算系统的度量模型提出了新的挑战。于是,大规模并行系统逐渐从"高性能"走向"高效能"的衡量标准。基于此,本文采用加速比度量指标,从系统可扩展角度将计算性能和能量消耗要素进行综合,提出了一种度量高性能计算系统综合性能的能耗并行加速比模型。该模型能够直观地反映并行计算系统的效能,旨在指导系统设计和应用研究。最后,通过对该模型的分析和模拟,验证了模型的有效性。 展开更多
关键词 能耗并行加速比 高效能 度量模型
在线阅读 下载PDF
SMA:一种新的多线程处理器模型 被引量:2
16
作者 肖刚 徐明 周兴铭 《计算机工程与科学》 CSCD 1999年第4期7-12,共6页
本文提出了一种新的多线程处理器模型,它结合了前瞻性执行机制和多线程执行机制,既能从更大的指令窗口中开发出更多的ILP,又能屏蔽各种长延迟操作,达到较高的资源利用率。本文深入讨论了SMA模型及其特点,并进行了初步的性能... 本文提出了一种新的多线程处理器模型,它结合了前瞻性执行机制和多线程执行机制,既能从更大的指令窗口中开发出更多的ILP,又能屏蔽各种长延迟操作,达到较高的资源利用率。本文深入讨论了SMA模型及其特点,并进行了初步的性能分析。 展开更多
关键词 前瞻性执行 多线程 体系结构 处理器
在线阅读 下载PDF
主从式单边异构多核处理器编程模型和编译架构 被引量:2
17
作者 李春江 杨学军 《计算机工程与科学》 CSCD 北大核心 2009年第8期66-68,共3页
主从式单边异构体系结构的异构多核处理器广泛应用于面向专门应用领域的计算加速,如异构多核嵌入式处理器、DSP、SoC等;高性能的该类处理器也可用于一些大规模科学和工程计算问题的处理。主从式单边异构处理器对编程模型和编译技术提出... 主从式单边异构体系结构的异构多核处理器广泛应用于面向专门应用领域的计算加速,如异构多核嵌入式处理器、DSP、SoC等;高性能的该类处理器也可用于一些大规模科学和工程计算问题的处理。主从式单边异构处理器对编程模型和编译技术提出了很多挑战性问题,如编程模型的选择、编程语言的设计、编译器架构设计以及运行库的设计等。本文分析了这一类处理器结构特点和执行模型,认为功能卸载模型是最适用于这一体系结构的编程模型;并分析了面向功能卸载模型的编程语言设计关键问题,提出了编译系统的架构,讨论了相应的运行库设计问题。 展开更多
关键词 主从式单边异构 多核 编程模型 编译架构
在线阅读 下载PDF
一种面向分布式系统的程序设计模式 被引量:1
18
作者 李慧霸 彭宇行 卢锡城 《计算机工程与科学》 CSCD 2008年第12期142-145,共4页
分布式系统的程序设计模式主要包括多线程模式和事件驱动模式,其中事件驱动模式占据了主导地位。本文讨论了这两种模式的不足,以及Coroutine模式相对它们的优点,并认为Coroutine模式是最适合分布式系统的程序设计模式。本文在此基础上... 分布式系统的程序设计模式主要包括多线程模式和事件驱动模式,其中事件驱动模式占据了主导地位。本文讨论了这两种模式的不足,以及Coroutine模式相对它们的优点,并认为Coroutine模式是最适合分布式系统的程序设计模式。本文在此基础上提出了Libresync,它是一个基于Coroutine模式的分布式系统基础支持库。它既能给应用开发带来非常清晰的控制流程,又具有很高的灵活性和表达力,性能也能满足大多数需求。 展开更多
关键词 分布式系统 并发 多线程 事件驱动 Coroutine
在线阅读 下载PDF
并行计算的运行支撑系统技术的研究 被引量:1
19
作者 肖侬 卢宇彤 卢锡城 《计算机工程与科学》 CSCD 2000年第1期96-99,共4页
本文介绍了并行计算的运行支撑系统技术的研究 。
关键词 并行计算 运行支撑系统 并行计算机 并行处理
在线阅读 下载PDF
并行计算时间模型研究 被引量:1
20
作者 李晓梅 莫则尧 乔香珍 《计算机工程与科学》 CSCD 1998年第3期18-27,共10页
本文系统地总结和探讨了共享和分布式存储环境下的并行计算时间模型。微观上,结合并行机结构特征和通信机制,揭示了延长算法运行时间的关键因素,并据此提出一些优化原则和效率评价准则,能辅助用户修改并行算法达到最优性能;宏观上... 本文系统地总结和探讨了共享和分布式存储环境下的并行计算时间模型。微观上,结合并行机结构特征和通信机制,揭示了延长算法运行时间的关键因素,并据此提出一些优化原则和效率评价准则,能辅助用户修改并行算法达到最优性能;宏观上,给出了基本消息传递的常用通信原语类型和部分原语操作时间经验公式,能辅助用户选择最优通信原语和问题粒度,正确预测程序的运行时间和性能。 展开更多
关键词 并行计算 时间模型 算法 并行计算机
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部