期刊文献+
共找到1,526篇文章
< 1 2 77 >
每页显示 20 50 100
面向迈创3000异构处理器的多头注意力机制多重并行优化
1
作者 路瑶 栾钟治 +4 位作者 李根 齐家兴 韩斌 杨海龙 钱德沛 《计算机学报》 北大核心 2025年第9期2049-2063,共15页
针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令... 针对迈创3000(MT-3000)异构多核处理器在带宽不足场景下多头注意力(Multi-Head Attention,MHA)计算效率低的问题,本文提出了一套涵盖算子优化、访存优化与调度优化的综合方案,以加速PyTorch框架中的MHA推理。通过融合MT-3000的VLIW指令集、片上存储层次和DMA传输特性,设计了三方面的优化策略:在算子方面,对Linear和Softmax等算子进行内核级优化与算子融合,减少计算与访存开销;在访存方面,利用广播机制与全局共享内存(GSM)优化数据流,降低主存带宽依赖;在调度方面,以行为粒度分块并行,隐藏数据传输延迟。实验表明,优化后的Linear算子单簇峰值性能达1.53 TFLOPS,占理论峰值的37.7%,较NVIDIA V100 GPU加速比最高达5.34倍;在典型大语言模型配置下(嵌入维度4096/8192,头数32/64),MHA机制相较NVIDIA V100 GPU实现最高23.53倍加速,且在单节点多簇环境中扩展性良好。本研究为MT-3000在长序列推理任务中的高效部署提供了解决方案,并为天河超算支持大语言模型等复杂AI任务奠定了技术基础。 展开更多
关键词 MT-3000 多头注意力 性能优化 PyTorch 加速比
在线阅读 下载PDF
基于图强化学习的多边缘协同负载均衡方法
2
作者 郑龙海 肖博怀 +2 位作者 姚泽玮 陈星 莫毓昌 《计算机科学》 北大核心 2025年第3期338-348,共11页
在移动边缘计算中,设备通过将计算密集型任务卸载到附近边缘服务器,可以有效减少应用程序的延迟和能耗。为了提高服务质量,边缘服务器之间需要协作而非单独工作。针对多边缘协作的负载均衡问题,现有的策略往往依赖于精确的数学模型或缺... 在移动边缘计算中,设备通过将计算密集型任务卸载到附近边缘服务器,可以有效减少应用程序的延迟和能耗。为了提高服务质量,边缘服务器之间需要协作而非单独工作。针对多边缘协作的负载均衡问题,现有的策略往往依赖于精确的数学模型或缺乏对边缘拓扑关系的利用。为了解决此问题,文中提出了一种基于图强化学习的卸载决策方法。首先将多边缘协作的负载均衡场景抽象为图数据;然后采用基于图卷积神经网络的图嵌入过程来提取图的信息特征,以辅助深度Q网络进行卸载决策;最后通过集中反馈控制机制找到目标负载均衡方案。在多个场景下进行仿真实验,实验结果验证了所提方法在缩短任务平均响应时延方面的有效性,并且可以在短时间内获得优于对比算法且接近理想方案的负载均衡效果。 展开更多
关键词 多边缘协作 负载均衡 任务卸载 图神经网络 深度强化学习
在线阅读 下载PDF
一种带缓冲区的分布式流式图划分算法
3
作者 史惠康 王泽胜 +2 位作者 胡克坤 董刚 赵有健 《计算机研究与发展》 北大核心 2025年第7期1805-1815,共11页
图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法... 图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法采用多加载器-多划分器架构,多个加载器并行读取图数据,提高图数据加载效率;每个划分器维护一个缓冲区,缓存相应加载器发来的图顶点,并按顶点度数高低排序,为划分器提供更多决策依据.划分器预置有4条流式启发式规则,围绕不同目标,对缓冲区中的顶点实施并行划分,并借助重流机制微调划分结果,改进划分质量.分布式系统环境下的划分质量与性能实验表明:提出算法的划分质量(割边比)比当前最好的在线划分算法改善超过18.8个百分点,并将图数据加载时间在划分总时间的占比,从单划分器-单加载器架构流式划分算法的平均30.8%缩减至平均20.1%. 展开更多
关键词 大图 流式划分 分布式 缓冲 重流
在线阅读 下载PDF
一种集成于超算作业调度系统应用的并行参数优化方法
4
作者 张文帅 李会民 +1 位作者 李京 潘必才 《计算机工程》 北大核心 2025年第7期59-67,共9页
随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率... 随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率影响很大。随着计算规模与复杂度的提升,多个并行参数的可配置空间越来越大,用户越来越难以确定最佳的并行参数值。这类运行时优化问题在科学计算应用中较为普遍,但相关的研究与解决方法比较少见。以VASP(Vienna Ab initio Simulation Package)应用为例,首先分析了该应用的多层并行结构,展示了不同并行参数配置引发的巨大运行速度差异。然后提出了一个基于约化并行效率指标的全自动运行优化方法,其不仅可以帮助用户简单快捷地确定最佳应用并行参数,而且可以帮助用户确定最佳的计算资源使用量,使应用可以高效率地扩展到大规模的并行计算中。最后将该优化方法与计算集群作业调度系统相融合应用于用户提交的真实VASP计算作业。统计结果表明,该方法显著提升了作业运行速度与超算资源的使用效率,具有很好的工程应用前景。 展开更多
关键词 并行计算 作业调度 运行时优化 超级计算 VASP应用
在线阅读 下载PDF
DSP处理器二级缓存的结构优化研究 被引量:1
5
作者 安昕辰 《计算机工程与科学》 北大核心 2025年第1期10-17,共8页
近年来自动驾驶、医用仪器、智能家居等领域涌现出的新应用对DSP处理器的实时性和数据吞吐能力提出了更高的要求。多级缓存结构在DSP中的使用引入了因缓存缺失和一致性维护等过程带来的延迟不确定性。针对长延时访问导致的性能下降问题... 近年来自动驾驶、医用仪器、智能家居等领域涌现出的新应用对DSP处理器的实时性和数据吞吐能力提出了更高的要求。多级缓存结构在DSP中的使用引入了因缓存缺失和一致性维护等过程带来的延迟不确定性。针对长延时访问导致的性能下降问题,提出将缺失缓冲区和逐出缓冲区合并,在运行时灵活分配缓冲条目的功能,以提高缓冲区利用率。针对L1 Cache、L2 Cache间一致性维护信息同步效率低的问题,提出利用无效化地址的连续性,将无效化信息非阻塞地同步到监听过滤器。测试结果表明,生产者-消费者场景下包含大量脏数据更新的程序性能提高了19.91%,32行无效化信息的同步时间从61个时钟周期降低到16个时钟周期。 展开更多
关键词 DSP 二级缓存 流水线 一致性
在线阅读 下载PDF
基于最长时延加权带宽的Wasm与容器混合函数部署优化方法
6
作者 谌燃照 李哲雄 +2 位作者 顾琳 钟梁 曾德泽 《计算机科学》 北大核心 2025年第9期170-177,共8页
容器技术因具备轻量化、易于部署和高可用等优势,在边缘服务器无感知计算平台中得到了广泛使用。然而,随着应用对低延迟需求的增长,容器的冷启动所引发的高时延问题逐渐成为系统性能的瓶颈。WebAssembly(Wasm)凭借其轻量级沙箱特性和毫... 容器技术因具备轻量化、易于部署和高可用等优势,在边缘服务器无感知计算平台中得到了广泛使用。然而,随着应用对低延迟需求的增长,容器的冷启动所引发的高时延问题逐渐成为系统性能的瓶颈。WebAssembly(Wasm)凭借其轻量级沙箱特性和毫秒级启动能力,成为容器技术在某些场景下的重要补充方案。然而,Wasm的计算性能相较容器存在劣势,尤其在需要处理函数间的复杂依赖关系时,Wasm和容器的固有优缺点使得函数部署方式和部署位置的决策变得十分困难。为解决该问题,构建了基于函数依赖关系的服务器无感知计算模型,将Wasm与容器混合部署问题转换为非线性整数规划问题。该问题随后被证明是一个NP-hard问题。为此,设计了长时延敏感的加权带宽贪心调度算法(Long-Latency-Sensitive Weighted Bandwidth Greedy Scheduling Algorithm,LLS-WBG),根据函数依赖以及前驱函数最长完成时间,加权计算服务器带宽,以优化资源利用并降低任务尾时延。基于真实世界数据的实验结果表明,在边缘计算场景下,与先进算法相比,所提出的算法能够使应用完成时间减少44.45%。 展开更多
关键词 服务器无感知计算 容器 边缘计算 WebAssembly
在线阅读 下载PDF
基于服务器无感知计算架构的并行计算通信框架
7
作者 袁雨馨 李庆文 +1 位作者 史骁 赵晓芳 《高技术通讯》 北大核心 2025年第6期590-603,共14页
随着云计算技术的发展与成熟,并行计算在云环境中得到了越来越多的实践。服务器无感知计算作为云计算中的一种新型的应用部署与计算方式,允许用户弹性分配资源并实现负载均衡,并提供了更强的可扩展性和更大的灵活性。然而,无状态的特性... 随着云计算技术的发展与成熟,并行计算在云环境中得到了越来越多的实践。服务器无感知计算作为云计算中的一种新型的应用部署与计算方式,允许用户弹性分配资源并实现负载均衡,并提供了更强的可扩展性和更大的灵活性。然而,无状态的特性导致服务器无感知计算框架并不完全适用于传统并行计算,其中通信是一个关键问题。本文提出了一个具有服务质量(quality of service,QoS)保障的通信框架FreeParallel,旨在基于服务器无感知计算中的函数即服务(function as a service,FaaS)平台构建面向并行计算的通信能力。FreeParallel结合了消息传递接口(message passing interface,MPI)并行计算编程模型,有效地保证了通信服务的质量;并采用代理模型来支持并行函数的识别和转换,并以服务形式灵活部署在多个FaaS或虚拟化平台上。此外,本研究还提出了函数间通信流量的QoS管理策略fm Clock,在保证传输公平性的前提下,实现基于请求和限制的通信原语级网络资源分配。实验结果表明,点对点通信场景下FreeParallel与虚拟化平台的覆盖网络相比传输性能略有不足,但比当前服务器无感知计算状态共享方案的传输效率有至少89.5%的提升。并且FreeParallel在集合通信场景下表现极佳,比基线方法提升了59.9%~83.1%。同时,带有fm Clock策略的FreeParallel能够实现原语级按比例分配策略,避免了不同原语间请求的交叉干扰,案例表明,策略的加入降低了应用25.0%的完成时间。 展开更多
关键词 服务器无感知计算 消息传递接口并行计算 服务质量保障 弹性资源分配
在线阅读 下载PDF
基于国产加速器的三维卷积前向算子优化
8
作者 姬晨晨 陈永青 韩孟之 《计算机工程》 北大核心 2025年第2期250-258,共9页
目前三维卷积神经网络(3D CNN)的应用场景越来越广泛,其能够从原始数据中提取更丰富、更具判别性的特征信息,在处理3D数据、特征提取和实际应用等方面具有重要意义。然而,从二维(2D)数据到3D数据的转变导致了卷积运算的数据量和计算量... 目前三维卷积神经网络(3D CNN)的应用场景越来越广泛,其能够从原始数据中提取更丰富、更具判别性的特征信息,在处理3D数据、特征提取和实际应用等方面具有重要意义。然而,从二维(2D)数据到3D数据的转变导致了卷积运算的数据量和计算量均呈指数级增长,对计算资源和时间的需求也相应增加,这会导致训练和推理过程更加耗时,特别是在处理大规模3D数据时尤为明显。针对以上问题,提出一种基于国产加速器的隐式卷积算法,对3D卷积的前向计算过程进行优化。首先,该算法结合了硬件特点和并行化思路,利用索引直接访问所需计算的数据地址,无须开辟新的内存空间,大幅节省内存开销;其次,考虑到国产加速器具有高度并行的计算结构和丰富的计算资源,适合处理大规模数据和复杂的计算任务,结合国产加速器的计算能力和架构特点,采用一系列特定的异构并行优化算法,加速3D卷积前向算子的计算过程,提高计算效率和性能。实验结果表明,自研算子性能远超国产计算平台现有算子的最优性能,在多数情况下与NVIDIA V100之间的能效比可以达到70%甚至更高。 展开更多
关键词 三维卷积 国产加速器 隐式卷积算法 索引机制 前向算子优化 并行优化算法
在线阅读 下载PDF
高性能并行计算的发展历程 被引量:2
9
作者 陈国良 《计算机科学》 CSCD 北大核心 2024年第1期1-3,共3页
并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解。使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解。非数值计算是相对数值计算而言的,它研究的... 并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解。使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解。非数值计算是相对数值计算而言的,它研究的是如何将计算科学中一些不能直接使用数学函数解决的问题并行求解。90年代开始,我带领团队系统地开展了此方面的研究,首先是奠定了所需的理论基础,并逐渐形成了完善的学科体系和应用示范。在此过程中,我们还积极倡导交叉学科研究,及时关注学科前沿技术,并且坚持学术研究要服务于国民经济主战场。在整个研究过程中,我们一方面积极开展国际学术交流,创办国际学术会议和专业期刊;另一方面坚持自力更生,研制自主可控的国产高性能计算机,创建科教平台为普及中国高性能计算机教育服务。 展开更多
关键词 并行计算 高性能计算 国产计算机 学科体系
在线阅读 下载PDF
混合云环境面向安全科学工作流数据布局策略 被引量:2
10
作者 苏明辉 林兵 +1 位作者 卢宇 王素云 《计算机工程与设计》 北大核心 2024年第7期2004-2012,共9页
为解决混合云环境下科学工作流数据布局问题,在考虑数据的安全需求的前提下,以优化跨数据中心传输时延为目标,提出了一种混合云环境下面向安全的科学工作流布局策略。分析数据集的安全需求以及数据中心所能提供的安全服务,提出安全等级... 为解决混合云环境下科学工作流数据布局问题,在考虑数据的安全需求的前提下,以优化跨数据中心传输时延为目标,提出了一种混合云环境下面向安全的科学工作流布局策略。分析数据集的安全需求以及数据中心所能提供的安全服务,提出安全等级分级规则;设计并提出基于遗传算法和模拟退火算法的自适应粒子群优化算法(adaptive particle swarm optimization algorithm based on SA and GA,SAGA-PSO),避免算法陷入局部极值,有效提高种群多样性;与其它经典布局算法对比,基于SAGA-PSO的数据布局策略在满足数据安全需求的同时能够大大降低传输时延。 展开更多
关键词 混合云 科学工作流 数据布局 安全分级 时延优化 遗传粒子群优化算法 模拟退火
在线阅读 下载PDF
云边协同环境下基于局部关键路径的工作流应用调度策略 被引量:2
11
作者 林潮伟 林兵 陈星 《小型微型计算机系统》 CSCD 北大核心 2024年第2期335-344,共10页
针对不确定性云边协同环境下工作流应用调度问题,考虑服务器的负载压力、网络拥塞等计算环境因素造成计算性能和传输带宽的不稳定性,采用三角模糊数表示模糊云边协同环境中服务器的计算性能和传输带宽.对于泊松到达的多工作流应用,提出... 针对不确定性云边协同环境下工作流应用调度问题,考虑服务器的负载压力、网络拥塞等计算环境因素造成计算性能和传输带宽的不稳定性,采用三角模糊数表示模糊云边协同环境中服务器的计算性能和传输带宽.对于泊松到达的多工作流应用,提出一种基于局部关键路径的多工作流应用调度策略,将局部关键路径作为调度单元进行统一调度,充分避免任务之间的数据传输,旨在满足多工作流应用截止日期约束的前提下,降低其模糊执行代价.仿真结果表明,与其他基准策略相比,在不同的截止时间约束下,该策略都能获得多工作流应用最优的可行调度方案,同时实现了模糊执行代价的有效优化. 展开更多
关键词 云边协同计算 工作流应用调度 模糊不确定性 局部关键路径
在线阅读 下载PDF
大点数FFT在“申威26010”上的并行优化 被引量:1
12
作者 郭俊 刘鹏 +2 位作者 杨昕遥 张鲁飞 吴东 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第1期78-86,共9页
根据“神威·太湖之光”超级计算机所用国产“申威26010”处理器的架构特点和编程规范,提出针对大点数FFT的众核并行优化方案.该方案源自经典的Cooley-Tukey FFT算法,通过将一维大点数数据迭代分解为二维小规模矩阵进行并行加速.为... 根据“神威·太湖之光”超级计算机所用国产“申威26010”处理器的架构特点和编程规范,提出针对大点数FFT的众核并行优化方案.该方案源自经典的Cooley-Tukey FFT算法,通过将一维大点数数据迭代分解为二维小规模矩阵进行并行加速.为了解决矩阵“列FFT”的读写、转置和计算问题,提出“列均分-行连续”的读写策略,通过对数据进行合理的分配、重排、交换,结合SIMD向量化、旋转因子优化、双缓冲、寄存器通信、跨步传输等优化手段,充分利用了众核处理器的计算资源和传输带宽.实验结果显示,单核组64从核并行程序较主核运行FFTW库,可以达到最高65x、平均48x以上的加速比. 展开更多
关键词 神威·太湖之光 申威26010 快速傅里叶变换 Cooley-Tukey算法 众核并行
在线阅读 下载PDF
数联网标识解析系统中的标识数据布局策略 被引量:2
13
作者 周春雷 宋继勐 +3 位作者 沈子奇 余晗 雷杰 林兵 《计算机工程》 CAS CSCD 北大核心 2024年第6期311-320,共10页
数联网是为解决目前互联网数据资源共享交互过程中传输效率低、协调成本高、安全管控难等缺陷而提出的一种新型信息基础设施。标识解析系统是实现数据流通的关键,但随着标识注册量和解析量的迅速增长,解析节点正面临着大量高并发解析请... 数联网是为解决目前互联网数据资源共享交互过程中传输效率低、协调成本高、安全管控难等缺陷而提出的一种新型信息基础设施。标识解析系统是实现数据流通的关键,但随着标识注册量和解析量的迅速增长,解析节点正面临着大量高并发解析请求,服务质量将变得难以保证。针对该问题,考虑数联网标识解析系统中节点架构的特点,以降低解析时延为目标,提出一种基于遗传算法的自适应离散粒子群优化算法(DPSO-GA)来对标识进行合理布局。该方法综合考虑节点之间的带宽、标识数量和节点容量等因素对解析时延的影响,引入遗传算法的交叉操作和变异操作,对粒子群优化算法的惯性权重因子采取自适应策略,对学习因子采取线性增减的策略。实验结果表明,相较于传统粒子群优化算法及遗传算法,该算法优化效果分别提升了48.9%和19.9%,增加了种群进化的多样性及搜索范围,减少了算法的时间复杂度以及陷入局部最优解的可能性,且能较稳定地降低标识解析时延。 展开更多
关键词 数联网 标识解析 数据布局 启发式算法 遗传算法 粒子群优化算法
在线阅读 下载PDF
云化的智算中心万卡集群创新与实践 被引量:2
14
作者 丁宏庆 张鹏飞 +6 位作者 牛红韦华 李志勇 周丹媛 丁国强 李攀攀 李道通 张久仙 《电信科学》 北大核心 2024年第12期125-135,共11页
为解决智算中心超大规模算力集群算力可用率低、国产技术成熟度低、大规模组网效率存在瓶颈、运营运维复杂等问题,提出了一种基于云计算技术构建智算中心万卡集群的系统。采用18432块神经网络处理单元(neural processing unit,NPU)卡和... 为解决智算中心超大规模算力集群算力可用率低、国产技术成熟度低、大规模组网效率存在瓶颈、运营运维复杂等问题,提出了一种基于云计算技术构建智算中心万卡集群的系统。采用18432块神经网络处理单元(neural processing unit,NPU)卡和优化后的基于以太网的远程直接内存访问(remote direct memory access,RDMA)网络构建云化的智算中心万卡集群,结合软件定义网络(software defined network,SDN)技术实现RDMA网络租户隔离,实现了链路负载均衡误差小于10%,集群All-Reduce带宽达35 GB/s以上。采用优化后的分布式存储协议,实现模型断点恢复时长缩短为原来的1/2。验证结果表明,经过软硬件协同优化,国产化的NPU万卡集群不仅能够满足千亿参数大模型训练的需求,未来更可以支撑万亿参数大模型训练任务。 展开更多
关键词 超级计算集群 智算中心 万卡集群 人工智能
在线阅读 下载PDF
智能移动终端计算迁移研究 被引量:38
15
作者 张文丽 郭兵 +3 位作者 沈艳 王毅 熊伟 段林涛 《计算机学报》 EI CSCD 北大核心 2016年第5期1021-1038,共18页
随着智能移动终端的普及和移动应用对计算资源需求的不断增长,移动终端资源(包括计算、存储、能量等)受限问题日益突出,如何扩展移动终端资源成为移动计算领域需要迫切解决的问题.计算迁移(computation offloading)是解决移动终端资源... 随着智能移动终端的普及和移动应用对计算资源需求的不断增长,移动终端资源(包括计算、存储、能量等)受限问题日益突出,如何扩展移动终端资源成为移动计算领域需要迫切解决的问题.计算迁移(computation offloading)是解决移动终端资源受限问题的一个有效途径,通过将一部分计算任务从本地迁移到远程设备执行来扩展移动终端的资源.该文首先回顾了计算迁移在分布式计算、普适计算和云计算背景下具有代表性的研究工作和进展,然后具体介绍和分析了3个典型的计算迁移系统,在此基础上,从软件架构角度对计算迁移系统的内部组成结构和关键质量属性等共性问题进行了探讨,并试着提出了计算迁移系统的参考架构.最后,探讨了未来计算迁移的研究挑战和发展趋势. 展开更多
关键词 计算迁移 智能移动终端 划分 移动云计算 移动增强 物联网
在线阅读 下载PDF
美蝉联超级计算机冠军
16
作者 曹来发 《兵工自动化》 2006年第1期10-10,共1页
关键词 超级计算机 TOP500 美国IBM公司 评选活动 运算速度 地球模拟器 蓝色基因 万亿次
在线阅读 下载PDF
网格环境下基于信任模型的动态级调度 被引量:53
17
作者 袁禄来 曾国荪 +1 位作者 姜黎立 蒋昌俊 《计算机学报》 EI CSCD 北大核心 2006年第7期1217-1224,共8页
网格用户、资源和服务的不确定性潜在地影响网格应用任务的正常执行,这样使得设计既能减小应用任务执行时间又能减小欺骗可能性的调度算法十分困难.参考社会学的人际关系信任模型,建立网格节点信任推荐机制,并利用D-S理论对推荐证据进... 网格用户、资源和服务的不确定性潜在地影响网格应用任务的正常执行,这样使得设计既能减小应用任务执行时间又能减小欺骗可能性的调度算法十分困难.参考社会学的人际关系信任模型,建立网格节点信任推荐机制,并利用D-S理论对推荐证据进行综合分析,从而定义出基于不确定性推理理论的信任度计算函数.将该函数并入DLS算法得到“可信”动态级调度算法(TDLS),从而在计算调度级别时考虑网格节点的可信程度.仿真结果证实,提出的TDLS算法以小的时间花费为代价,能有效提高任务在信任方面的服务质量需求. 展开更多
关键词 网格计算 可信调度 信任模型 不确定性推理 DLS算法
在线阅读 下载PDF
浅析高性能计算应用的需求与发展 被引量:30
18
作者 赵毅 朱鹏 +2 位作者 迟学斌 牛铁 曹宗雁 《计算机研究与发展》 EI CSCD 北大核心 2007年第10期1640-1646,共7页
高性能计算应用在高性能计算技术的支持下为科技创新做出了巨大贡献,并且和高性能计算技术在相辅相成中不断发展.自2004年以来,中国科学院计算机网络信息中心超级计算中心针对中国科学院在"十一五"期间的高性能计算需求在全... 高性能计算应用在高性能计算技术的支持下为科技创新做出了巨大贡献,并且和高性能计算技术在相辅相成中不断发展.自2004年以来,中国科学院计算机网络信息中心超级计算中心针对中国科学院在"十一五"期间的高性能计算需求在全院范围内开展了多次调研活动,对中国科学院在"十一五"期间高性能计算的整体需求及各应用领域需求的分布情况有了比较全面的了解,其调研结果对"十一五"中国科学院高性能计算环境建设和高性能计算应用的发展具有良好的借鉴作用.首先介绍了国内外高性能计算应用的发展现状,并结合中国科学院高性能计算环境建设和高性能计算应用的发展情况,分析了"十一五"中国科学院高性能计算的应用需求,最后对我国高性能计算应用的发展前景进行了展望. 展开更多
关键词 高性能计算应用 高性能计算机 网格 需求 发展
在线阅读 下载PDF
云环境下可用性感知的并行任务调度方法 被引量:18
19
作者 曹洁 曾国荪 +1 位作者 钮俊 许金超 《计算机研究与发展》 EI CSCD 北大核心 2013年第7期1563-1572,共10页
云计算是一种新兴的计算模式,倡导一切皆服务.云计算由于能够共享分布在世界各地的计算资源,在大规模计算和数据存储中越来越受到重视.云计算是当前IT工业界、学术界研究的热点领域,云环境中的资源可用性已成为云计算不可忽视的问题.对... 云计算是一种新兴的计算模式,倡导一切皆服务.云计算由于能够共享分布在世界各地的计算资源,在大规模计算和数据存储中越来越受到重视.云计算是当前IT工业界、学术界研究的热点领域,云环境中的资源可用性已成为云计算不可忽视的问题.对于云计算,当处理器的处理速度不同,不是一直可用于计算时,可用性成为设计和发展云计算系统的关键需求.根据并行任务图及树形云平台的结构特点,分别讨论了影响并行任务可用性需求和计算资源可用性保障的关键因素,给出一种可用性的量化计算公式.并且通过感知任务"可用性需求"和计算资源"可用性保障",实现可用性匹配,提出了两种可用性感知的调度算法Afsa和Agsa.模拟实验表明该算法能够改善云环境中资源可用性和可靠性,对提高任务调度的成功率具有实际意义. 展开更多
关键词 云计算 并行任务 可用性需求 可用性保障 任务调度
在线阅读 下载PDF
超立方体中基于极大安全通路矩阵的容错路由 被引量:13
20
作者 王雷 林亚平 +1 位作者 陈治平 文学 《软件学报》 EI CSCD 北大核心 2004年第7期994-1004,共11页
n维超立方体结构的多处理机系统在并行与分布式处理中具有良好的性能,随着多处理机系统规模的增大,系统出现链路与节点故障的概率也随之增大,因此设计容错性更强的路由算法对n维超立方体结构的多处理机系统具有重要意义.针对超立方体结... n维超立方体结构的多处理机系统在并行与分布式处理中具有良好的性能,随着多处理机系统规模的增大,系统出现链路与节点故障的概率也随之增大,因此设计容错性更强的路由算法对n维超立方体结构的多处理机系统具有重要意义.针对超立方体结构的多处理机系统中存在链路故障的情况,提出了用于最优通路记录的极大安全通路矩阵(maximumsafetypathmatrices,简称MSPMs)这一概念,给出了一种建立MSPMs及其容错路由算法.证明了MSPMs通过n-1轮邻节点之间的信息交换,能以矩阵的形式记录最多的最优通路;与基于最优通路矩阵(optimalpathmatrices,简称OPMs)及扩展最优通路矩阵(extendedoptimalpathmatrices,简称EOPMs)的容错路由算法相比,MSPMs是OPMs以及EOPMs的最大扩展,解决了如何用矩阵的形式来记录最多最优通路的问题. 展开更多
关键词 容错路由 最优通路 极大安全通路矩阵 超立方体 多处理机系统
在线阅读 下载PDF
上一页 1 2 77 下一页 到第
使用帮助 返回顶部