期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
Pipe-RLHF:计算模式感知的RLHF并行加速框架
1
作者 徐颖 王梦迪 +4 位作者 程龙 刘炼 赵世新 张磊 王颖 《计算机研究与发展》 北大核心 2025年第6期1513-1529,共17页
基于人类反馈的强化学习(reinforcement learning with human feedback,RLHF)作为当前大语言模型(large language models,LLMs)对齐的主流方法,其核心优化算法——近端策略优化(proximal policy optimization,PPO)却面临着显著的效率问... 基于人类反馈的强化学习(reinforcement learning with human feedback,RLHF)作为当前大语言模型(large language models,LLMs)对齐的主流方法,其核心优化算法——近端策略优化(proximal policy optimization,PPO)却面临着显著的效率问题.PPO由生成、推理、训练3个相互关联的阶段组成,各个阶段有着不同的计算特性.然而,现有的RLHF并行框架采用相同并行策略顺序执行PPO的所有阶段,这导致以下2个问题:其一,生成阶段不能充分利用计算资源,进而影响整体效率;其二,阶段间严格串行执行,未能充分利用潜在并行性.针对上述问题,提出了一个新型RLHF并行框架——Pipe-RLHF.该框架能够自适应地根据各阶段的计算特征确定最优并行策略,突破现有阶段串行范式,采用异步PPO算法发掘阶段间的并行性.具体而言,创新性地提出了适用于PPO生成阶段的延迟批间流水线并行方法,显著提升了该阶段的计算资源利用率;再次,使用异步PPO解放阶段间的依赖关系,将阶段间并行应用到PPO的加速上;最后,针对PPO算法的整体优化,构建了分层并行策略空间,并提出了一套优化算法以实现该空间中的最优解搜索.通过在多个大语言模型上的性能评估实验表明,相较于现有方法,Pipe-RLHF最高可实现3.7倍的加速比,充分验证了该框架的有效性和优越性. 展开更多
关键词 基于人类反馈的强化学习 近端策略优化 大模型微调 分布式系统 并行计算
在线阅读 下载PDF
分布式虚拟环境综述 被引量:123
2
作者 潘志庚 cad.zju.edu.cn +2 位作者 姜晓红 张明敏 石教英 《软件学报》 EI CSCD 北大核心 2000年第4期461-467,共7页
在分布式虚拟环境中 ,位于不同物理位置的多个用户或多个虚拟环境通过网络相互联结 ,进行信息共享和交互 .该文结合作者的研究工作 ,从分布式虚拟环境的产生、需求和特征、模型和结构以及系统关键技术这几个方面对分布式虚拟环境的研究... 在分布式虚拟环境中 ,位于不同物理位置的多个用户或多个虚拟环境通过网络相互联结 ,进行信息共享和交互 .该文结合作者的研究工作 ,从分布式虚拟环境的产生、需求和特征、模型和结构以及系统关键技术这几个方面对分布式虚拟环境的研究情况进行综述 。 展开更多
关键词 虚拟现实 分布式虚拟环境 可扩展性 仿真
在线阅读 下载PDF
基于瓦片金字塔模型的海量空间数据快速分发方法 被引量:8
3
作者 殷君茹 侯瑞霞 +1 位作者 唐小明 罗鹏 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第6期1269-1274,共6页
针对分布式并行环境下海量空间数据的快速显示和浏览问题,提出一种基于分层、分专题的海量空间数据金字塔模型及基于数据库存储方案的瓦片数据快速分发方法.对比分析了瓦片数据在文件式管理和数据库管理两种模式下的存储机制和响应流程... 针对分布式并行环境下海量空间数据的快速显示和浏览问题,提出一种基于分层、分专题的海量空间数据金字塔模型及基于数据库存储方案的瓦片数据快速分发方法.对比分析了瓦片数据在文件式管理和数据库管理两种模式下的存储机制和响应流程,并以时间跨度59年的沙尘暴观测数据为例,验证了该方法不仅能有效地组织管理海量空间数据,实现高效数据互操作,而且在多用户并发访问时,能快速响应客户端请求. 展开更多
关键词 瓦片金字塔模型 海量空间数据 数据库 分布式并行环境
在线阅读 下载PDF
UML状态图在并行环境的应用研究 被引量:3
4
作者 邓建波 张立臣 徐碧红 《计算机工程与设计》 CSCD 北大核心 2011年第3期945-947,1022,共4页
标准UML(unifiedmodellanguage)状态图中缺乏对并行环境精确的动态语义,不利于对其所描述的并行环境进行形式化分析、验证和确认,而CSP(通信序列进程)语言具有严格的数学定义和分析方法,可用于验证模型的正确性。针对此特点,提出了结合... 标准UML(unifiedmodellanguage)状态图中缺乏对并行环境精确的动态语义,不利于对其所描述的并行环境进行形式化分析、验证和确认,而CSP(通信序列进程)语言具有严格的数学定义和分析方法,可用于验证模型的正确性。针对此特点,提出了结合CSP的UML状态图的形式语义,同时给出在并行环境下UML状态图的合并方法。根据形式语义对UML状态图在并行环境中应用的正确性(模型检验)进行分析,通过操作系统进程调度在并行环境下运行实例的结果表明了该形式语义的正确性。 展开更多
关键词 统一建模语言 状态图 通信序列进程语言 并行环境 形式语义 模型检验
在线阅读 下载PDF
扩展UML语义以支持并行和分布式仿真系统设计 被引量:3
5
作者 胡四泉 范植华 佘春东 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期1030-1036,共7页
标准UML中不包含虚拟时间和时间同步语义 ,因而缺乏对并行和分布式仿真 (parallelanddistributedsimula tion ,PADS)系统设计的支持 对标准UML语义进行扩展以支持PADS领域的概念并降低PADS系统构造的复杂性 主要的工作包括在UML中引入... 标准UML中不包含虚拟时间和时间同步语义 ,因而缺乏对并行和分布式仿真 (parallelanddistributedsimula tion ,PADS)系统设计的支持 对标准UML语义进行扩展以支持PADS领域的概念并降低PADS系统构造的复杂性 主要的工作包括在UML中引入虚拟时间语义 ,用包含虚拟时间标记和约束的状态图和交互图来描述仿真实体的功能属性 另外 ,通过创建虚拟时间同步构造型 (stereotype) ,提出“分离法”将时间同步细节与仿真模型内部的功能属性逻辑地分离 ,不仅使得仿真对象建模更加容易 。 展开更多
关键词 并行和分布式仿真(PADS) 统一建模语言(UML)仿真建模 面向对象设计
在线阅读 下载PDF
一种面向软件工程的时序逻辑语言 被引量:15
6
作者 唐稚松 赵琛 《软件学报》 EI CSCD 北大核心 1994年第12期1-16,共16页
XYZ系统由时序逻辑语言XYZ/E及一组基于该语言的CASE工具集组成.XYZ/E语言的目的是欲使逐步求精,描述及验证、快速原型等一些软件工程方法更加有效.特别地,它还能表示实时通信进程中的动态成分.在统一的框架下,... XYZ系统由时序逻辑语言XYZ/E及一组基于该语言的CASE工具集组成.XYZ/E语言的目的是欲使逐步求精,描述及验证、快速原型等一些软件工程方法更加有效.特别地,它还能表示实时通信进程中的动态成分.在统一的框架下,不仅能表示不同层次的抽象描述,而且能表示普通高级语言的各种重要性质.本文是关于这一时序逻辑语言最新、最完整的介绍. 展开更多
关键词 软件工程 时序逻辑语言 CASE
在线阅读 下载PDF
一种支持并行离散事件仿真建模和并行模型检验的建模语言
7
作者 夏薇 姚益平 慕晓冬 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第6期66-71,共6页
并行离散事件仿真(Parallel Discrete Event Simulation,PDES)模型的正确性和可信度对PDES应用的发展起着决定性作用。然而,现有的并行离散事件仿真开发环境都没有提供仿真模型检验功能。并行模型检验(Parallel Model Checking,PMC)方... 并行离散事件仿真(Parallel Discrete Event Simulation,PDES)模型的正确性和可信度对PDES应用的发展起着决定性作用。然而,现有的并行离散事件仿真开发环境都没有提供仿真模型检验功能。并行模型检验(Parallel Model Checking,PMC)方法以其完备性、高效性已经在工业界中得到了成功的应用,但是PDES和PMC是基于不同的建模语言实现的,现阶段要对PDES模型进行验证需要专门设计基于PMC建模语言的模型,不仅耗费资源、时间,而且容易出错。为了实现PDES和PMC的有机结合,提出了一种支持PDES和PMC的统一的建模语言——扩展事件图(Extended Event Graph,EEG),它对事件图在模型同步方面进行了扩展,然后通过转换机制,该建模语言使得用户只需建立一个模型,就能够既进行PDES又利用并行模型检验方法对PDES模型进行形式化验证。最后通过实验验证了基于EEG建立的模型既可以进行PDES又能够进行PMC。 展开更多
关键词 并行离散事件仿真 模型检验 事件图 逻辑进程范型 DVE建模语言 模型转换
在线阅读 下载PDF
基于网络的数据并行计算中分布数组描述研究
8
作者 胡长军 丁文魁 +2 位作者 黄其军 向华 许卓群 《软件学报》 EI CSCD 北大核心 2002年第4期608-615,共8页
如何描述分布数组是基于网络数据并行计算的基本问题.从网络并行计算的一般需求出发,讨论了分布数组描述DAD(distributed array descriptor)的内容和结构,具体给出了p-HPF并行编译系统的DAD结构定义.针对分布数据的稀疏存储和紧凑存... 如何描述分布数组是基于网络数据并行计算的基本问题.从网络并行计算的一般需求出发,讨论了分布数组描述DAD(distributed array descriptor)的内容和结构,具体给出了p-HPF并行编译系统的DAD结构定义.针对分布数据的稀疏存储和紧凑存储模型,给出了数据在Block分布、Cyclic分布和Block_Cyclic(k)分布方式下,全局数组到局部数组转换的计算方法,这些方法已在p-HPF编译器中得到实现并证明了其有效性.最后讨论了分布数据描述的标准化对实现并行计算系统的可移植性和可重用性的意义. 展开更多
关键词 分布数组描述 网络并行计算 HPF语言 并行编译 数据并行计算
在线阅读 下载PDF
数据并行高层描述语言中的数据抽象
9
作者 郑全录 陆林生 《小型微型计算机系统》 CSCD 北大核心 2001年第8期1000-1003,共4页
数据并行高层描述语言 DPHL 是我们开发的面向科学计算的一个描述语言 ,变量定义和基于域上的计算是该语言的重要组成部分 .本文通过对数据并行方法、科学计算特点以及现有并行语言的研究和分析 ,论述了变量定义中数据抽象的两个主要方... 数据并行高层描述语言 DPHL 是我们开发的面向科学计算的一个描述语言 ,变量定义和基于域上的计算是该语言的重要组成部分 .本文通过对数据并行方法、科学计算特点以及现有并行语言的研究和分析 ,论述了变量定义中数据抽象的两个主要方面 :一是引入了变量的定义域、子域和依赖域概念 ,给出了它们的形式化描述 ,二是引入了变量的数学属性 ,并和域分离 ,便于数据并行自动识别 ,重构高效的并行程序 ,使 展开更多
关键词 DPHL语言 程序设计语言 数据抽象 数据并行高层描述语言
在线阅读 下载PDF
基于分布内存的层次短语机器翻译并行化算法 被引量:3
10
作者 赵博 黄书剑 +2 位作者 戴新宇 袁春风 黄宜华 《计算机研究与发展》 EI CSCD 北大核心 2014年第12期2724-2732,共9页
近年来,为了提高统计机器翻译系统的准确性,普遍应用海量语料训练出大规模语言模型和翻译模型.而模型规模的不断增大,给统计机器翻译带来了突出的计算性能问题,使得现有的单机串行化翻译处理难以在较快的时间内完成计算,该问题在处理联... 近年来,为了提高统计机器翻译系统的准确性,普遍应用海量语料训练出大规模语言模型和翻译模型.而模型规模的不断增大,给统计机器翻译带来了突出的计算性能问题,使得现有的单机串行化翻译处理难以在较快的时间内完成计算,该问题在处理联机翻译时更为突出.为了克服单机机器翻译算法在这方面的局限性,提高大规模统计机器翻译处理的计算性能,面向一个实际的联机翻译系统,提出了一个分布式和并行化翻译解码算法框架,对整个大规模语言模型和翻译模型同时采用分布式存储和并行化查询机制,在此基础上进一步研究实现完整的翻译解码并行化算法.研究实现了一个基于分布式内存数据库的层次短语并行化机器翻译解码器,该解码器使用分布式内存数据库存储和查询大数据量的翻译模型表和语言模型表,克服了传统的机器翻译系统所面临的内存容量和并发度方面的限制.为了进一步提高并行解码速度,还研究实现了另外3项优化技术:1)将翻译模型表的同步规则和Trie树结构的语言模型表转化为基于内存数据库的"键-值"结构的Hash索引表的方法;2)对Cube-Pruning算法进行了修改使其适用于批量查询;3)采用并优化了批量查询方式减少语言和翻译模型查询时的网络传输开销.所提出的解码算法实现了基于大规模语料统计机器翻译时的快速解码,并具备优异的系统可扩展性.实验结果表明:与单机解码器相比,单句翻译速度可提高2.7倍,批量翻译作业的总体解码性能可提高至少11.7倍,实现了显著的计算性能提升. 展开更多
关键词 统计机器翻译 层次短语 语言模型 翻译模型 并行化解码 分布内存
在线阅读 下载PDF
CC$:一种面向分布式众核平台的并行编程语言 被引量:1
11
作者 吴峻峰 许跃生 +2 位作者 张永东 江颖 叶纬材 《计算机科学》 CSCD 北大核心 2013年第3期128-132,共5页
CC$是一种并行编程语言,目的是解决分布式众核并行计算机的编程困难。CC$的编程模型以Multi-BSP模型为基础,将分布式众核并行计算机的硬件架构抽象为3层。数据按照存储的层次和共享范围分为5类,以便在不同层次上提供共享。CC$还提出... CC$是一种并行编程语言,目的是解决分布式众核并行计算机的编程困难。CC$的编程模型以Multi-BSP模型为基础,将分布式众核并行计算机的硬件架构抽象为3层。数据按照存储的层次和共享范围分为5类,以便在不同层次上提供共享。CC$还提出一类虚拟指令来解决不同层次之间的数据交换,实现数据访问的逻辑化描述。并行程序按照3层Multi-BSP超步嵌套执行。CC$具有统一的编程风格、内建的多层公共地址空间、数据访问请求的表达式描述和数据传输编译优化4大特点。测试表明,CC$程序的运行效率高,易学易用,大幅地缩短了开发周期。 展开更多
关键词 分布式众核 并行计算 编程语言 Multi-BSP 并行编程模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部