检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于异步优势演员-评论家学习的服务功能链资源分配算法被引量：8: 1; 作者唐伦贺小雨 +3 位作者王晓谭颀胡彦娟陈前斌《电子与信息学报》 EI CSCD 北大核心 2021年第6期1733-1741,共9页; 考虑网络全局信息难以获悉的实际情况,针对接入网切片场景下用户终端(UE)的移动性和数据包到达的动态性导致的资源分配优化问题,该文提出了一种基于异步优势演员-评论家(A3C)学习的服务功能链(SFC)资源分配算法。首先,该算法建立基于区... 展开更多; 关键词网络切片服务功能链资源分配马尔科夫决策过程异步优势演员-评论家学习区块链; 在线阅读下载PDF 职称材料

基于优势演员-评论家算法的强化自动摘要模型被引量：7: 2; 作者杜嘻嘻程华房一泉《计算机应用》 CSCD 北大核心 2021年第3期699-705,共7页; 针对长文本自动摘要任务中抽取式模型摘要较为冗余,而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题,提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型(A2C-RLAS)。首先,用基于卷积神经网络(CNN)... 展开更多; 关键词自动摘要模型抽取式摘要模型生成式摘要模型编码器-解码器强化学习优势演员-评论家算法; 在线阅读下载PDF 职称材料

基于优势演员-评论家算法的危险货物集装箱堆场安全堆存空间分配: 3; 作者沈阳黄诚宓为建《上海海事大学学报》北大核心 2022年第3期13-20,61,共9页; 针对危险货物集装箱(简称危货箱)堆场堆存空间分配的安全性问题,通过分析危货箱堆存的风险因素及安全堆存规范,提出一种以安全堆存空间利用率和安全指数最大为目标的危货箱堆场安全堆存空间分配多目标优化模型。设计优势演员-评论家(adv... 展开更多; 关键词危险货物集装箱安全堆存空间分配多目标优化优势演员-评论家算法; 在线阅读下载PDF 职称材料

基于融合状态预测的深度强化学习A2C的交通信号控制: 4; 作者叶宝林孙瑞涛 +1 位作者李灵犀吴维敏《计算机工程》北大核心 2025年第5期33-42,共10页; 现有基于强化学习的交通信号控制方法主要使用历史交通状态和当前时间步的实时交通状态来确定下一个时间步的控制策略,造成控制策略始终滞后于交通状态一个时间步。为了解决该问题,提出一种基于融合交通状态预测的深度强化学习优势演员... 展开更多; 关键词交通信号控制优势演员评论家交通状态预测双向长短时记忆网络; 在线阅读下载PDF 职称材料

A3C深度强化学习模型压缩及知识抽取被引量：2: 5; 作者张晶王子铭任永功《计算机研究与发展》 EI CSCD 北大核心 2023年第6期1373-1384,共12页; 异步优势演员评论家(asynchronous advantage actor-critic,A3C)构建一主多从异步并行深度强化学习框架,其在最优策略探索中存在求解高方差问题,使主智能体难以保证全局最优参数更新及最佳策略学习.同时,利用百万计算资源构建的大规模... 展开更多; 关键词强化学习深度强化学习演员评论家模型异步优势演员评论家模型模型压缩; 在线阅读下载PDF 职称材料

基于多域联合的无人机集群认知抗干扰算法被引量：11: 6; 作者刘春玲刘敏提丁元明《计算机工程》 CAS CSCD 北大核心 2020年第12期193-200,共8页; 为解决无人机集群网络在复杂通信环境中对抗智能性干扰能力较弱的问题,基于智能决策理论,提出一种多域联合的认知抗干扰算法。该算法在优势演员-评论家算法的基础上,将无人机视作智能体,并由感知到的环境频谱状态决策出干扰信道。基于St... 展开更多; 关键词认知抗干扰算法优势演员-评论家算法 STACKELBERG博弈无人机集群分布式网络; 在线阅读下载PDF 职称材料

移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法被引量：2: 7; 作者唐伦文明艳 +1 位作者单贞贞陈前斌《电子与信息学报》 EI CSCD 北大核心 2023年第7期2406-2414,共9页; 智能驾驶中的碰撞避免任务存在对时延要求极高和隐私保护等挑战。首先,该文提出一种基于自适应调整参数的半异步联邦学习(SFLAAP)的门控循环单元联合支持向量机(GRU_SVM)碰撞多级预警算法,SFLAAP可根据训练和资源情况动态调整两个训练参... 展开更多; 关键词碰撞预警联邦学习移动边缘计算异步优势演员-评论家算法; 在线阅读下载PDF 职称材料

基于自适应多目标强化学习的服务集成方法: 8; 作者郭潇李春山 +1 位作者张宇跃初佃辉《计算机应用》 CSCD 北大核心 2022年第11期3500-3505,共6页; 当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性... 展开更多; 关键词服务集成强化学习异步优势演员评论家算法多目标优化自适应权重; 在线阅读下载PDF 职称材料

基于A3C的特征重构工艺路线规划方法被引量：1: 9; 作者陶鑫钰王艳纪志成《现代制造工程》 CSCD 北大核心 2023年第10期15-26,共12页; 针对柔性加工系统中零件发生特征重构的工艺路线规划问题,结合异步优势演员-评论家(A3C)算法的并行、异步、响应速度快以及决策经验可复用性、可扩展性的特点,提出了基于A3C算法的特征重构工艺路线规划方法。在零件发生特征重构的背景下... 展开更多; 关键词异步优势演员-评论家特征重构工艺路线深度强化学习马尔可夫决策过程; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部