检索结果-维普期刊中文期刊服务平台

异步策略的强化因果发现方法: 1; 作者张英郭辉《燕山大学学报》 CAS 北大核心 2024年第4期356-368,共13页; 研究和发掘事物之间的因果关系是数据科学的核心问题之一。针对因果发现面临着搜索空间超指数量级增长、评价指标低、收敛速度慢且效果差等问题,本文提出一种基于异步策略的强化因果发现方法。首先采用自注意力机制的编码器和单层解码... 展开更多; 关键词因果关系有向无环图强化因果发现结构约束异步优势算法; 在线阅读下载PDF 职称材料

基于长短期记忆-异步优势动作评判的智能车汇入模型被引量：1: 2; 作者吴思凡杜煜 +2 位作者徐世杰杨硕杜晨《汽车技术》 CSCD 北大核心 2019年第10期42-47,共6页; 针对以往强化学习中智能车汇入车流算法训练时间复杂度高、收敛速度慢的问题,提出基于长短期记忆-异步优势动作评判算法的智能车汇入模型。在异步优势动作评判算法的基础上,结合长短期记忆神经网络,有效地解决训练模型时间和模型收敛的... 展开更多; 关键词智能车汇入车流异步优势动作评判算法长短期记忆神经网络时间复杂度收敛速度; 在线阅读下载PDF 职称材料

基于A3C的认知物联网通信干扰消除算法被引量：1: 3; 作者刘新梦谢健骊 +1 位作者李翠然王亦鸣《计算机工程》 CAS CSCD 北大核心 2024年第10期281-290,共10页; 针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决... 展开更多; 关键词认知物联网干扰消除异步优势行动者-评论家算法干扰程度信号质量吞吐量; 在线阅读下载PDF 职称材料

移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法被引量：2: 4; 作者唐伦文明艳 +1 位作者单贞贞陈前斌《电子与信息学报》 EI CSCD 北大核心 2023年第7期2406-2414,共9页; 智能驾驶中的碰撞避免任务存在对时延要求极高和隐私保护等挑战。首先,该文提出一种基于自适应调整参数的半异步联邦学习(SFLAAP)的门控循环单元联合支持向量机(GRU_SVM)碰撞多级预警算法,SFLAAP可根据训练和资源情况动态调整两个训练参... 展开更多; 关键词碰撞预警联邦学习移动边缘计算异步优势演员-评论家算法; 在线阅读下载PDF 职称材料

矿山信息物理融合系统多节点智联策略被引量：4: 5; 作者马洋锦付茂全 +1 位作者许志李敬兆《工矿自动化》北大核心 2020年第3期38-42,48,共6页; 针对当前矿山信息物理融合系统(CPS)的通信节点无法与基于不同无线通信协议的感知节点实现智能连接的问题,在通信节点上集成多种通信模块构成多模态通信节点,提出了一种基于渐进式神经网络的矿山CPS多节点智联策略。采用渐进式神经网络... 展开更多; 关键词智慧矿山矿山信息物理融合系统多模态通信节点渐进式神经网络异步优势动作评价算法; 在线阅读下载PDF 职称材料

基于自适应多目标强化学习的服务集成方法: 6; 作者郭潇李春山 +1 位作者张宇跃初佃辉《计算机应用》 CSCD 北大核心 2022年第11期3500-3505,共6页; 当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性... 展开更多; 关键词服务集成强化学习异步优势演员评论家算法多目标优化自适应权重; 在线阅读下载PDF 职称材料

题名异步策略的强化因果发现方法: 1; 作者张英郭辉; 机构宁夏大学信息工程学院; 出处《燕山大学学报》 CAS 北大核心 2024年第4期356-368,共13页; 基金宁夏自然科学基金资助项目(2021AAC03117)。; 文摘研究和发掘事物之间的因果关系是数据科学的核心问题之一。针对因果发现面临着搜索空间超指数量级增长、评价指标低、收敛速度慢且效果差等问题,本文提出一种基于异步策略的强化因果发现方法。首先采用自注意力机制的编码器和单层解码器模型探索数据之间的因果关系;其次,改进强化学习模型中的结构约束,并基于异步优势算法更新网络模型参数;最后,搜索、输出最大奖励的有向无环图。通过实验对比验证了该方法的良好性能。; 关键词因果关系有向无环图强化因果发现结构约束异步优势算法; Keywords causal relationship directed acyclic graph reinforcement causal discovery structural constraint asynchronous dominance algorithm; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于长短期记忆-异步优势动作评判的智能车汇入模型被引量：1: 2; 作者吴思凡杜煜徐世杰杨硕杜晨; 机构北京联合大学北京市信息服务工程重点实验室; 出处《汽车技术》 CSCD 北大核心 2019年第10期42-47,共6页; 基金国家自然科学基金项目(91420202) 北京联合大学研究生资助项目; 文摘针对以往强化学习中智能车汇入车流算法训练时间复杂度高、收敛速度慢的问题,提出基于长短期记忆-异步优势动作评判算法的智能车汇入模型。在异步优势动作评判算法的基础上,结合长短期记忆神经网络,有效地解决训练模型时间和模型收敛的问题。试验结果表明,该算法提高了模型收敛速度与汇入成功率,同时降低了时间复杂度,适合汇入车流场景。; 关键词智能车汇入车流异步优势动作评判算法长短期记忆神经网络时间复杂度收敛速度; Keywords Intelligent vehicle Vehicle merging Asynchronous advantage actor critic algorithm Long short-term memory neural network Time complexity Convergence speed; 分类号 U461.99 [机械工程—车辆工程]; 在线阅读下载PDF 职称材料

题名基于A3C的认知物联网通信干扰消除算法被引量：1: 3; 作者刘新梦谢健骊李翠然王亦鸣; 机构兰州交通大学电子与信息工程学院; 出处《计算机工程》 CAS CSCD 北大核心 2024年第10期281-290,共10页; 基金国家自然科学基金(62161016) 甘肃省科技计划基金(20JR10RA273) 北京市高速铁路宽带移动通信工程技术研究中心(北京交通大学)开放课题基金资助(BHRC-2022-1)。; 文摘针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决策,从而改善通信质量和系统性能。在该算法中,当SU遭受干扰影响通信质量时,智能体通过学习和优化,使SU能够根据当前的位置信息、发射功率、接收功率以及干扰程度选择最低干扰程度的行动,并执行该行动后获得的奖励。智能体通过尝试不同减少干扰的行动,并根据奖励的反馈调整策略,达到最大化定义干扰程度指标和信号质量指标的奖励函数的目的,从而最大程度地减少干扰对通信质量的影响。实验结果表明,与传统k-means算法以及深度递归Q网络(DRQN)和深度Q网络(DQN)优化算法相比,基于A3C的干扰消除算法具有更短的收敛时间、更高的执行效率以及更高的系统吞吐量,较3种基准方法在吞吐量性能上至少提高7%,能够有效地减少干扰对通信质量的不利影响。; 关键词认知物联网干扰消除异步优势行动者-评论家算法干扰程度信号质量吞吐量; Keywords Cognitive Internet of Things(CIoT) interference cancellation Asynchronous Advantage Actor-Critic(A3C)algorithm interference level signal quality throughput; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法被引量：2: 4; 作者唐伦文明艳单贞贞陈前斌; 机构重庆邮电大学通信与信息工程学院重庆邮电大学移动通信重点实验室; 出处《电子与信息学报》 EI CSCD 北大核心 2023年第7期2406-2414,共9页; 基金国家自然科学基金(62071078) 四川省科技计划(2021YFQ0053) 重庆市教委科学技术研究项目(KJZD-M201800601)。; 文摘智能驾驶中的碰撞避免任务存在对时延要求极高和隐私保护等挑战。首先,该文提出一种基于自适应调整参数的半异步联邦学习(SFLAAP)的门控循环单元联合支持向量机(GRU_SVM)碰撞多级预警算法,SFLAAP可根据训练和资源情况动态调整两个训练参数:本地训练次数和参与聚合的局部模型数量。然后,为解决资源受限的移动边缘计算(MEC)下碰撞预警模型协作训练的效率问题,根据上述参数与SFLAAP训练时延的关系,建立训练总时延最小化模型,并将其转化为马尔可夫决策过程(MDP)。最后,在所建立的MDP中采用异步优势演员-评论家(A3C)学习求解,自适应地确定最优训练参数,从而减少碰撞预警模型的训练完成时间。仿真结果表明,所提算法有效地降低训练总时延并保证预测精度。; 关键词碰撞预警联邦学习移动边缘计算异步优势演员-评论家算法; Keywords Collision warning Federated Learning(FL) Mobile Edge Computing(MEC) Asynchronous Advantage Actor-Critic(A3C)algorithm; 分类号 TN929.5 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名矿山信息物理融合系统多节点智联策略被引量：4: 5; 作者马洋锦付茂全许志李敬兆; 机构安徽理工大学电气与信息工程学院大同煤矿集团有限责任公司安全监管五人小组管理部; 出处《工矿自动化》北大核心 2020年第3期38-42,48,共6页; 基金国家自然科学基金项目(51874010) 北京理工大学高精尖机器人开放性研究项目(2018IRS16) 物联网关键技术研究创新团队项目(201950ZX003)。; 文摘针对当前矿山信息物理融合系统(CPS)的通信节点无法与基于不同无线通信协议的感知节点实现智能连接的问题,在通信节点上集成多种通信模块构成多模态通信节点,提出了一种基于渐进式神经网络的矿山CPS多节点智联策略。采用渐进式神经网络控制多模态通信节点准确切换工作模态,实现异构无线通信网络自主建立;利用异步优势动作评价算法对渐进式神经网络进行深度训练,提高渐进式神经网络的收敛速度和训练精度。实验结果表明,该策略实现了多模态通信节点与多类感知节点之间的准确、可靠通信。; 关键词智慧矿山矿山信息物理融合系统多模态通信节点渐进式神经网络异步优势动作评价算法; Keywords smart mine mine cyber-physical system multi-mode communication node progressive neural network asynchronous advantage actor-critic algorithm; 分类号 TD67 [矿业工程—矿山机电]; 在线阅读下载PDF 职称材料

题名基于自适应多目标强化学习的服务集成方法: 6; 作者郭潇李春山张宇跃初佃辉; 机构哈尔滨工业大学(威海)计算机科学与技术学院; 出处《计算机应用》 CSCD 北大核心 2022年第11期3500-3505,共6页; 基金国家重点研发计划项目(2018YFB1402500) 国家自然科学基金资助项目(61902090,61832004) 山东省自然科学基金资助项目(ZR2020KF019)。; 文摘当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性。针对上述问题,提出一种基于自适应多目标强化学习的服务集成方法,该方法在异步优势演员评论家(A3C)算法的框架下引入多目标优化策略,从而在满足用户需求的同时保证IoS生态系统的健康发展。所提方法可以根据遗憾值对多目标值集成权重进行动态调整,改善多目标强化学习中子目标值不平衡的现象。在真实大规模服务环境下进行了服务集成验证,实验结果表明所提方法相对于传统机器学习方法在大规模服务环境下求解速度更快;相较于权重固定的强化学习(RL),各目标的求解质量更均衡。; 关键词服务集成强化学习异步优势演员评论家算法多目标优化自适应权重; Keywords service integration Reinforcement Learning(RL) Asynchronous Advantage Actor‑Critic(A3C)algorithm multi‑objective optimization adaptive weight; 分类号 TP315 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	异步策略的强化因果发现方法	张英郭辉	《燕山大学学报》 CAS 北大核心	2024	0	在线阅读下载PDF 职称材料
2	基于长短期记忆-异步优势动作评判的智能车汇入模型	吴思凡杜煜徐世杰杨硕杜晨	《汽车技术》 CSCD 北大核心	2019	1	在线阅读下载PDF 职称材料
3	基于A3C的认知物联网通信干扰消除算法	刘新梦谢健骊李翠然王亦鸣	《计算机工程》 CAS CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料
4	移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法	唐伦文明艳单贞贞陈前斌	《电子与信息学报》 EI CSCD 北大核心	2023	2	在线阅读下载PDF 职称材料
5	矿山信息物理融合系统多节点智联策略	马洋锦付茂全许志李敬兆	《工矿自动化》北大核心	2020	4	在线阅读下载PDF 职称材料
6	基于自适应多目标强化学习的服务集成方法	郭潇李春山张宇跃初佃辉	《计算机应用》 CSCD 北大核心	2022	0	在线阅读下载PDF 职称材料