期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
异步策略的强化因果发现方法
1
作者
张英
郭辉
《燕山大学学报》
CAS
北大核心
2024年第4期356-368,共13页
研究和发掘事物之间的因果关系是数据科学的核心问题之一。针对因果发现面临着搜索空间超指数量级增长、评价指标低、收敛速度慢且效果差等问题,本文提出一种基于异步策略的强化因果发现方法。首先采用自注意力机制的编码器和单层解码...
研究和发掘事物之间的因果关系是数据科学的核心问题之一。针对因果发现面临着搜索空间超指数量级增长、评价指标低、收敛速度慢且效果差等问题,本文提出一种基于异步策略的强化因果发现方法。首先采用自注意力机制的编码器和单层解码器模型探索数据之间的因果关系;其次,改进强化学习模型中的结构约束,并基于异步优势算法更新网络模型参数;最后,搜索、输出最大奖励的有向无环图。通过实验对比验证了该方法的良好性能。
展开更多
关键词
因果关系
有向无环图
强化因果发现
结构约束
异步优势算法
在线阅读
下载PDF
职称材料
基于长短期记忆-异步优势动作评判的智能车汇入模型
被引量:
1
2
作者
吴思凡
杜煜
+2 位作者
徐世杰
杨硕
杜晨
《汽车技术》
CSCD
北大核心
2019年第10期42-47,共6页
针对以往强化学习中智能车汇入车流算法训练时间复杂度高、收敛速度慢的问题,提出基于长短期记忆-异步优势动作评判算法的智能车汇入模型。在异步优势动作评判算法的基础上,结合长短期记忆神经网络,有效地解决训练模型时间和模型收敛的...
针对以往强化学习中智能车汇入车流算法训练时间复杂度高、收敛速度慢的问题,提出基于长短期记忆-异步优势动作评判算法的智能车汇入模型。在异步优势动作评判算法的基础上,结合长短期记忆神经网络,有效地解决训练模型时间和模型收敛的问题。试验结果表明,该算法提高了模型收敛速度与汇入成功率,同时降低了时间复杂度,适合汇入车流场景。
展开更多
关键词
智能车
汇入车流
异步
优势
动作评判
算法
长短期记忆神经网络
时间复杂度
收敛速度
在线阅读
下载PDF
职称材料
基于A3C的认知物联网通信干扰消除算法
被引量:
1
3
作者
刘新梦
谢健骊
+1 位作者
李翠然
王亦鸣
《计算机工程》
CAS
CSCD
北大核心
2024年第10期281-290,共10页
针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决...
针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决策,从而改善通信质量和系统性能。在该算法中,当SU遭受干扰影响通信质量时,智能体通过学习和优化,使SU能够根据当前的位置信息、发射功率、接收功率以及干扰程度选择最低干扰程度的行动,并执行该行动后获得的奖励。智能体通过尝试不同减少干扰的行动,并根据奖励的反馈调整策略,达到最大化定义干扰程度指标和信号质量指标的奖励函数的目的,从而最大程度地减少干扰对通信质量的影响。实验结果表明,与传统k-means算法以及深度递归Q网络(DRQN)和深度Q网络(DQN)优化算法相比,基于A3C的干扰消除算法具有更短的收敛时间、更高的执行效率以及更高的系统吞吐量,较3种基准方法在吞吐量性能上至少提高7%,能够有效地减少干扰对通信质量的不利影响。
展开更多
关键词
认知物联网
干扰消除
异步
优势
行动者-评论家
算法
干扰程度
信号质量
吞吐量
在线阅读
下载PDF
职称材料
移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法
被引量:
2
4
作者
唐伦
文明艳
+1 位作者
单贞贞
陈前斌
《电子与信息学报》
EI
CSCD
北大核心
2023年第7期2406-2414,共9页
智能驾驶中的碰撞避免任务存在对时延要求极高和隐私保护等挑战。首先,该文提出一种基于自适应调整参数的半异步联邦学习(SFLAAP)的门控循环单元联合支持向量机(GRU_SVM)碰撞多级预警算法,SFLAAP可根据训练和资源情况动态调整两个训练参...
智能驾驶中的碰撞避免任务存在对时延要求极高和隐私保护等挑战。首先,该文提出一种基于自适应调整参数的半异步联邦学习(SFLAAP)的门控循环单元联合支持向量机(GRU_SVM)碰撞多级预警算法,SFLAAP可根据训练和资源情况动态调整两个训练参数:本地训练次数和参与聚合的局部模型数量。然后,为解决资源受限的移动边缘计算(MEC)下碰撞预警模型协作训练的效率问题,根据上述参数与SFLAAP训练时延的关系,建立训练总时延最小化模型,并将其转化为马尔可夫决策过程(MDP)。最后,在所建立的MDP中采用异步优势演员-评论家(A3C)学习求解,自适应地确定最优训练参数,从而减少碰撞预警模型的训练完成时间。仿真结果表明,所提算法有效地降低训练总时延并保证预测精度。
展开更多
关键词
碰撞预警
联邦学习
移动边缘计算
异步
优势
演员-评论家
算法
在线阅读
下载PDF
职称材料
矿山信息物理融合系统多节点智联策略
被引量:
4
5
作者
马洋锦
付茂全
+1 位作者
许志
李敬兆
《工矿自动化》
北大核心
2020年第3期38-42,48,共6页
针对当前矿山信息物理融合系统(CPS)的通信节点无法与基于不同无线通信协议的感知节点实现智能连接的问题,在通信节点上集成多种通信模块构成多模态通信节点,提出了一种基于渐进式神经网络的矿山CPS多节点智联策略。采用渐进式神经网络...
针对当前矿山信息物理融合系统(CPS)的通信节点无法与基于不同无线通信协议的感知节点实现智能连接的问题,在通信节点上集成多种通信模块构成多模态通信节点,提出了一种基于渐进式神经网络的矿山CPS多节点智联策略。采用渐进式神经网络控制多模态通信节点准确切换工作模态,实现异构无线通信网络自主建立;利用异步优势动作评价算法对渐进式神经网络进行深度训练,提高渐进式神经网络的收敛速度和训练精度。实验结果表明,该策略实现了多模态通信节点与多类感知节点之间的准确、可靠通信。
展开更多
关键词
智慧矿山
矿山信息物理融合系统
多模态通信节点
渐进式神经网络
异步
优势
动作评价
算法
在线阅读
下载PDF
职称材料
基于自适应多目标强化学习的服务集成方法
6
作者
郭潇
李春山
+1 位作者
张宇跃
初佃辉
《计算机应用》
CSCD
北大核心
2022年第11期3500-3505,共6页
当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性...
当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性。针对上述问题,提出一种基于自适应多目标强化学习的服务集成方法,该方法在异步优势演员评论家(A3C)算法的框架下引入多目标优化策略,从而在满足用户需求的同时保证IoS生态系统的健康发展。所提方法可以根据遗憾值对多目标值集成权重进行动态调整,改善多目标强化学习中子目标值不平衡的现象。在真实大规模服务环境下进行了服务集成验证,实验结果表明所提方法相对于传统机器学习方法在大规模服务环境下求解速度更快;相较于权重固定的强化学习(RL),各目标的求解质量更均衡。
展开更多
关键词
服务集成
强化学习
异步
优势
演员评论家
算法
多目标优化
自适应权重
在线阅读
下载PDF
职称材料
题名
异步策略的强化因果发现方法
1
作者
张英
郭辉
机构
宁夏大学信息工程学院
出处
《燕山大学学报》
CAS
北大核心
2024年第4期356-368,共13页
基金
宁夏自然科学基金资助项目(2021AAC03117)。
文摘
研究和发掘事物之间的因果关系是数据科学的核心问题之一。针对因果发现面临着搜索空间超指数量级增长、评价指标低、收敛速度慢且效果差等问题,本文提出一种基于异步策略的强化因果发现方法。首先采用自注意力机制的编码器和单层解码器模型探索数据之间的因果关系;其次,改进强化学习模型中的结构约束,并基于异步优势算法更新网络模型参数;最后,搜索、输出最大奖励的有向无环图。通过实验对比验证了该方法的良好性能。
关键词
因果关系
有向无环图
强化因果发现
结构约束
异步优势算法
Keywords
causal relationship
directed acyclic graph
reinforcement causal discovery
structural constraint
asynchronous dominance algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于长短期记忆-异步优势动作评判的智能车汇入模型
被引量:
1
2
作者
吴思凡
杜煜
徐世杰
杨硕
杜晨
机构
北京联合大学
北京市信息服务工程重点实验室
出处
《汽车技术》
CSCD
北大核心
2019年第10期42-47,共6页
基金
国家自然科学基金项目(91420202)
北京联合大学研究生资助项目
文摘
针对以往强化学习中智能车汇入车流算法训练时间复杂度高、收敛速度慢的问题,提出基于长短期记忆-异步优势动作评判算法的智能车汇入模型。在异步优势动作评判算法的基础上,结合长短期记忆神经网络,有效地解决训练模型时间和模型收敛的问题。试验结果表明,该算法提高了模型收敛速度与汇入成功率,同时降低了时间复杂度,适合汇入车流场景。
关键词
智能车
汇入车流
异步
优势
动作评判
算法
长短期记忆神经网络
时间复杂度
收敛速度
Keywords
Intelligent vehicle
Vehicle merging
Asynchronous advantage actor critic algorithm
Long short-term memory neural network
Time complexity
Convergence speed
分类号
U461.99 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
基于A3C的认知物联网通信干扰消除算法
被引量:
1
3
作者
刘新梦
谢健骊
李翠然
王亦鸣
机构
兰州交通大学电子与信息工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第10期281-290,共10页
基金
国家自然科学基金(62161016)
甘肃省科技计划基金(20JR10RA273)
北京市高速铁路宽带移动通信工程技术研究中心(北京交通大学)开放课题基金资助(BHRC-2022-1)。
文摘
针对频谱资源干扰管理的智能化需求,提出一种基于异步优势行动者-评论家(A3C)的干扰消除算法,旨在应对认知物联网(CIoT)通信系统中由频谱资源共享引起的干扰问题。通过智能体的学习和优化,帮助次级用户(SU)在受到干扰影响时做出最优的决策,从而改善通信质量和系统性能。在该算法中,当SU遭受干扰影响通信质量时,智能体通过学习和优化,使SU能够根据当前的位置信息、发射功率、接收功率以及干扰程度选择最低干扰程度的行动,并执行该行动后获得的奖励。智能体通过尝试不同减少干扰的行动,并根据奖励的反馈调整策略,达到最大化定义干扰程度指标和信号质量指标的奖励函数的目的,从而最大程度地减少干扰对通信质量的影响。实验结果表明,与传统k-means算法以及深度递归Q网络(DRQN)和深度Q网络(DQN)优化算法相比,基于A3C的干扰消除算法具有更短的收敛时间、更高的执行效率以及更高的系统吞吐量,较3种基准方法在吞吐量性能上至少提高7%,能够有效地减少干扰对通信质量的不利影响。
关键词
认知物联网
干扰消除
异步
优势
行动者-评论家
算法
干扰程度
信号质量
吞吐量
Keywords
Cognitive Internet of Things(CIoT)
interference cancellation
Asynchronous Advantage Actor-Critic(A3C)algorithm
interference level
signal quality
throughput
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法
被引量:
2
4
作者
唐伦
文明艳
单贞贞
陈前斌
机构
重庆邮电大学通信与信息工程学院
重庆邮电大学移动通信重点实验室
出处
《电子与信息学报》
EI
CSCD
北大核心
2023年第7期2406-2414,共9页
基金
国家自然科学基金(62071078)
四川省科技计划(2021YFQ0053)
重庆市教委科学技术研究项目(KJZD-M201800601)。
文摘
智能驾驶中的碰撞避免任务存在对时延要求极高和隐私保护等挑战。首先,该文提出一种基于自适应调整参数的半异步联邦学习(SFLAAP)的门控循环单元联合支持向量机(GRU_SVM)碰撞多级预警算法,SFLAAP可根据训练和资源情况动态调整两个训练参数:本地训练次数和参与聚合的局部模型数量。然后,为解决资源受限的移动边缘计算(MEC)下碰撞预警模型协作训练的效率问题,根据上述参数与SFLAAP训练时延的关系,建立训练总时延最小化模型,并将其转化为马尔可夫决策过程(MDP)。最后,在所建立的MDP中采用异步优势演员-评论家(A3C)学习求解,自适应地确定最优训练参数,从而减少碰撞预警模型的训练完成时间。仿真结果表明,所提算法有效地降低训练总时延并保证预测精度。
关键词
碰撞预警
联邦学习
移动边缘计算
异步
优势
演员-评论家
算法
Keywords
Collision warning
Federated Learning(FL)
Mobile Edge Computing(MEC)
Asynchronous Advantage Actor-Critic(A3C)algorithm
分类号
TN929.5 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
矿山信息物理融合系统多节点智联策略
被引量:
4
5
作者
马洋锦
付茂全
许志
李敬兆
机构
安徽理工大学电气与信息工程学院
大同煤矿集团有限责任公司安全监管五人小组管理部
出处
《工矿自动化》
北大核心
2020年第3期38-42,48,共6页
基金
国家自然科学基金项目(51874010)
北京理工大学高精尖机器人开放性研究项目(2018IRS16)
物联网关键技术研究创新团队项目(201950ZX003)。
文摘
针对当前矿山信息物理融合系统(CPS)的通信节点无法与基于不同无线通信协议的感知节点实现智能连接的问题,在通信节点上集成多种通信模块构成多模态通信节点,提出了一种基于渐进式神经网络的矿山CPS多节点智联策略。采用渐进式神经网络控制多模态通信节点准确切换工作模态,实现异构无线通信网络自主建立;利用异步优势动作评价算法对渐进式神经网络进行深度训练,提高渐进式神经网络的收敛速度和训练精度。实验结果表明,该策略实现了多模态通信节点与多类感知节点之间的准确、可靠通信。
关键词
智慧矿山
矿山信息物理融合系统
多模态通信节点
渐进式神经网络
异步
优势
动作评价
算法
Keywords
smart mine
mine cyber-physical system
multi-mode communication node
progressive neural network
asynchronous advantage actor-critic algorithm
分类号
TD67 [矿业工程—矿山机电]
在线阅读
下载PDF
职称材料
题名
基于自适应多目标强化学习的服务集成方法
6
作者
郭潇
李春山
张宇跃
初佃辉
机构
哈尔滨工业大学(威海)计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2022年第11期3500-3505,共6页
基金
国家重点研发计划项目(2018YFB1402500)
国家自然科学基金资助项目(61902090,61832004)
山东省自然科学基金资助项目(ZR2020KF019)。
文摘
当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性。针对上述问题,提出一种基于自适应多目标强化学习的服务集成方法,该方法在异步优势演员评论家(A3C)算法的框架下引入多目标优化策略,从而在满足用户需求的同时保证IoS生态系统的健康发展。所提方法可以根据遗憾值对多目标值集成权重进行动态调整,改善多目标强化学习中子目标值不平衡的现象。在真实大规模服务环境下进行了服务集成验证,实验结果表明所提方法相对于传统机器学习方法在大规模服务环境下求解速度更快;相较于权重固定的强化学习(RL),各目标的求解质量更均衡。
关键词
服务集成
强化学习
异步
优势
演员评论家
算法
多目标优化
自适应权重
Keywords
service integration
Reinforcement Learning(RL)
Asynchronous Advantage Actor‑Critic(A3C)algorithm
multi‑objective optimization
adaptive weight
分类号
TP315 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
异步策略的强化因果发现方法
张英
郭辉
《燕山大学学报》
CAS
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
基于长短期记忆-异步优势动作评判的智能车汇入模型
吴思凡
杜煜
徐世杰
杨硕
杜晨
《汽车技术》
CSCD
北大核心
2019
1
在线阅读
下载PDF
职称材料
3
基于A3C的认知物联网通信干扰消除算法
刘新梦
谢健骊
李翠然
王亦鸣
《计算机工程》
CAS
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
4
移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法
唐伦
文明艳
单贞贞
陈前斌
《电子与信息学报》
EI
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
5
矿山信息物理融合系统多节点智联策略
马洋锦
付茂全
许志
李敬兆
《工矿自动化》
北大核心
2020
4
在线阅读
下载PDF
职称材料
6
基于自适应多目标强化学习的服务集成方法
郭潇
李春山
张宇跃
初佃辉
《计算机应用》
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部