|
1
|
基于柔性演员-评论家算法的决策规划协同研究 |
唐斌
刘光耀
江浩斌
田宁
米伟
王春宏
|
《交通运输系统工程与信息》
EI
CSCD
北大核心
|
2024 |
3
|
|
|
2
|
带最大熵修正的行动者评论家算法 |
姜玉斌
刘全
胡智慧
|
《计算机学报》
EI
CSCD
北大核心
|
2020 |
6
|
|
|
3
|
基于优势演员-评论家算法的强化自动摘要模型 |
杜嘻嘻
程华
房一泉
|
《计算机应用》
CSCD
北大核心
|
2021 |
7
|
|
|
4
|
基于优势演员-评论家算法的危险货物集装箱堆场安全堆存空间分配 |
沈阳
黄诚
宓为建
|
《上海海事大学学报》
北大核心
|
2022 |
0 |
|
|
5
|
基于Actor-Critic算法的无人机集群任务分配方法 |
苏瑞
龚俊
张鸿宇
|
《兵工自动化》
北大核心
|
2025 |
0 |
|
|
6
|
一种用于连续动作空间的最小二乘行动者-评论家方法 |
朱斐
刘全
傅启明
伏玉琛
|
《计算机研究与发展》
EI
CSCD
北大核心
|
2014 |
9
|
|
|
7
|
基于A3C的认知物联网通信干扰消除算法 |
刘新梦
谢健骊
李翠然
王亦鸣
|
《计算机工程》
CAS
CSCD
北大核心
|
2024 |
1
|
|
|
8
|
基于SAC的桥式起重机智能防摇控制 |
唐伟强
王伟
马瑞
许天鹏
|
《中国工程机械学报》
北大核心
|
2025 |
0 |
|
|
9
|
考虑进站策略的网联电动公交车节能驾驶优化研究 |
南斯睿
于谦
李铁柱
尚赞娣
陈海波
|
《交通运输系统工程与信息》
北大核心
|
2025 |
0 |
|
|
10
|
基于多域联合的无人机集群认知抗干扰算法 |
刘春玲
刘敏提
丁元明
|
《计算机工程》
CAS
CSCD
北大核心
|
2020 |
11
|
|
|
11
|
移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法 |
唐伦
文明艳
单贞贞
陈前斌
|
《电子与信息学报》
EI
CSCD
北大核心
|
2023 |
2
|
|
|
12
|
融合强化学习的分阶段策略求解旅行背包问题 |
章政
夏小云
陈泽丰
向毅
|
《计算机工程与科学》
北大核心
|
2025 |
1
|
|
|
13
|
一种针对坦克速度控制的深度强化学习算法 |
崔新悦
阳周明
赵彦东
杨霄
范玲瑜
|
《火力与指挥控制》
CSCD
北大核心
|
2022 |
1
|
|
|
14
|
基于随机加权三重Q学习的异策略最大熵强化学习算法 |
范静宇
刘全
|
《计算机科学》
CSCD
北大核心
|
2022 |
2
|
|
|
15
|
基于多层注意力机制—柔性AC算法的机器人路径规划 |
韩金亮
任海菁
吴淞玮
蒋欣欣
刘凤凯
|
《计算机应用研究》
CSCD
北大核心
|
2020 |
5
|
|
|
16
|
基于最大熵深度强化学习的双足机器人步态控制方法 |
李源潮
陶重犇
王琛
|
《计算机应用》
CSCD
北大核心
|
2024 |
3
|
|
|
17
|
基于深度强化学习的电子政务云动态化任务调度方法 |
龙宇杰
修熙
黄庆
黄晓勉
李莹
吴维刚
|
《计算机应用研究》
CSCD
北大核心
|
2024 |
2
|
|
|
18
|
基于深度强化学习的机械臂多模混合控制 |
李家乐
张建锋
李彬
刘天琅
陈检
|
《计算机工程与设计》
北大核心
|
2024 |
1
|
|
|
19
|
一种平衡探索和利用的优先经验回放方法 |
张佳能
李辉
吴昊霖
王壮
|
《计算机科学》
CSCD
北大核心
|
2022 |
2
|
|
|
20
|
基于自适应多目标强化学习的服务集成方法 |
郭潇
李春山
张宇跃
初佃辉
|
《计算机应用》
CSCD
北大核心
|
2022 |
1
|
|