|
1
|
基于柔性演员-评论家算法的决策规划协同研究 |
唐斌
刘光耀
江浩斌
田宁
米伟
王春宏
|
《交通运输系统工程与信息》
EI
CSCD
北大核心
|
2024 |
3
|
|
|
2
|
基于优势演员-评论家算法的强化自动摘要模型 |
杜嘻嘻
程华
房一泉
|
《计算机应用》
CSCD
北大核心
|
2021 |
7
|
|
|
3
|
基于优势演员-评论家算法的危险货物集装箱堆场安全堆存空间分配 |
沈阳
黄诚
宓为建
|
《上海海事大学学报》
北大核心
|
2022 |
0 |
|
|
4
|
基于Actor-Critic算法的无人机集群任务分配方法 |
苏瑞
龚俊
张鸿宇
|
《兵工自动化》
北大核心
|
2025 |
0 |
|
|
5
|
基于SAC的桥式起重机智能防摇控制 |
唐伟强
王伟
马瑞
许天鹏
|
《中国工程机械学报》
北大核心
|
2025 |
0 |
|
|
6
|
考虑进站策略的网联电动公交车节能驾驶优化研究 |
南斯睿
于谦
李铁柱
尚赞娣
陈海波
|
《交通运输系统工程与信息》
北大核心
|
2025 |
0 |
|
|
7
|
基于多域联合的无人机集群认知抗干扰算法 |
刘春玲
刘敏提
丁元明
|
《计算机工程》
CAS
CSCD
北大核心
|
2020 |
11
|
|
|
8
|
移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法 |
唐伦
文明艳
单贞贞
陈前斌
|
《电子与信息学报》
EI
CSCD
北大核心
|
2023 |
2
|
|
|
9
|
融合强化学习的分阶段策略求解旅行背包问题 |
章政
夏小云
陈泽丰
向毅
|
《计算机工程与科学》
北大核心
|
2025 |
1
|
|
|
10
|
基于深度强化学习的电子政务云动态化任务调度方法 |
龙宇杰
修熙
黄庆
黄晓勉
李莹
吴维刚
|
《计算机应用研究》
CSCD
北大核心
|
2024 |
2
|
|
|
11
|
基于最大熵深度强化学习的双足机器人步态控制方法 |
李源潮
陶重犇
王琛
|
《计算机应用》
CSCD
北大核心
|
2024 |
3
|
|
|
12
|
基于深度强化学习的机械臂多模混合控制 |
李家乐
张建锋
李彬
刘天琅
陈检
|
《计算机工程与设计》
北大核心
|
2024 |
1
|
|
|
13
|
基于自适应多目标强化学习的服务集成方法 |
郭潇
李春山
张宇跃
初佃辉
|
《计算机应用》
CSCD
北大核心
|
2022 |
1
|
|
|
14
|
基于改进强化学习的移动机器人动态避障方法 |
徐建华
邵康康
王佳惠
刘学聪
|
《中国惯性技术学报》
EI
CSCD
北大核心
|
2023 |
11
|
|
|
15
|
基于深度强化学习的柔性作业车间调度方法 |
崔雪艳
万烂军
赵昊鑫
李长云
|
《制造技术与机床》
北大核心
|
2023 |
5
|
|
|
16
|
基于优先经验回放的生成式SAC算法及其应用 |
张伟
李玉俊
谢雯雯
许耘嘉
孙庚
|
《吉林大学学报(理学版)》
|
2025 |
|
|
|
17
|
一种平衡探索和利用的优先经验回放方法 |
张佳能
李辉
吴昊霖
王壮
|
《计算机科学》
CSCD
北大核心
|
2022 |
2
|
|