|
1
|
基于分层马尔可夫决策过程的AUV全局路径规划研究 |
洪晔
王宏健
边信黔
|
《系统仿真学报》
EI
CAS
CSCD
北大核心
|
2008 |
3
|
|
|
2
|
分层网络中基于马尔可夫决策过程的能效优先的接纳控制和业务转移算法 |
潘军
张文逸
|
《中国科学技术大学学报》
CAS
CSCD
北大核心
|
2014 |
1
|
|
|
3
|
基于HMDP的无人机三维路径规划 |
洪晔
房建成
|
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
|
2009 |
8
|
|
|
4
|
分层强化学习研究进展 |
彭志平
李绍平
|
《计算机应用研究》
CSCD
北大核心
|
2008 |
7
|
|
|
5
|
基于分层POMDP的智能轮椅行为控制方法 |
陶永
王田苗
魏洪兴
陈殿生
|
《高技术通讯》
CAS
CSCD
北大核心
|
2010 |
3
|
|
|
6
|
基于符号知识的选项发现方法 |
王麒迪
沈立炜
吴天一
|
《计算机科学》
北大核心
|
2025 |
0 |
|
|
7
|
深度分层强化学习研究与发展 |
黄志刚
刘全
张立华
曹家庆
朱斐
|
《软件学报》
EI
CSCD
北大核心
|
2023 |
9
|
|
|
8
|
分层强化学习综述 |
周文吉
俞扬
|
《智能系统学报》
CSCD
北大核心
|
2017 |
21
|
|
|
9
|
基于深度强化学习的家庭能量管理分层优化策略 |
张甜
赵奇
陈中
王瑞升
邢强
田江
|
《电力系统自动化》
EI
CSCD
北大核心
|
2021 |
17
|
|
|
10
|
基于动作空间划分的MAXQ自动分层方法 |
王奇
秦进
|
《计算机应用》
CSCD
北大核心
|
2017 |
0 |
|
|
11
|
基于分层强化学习的智能化攻击路径发现方法 |
曾庆伟
张国敏
邢长友
宋丽华
|
《计算机科学》
CSCD
北大核心
|
2023 |
4
|
|
|
12
|
电力线路巡检飞行机器人三维轨迹生成方法 |
柳长安
杨国田
吴华
周宏
|
《同济大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2010 |
2
|
|
|
13
|
家庭基站网络中基于移动和业务的接纳控制算法 |
潘军
张文逸
|
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
|
2014 |
0 |
|