|
1
|
部分可观测马尔可夫决策过程算法综述 |
桂林
武小悦
|
《系统工程与电子技术》
EI
CSCD
北大核心
|
2008 |
12
|
|
|
2
|
基于部分可观测马尔可夫决策过程的水声传感器网络介质访问控制协议 |
徐明
刘广钟
|
《计算机应用》
CSCD
北大核心
|
2015 |
2
|
|
|
3
|
连续时间部分可观Markov决策过程的策略梯度估计 |
唐波
李衍杰
殷保群
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|
|
4
|
有限规划水平部分可观Markov自适应决策过程的参数决策 |
李江红
韩正之
|
《上海交通大学学报》
EI
CAS
CSCD
北大核心
|
2000 |
0 |
|
|
5
|
部分可观测Markov环境下的激励学习综述 |
谢丽娟
陈焕文
|
《长沙电力学院学报(自然科学版)》
|
2002 |
0 |
|
|
6
|
部分可观测信息条件下系统最佳检修策略分析 |
尚永爽
许爱强
李文海
王怡苹
盛沛
|
《系统工程与电子技术》
EI
CSCD
北大核心
|
2012 |
4
|
|
|
7
|
基于MADDPG的多无人机协同攻击方法 |
张波
刘满国
刘梦焱
|
《弹箭与制导学报》
北大核心
|
2025 |
1
|
|
|
8
|
基于POMDP模型的检修与备件库存联合优化 |
汪凯
顾刘栋
周一帆
|
《中国机械工程》
北大核心
|
2025 |
0 |
|
|
9
|
面向关系建模的合作多智能体深度强化学习综述 |
熊丽琴
陈希亮
赖俊
骆西建
曹雷
|
《计算机工程与应用》
北大核心
|
2025 |
0 |
|
|
10
|
基于IMM的无人机在线路径规划决策建模 |
杨啟明
徐建城
田海宝
吴勇
|
《西北工业大学学报》
EI
CAS
CSCD
北大核心
|
2018 |
8
|
|
|
11
|
基于POMDP的可伸缩视频流优化决策调度 |
范凤军
邹君妮
汪敏
熊红凯
|
《上海交通大学学报》
EI
CAS
CSCD
北大核心
|
2010 |
1
|
|
|
12
|
POMDP在战场决策评估中的应用和仿真 |
王祥
林秀青
|
《现代防御技术》
北大核心
|
2008 |
1
|
|
|
13
|
基于POMDP模型的智能雷达干扰决策方法 |
冯路为
刘松涛
徐华志
|
《系统工程与电子技术》
EI
CSCD
北大核心
|
2023 |
1
|
|
|
14
|
面向实际信道观测环境的时限约束无线下行调度策略 |
张帆
宫傲宇
邓磊
刘芳
林艳
张一晋
|
《计算机科学》
CSCD
北大核心
|
2021 |
0 |
|
|
15
|
基于信息熵的POMDP模型观测函数估计 |
钟可立
王小捷
|
《中兴通讯技术》
|
2015 |
0 |
|
|
16
|
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法 |
王增福
杨广宇
金术玲
|
《雷达学报(中英文)》
EI
CSCD
北大核心
|
2024 |
2
|
|
|
17
|
基于深度注意力Q网络的机器人路径规划研究 |
马海杰
薛安虎
|
《传感器与微系统》
CSCD
北大核心
|
2024 |
2
|
|
|
18
|
基于深度强化学习的动态频谱智能干扰算法研究 |
张兰
张彪
梁天一
朱辉杰
|
《南京邮电大学学报(自然科学版)》
北大核心
|
2024 |
0 |
|
|
19
|
求解POMDP的动态合并激励学习算法 |
殷苌茗
王汉兴
陈焕文
谢丽娟
|
《计算机工程》
EI
CAS
CSCD
北大核心
|
2005 |
1
|
|
|
20
|
U-Clustering:基于效用聚类的激励学习算法 |
陈焕文
殷苌茗
谢丽娟
|
《计算机工程与应用》
CSCD
北大核心
|
2005 |
0 |
|