1
连续时间部分可观Markov决策过程的策略梯度估计
唐波
李衍杰
殷保群
《控制理论与应用》
EI
CAS
CSCD
北大核心
2009
1
2
有限规划水平部分可观Markov自适应决策过程的参数决策
李江红
韩正之
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2000
0
3
基于部分可观马氏决策过程的多平台主被动传感器调度
张子宁
单甘霖
段修生
《电子学报》
EI
CAS
CSCD
北大核心
2014
4
4
基于部分可观察马尔可夫决策过程的受控无线网络系统动态资源分配
李萌
司鹏搏
孙恩昌
张延华
《高技术通讯》
北大核心
2017
2
5
部分可观测Markov环境下的激励学习综述
谢丽娟
陈焕文
《长沙电力学院学报(自然科学版)》
2002
0
6
部分可观环境中AUV软件自修复模型研究
张汝波
孟雷
史长亭
《计算机工程与应用》
CSCD
北大核心
2017
1
7
采用马氏决策过程和后验克拉美罗下界的多被动式移动传感器长期调度方法
徐公国
单甘霖
段修生
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2019
1
8
基于分层POMDP的智能轮椅行为控制方法
陶永
王田苗
魏洪兴
陈殿生
《高技术通讯》
CAS
CSCD
北大核心
2010
3
9
异构无线传感器网络中基于POMDP的实时调度算法
冯延蓬
仵博
郑红燕
《仪表技术与传感器》
CSCD
北大核心
2012
2
10
求解POMDP的动态合并激励学习算法
殷苌茗
王汉兴
陈焕文
谢丽娟
《计算机工程》
EI
CAS
CSCD
北大核心
2005
1
11
SHP-VI:一种基于最短哈密顿通路的POMDP值迭代算法
冯奇
周雪忠
黄厚宽
张小平
《计算机研究与发展》
EI
CSCD
北大核心
2011
1
12
基于FPOMDP的无线传感器网络动态调度算法
冯延蓬
仵博
郑红燕
《计算机应用与软件》
CSCD
北大核心
2012
1
13
基于IMM的无人机在线路径规划决策建模
杨啟明
徐建城
田海宝
吴勇
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2018
8
14
基于实例的POMDP问题的近似求解
修国明
张积滨
潘启树
《计算机工程与应用》
CSCD
北大核心
2008
0
15
基于一阶信念点的一阶POMDP值迭代算法研究
陈丽娜
黄宏斌
邓苏
《计算机工程与应用》
CSCD
2012
0
16
分布式业务系统基于模型的接入控制方案(英文)
陆效农
殷保群
张海鹏
凌强
《中国科学技术大学学报》
CAS
CSCD
北大核心
2012
1
17
面向跟踪任务需求的主动传感器调度方法
乔成林
单甘霖
段修生
刘欣怡
《系统工程与电子技术》
EI
CSCD
北大核心
2017
7
18
面向目标跟踪的单平台主被动传感器长期调度
单甘霖
张子宁
《系统工程与电子技术》
EI
CSCD
北大核心
2014
7
19
U-Clustering:基于效用聚类的激励学习算法
陈焕文
殷苌茗
谢丽娟
《计算机工程与应用》
CSCD
北大核心
2005
0
20
优化策略模型下的匹配律算法
程振波
邓志东
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009
0