1
|
随机模型检测连续时间Markov过程 |
钮俊
曾国荪
吕新荣
徐畅
|
《计算机科学》
CSCD
北大核心
|
2011 |
2
|
|
2
|
连续时间部分可观Markov决策过程的策略梯度估计 |
唐波
李衍杰
殷保群
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|
3
|
基于连续时间半马尔可夫决策过程的Option算法 |
唐昊
张晓艳
韩江洪
周雷
|
《计算机学报》
EI
CSCD
北大核心
|
2014 |
3
|
|
4
|
连续时间Markov控制过程的平均代价最优鲁棒控制策略 |
唐昊
韩江洪
高隽
|
《中国科学技术大学学报》
CAS
CSCD
北大核心
|
2004 |
4
|
|
5
|
连续时间马氏决策过程——最优策略对折扣因子的灵敏度分析 |
朱益民
|
《浙江工业大学学报》
CAS
|
1999 |
1
|
|
6
|
基于离散Markov决策过程的发电公司多阶段决策 |
张宏刚
宋依群
|
《上海交通大学学报》
EI
CAS
CSCD
北大核心
|
2004 |
2
|
|
7
|
基于连续时间马尔可夫过程的证券投资策略 |
崔海波
赵希男
梁好
潘德惠
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2003 |
1
|
|
8
|
Q(f)-过程非唯一时连续时间折扣目标MDP |
郭先平
|
《湖南师范大学自然科学学报》
CAS
|
1996 |
0 |
|
9
|
Markov控制过程基于性能势仿真的并行优化 |
高旭东
殷保群
唐昊
奚宏生
|
《系统仿真学报》
CAS
CSCD
|
2003 |
1
|
|
10
|
基于BER和CTMC的航天器发射组织过程可靠度模型 |
董学军
白国庆
陈英武
|
《国防科技大学学报》
EI
CAS
CSCD
北大核心
|
2013 |
0 |
|
11
|
Polish空间上的折扣马氏过程量子化策略的渐近优化 |
吴晓
孔荫莹
郭圳滨
|
《数学物理学报(A辑)》
CSCD
北大核心
|
2022 |
0 |
|
12
|
事件驱动Q学习在呼叫接入控制中的应用 |
任付彪
周雷
马学森
魏振春
|
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
|
2011 |
0 |
|
13
|
受控排队系统的平均最优与约束平均最优 |
张兰兰
郭先平
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|