|
1
|
基于连续时间半马尔可夫决策过程的Option算法 |
唐昊
张晓艳
韩江洪
周雷
|
《计算机学报》
EI
CSCD
北大核心
|
2014 |
3
|
|
|
2
|
基于连续时间马尔可夫过程的证券投资策略 |
崔海波
赵希男
梁好
潘德惠
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2003 |
1
|
|
|
3
|
基于马尔可夫决策过程的MES系统动态调度方法 |
赵海峰
姜兴宇
王贵和
王宛山
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2007 |
2
|
|
|
4
|
连续时间部分可观Markov决策过程的策略梯度估计 |
唐波
李衍杰
殷保群
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|
|
5
|
连续时间马氏决策过程——最优策略对折扣因子的灵敏度分析 |
朱益民
|
《浙江工业大学学报》
CAS
|
1999 |
1
|
|
|
6
|
随机模型检测连续时间Markov过程 |
钮俊
曾国荪
吕新荣
徐畅
|
《计算机科学》
CSCD
北大核心
|
2011 |
2
|
|
|
7
|
Q(f)-过程非唯一时连续时间折扣目标MDP |
郭先平
|
《湖南师范大学自然科学学报》
CAS
|
1996 |
0 |
|
|
8
|
连续时间可重入生产系统调度策略灵敏度分析 |
王利存
郑应平
|
《计算机集成制造系统-CIMS》
EI
CSCD
北大核心
|
2001 |
2
|
|
|
9
|
火控相控阵雷达的时间资源管理算法 |
秦童
戴奉周
刘宏伟
方明
|
《系统工程与电子技术》
EI
CSCD
北大核心
|
2016 |
9
|
|
|
10
|
企业知识系统柔性战略的决策模型 |
张新武
刘仲英
|
《管理科学学报》
CSSCI
|
2002 |
14
|
|
|
11
|
基于深度强化学习的新能源配电网双时间尺度无功电压优化 |
李鹏
姜磊
王加浩
夏辉
潘有朋
|
《中国电机工程学报》
EI
CSCD
北大核心
|
2023 |
29
|
|
|
12
|
Polish空间上的折扣马氏过程量子化策略的渐近优化 |
吴晓
孔荫莹
郭圳滨
|
《数学物理学报(A辑)》
CSCD
北大核心
|
2022 |
0 |
|
|
13
|
配电系统双时间尺度电压管理的深度强化学习方法 |
冯昌森
张瑜
谢路耀
文福拴
张凯怡
张有兵
|
《电力系统自动化》
EI
CSCD
北大核心
|
2022 |
10
|
|
|
14
|
基于随机恢复时间的骨盆骨折创伤患者手术分配优化 |
李清
苏强
邓国英
|
《运筹与管理》
CSSCI
CSCD
北大核心
|
2023 |
2
|
|
|
15
|
考虑不确定因素的多模式城市交通网络路径决策 |
李浩楠
曹成铉
柳雨彤
冯紫嫣
|
《科学技术与工程》
北大核心
|
2019 |
4
|
|
|
16
|
干扰惰性序列的连续决策模型模糊测试 |
吴泊逾
王凯锐
王亚文
王俊杰
|
《软件学报》
|
2025 |
|
|
|
17
|
耦合级联失效系统可靠性建模与分析 |
王琦
贾旭杰
翁宇如
田美玉
|
《运筹与管理》
CSSCI
CSCD
北大核心
|
2024 |
0 |
|
|
18
|
受控排队系统的平均最优与约束平均最优 |
张兰兰
郭先平
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|
|
19
|
动态武器目标分配问题的研究现状与展望 |
刘传波
邱志明
吴玲
王航宇
|
《电光与控制》
北大核心
|
2010 |
47
|
|
|
20
|
互联电网CPS调节指令动态最优分配Q–学习算法 |
余涛
王宇名
刘前进
|
《中国电机工程学报》
EI
CSCD
北大核心
|
2010 |
25
|
|