1
|
基于序贯检测的快速马尔可夫决策:理论、方法及应用 |
陈祖旭
陈巍
李长坤
韩宇星
|
《信号处理》
北大核心
|
2025 |
1
|
|
2
|
基于部分可观察马尔可夫决策过程的受控无线网络系统动态资源分配 |
李萌
司鹏搏
孙恩昌
张延华
|
《高技术通讯》
北大核心
|
2017 |
2
|
|
3
|
基于马尔可夫决策过程的接纳控制模型研究 |
史继飞
刘婷
李浩
|
《计算机应用研究》
CSCD
北大核心
|
2014 |
3
|
|
4
|
受控排队系统的平均最优与约束平均最优 |
张兰兰
郭先平
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|
5
|
室内环境下基于边际约束的快速路径自主探索算法 |
徐晓苏
梁紫依
杨博
王迪
|
《中国惯性技术学报》
EI
CSCD
北大核心
|
2019 |
4
|
|
6
|
基于融合经验安全强化学习的配电网电压控制 |
冯昌森
汤飞霞
王国烽
文福拴
张有兵
|
《电力系统自动化》
北大核心
|
2025 |
0 |
|
7
|
基于受限MDP的无模型安全强化学习方法 |
朱斐
葛洋洋
凌兴宏
刘全
|
《软件学报》
EI
CSCD
北大核心
|
2022 |
3
|
|
8
|
考虑主/被动资源约束的随机MDP项目调度优化 |
杨建卫
任晓莉
李乃乾
|
《计算机科学与探索》
CSCD
北大核心
|
2018 |
1
|
|
9
|
传感器工作时长约束及辐射控制的调度方法 |
乔成林
段修生
单甘霖
王俭臣
|
《探测与控制学报》
CSCD
北大核心
|
2018 |
5
|
|
10
|
面向实际信道观测环境的时限约束无线下行调度策略 |
张帆
宫傲宇
邓磊
刘芳
林艳
张一晋
|
《计算机科学》
CSCD
北大核心
|
2021 |
0 |
|
11
|
基于安全深度强化学习的电网有功频率协同优化控制 |
周毅
周良才
史迪
赵小英
闪鑫
|
《上海交通大学学报》
EI
CAS
CSCD
北大核心
|
2024 |
1
|
|
12
|
一种基于认知无线电技术的能效传输控制方案 |
朱江
黄海洋
李少谦
|
《计算机工程与应用》
CSCD
北大核心
|
2008 |
0 |
|
13
|
安全强化学习及其在机器人系统中的应用综述 |
张昌昕
张兴龙
徐昕
陆阳
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2023 |
3
|
|