1
|
强化学习算法中启发式回报函数的设计及其收敛性分析 |
魏英姿
赵明扬
|
《计算机科学》
CSCD
北大核心
|
2005 |
13
|
|
2
|
回报函数学习的学徒学习综述 |
金卓军
钱徽
陈沈轶
朱淼良
|
《智能系统学报》
|
2009 |
2
|
|
3
|
风险决策中的回报和风险研究 |
刘海澜
林凤
|
《华东工业大学学报》
|
1997 |
1
|
|
4
|
基于强化学习算法的公交信号优先策略 |
舒波
李大铭
赵新良
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2012 |
4
|
|
5
|
基于强化学习的自主移动机器人反应式自救控制 |
王忠巍
曹其新
栾楠
张蕾
|
《上海交通大学学报》
EI
CAS
CSCD
北大核心
|
2009 |
2
|
|
6
|
考虑借贷过程的比例再保险最优控制模型 |
杨瑞成
刘坤会
|
《北方交通大学学报》
CSCD
北大核心
|
2003 |
6
|
|
7
|
基于参考模型的输出反馈强化学习控制 |
郝钏钏
方舟
李平
|
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
|
2013 |
1
|
|
8
|
基于倾向性分析的轨迹评测技术 |
金卓军
钱徽
朱淼良
|
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
|
2011 |
1
|
|
9
|
考虑运转费用的奇异随机收获模型的最优控制问题 |
杨瑞成
刘坤会
|
《北京交通大学学报》
EI
CAS
CSCD
北大核心
|
2005 |
1
|
|
10
|
带漂移因子及停时的最优脉冲随机控制问题(英文) |
杨瑞成
刘坤会
|
《工程数学学报》
CSCD
北大核心
|
2006 |
0 |
|
11
|
基于RDC-Q学习算法的移动机器人路径规划 |
王子强
武继刚
|
《计算机工程》
CAS
CSCD
|
2014 |
7
|
|
12
|
基于多阈值算法融合的图像分割 |
吕红力
|
《郑州轻工业学院学报(自然科学版)》
CAS
|
2014 |
0 |
|