1
|
基于二阶价值梯度模型强化学习的工业过程控制方法 |
张博
潘福成
周晓锋
李帅
|
《计算机应用研究》
CSCD
北大核心
|
2024 |
1
|
|
2
|
无模型强化学习研究综述 |
秦智慧
李宁
刘晓彤
刘秀磊
佟强
刘旭红
|
《计算机科学》
CSCD
北大核心
|
2021 |
36
|
|
3
|
一种基于确定性环境模型的离线强化学习方法 |
汤瑞航
黄初华
秦进
|
《计算机应用研究》
北大核心
|
2025 |
0 |
|
4
|
柠檬酸三钙中和过程的强化学习优化控制 |
祝丽娜
苗茂栋
金赛
赵忠盖
孙福新
石贵阳
刘飞
|
《化工学报》
北大核心
|
2025 |
0 |
|
5
|
潜在空间中的策略搜索强化学习方法 |
赵婷婷
王莹
孙威
陈亚瑞
王嫄
杨巨成
|
《计算机科学与探索》
CSCD
北大核心
|
2024 |
0 |
|
6
|
模型化强化学习研究综述 |
赵婷婷
孔乐
韩雅杰
任德华
陈亚瑞
|
《计算机科学与探索》
CSCD
北大核心
|
2020 |
14
|
|
7
|
一种基于Agent团队的强化学习模型与应用研究 |
蔡庆生
张波
|
《计算机研究与发展》
EI
CSCD
北大核心
|
2000 |
31
|
|
8
|
基于模型的强化学习中可学习的样本加权机制 |
黄文振
尹奇跃
张俊格
黄凯奇
|
《软件学报》
EI
CSCD
北大核心
|
2023 |
3
|
|
9
|
基于强化学习的机器人曲面恒力跟踪研究 |
张铁
肖蒙
邹焱飚
肖佳栋
|
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
|
2019 |
8
|
|
10
|
基于平均场内生奖励的多智能体强化学习算法 |
孙文绮
李大鹏
田峰
丁良辉
|
《无线电通信技术》
|
2023 |
0 |
|
11
|
基于无模型深度强化学习的煤泥浮选智能控制研究 |
秦新凯
王然风
付翔
窦治衡
李品钰
|
《工矿自动化》
|
2025 |
|
|
12
|
基于高斯回归的连续空间多智能体跟踪学习 |
陈鑫
魏海军
吴敏
曹卫华
|
《自动化学报》
EI
CSCD
北大核心
|
2013 |
2
|
|
13
|
基于时序差分学习的充电站有序充电方法 |
江明
许庆强
季振亚
|
《电力工程技术》
北大核心
|
2021 |
11
|
|
14
|
一类供应链中考虑公平关切的学习效应行为实验研究 |
陈俊霖
赵晓波
宋亚楠
陈建铭
|
《运筹与管理》
CSSCI
CSCD
北大核心
|
2015 |
5
|
|
15
|
基于模型的功能磁共振成像方法研究综述 |
陈富琴
张俊然
杨冰
|
《中国生物医学工程学报》
CAS
CSCD
北大核心
|
2016 |
1
|
|
16
|
人际互动中社会学习的计算神经机制 |
黎穗卿
陈新玲
翟瑜竹
张怡洁
章植鑫
封春亮
|
《心理科学进展》
CSSCI
CSCD
北大核心
|
2021 |
6
|
|