|
1
|
基于强化学习的合作线性二次微分博弈研究 |
赵子豪
彭称称
张维海
|
《山东科技大学学报(自然科学版)》
北大核心
|
2025 |
0 |
|
|
2
|
基于AUTOSAR的汽车控制器软件优化部署研究 |
邹渊
马文斌
张旭东
翟建阳
张兆龙
|
《北京理工大学学报》
EI
CAS
CSCD
北大核心
|
2024 |
1
|
|
|
3
|
基于强化学习的任务型对话策略研究综述 |
徐恺
王振宇
王旭
秦华
龙宇轩
|
《计算机学报》
EI
CAS
CSCD
北大核心
|
2024 |
4
|
|
|
4
|
基于类人行为表征的场景可迁移决策控制方法 |
王昊阳
吕超
党睿娜
尹俭芳
孟静
龚乘
|
《北京理工大学学报》
EI
CAS
CSCD
北大核心
|
2024 |
0 |
|
|
5
|
基于连续时间半马尔可夫决策过程的Option算法 |
唐昊
张晓艳
韩江洪
周雷
|
《计算机学报》
EI
CSCD
北大核心
|
2014 |
3
|
|
|
6
|
基于平均报酬模型的强化学习算法研究 |
黄炳强
曹广益
费燕琼
王占全
|
《上海理工大学学报》
EI
CAS
北大核心
|
2006 |
1
|
|
|
7
|
基于多时隙业务联合整形的低能耗资源调度方法 |
李建东
牛淳隆
赵晨曦
刘俊宇
|
《中兴通讯技术》
|
2023 |
2
|
|
|
8
|
莞惠城际轨道交通工程深基坑施工对邻近建筑物的影响及控制分析 |
王凯椿
|
《隧道建设》
|
2014 |
8
|
|