期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
平均报酬模型强化学习理论、算法及应用 被引量:4
1
作者 黄炳强 曹广益 李建华 《计算机工程》 CAS CSCD 北大核心 2007年第18期18-19,39,共3页
折扣报酬模型强化学习是目前强化学习研究的主流,但折扣因子的选取使得近期期望报酬的影响大于远期期望报酬的影响,而有时候较大远期期望报酬的策略有可能是最优的,因此比较合理的方法是采用平均报酬模型强化学习。该文介绍了平均报酬... 折扣报酬模型强化学习是目前强化学习研究的主流,但折扣因子的选取使得近期期望报酬的影响大于远期期望报酬的影响,而有时候较大远期期望报酬的策略有可能是最优的,因此比较合理的方法是采用平均报酬模型强化学习。该文介绍了平均报酬模型强化学习的两个主要算法以及主要应用。 展开更多
关键词 平均报酬强化学习 R学习 h学习
在线阅读 下载PDF
基于平均报酬模型的强化学习算法研究 被引量:1
2
作者 黄炳强 曹广益 +1 位作者 费燕琼 王占全 《上海理工大学学报》 EI CAS 北大核心 2006年第5期418-422,共5页
对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化... 对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化学习的主要应用及研究方向. 展开更多
关键词 平均报酬强化学习 R学习 h学习 LC学习
在线阅读 下载PDF
基于多变量GAMLSS模型的洪水理论分布研究 被引量:2
3
作者 邢贞相 刘昊奇 +6 位作者 刘明阳 喻熠 李根 王红利 李衡 付强 纪毅 《东北农业大学学报》 CAS CSCD 北大核心 2022年第4期59-69,共11页
为探讨水文数据非一致性对洪水频率分析的影响,提出基于位置、尺度、形状的广义可加模型(Generalized additive models for location,scale and shape,GAMLSS),从时间和降水两类因素出发,计算单变量、多变量洪水频率,分析经验点据与理... 为探讨水文数据非一致性对洪水频率分析的影响,提出基于位置、尺度、形状的广义可加模型(Generalized additive models for location,scale and shape,GAMLSS),从时间和降水两类因素出发,计算单变量、多变量洪水频率,分析经验点据与理论分位曲线拟合效果,选取不同变化条件下洪水适宜理论分布。以汤旺河流域为例,研究结果表明,单变量洪水频率最优分布选取较稳定,而受时间和降水因素影响,多变量洪水频率最优分布选取均不同。与前者相比,引入协变量使原序列参考时间连续性变化和降水极端信息,改进传统洪水频率计算方法。 展开更多
关键词 非一致性 GAMLSS模型 洪水频率分布 气候因子 h2o深度学习模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部