检索结果-维普期刊中文期刊服务平台

平均报酬模型强化学习理论、算法及应用被引量：4: 1; 作者黄炳强曹广益李建华《计算机工程》 CAS CSCD 北大核心 2007年第18期18-19,39,共3页; 折扣报酬模型强化学习是目前强化学习研究的主流,但折扣因子的选取使得近期期望报酬的影响大于远期期望报酬的影响,而有时候较大远期期望报酬的策略有可能是最优的,因此比较合理的方法是采用平均报酬模型强化学习。该文介绍了平均报酬... 展开更多; 关键词平均报酬强化学习 R学习 h学习; 在线阅读下载PDF 职称材料

基于平均报酬模型的强化学习算法研究被引量：1: 2; 作者黄炳强曹广益 +1 位作者费燕琼王占全《上海理工大学学报》 EI CAS 北大核心 2006年第5期418-422,共5页; 对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化... 展开更多; 关键词平均报酬强化学习 R学习 h学习 LC学习; 在线阅读下载PDF 职称材料

基于多变量GAMLSS模型的洪水理论分布研究被引量：2: 3; 作者邢贞相刘昊奇 +6 位作者刘明阳喻熠李根王红利李衡付强纪毅《东北农业大学学报》 CAS CSCD 北大核心 2022年第4期59-69,共11页; 为探讨水文数据非一致性对洪水频率分析的影响,提出基于位置、尺度、形状的广义可加模型(Generalized additive models for location,scale and shape,GAMLSS),从时间和降水两类因素出发,计算单变量、多变量洪水频率,分析经验点据与理... 展开更多; 关键词非一致性 GAMLSS模型洪水频率分布气候因子 h2o深度学习模型; 在线阅读下载PDF 职称材料