净生态系统CO_(2)交换量(NEE)和蒸散(ET)是表征半干旱区生态系统碳水循环能力的重要指标。对碳水通量动态变化的准确模拟和驱动机制的深入分析,有助于明确黄土高原半干旱区草地生态系统的功能及其对气候变化的响应。基于黄土高原铁杆蒿...净生态系统CO_(2)交换量(NEE)和蒸散(ET)是表征半干旱区生态系统碳水循环能力的重要指标。对碳水通量动态变化的准确模拟和驱动机制的深入分析,有助于明确黄土高原半干旱区草地生态系统的功能及其对气候变化的响应。基于黄土高原铁杆蒿草地生态系统2018—2022年日尺度通量观测数据,使用多元线性回归模型、机器学习模型(随机森林、支持向量机和人工神经网络模型)和融合生态学知识与机器学习的生态知识-机器学习(EML)模型分别对NEE和ET进行拟合。其中,有6种基于不同生态假设的EML模型用于拟合NEE,7种基于不同生态假设的EML模型用于拟合ET。最后构建拟合效果最好和解释能力最优的EML模型并探究环境和植被因素对NEE和ET的影响。结果表明:(1)包含了气象因素、土壤水分因素和植被因素的EML模型对NEE和ET的拟合效果最好,R2和RMSE分别为0.81和0.70 g C m^(-2)d^(-1),0.83和0.48 mm/d,MRE和MAE分别为1.72和0.48 g C m^(-2)d^(-1),0.29和0.30 mm/d。该模型在NEE和ET上的拟合能力较多元线性回归模型提升了24.62%和12.16%,较机器学习模型平均提升了13.02%和6.87%。(2)空气温度是NEE和ET的主要影响因素,重要性占比分别为63.12%和60.38%。6℃和22℃是草地NEE日均空气温度的阈值,在6—22℃之间NEE处于下降趋势,在22℃后NEE变为平稳趋势。0℃和22℃是草地ET日均空气温度的阈值,当空气温度大于22℃后,ET由上升趋势转变为平稳趋势。(3)土壤水分因素在NEE和ET的重要影响因素中的占比分别为17.13%和5.66%,NEE对土壤水分的敏感性高于ET。研究结果有助于完善半干旱区草地生态系统碳水通量的模拟方法,并明确其对环境和植被因素的响应。展开更多
离线强化学习(Offline RL)定义了从固定批次的数据集中学习的任务,能够规避与环境交互的风险,提高学习的效率与稳定性。其中优势加权行动者-评论家算法提出了一种将样本高效动态规划与最大似然策略更新相结合的方法,在利用大量离线数据...离线强化学习(Offline RL)定义了从固定批次的数据集中学习的任务,能够规避与环境交互的风险,提高学习的效率与稳定性。其中优势加权行动者-评论家算法提出了一种将样本高效动态规划与最大似然策略更新相结合的方法,在利用大量离线数据的同时,快速执行在线精细化策略的调整。但是该算法使用随机经验回放机制,同时行动者-评论家模型只采用一套行动者,数据采样与回放不平衡。针对以上问题,提出一种基于策略蒸馏并进行数据经验优选回放的优势加权双行动者-评论家算法(Advantage Weighted Double Actors-Critics Based on Policy Distillation with Data Experience Optimization and Replay,DOR-PDAWAC),该算法采用偏好新经验并重复回放新旧经验的机制,利用双行动者增加探索,并运用基于策略蒸馏的主从框架,将行动者分为主行为者和从行为者,提升协作效率。将所提算法应用到通用D4RL数据集中的MuJoCo任务上进行消融实验与对比实验,结果表明,其学习效率等均获得了更优的表现。展开更多
文摘净生态系统CO_(2)交换量(NEE)和蒸散(ET)是表征半干旱区生态系统碳水循环能力的重要指标。对碳水通量动态变化的准确模拟和驱动机制的深入分析,有助于明确黄土高原半干旱区草地生态系统的功能及其对气候变化的响应。基于黄土高原铁杆蒿草地生态系统2018—2022年日尺度通量观测数据,使用多元线性回归模型、机器学习模型(随机森林、支持向量机和人工神经网络模型)和融合生态学知识与机器学习的生态知识-机器学习(EML)模型分别对NEE和ET进行拟合。其中,有6种基于不同生态假设的EML模型用于拟合NEE,7种基于不同生态假设的EML模型用于拟合ET。最后构建拟合效果最好和解释能力最优的EML模型并探究环境和植被因素对NEE和ET的影响。结果表明:(1)包含了气象因素、土壤水分因素和植被因素的EML模型对NEE和ET的拟合效果最好,R2和RMSE分别为0.81和0.70 g C m^(-2)d^(-1),0.83和0.48 mm/d,MRE和MAE分别为1.72和0.48 g C m^(-2)d^(-1),0.29和0.30 mm/d。该模型在NEE和ET上的拟合能力较多元线性回归模型提升了24.62%和12.16%,较机器学习模型平均提升了13.02%和6.87%。(2)空气温度是NEE和ET的主要影响因素,重要性占比分别为63.12%和60.38%。6℃和22℃是草地NEE日均空气温度的阈值,在6—22℃之间NEE处于下降趋势,在22℃后NEE变为平稳趋势。0℃和22℃是草地ET日均空气温度的阈值,当空气温度大于22℃后,ET由上升趋势转变为平稳趋势。(3)土壤水分因素在NEE和ET的重要影响因素中的占比分别为17.13%和5.66%,NEE对土壤水分的敏感性高于ET。研究结果有助于完善半干旱区草地生态系统碳水通量的模拟方法,并明确其对环境和植被因素的响应。
文摘离线强化学习(Offline RL)定义了从固定批次的数据集中学习的任务,能够规避与环境交互的风险,提高学习的效率与稳定性。其中优势加权行动者-评论家算法提出了一种将样本高效动态规划与最大似然策略更新相结合的方法,在利用大量离线数据的同时,快速执行在线精细化策略的调整。但是该算法使用随机经验回放机制,同时行动者-评论家模型只采用一套行动者,数据采样与回放不平衡。针对以上问题,提出一种基于策略蒸馏并进行数据经验优选回放的优势加权双行动者-评论家算法(Advantage Weighted Double Actors-Critics Based on Policy Distillation with Data Experience Optimization and Replay,DOR-PDAWAC),该算法采用偏好新经验并重复回放新旧经验的机制,利用双行动者增加探索,并运用基于策略蒸馏的主从框架,将行动者分为主行为者和从行为者,提升协作效率。将所提算法应用到通用D4RL数据集中的MuJoCo任务上进行消融实验与对比实验,结果表明,其学习效率等均获得了更优的表现。