随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,...随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。展开更多
净生态系统CO_(2)交换量(NEE)和蒸散(ET)是表征半干旱区生态系统碳水循环能力的重要指标。对碳水通量动态变化的准确模拟和驱动机制的深入分析,有助于明确黄土高原半干旱区草地生态系统的功能及其对气候变化的响应。基于黄土高原铁杆蒿...净生态系统CO_(2)交换量(NEE)和蒸散(ET)是表征半干旱区生态系统碳水循环能力的重要指标。对碳水通量动态变化的准确模拟和驱动机制的深入分析,有助于明确黄土高原半干旱区草地生态系统的功能及其对气候变化的响应。基于黄土高原铁杆蒿草地生态系统2018—2022年日尺度通量观测数据,使用多元线性回归模型、机器学习模型(随机森林、支持向量机和人工神经网络模型)和融合生态学知识与机器学习的生态知识-机器学习(EML)模型分别对NEE和ET进行拟合。其中,有6种基于不同生态假设的EML模型用于拟合NEE,7种基于不同生态假设的EML模型用于拟合ET。最后构建拟合效果最好和解释能力最优的EML模型并探究环境和植被因素对NEE和ET的影响。结果表明:(1)包含了气象因素、土壤水分因素和植被因素的EML模型对NEE和ET的拟合效果最好,R2和RMSE分别为0.81和0.70 g C m^(-2)d^(-1),0.83和0.48 mm/d,MRE和MAE分别为1.72和0.48 g C m^(-2)d^(-1),0.29和0.30 mm/d。该模型在NEE和ET上的拟合能力较多元线性回归模型提升了24.62%和12.16%,较机器学习模型平均提升了13.02%和6.87%。(2)空气温度是NEE和ET的主要影响因素,重要性占比分别为63.12%和60.38%。6℃和22℃是草地NEE日均空气温度的阈值,在6—22℃之间NEE处于下降趋势,在22℃后NEE变为平稳趋势。0℃和22℃是草地ET日均空气温度的阈值,当空气温度大于22℃后,ET由上升趋势转变为平稳趋势。(3)土壤水分因素在NEE和ET的重要影响因素中的占比分别为17.13%和5.66%,NEE对土壤水分的敏感性高于ET。研究结果有助于完善半干旱区草地生态系统碳水通量的模拟方法,并明确其对环境和植被因素的响应。展开更多
文摘随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。
文摘净生态系统CO_(2)交换量(NEE)和蒸散(ET)是表征半干旱区生态系统碳水循环能力的重要指标。对碳水通量动态变化的准确模拟和驱动机制的深入分析,有助于明确黄土高原半干旱区草地生态系统的功能及其对气候变化的响应。基于黄土高原铁杆蒿草地生态系统2018—2022年日尺度通量观测数据,使用多元线性回归模型、机器学习模型(随机森林、支持向量机和人工神经网络模型)和融合生态学知识与机器学习的生态知识-机器学习(EML)模型分别对NEE和ET进行拟合。其中,有6种基于不同生态假设的EML模型用于拟合NEE,7种基于不同生态假设的EML模型用于拟合ET。最后构建拟合效果最好和解释能力最优的EML模型并探究环境和植被因素对NEE和ET的影响。结果表明:(1)包含了气象因素、土壤水分因素和植被因素的EML模型对NEE和ET的拟合效果最好,R2和RMSE分别为0.81和0.70 g C m^(-2)d^(-1),0.83和0.48 mm/d,MRE和MAE分别为1.72和0.48 g C m^(-2)d^(-1),0.29和0.30 mm/d。该模型在NEE和ET上的拟合能力较多元线性回归模型提升了24.62%和12.16%,较机器学习模型平均提升了13.02%和6.87%。(2)空气温度是NEE和ET的主要影响因素,重要性占比分别为63.12%和60.38%。6℃和22℃是草地NEE日均空气温度的阈值,在6—22℃之间NEE处于下降趋势,在22℃后NEE变为平稳趋势。0℃和22℃是草地ET日均空气温度的阈值,当空气温度大于22℃后,ET由上升趋势转变为平稳趋势。(3)土壤水分因素在NEE和ET的重要影响因素中的占比分别为17.13%和5.66%,NEE对土壤水分的敏感性高于ET。研究结果有助于完善半干旱区草地生态系统碳水通量的模拟方法,并明确其对环境和植被因素的响应。