期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
问答式林业预训练语言模型ForestBERT 被引量:4
1
作者 谭晶维 张怀清 +2 位作者 刘洋 杨杰 郑东萍 《林业科学》 EI CAS CSCD 北大核心 2024年第9期99-110,共12页
【目的】针对林业文本利用率低、通用领域预训练语言模型对林业知识理解不足以及手动标注数据耗时费力等问题,基于大量林业文本,提出一种融合林业领域知识的预训练语言模型,并通过自动标注训练数据,高效实现林业抽取式问答,为林业决策... 【目的】针对林业文本利用率低、通用领域预训练语言模型对林业知识理解不足以及手动标注数据耗时费力等问题,基于大量林业文本,提出一种融合林业领域知识的预训练语言模型,并通过自动标注训练数据,高效实现林业抽取式问答,为林业决策管理提供智能化信息服务。【方法】首先,基于网络爬虫技术构建包含术语、法律法规和文献3个主题的林业语料库,使用该语料库对通用领域预训练语言模型BERT进行继续预训练,再通过掩码语言模型和下一句预测这2个任务进行自监督学习,使BERT能够有效地学习林业语义信息,得到具有林业文本通用特征的预训练语言模型ForestBERT。然后,对预训练语言模型mT5进行微调,实现样本的自动标注,通过人工校正后,构建包含3个主题共2280个样本的林业抽取式问答数据集。基于该数据集对BERT、RoBERTa、MacBERT、PERT、ELECTRA、LERT 6个通用领域的中文预训练语言模型以及本研究构建的ForestBERT进行训练和验证,以明确ForestBERT的优势。为探究不同主题对模型性能的影响,分别基于林业术语、林业法律法规、林业文献3个主题数据集对所有模型进行微调。将ForestBERT与BERT在林业文献中的问答结果进行可视化比较,以更直观展现ForestBERT的优势。【结果】ForestBERT在林业领域的抽取式问答任务中整体表现优于其他6个对比模型,与基础模型BERT相比,精确匹配(EM)分数和F1分数分别提升1.6%和1.72%,在另外5个模型的平均性能上也均提升0.96%。在各个模型最优划分比例下,ForestBERT在EM上分别优于BERT和其他5个模型2.12%和1.2%,在F1上分别优于1.88%和1.26%。此外,ForestBERT在3个林业主题上也均表现优异,术语、法律法规、文献任务的评估分数分别比其他6个模型平均提升3.06%、1.73%、2.76%。在所有模型中,术语任务表现最佳,F1的平均值达到87.63%,表现较差的法律法规也达到82.32%。在文献抽取式问答任务中,ForestBERT相比BERT可提供更准确、全面的答案。【结论】采用继续预训练的方式增强通用领域预训练语言模型的林业专业知识,可有效提升模型在林业抽取式问答任务中的表现,为林业文本和其他领域的文本处理和应用提供一种新思路。 展开更多
关键词 林业文本 BERT 预训练语言模型 特定领域预训练 抽取式问答任务 自然语言处理
在线阅读 下载PDF
基于MODIS数据的全国林灌草火点时空特征分析
2
作者 蒋凤 覃先林 +3 位作者 黄水生 胡心雨 杨馨媛 蒙方鑫 《中南林业科技大学学报》 CAS CSCD 北大核心 2024年第9期50-59,共10页
【目的】为在空间、时间尺度上对我国全域林灌草火灾发生特征有清晰的认知,进而对森林草原火灾预防决策提供参考。【方法】选用2003—2022年MODIS卫星火点数据产品和土地覆盖数据产品,以全国陆地区域作为研究范围,利用优化的热点分析方... 【目的】为在空间、时间尺度上对我国全域林灌草火灾发生特征有清晰的认知,进而对森林草原火灾预防决策提供参考。【方法】选用2003—2022年MODIS卫星火点数据产品和土地覆盖数据产品,以全国陆地区域作为研究范围,利用优化的热点分析方法来分析林灌草火点的空间分布特征;统计分析年际、月度以及我国传统节日林灌草火点的时间分布特征,并采用Mann-Kendall趋势分析法从年际、月度分析林灌草火点的时间变化趋势。【结果】1)林灌草火点的稠密区域主要分布在我国的广东省、云南省、广西壮族自治区和黑龙江省,稀疏区域主要分布在我国的河南省、河北省和山东省。2)属于草的卫星火点数量最多,主要发生在春季和冬季;属于灌丛的火点数量最少,主要发生在夏季。3)卫星火点数量在我国七大传统节日中占比排名前三的是:春节、清明节、劳动节。4)2003—2022年的年际和月度林灌草火点数量呈现波折起伏的走势,在年际变化上,2015年为全国火点数量发生突变年;在月度上,5月是火点数量发生突变的月份。【结论】1)我国南部火点稠密,中东部火点稀疏,且2003—2022年疏密区域未发生明显迁移,因而在实施防火部署时可进行差异化管理。2)春、冬两季草地分布的区域以及阔叶林分布区域在春、夏两季需加强防火管理。 展开更多
关键词 森林防火 MODIS Mann-Kendall趋势分析 优化的热点分析法 时空分布规律
在线阅读 下载PDF
基于多时相Sentinel-2影像和SNIC分割算法的优势树种识别 被引量:7
3
作者 岳巍 李世明 +3 位作者 李增元 刘清旺 庞勇 斯林 《林业科学》 EI CAS CSCD 北大核心 2022年第9期60-69,共10页
【目的】探究将简单非迭代聚类超像素分割算法(SNIC)融合到基于多时相数据的树种分类问题中,并对比分析不同时相数据组合对分类结果的影响,实现更高效、更精准的优势树种识别。【方法】以内蒙古旺业甸林场为研究区,在Google Earth Engin... 【目的】探究将简单非迭代聚类超像素分割算法(SNIC)融合到基于多时相数据的树种分类问题中,并对比分析不同时相数据组合对分类结果的影响,实现更高效、更精准的优势树种识别。【方法】以内蒙古旺业甸林场为研究区,在Google Earth Engine(GEE)云计算平台上利用多时相Sentinel-2多光谱数据提取波段反射率特征和光谱指数特征,采用SNIC和支持向量机(SVM)机器学习分类方法,实现面向对象的优势树种识别,并分析不同时相数据组合对优势树种识别精度的影响。【结果】多时相数据组合的分类精度明显高于各季节单时相数据。对比不同多时相数据组合分类结果,春、秋2个季节时间序列组合数据的分类精度与多季节组合数据结果相近,总体精度分别为94.5%、95.0%和95.8%。【结论】基于多时相Sentinel-2影像和SNIC分割算法的面向对象分类方法能够快速、准确识别优势树种,多季节组合数据的分类结果最优,春、秋2个季节时间序列数据也能获得较好分类结果,总体精度与最优结果差距较小。 展开更多
关键词 多时相 简单非迭代聚类超像素分割算法 树种识别 时间序列
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部