外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模...外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。展开更多
本文全面、科学地梳理了紫茎泽兰研究领域的发展脉络和研究趋势,为紫茎泽兰的科学防除和资源化利用提供参考。通过对Web of Science数据库中紫茎泽兰研究文献的分析,着重考察了紫茎泽兰研究的整体发表时间分布、主要研究机构、研究内容...本文全面、科学地梳理了紫茎泽兰研究领域的发展脉络和研究趋势,为紫茎泽兰的科学防除和资源化利用提供参考。通过对Web of Science数据库中紫茎泽兰研究文献的分析,着重考察了紫茎泽兰研究的整体发表时间分布、主要研究机构、研究内容及研究热点等方面的问题,并运用文献计量软件VOSviewer进行进一步分析。结果表明:紫茎泽兰研究处于平稳发展阶段,中国在该领域处于主导地位,主要研究机构为国内各高校和科研院所,研究机构及团队关联分析显示各研究单元之间的合作交流仍有待加强。紫茎泽兰研究范围逐步拓宽,尤其是在探究其生长特性、化感作用、入侵机制、动物中毒机制及其他生物活性方面取得了良好的进展,但在紫茎泽兰的防治方面仍缺乏有效方法,且其资源化利用尚未多样化。因此,我们需要进一步加强紫茎泽兰的防治技术研究,同时探索其资源化利用的新途径。展开更多
文摘外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。
文摘本文全面、科学地梳理了紫茎泽兰研究领域的发展脉络和研究趋势,为紫茎泽兰的科学防除和资源化利用提供参考。通过对Web of Science数据库中紫茎泽兰研究文献的分析,着重考察了紫茎泽兰研究的整体发表时间分布、主要研究机构、研究内容及研究热点等方面的问题,并运用文献计量软件VOSviewer进行进一步分析。结果表明:紫茎泽兰研究处于平稳发展阶段,中国在该领域处于主导地位,主要研究机构为国内各高校和科研院所,研究机构及团队关联分析显示各研究单元之间的合作交流仍有待加强。紫茎泽兰研究范围逐步拓宽,尤其是在探究其生长特性、化感作用、入侵机制、动物中毒机制及其他生物活性方面取得了良好的进展,但在紫茎泽兰的防治方面仍缺乏有效方法,且其资源化利用尚未多样化。因此,我们需要进一步加强紫茎泽兰的防治技术研究,同时探索其资源化利用的新途径。