外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模...外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。展开更多
针对人工目视排查大型旋转过滤设备网片缺陷时存在的效率低下,缺陷与背景之间边界模糊及网孔中的小水珠产生反光现象等问题,提出了一个基于多维特征融合的高效网片缺陷检测算法。引入了泊松图像增强技术,实现了缺陷目标与正常背景区域...针对人工目视排查大型旋转过滤设备网片缺陷时存在的效率低下,缺陷与背景之间边界模糊及网孔中的小水珠产生反光现象等问题,提出了一个基于多维特征融合的高效网片缺陷检测算法。引入了泊松图像增强技术,实现了缺陷目标与正常背景区域的平滑融合,增加了小样本缺陷数量的同时解决了缺陷数量分布不均匀的问题。在YOLOv8中融入轻量多维卷积改进的C2fLWDC(C2flightweight multi-dimensional convolution)模块及加权多特征增强模块,既增强了网络对缺陷特征的提取又实现了各级特征的高效融合,提升了对多尺度缺陷样本的表征能力。采用EIOU(efficient intersection over union)定位损失函数,加速了对缺陷目标的准确定位。网片数据集检测结果表明,改进后的算法mAP(mean average precision)达到92%,相较于原始模型提升了16.8个百分点,能很好地完成缺陷目标的检测任务。展开更多
文摘外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。
文摘针对人工目视排查大型旋转过滤设备网片缺陷时存在的效率低下,缺陷与背景之间边界模糊及网孔中的小水珠产生反光现象等问题,提出了一个基于多维特征融合的高效网片缺陷检测算法。引入了泊松图像增强技术,实现了缺陷目标与正常背景区域的平滑融合,增加了小样本缺陷数量的同时解决了缺陷数量分布不均匀的问题。在YOLOv8中融入轻量多维卷积改进的C2fLWDC(C2flightweight multi-dimensional convolution)模块及加权多特征增强模块,既增强了网络对缺陷特征的提取又实现了各级特征的高效融合,提升了对多尺度缺陷样本的表征能力。采用EIOU(efficient intersection over union)定位损失函数,加速了对缺陷目标的准确定位。网片数据集检测结果表明,改进后的算法mAP(mean average precision)达到92%,相较于原始模型提升了16.8个百分点,能很好地完成缺陷目标的检测任务。