期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于XLNet—BiLSTM—AFF—CRF的谷物收割机械维修知识命名实体识别
1
作者 李先旺 刘赛虎 +1 位作者 黄忠祥 章霞东 《中国农机化学报》 北大核心 2025年第2期319-325,352,共8页
针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transfor... 针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transformer—XL的广义自回归XLNet预训练模型作为嵌入层提取字向量;然后使用双向长短时记忆网络(BiLSTM)获取上下文语义特征;利用注意力特征融合AFF将XLNet层输出与BiLSTM层输出进行组合,增强序列的语义信息;最后输入条件随机场CRF模型学习标注约束规则生成全局最优序列。在创建的维修语料库上展开试验,结果表明:所提模型的精确率、召回率和F1值分别为98.4%、97.6%和97.9%,均高于对比模型,验证所提模型的有效性。 展开更多
关键词 谷物收割机械 维修 命名实体识别 注意力机制 广义自回归预训练语言模型(xlnet)
在线阅读 下载PDF
融合XLnet与DMGAN的文本生成图像方法 被引量:1
2
作者 赵泽纬 车进 吕文涵 《液晶与显示》 CAS CSCD 北大核心 2024年第2期168-179,共12页
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能... 针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。 展开更多
关键词 文本生成图像 xlnet模型 生成对抗网络 通道注意力
在线阅读 下载PDF
基于 XLNet 的农业命名实体识别方法 被引量:4
3
作者 陈明 顾凡 《河北农业大学学报》 CAS CSCD 北大核心 2023年第4期111-117,共7页
随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等... 随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等问题,本文提出了基于XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)的农业命名实体识别模型XLNet-IDCNN-CRF。嵌入层XLNet对于输入文本进行向量化表示,丰富文本的语义信息,缓解一词多义问题,通过编码层迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN)并行计算减少训练时间,获取文本特征信息,结合起来输入到输出层条件随机场模型(Conditional Random Field,CRF)识别标签信息,输出最优序列。本文在自建语料库上准确率达到95.58%,召回率92.36%,F1值93.91%,对比优于其他模型。实验结果表明,XLNet-IDCNNCRF模型能够较好地完成农业命名实体识别任务。 展开更多
关键词 农业文本 命名实体识别 xlnet模型 预训练语言模型 迭代膨胀卷积
在线阅读 下载PDF
基于XLNet的业务流程下一活动预测方法 被引量:3
4
作者 夏灿铭 邢玛丽 何胜煌 《计算机集成制造系统》 EI CSCD 北大核心 2023年第10期3496-3503,共8页
预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆... 预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆,并采用注意力掩码重构事件序列,以利用序列的双向信息。通过在4个公开数据集上进行评估表明,该方法的平均准确率具有优越性,且在日志记录充分时,该方法对业务流程下一活动的预测准确率较高,可为业务流程管理系统提供实时的决策依据。 展开更多
关键词 业务流程实例 下一活动预测 深度学习 xlnet模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部