期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于XLNet和多粒度对比学习的新闻主题文本分类方法 被引量:1
1
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 xlnet 对比学习
在线阅读 下载PDF
基于XLNet—BiLSTM—AFF—CRF的谷物收割机械维修知识命名实体识别
2
作者 李先旺 刘赛虎 +1 位作者 黄忠祥 章霞东 《中国农机化学报》 北大核心 2025年第2期319-325,352,共8页
针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transfor... 针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transformer—XL的广义自回归XLNet预训练模型作为嵌入层提取字向量;然后使用双向长短时记忆网络(BiLSTM)获取上下文语义特征;利用注意力特征融合AFF将XLNet层输出与BiLSTM层输出进行组合,增强序列的语义信息;最后输入条件随机场CRF模型学习标注约束规则生成全局最优序列。在创建的维修语料库上展开试验,结果表明:所提模型的精确率、召回率和F1值分别为98.4%、97.6%和97.9%,均高于对比模型,验证所提模型的有效性。 展开更多
关键词 谷物收割机械 维修 命名实体识别 注意力机制 广义自回归预训练语言模型(xlnet)
在线阅读 下载PDF
基于改进XLNet算法的震后舆情分析研究——以甘肃积石山县6.2级和新疆乌什县7.1级地震为例 被引量:2
3
作者 郑通彦 王尅丰 +4 位作者 黄猛 张淞 周文涛 游巧 刘帅 《地震工程学报》 CSCD 北大核心 2024年第4期955-964,共10页
震后对网络舆情信息的监控与分析,对于相关部门开展震灾应急救援、掌握救灾动态、稳定民众情绪具有重要意义。为解决震后舆情信息数据量大、语言多义性等问题,文章使用自回归模型(XLNet)作为文本向量化表示层,将社交媒体地震数据文本转... 震后对网络舆情信息的监控与分析,对于相关部门开展震灾应急救援、掌握救灾动态、稳定民众情绪具有重要意义。为解决震后舆情信息数据量大、语言多义性等问题,文章使用自回归模型(XLNet)作为文本向量化表示层,将社交媒体地震数据文本转化为包含上下文语义信息的媒体数据词向量,同时,使用双向门控循环单元(BiGRU)网络作为特征提取层,把词向量序列输入到BiGRU层,提取社交媒体地震数据的文本特征;将初步提取特征的文本输入到注意力机制层(Attention),进一步提取更为重要的情感类别特征,并对重要特征进行权重强化,构建基于网络地震应急处置信息改进的XLNet-BiGRU-Att地震舆情情感分析模型;最终,获得社交媒体地震数据的舆情态势。相比传统的XLNet模型,文章模型在甘肃积石山县6.2级与新疆乌什县7.1级地震的舆情情感分析中能够准确\,快速捕捉长短文本数据特征,分析舆情态势,情感分析准确率分别提升到92.45%和93.42%。 展开更多
关键词 舆情分析 xlnet BiGRU 甘肃积石山 新疆乌什
在线阅读 下载PDF
融合XLnet与DMGAN的文本生成图像方法 被引量:1
4
作者 赵泽纬 车进 吕文涵 《液晶与显示》 CAS CSCD 北大核心 2024年第2期168-179,共12页
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能... 针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。 展开更多
关键词 文本生成图像 xlnet模型 生成对抗网络 通道注意力
在线阅读 下载PDF
基于XLNET模型的开阳磷矿成矿条件相关地质实体识别与应用
5
作者 彭彬 田宜平 +2 位作者 曾斌 吴雪超 吴文明 《地质科技通报》 CAS CSCD 北大核心 2024年第4期224-234,共11页
随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立... 随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立了磷矿成矿地质实体自动识别的方法。首先对实体进行BIO标注建立地质实体字典,利用XLNET作为底层预处理模型学习句子双向语义;然后使用BILSTM-Attention-CRF模型实现文本多标签的智能分类;最后通过定位磷矿实体在报告中的分布位置大致推测该处磷矿成矿条件和成矿模式。将该模型与其余3种模型比较得出结果,该模型识别的准确率(P)、召回率(R)及F1值都接近了90%,较前3种模型分别调高了2%,5%,6%。该研究为开阳磷矿地质研究人员提供了更加高效的地质实体自动识别的方法。 展开更多
关键词 地质实体识别 xlnet-BILSTM-Attention-CRF 磷矿成矿模式 预训练模型 序列标注
在线阅读 下载PDF
基于 XLNet 的农业命名实体识别方法 被引量:5
6
作者 陈明 顾凡 《河北农业大学学报》 CAS CSCD 北大核心 2023年第4期111-117,共7页
随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等... 随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等问题,本文提出了基于XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)的农业命名实体识别模型XLNet-IDCNN-CRF。嵌入层XLNet对于输入文本进行向量化表示,丰富文本的语义信息,缓解一词多义问题,通过编码层迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN)并行计算减少训练时间,获取文本特征信息,结合起来输入到输出层条件随机场模型(Conditional Random Field,CRF)识别标签信息,输出最优序列。本文在自建语料库上准确率达到95.58%,召回率92.36%,F1值93.91%,对比优于其他模型。实验结果表明,XLNet-IDCNNCRF模型能够较好地完成农业命名实体识别任务。 展开更多
关键词 农业文本 命名实体识别 xlnet模型 预训练语言模型 迭代膨胀卷积
在线阅读 下载PDF
基于XLNet的情感分析模型 被引量:12
7
作者 梁淑蓉 谢晓兰 +1 位作者 陈基漓 许可 《科学技术与工程》 北大核心 2021年第17期7200-7207,共8页
目前通过深度学习方法进行语言模型预训练是情感分析的主要方式,XLNet模型的提出解决了BERT模型上下游任务不一致的问题。在XLNet基础上增加LSTM网络层和Attention机制,提出XLNet-LSTM-Att情感分析优化模型,通过XLNet预训练模型获取包... 目前通过深度学习方法进行语言模型预训练是情感分析的主要方式,XLNet模型的提出解决了BERT模型上下游任务不一致的问题。在XLNet基础上增加LSTM网络层和Attention机制,提出XLNet-LSTM-Att情感分析优化模型,通过XLNet预训练模型获取包含上下文语义信息的特征向量,接着利用LSTM提取上下文相关特征,最后引入注意力机制根据特征重要程度赋予不同权重,再进行文本情感倾向性分析。仿真实验中将XLNet-LSTM-Att模型与5种常用的情感分析模型进行对比,结果表明提出的模型优于其他测试模型,模型的精准率达到89.29%。 展开更多
关键词 情感分析 xlnet LSTM 注意力机制
在线阅读 下载PDF
基于XLnet语言模型的中文命名实体识别 被引量:11
8
作者 姚贵斌 张起贵 《计算机工程与应用》 CSCD 北大核心 2021年第18期156-162,共7页
语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向... 语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向量特征,同时将词向量预测矩阵传入到字向量特征提取阶段,通过矩阵运算融合为词向量特征,并进一步利用CNN提取词语之间的空间信息,将其与得到的词向量特征整合到一起输入语言模型XLnet(Generalized autoregressive pretraining for language understanding)中,然后经过BiGRU-CRF输出最优标签序列,提出了CAW-XLnet-BiGRU-CRF网络框架。并与其他的语言模型作了对比分析,实验结果表明,该框架解决了挖掘内部隐藏信息不充分问题,在《人民日报》1998年1月份数据集上的F1值达到了95.73%,能够较好地应用于中文命名实体识别任务。 展开更多
关键词 命名实体识别 词向量 xlnet 语言模型
在线阅读 下载PDF
基于XLNet的业务流程下一活动预测方法 被引量:3
9
作者 夏灿铭 邢玛丽 何胜煌 《计算机集成制造系统》 EI CSCD 北大核心 2023年第10期3496-3503,共8页
预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆... 预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆,并采用注意力掩码重构事件序列,以利用序列的双向信息。通过在4个公开数据集上进行评估表明,该方法的平均准确率具有优越性,且在日志记录充分时,该方法对业务流程下一活动的预测准确率较高,可为业务流程管理系统提供实时的决策依据。 展开更多
关键词 业务流程实例 下一活动预测 深度学习 xlnet模型
在线阅读 下载PDF
基于XLNet的中文文本情感分析 被引量:1
10
作者 李东金 单锐 +2 位作者 阴良魁 王芳 程宝娜 《燕山大学学报》 CAS 北大核心 2022年第6期547-553,共7页
针对Word2vec等静态词向量模型不能解决一词多义、传统情感分析模型不能同时提取文本的全局和局部信息问题,本文提出了结合广义自回归预训练语言模型(XLNet)的文本情感分析模型。首先利用XLNet表示文本特征,然后利用卷积神经网络提取文... 针对Word2vec等静态词向量模型不能解决一词多义、传统情感分析模型不能同时提取文本的全局和局部信息问题,本文提出了结合广义自回归预训练语言模型(XLNet)的文本情感分析模型。首先利用XLNet表示文本特征,然后利用卷积神经网络提取文本向量的局部特征,再利用双向门控循环单元提取文本的更深层次上下文信息,最后引入注意力机制,根据特征的重要性赋予特征不同的权重,并进行文本情感极性分析。仿真实验中将本文模型与5种常用的情感分析模型进行对比,验证了模型的准确率和优越性。 展开更多
关键词 情感分析 广义自回归预训练语言模型 卷积神经网络 双向门控循环单元 注意力机制
在线阅读 下载PDF
基于语义关系和实体识别的潜在标准必要专利识别研究
11
作者 窦路遥 周志刚 冯宇 《现代情报》 北大核心 2025年第10期16-25,共10页
[目的/意义]为解决潜在标准必要专利识别任务中的序列信息的关键实体识别问题和序列建模的长距离依赖问题,实现识别精准度的提升和识别结果可解释性的增强。基于此,本文提出一种融合预训练模型XLNet和实体识别模型BiLSTM-CRF的潜在标准... [目的/意义]为解决潜在标准必要专利识别任务中的序列信息的关键实体识别问题和序列建模的长距离依赖问题,实现识别精准度的提升和识别结果可解释性的增强。基于此,本文提出一种融合预训练模型XLNet和实体识别模型BiLSTM-CRF的潜在标准必要专利识别模型(XLNet-BiLSTM-CRF-CNN,XLBLCC)。[方法/过程]通过XLNet模型联合上下文语境实现专利文本的词向量化与语义关系表达,并基于BiLSTM-CRF模型生成NER标签,用于标注文本中的命名实体边界,再通过构建CNN模型来学习标准必要专利(SEP)文本中的特征,实现潜在标准必要专利的识别和预测。实证部分以ETSI数据库中检索的SEP和incopat数据库中检索的非SEP构建的数据集对模型性能进行验证。[结果/结论]研究发现:XLBLCC模型在准确率(86%)、F1值(89%)和AUC值(84%)上均超越其他基线模型;XLNet模型在全局语义理解上较之BERT等模型具备优越性;在高价值专利与标准必要专利的对比实验中,该模型表现出较强的泛化能力。 展开更多
关键词 语义关系 潜在标准必要专利 xlnet BiLSTM-CRF CNN
在线阅读 下载PDF
结合广义自回归预训练语言模型与循环卷积神经网络的文本情感分析方法 被引量:10
12
作者 潘列 曾诚 +3 位作者 张海丰 温超东 郝儒松 何鹏 《计算机应用》 CSCD 北大核心 2022年第4期1108-1115,共8页
传统的机器学习方法在对网络评论文本进行情感极性分类时,未能充分挖掘语义信息和关联信息,而已有的深度学习方法虽能提取语义信息和上下文信息,但该过程往往是单向的,在获取评论文本的深层语义信息过程中存在不足。针对以上问题,提出... 传统的机器学习方法在对网络评论文本进行情感极性分类时,未能充分挖掘语义信息和关联信息,而已有的深度学习方法虽能提取语义信息和上下文信息,但该过程往往是单向的,在获取评论文本的深层语义信息过程中存在不足。针对以上问题,提出了一种结合广义自回归预训练语言模型(XLNet)与循环卷积神经网络(RCNN)的文本情感分析方法。首先,利用XLNet对文本进行特征表示,并通过引入片段级递归机制和相对位置信息编码,充分利用了评论文本的语境信息,从而有效提升了文本特征的表达能力;然后,利用RCNN对文本特征进行双向训练,并在更深层次上提取文本的上下文语义信息,从而提升了在情感分析任务中的综合性能。所提方法分别在三个公开数据集weibo-100k、waimai-10k和ChnSentiCorp上进行了实验,准确率分别达到了96.4%、91.8%和92.9%。实验结果证明了所提方法在情感分析任务中的有效性。 展开更多
关键词 评论文本 情感分析 xlnet 片段级递归机制 循环卷积神经网络
在线阅读 下载PDF
自然语言处理技术发展 被引量:30
13
作者 王海宁 《中兴通讯技术》 2022年第2期59-64,共6页
基于神经网络和深度学习的预训练语言模型为自然语言处理技术带来了突破性发展。基于自注意力机制的Transformer模型是预训练语言模型的基础。GPT、BERT、XLNet等大规模预训练语言模型均基于Transformer模型进行堆叠和优化。认为目前依... 基于神经网络和深度学习的预训练语言模型为自然语言处理技术带来了突破性发展。基于自注意力机制的Transformer模型是预训练语言模型的基础。GPT、BERT、XLNet等大规模预训练语言模型均基于Transformer模型进行堆叠和优化。认为目前依赖强大算力和海量数据的大规模预训练语言模型存在实用问题,指出轻量预训练语言模型是未来重要的发展方向。 展开更多
关键词 自然语言处理 预训练语言模型 TRANSFORMER GPT BERT xlnet 模型优化
在线阅读 下载PDF
基于指针网络的汉语宏观篇章结构双向解析方法
14
作者 何垅旺 范亚鑫 +3 位作者 褚晓敏 蒋峰 李军辉 李培峰 《中文信息学报》 CSCD 北大核心 2022年第11期68-78,共11页
宏观篇章结构解析旨在通过分析篇章的整体结构,为理解篇章的内容和主旨奠定基础。现有的研究大都采用了单一的自顶向下或自底向上的构建策略逐级地构建结构树,而单向构建策略无法根据不同待解析序列选择合适的解析动作,在解析流程中容... 宏观篇章结构解析旨在通过分析篇章的整体结构,为理解篇章的内容和主旨奠定基础。现有的研究大都采用了单一的自顶向下或自底向上的构建策略逐级地构建结构树,而单向构建策略无法根据不同待解析序列选择合适的解析动作,在解析流程中容易陷入决策局限性并将错误向后传播。该文提出一种集成自顶向下和自底向上两种构建策略的指针网络模型,该模型能同时利用两种构建策略的语义信息,从而选择合适的构建方式。在汉语宏观篇章树库(MCDTB 2.0)上的实验表明,通过集成两种构建方式,该文模型能有效提升篇章单元间的局部语义交互能力并减少构建过程中的错误传播,从而取得性能最优值。 展开更多
关键词 宏观篇章解析 结构识别 指针网络 xlnet
在线阅读 下载PDF
基于多视角建模的汉语议论文写作质量评估方法
15
作者 贺亚琼 蒋峰 +1 位作者 褚晓敏 李培峰 《计算机科学》 CSCD 北大核心 2023年第3期315-322,共8页
自动作文评分是一项代替人工为学生作文进行等级评分的任务,其中丰富的语义、严密的组织和合理的逻辑是重要的考虑因素。已有的研究大多数只从语义或组织等视角出发评估作文的质量,未考虑如逻辑等更高层次的因素。因此,文中提出了一个... 自动作文评分是一项代替人工为学生作文进行等级评分的任务,其中丰富的语义、严密的组织和合理的逻辑是重要的考虑因素。已有的研究大多数只从语义或组织等视角出发评估作文的质量,未考虑如逻辑等更高层次的因素。因此,文中提出了一个多视角评价框架(Multi-perspective Evaluation Framework,MPE),从语义表达、组织结构和整体逻辑3个方面对学生议论文进行了客观、可靠的评价。具体来说,多视角评价框架首先利用预训练模型编码句子并获得由低到高3个层次的语义信息,来评估文章的语义表达;其次,框架将句子功能识别与段落功能识别相结合,用于评估文章的组织结构;然后,通过计算段落之间的连贯性来评估文章的整体逻辑;最后,该框架综合这3个方面的评估特征,对作文评分。实验结果表明,所提出的多视角评价框架能够有效地对不同质量的作文进行评分,优于所有基准系统。 展开更多
关键词 多视角 作文评分 议论文 xlnet 全局连贯性
在线阅读 下载PDF
结合上下文词汇匹配和图卷积的材料数据命名实体识别
16
作者 陈茜 武星 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期372-385,共14页
材料领域的文献中蕴含着丰富的知识,利用机器学习和自然语言处理等手段对文献进行数据挖掘是研究热点.命名实体识别(named entity recognition,NER)是高效利用挖掘和抽取数据中信息的首要步骤.为了解决现有实体识别方法中存在的向量表... 材料领域的文献中蕴含着丰富的知识,利用机器学习和自然语言处理等手段对文献进行数据挖掘是研究热点.命名实体识别(named entity recognition,NER)是高效利用挖掘和抽取数据中信息的首要步骤.为了解决现有实体识别方法中存在的向量表示无法解决一词多义、模型常提取上下文特征而忽略全局特征等问题,提出了一种基于上下文词汇匹配和图卷积命名实体识别方法.该方法首先利用XLNet获取文本的上下文动态特征,其次利用长短期记忆网络并结合文本上下文匹配词汇的图卷积神经网络(graph convolutional network,GCN)模型分别获取上下文特征与全局特征,最终经过条件随机场输出标签序列.2种不同语料对模型进行验证的结果表明,该方法在材料数据集上的精确率、召回率和F1值分别达到90.05%、88.67%和89.36%,可有效提升命名实体识别的准确率. 展开更多
关键词 命名实体识别 xlnet 图卷积神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部