期刊文献+
共找到1,425篇文章
< 1 2 72 >
每页显示 20 50 100
基于自然语言处理(NLP)的生态环境准入清单政策内容分析 被引量:2
1
作者 魏泽洋 汪自书 +3 位作者 宫曼莉 谢丹 杨洋 刘毅 《环境工程技术学报》 北大核心 2025年第1期1-10,共10页
生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入... 生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入清单管控的对象、方式与力度是支撑生态环境分区管控政策实施的重要基础。本研究基于自然语言机器无监督学习技术对生态环境准入清单进行政策词汇模式挖掘并对政策文本设定多维定量化标签,应用自然语言深度学习模型对生态环境准入清单管控措施进行文本分类评估。河北省是我国产业门类最齐全、资源环境问题最复杂的省份之一,其生态环境准入管控具有典型性和代表性。以河北省生态环境准入清单的产业管控措施为例,识别了10类政策关键词特征、64项主要政策关键词,对全清单中对应关键词所在的语句覆盖率达95%;构造了24个管控措施-行业的分类标签,应用并比较了BERT、RoBERTa和ALBERT深度学习模型对政策文本的分类识别效果,预测精度、召回率和F1得分最高分别可达到0.95、0.79和0.86,训练模型可较好地识别准入清单政策内容。结果显示河北省准入清单在管控措施明确化、具体化、定量化方面仍存在不足,产业精细化管控、考核指标型以及时限型内容有待补充和细化。本研究提出的方法具有较好的适用前景,建议在此基础上结合前沿人工智能方法,进一步提高模型自动处理效率、动态分析以及提供精细化政策调整建议的能力。 展开更多
关键词 生态环境分区管控 生态环境准入清单 政策文本 自然语言处理(nlp)
在线阅读 下载PDF
基于NLP和SEM的博物馆导视系统设计优化策略研究
2
作者 王朝伟 郑刚强 +1 位作者 孙嘉伟 王征 《包装工程》 北大核心 2025年第16期472-483,共12页
目的基于自然语言处理(NLP)和结构方程模型(SEM)构建博物馆导视系统的设计优化路径,系统揭示关键设计因子对游客满意度的影响机制并提出具备普适适用性的优化策略,以提升导视系统的整体质量与用户体验。方法采用文本挖掘技术从多个旅游... 目的基于自然语言处理(NLP)和结构方程模型(SEM)构建博物馆导视系统的设计优化路径,系统揭示关键设计因子对游客满意度的影响机制并提出具备普适适用性的优化策略,以提升导视系统的整体质量与用户体验。方法采用文本挖掘技术从多个旅游平台获取用户评论,结合NLP词频分析与共现矩阵构建提取游客关注焦点。在用户体验理论与信息设计原则指导下,辅以定性访谈明确核心设计范畴,进一步转化为测量指标。通过探索性因子分析与主成分分析提取潜在变量,构建并验证结构方程模型,分析关键因子对满意度的路径影响关系。结果模型拟合度良好,验证了文化功能、信息传递、视觉设计、交互性与可用性五个外生变量对满意度的显著正向影响,而信息传递为最关键因子。基于路径系数结果,提出涵盖五大设计维度的系统性优化路径,明确了导视系统设计的优先介入顺序与策略方向。结论在实证基础上提出面向满意度提升的导视系统优化路径框架,为博物馆导视系统的系统化设计与科学决策提供理论依据与方法支持,拓展了结构方程模型在设计研究中的应用边界,具有良好的迁移性与实践指导价值。 展开更多
关键词 博物馆导视系统 自然语言处理(nlp) 结构方程模型(SEM) 设计影响因素 设计优化策略
在线阅读 下载PDF
大语言模型综述与展望 被引量:11
3
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
基于XLNet和多粒度对比学习的新闻主题文本分类方法 被引量:1
4
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 XLNet 对比学习
在线阅读 下载PDF
大语言模型参数高效微调技术综述 被引量:1
5
作者 秦董洪 李政韬 +3 位作者 白凤波 董路宽 张慧 徐晨 《计算机工程与应用》 北大核心 2025年第16期38-63,共26页
近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,... 近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,显著降低成本并保持性能。对近年来参数高效微调技术中最具代表性和最前沿的方法进行了简要介绍和系统分析,涵盖设计理念与核心算法,并对不同方法的特性、优势、不足以及适用场景进行了归纳和分析,并进一步对比了不同种类中同系列的多种方法,分析了同系列方法在设计理念上的演进趋势,提供了当前研究现状的全面概述。最后对参数高效微调技术进行整体的分析与展望,提出未来该技术可能的优化方向,并结合实践提出该技术在实际工程应用中可行的技术方案。 展开更多
关键词 参数高效微调技术 深度学习 自然语言处理 模型优化
在线阅读 下载PDF
层次融合多元知识的命名实体识别框架——HTLR
6
作者 吕学强 王涛 +1 位作者 游新冬 徐戈 《计算机应用》 北大核心 2025年第1期40-47,共8页
中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hi... 中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFECNN(Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT(Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 词汇增强 字形增强
在线阅读 下载PDF
基于知识图谱的钻井顶部驱动装置故障智能诊断方法 被引量:1
7
作者 陈冬 肖远山 +2 位作者 尹志勇 张彦龙 叶智慧 《天然气工业》 北大核心 2025年第2期125-135,共11页
钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井... 钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井顶部驱动装置故障诊断方法,利用以Transformer为基础的双向编码器模型(Bidirectional Encoder Representations from Transformers,BERT)构建了混合神经网络模型BERT-BiLSTM-CRF与BERT-BiLSTM-Attention,分别实现了顶驱故障文本数据的命名实体识别和关系抽取,并通过相似度计算,实现了故障知识的有效融合和智能问答,最终构建了顶部驱动装置故障诊断方法。研究结果表明:①在故障实体识别任务上,BERT-BiLSTM-CRF模型的精确度达到95.49%,能够有效识别故障文本中的信息实体;②在故障关系抽取上,BERT-BiLSTM-Attention模型的精确度达到93.61%,实现了知识图谱关系边的正确建立;③开发的问答系统实现了知识图谱的智能应用,其在多个不同类型问题上的回答准确率超过了90%,能够满足现场使用需求。结论认为,基于知识图谱的故障诊断方法能够有效利用顶部驱动装置的先验知识,实现故障的快速定位与智能诊断,具备良好的应用前景。 展开更多
关键词 钻井装备 顶部驱动装置 故障诊断 深度学习 知识图谱 自然语言处理 命名实体识别 智能问答系统
在线阅读 下载PDF
深层语义特征增强的ReLM中文拼写纠错模型
8
作者 张伟 牛家祥 +1 位作者 马继超 沈琼霞 《计算机应用》 北大核心 2025年第8期2484-2490,共7页
ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分... ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell(Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。 展开更多
关键词 自然语言处理 特征增强 中文拼写纠错 语义融合 文本纠错 预训练语言模型
在线阅读 下载PDF
面向跨域自然语言生成SQL语句的超图神经网络
9
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成SQL语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
基于双超图神经网络特征融合的文本分类
10
作者 郑诚 李鹏飞 《计算机工程》 北大核心 2025年第6期127-135,共9页
近年来,图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图,然后使用GNN对文本图进行特征传播与聚合,但是此类方法有两点不足:一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系;... 近年来,图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图,然后使用GNN对文本图进行特征传播与聚合,但是此类方法有两点不足:一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系;二是现有模型无法捕获文本中的关键语义信息。为了解决上述问题,提出一种基于双超图卷积网络特征融合的文本分类模型。一方面,使用原始文本建立文本超图;另一方面,为短文本引入外部知识,使用基于SenticNet词库的外部知识对文本进行语义增强,构建语义超图。经过超图卷积后通过注意力机制对双超图特征进行融合,实现短文本分类。在4个文本分类数据集上的实验结果表明,该模型优于基线模型,具有优越的文本分类性能。 展开更多
关键词 文本分类 超图 特征融合 SenticNet词库 自然语言处理
在线阅读 下载PDF
一种注意力引导知识增强的事件因果关系识别方法
11
作者 徐博 孙晋辰 +1 位作者 林鸿飞 宗林林 《中文信息学报》 北大核心 2025年第1期89-100,共12页
事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT... 事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT模型对事件对及其上下文进行编码;然后,提出零跳混合匹配方案挖掘事件相关的描述型知识和关系型知识,通过注意力机制对事件的描述型知识序列进行编码,通过稠密图神经网络对事件对的关系型知识进行编码。最后,融合前三个编码模块识别事件因果关系。基于EventStoryLine和Causal-TimeBank数据集的实验结果表明,该文所构建模型的识别效果优于现有模型,在零跳概念匹配、描述性和关系型知识编码等层面均获得了识别性能的提升。 展开更多
关键词 事件抽取 因果识别 知识图谱 注意力机制 自然语言处理
在线阅读 下载PDF
基于深度跨域中介模块的英文翻译
12
作者 黄笑菡 程时伟 张纪林 《计算机工程与设计》 北大核心 2025年第9期2502-2508,共7页
为促进文本域与视觉域之间的语义关联,提高英文翻译的准确性,提出一种基于深度跨域中介模块(deep crossdomain intermediary module,DCIM)的英文翻译方法,区别于传统的联合空间学习方法,DCIM作为中介模块指导图像中感兴趣区域与源词之... 为促进文本域与视觉域之间的语义关联,提高英文翻译的准确性,提出一种基于深度跨域中介模块(deep crossdomain intermediary module,DCIM)的英文翻译方法,区别于传统的联合空间学习方法,DCIM作为中介模块指导图像中感兴趣区域与源词之间的交互。通过强化文本编码器和视觉编码器提取的表征之间的语义关联,使视觉表征在语义上得到增强并演化为跨域表征。通过双重注意力解码器,利用两种独立的注意力机制分别处理文本和跨域表征的上下文,预测目标词汇。实验结果表明,集成DCIM的模型在两种英文翻译任务中基于Meteor和Ribes指标取得了最佳翻译准确性和鲁棒性。 展开更多
关键词 深度跨域中介模块 英文翻译 双重注意力解码器 文本域 视觉域 神经网络 自然语言处理
在线阅读 下载PDF
基于句法、语义和情感知识的方面级情感分析
13
作者 郑诚 杨楠 《计算机科学》 北大核心 2025年第7期218-225,共8页
方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定... 方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定用于情感分析的工具,不能直接有效地捕获方面词的情感表达,而这一点正是方面级情感分析的关键之处。为了更准确地识别方面词的情感表达,构造了融合句法、语义和情感知识的网络。具体来说,利用句法依赖树中的句法知识构建句法图,并将外部情感知识库信息融合在句法图中。同时,采用自注意力机制获得句子中各单词的语义知识,并通过方面感知注意力机制使语义图关注与方面词相关的信息。此外,采用双向消息传播机制同时学习这两个图中的信息并更新节点表示。在3个基准数据集上的实验结果验证了所提模型的有效性。 展开更多
关键词 方面级情感分析 图卷积网络 注意力机制 句法依赖树 情感知识 自然语言处理 深度学习
在线阅读 下载PDF
融合知识图谱的多行为职位推荐
14
作者 刘滨 雷晓雨 +3 位作者 刘格格 詹世源 高歆 杨晓艳 《河北科技大学学报》 北大核心 2025年第3期333-341,共9页
为提高职位推荐准确率,基于求职者和招聘者在“浏览岗位→投递简历→招聘者反馈”等环节表现出的行为隐含的求聘双方偏好信息,提出了一种融合知识图谱的多行为职位推荐模型(multi-behavior job recommendation integrating knowledge gr... 为提高职位推荐准确率,基于求职者和招聘者在“浏览岗位→投递简历→招聘者反馈”等环节表现出的行为隐含的求聘双方偏好信息,提出了一种融合知识图谱的多行为职位推荐模型(multi-behavior job recommendation integrating knowledge graph, MB-JRIKG)。该方法基于真实的职位数据构建求职领域知识图谱,并在偏好传播理论的基础上提出多行为偏好传播策略,将求聘各环节中“招聘者认可”设为目标行为,求职者浏览岗位和投递简历设定为辅助行为,综合预测求职者的偏好。首先,分别以用户在不同行为下的历史记录作为用户感兴趣的种子集,并在知识图谱中沿着节点之间的关系进行偏好传播以推理出用户的潜在偏好,增强用户表示;然后,将用户表示向量和职位表示向量输入预测函数中,计算用户在每个行为类型下的交互概率,并加权求和作为目标行为的交互概率;最后,使用阿里巴巴人岗智能匹配的比赛数据集进行点击率预测实验。结果表明,在与MF、XGBoost、KGCN、RippleNet 4个基准模型的对比中,MB-JRIKG相比次优基准模型RippleNet在指标AUC和ACC上分别提高了0.014 5和0.028 8,验证了模型的有效性,实现了数据的充分利用。该模型有效结合求聘双方的交互行为进行推荐,引入职位知识图谱的属性关联,对实现个性化的职位推荐有参考价值。 展开更多
关键词 自然语言处理 职位推荐 知识图谱 多行为 偏好传播
在线阅读 下载PDF
基于双向译码的实体关系抽取方法
15
作者 刘辉 张智 陈宇鹏 《应用科学学报》 北大核心 2025年第3期491-503,共13页
针对现有关系三元组提取方法存在的误差传播、嵌套三元组难提取和主客体难对齐等问题,从实体抽取、主客体对齐和关系判断3个子任务的全新视角出发,提出了一种新的基于联合实体关系抽取框架的双向译码解码模型。其中,双向抽取框架极大地... 针对现有关系三元组提取方法存在的误差传播、嵌套三元组难提取和主客体难对齐等问题,从实体抽取、主客体对齐和关系判断3个子任务的全新视角出发,提出了一种新的基于联合实体关系抽取框架的双向译码解码模型。其中,双向抽取框架极大地减少了级联误差传播;基于注意力机制的译码解码方法能够有效处理常规方法嵌套三元组难提取的问题,并有效对齐了主体和客体;关系判断模块的二部图方法充分挖掘了实体对之间的关系,实现了准确高效的关系判断。公开数据集上的实验结果验证了所提模型的性能。 展开更多
关键词 自然语言处理 信息提取 实体抽取 关系抽取 误差传播 三元组
在线阅读 下载PDF
结合对比学习和提示调优的层次文本分类方法
16
作者 郑诚 纪子威 《小型微型计算机系统》 北大核心 2025年第8期1878-1885,共8页
层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和... 层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和微调阶段的不同策略也限制了模型挖掘预训练模型的知识.本文提出一种结合对比学习和提示调优的层次文本分类方法,将层次标签信息嵌入到文本编码过程,同时设计提示模板整合标签信息,捕获文本与标签的关联性,弥合预训练模型与下游任务间的差距.借助对比学习,根据标签信息生成正样本,强化模型对关键特征的学习与保留,使模型有效指导文本特征表示的学习.在两个公开数据集上的大量实验表明了方法的有效性. 展开更多
关键词 层次文本分类 提示调优 对比学习 深度学习 自然语言处理
在线阅读 下载PDF
基于知识图谱和语义与结构融合的羊病诊断方法
17
作者 李书琴 高云帆 《农业机械学报》 北大核心 2025年第7期575-584,共10页
针对疾病诊断模型仅依靠语义特征而缺少结构特征,导致弱化诊断效果的问题,本文提出了基于知识图谱和语义与结构融合的羊病诊断方法。该方法采用双向门控循环单元(Bidirectional gated recurrent unit,BiGRU)获取症状文本的语义特征,采... 针对疾病诊断模型仅依靠语义特征而缺少结构特征,导致弱化诊断效果的问题,本文提出了基于知识图谱和语义与结构融合的羊病诊断方法。该方法采用双向门控循环单元(Bidirectional gated recurrent unit,BiGRU)获取症状文本的语义特征,采用图卷积网络(Graph convolutional network,GCN)获取症状知识图谱中潜在的结构特征。为更好地融合语义特征和结构特征,引入改进的注意力特征融合(Attentional feature fusion,AFF)模块。在羊病症状数据集Sheep上进行实验,结果表明本文模型的准确率、精确率、召回率、F1值、平均倒数排名分别达到96.86%、97.73%、97.32%、97.25%、97.49%,与TextCNN、TextRCNN、TextRNN、DPCNN、LASA、HSAN-capsule、DCDKG、CNNBiLSTM-Attention等模型对比,准确率提升0.19~1.76个百分点,精确率提升0.18~0.84个百分点,召回率提升0.14~1.21个百分点,F1值提升0.21~1.50个百分点,平均倒数排名提升0.15~0.23个百分点。同时在公开数据集Dxy和Muzhi上进行实验,模型表现出较好的鲁棒性。为增强疾病诊断的可解释性,本文提出了改进的基于梯度的显著性方法以解释诊断结果。该研究提出的融合语义和结构特征的方法有效提高了疾病诊断准确率,为羊病诊断提供技术支撑。 展开更多
关键词 羊病诊断 知识图谱 图卷积网络 可解释性 自然语言处理 多模态融合
在线阅读 下载PDF
方面语义增强的融合网络用于方面级情感分析
18
作者 郑诚 陈雪灵 《小型微型计算机系统》 北大核心 2025年第9期2105-2112,共8页
方面级情感分析旨在识别方面词表达的情感.最近,基于依赖树的图卷积网络已被证明在方面级情感分析任务中是有效的.然而,句法依赖树并不是特定于情感分析的工具,不能关注到特定的方面词.针对上述问题,本文提出一种方面语义增强的融合网... 方面级情感分析旨在识别方面词表达的情感.最近,基于依赖树的图卷积网络已被证明在方面级情感分析任务中是有效的.然而,句法依赖树并不是特定于情感分析的工具,不能关注到特定的方面词.针对上述问题,本文提出一种方面语义增强的融合网络模型,该模型将句法,语义和词法信息与方面词相结合,用于方面级情感分析.首先,使用快速梯度对抗训练算法进行数据增强.其次,为了充分利用句法依赖树中的有效信息,分别使用图卷积网络和注意力机制学习依赖树中的句法信息和词法信息.同时,将方面增强注意力机制与自注意力机制相结合,来增强句子的方面语义感知能力.最后,使用非对称损失作为损失函数.在基准数据集上进行了实验,验证了本文模型的有效性. 展开更多
关键词 自然语言处理 方面级情感分析 数据增强 注意力机制 句法依赖树
在线阅读 下载PDF
基于电子病历多模态数据的作物病害多元场景处方推荐方法研究
19
作者 张领先 丁俊琦 +2 位作者 陈菲菲 李宜滨 张一丁 《农业机械学报》 北大核心 2025年第1期25-36,46,共13页
针对作物品种及病害种类繁杂、样本数据严重不平衡、处方类别多样及数据多模态等特点和难点,本文基于电子病历多模态数据整合,开展面向多样化、可拓展和多模态3种应用场景需求的作物病害处方推荐方法研究。针对常见病害多样化处方推荐... 针对作物品种及病害种类繁杂、样本数据严重不平衡、处方类别多样及数据多模态等特点和难点,本文基于电子病历多模态数据整合,开展面向多样化、可拓展和多模态3种应用场景需求的作物病害处方推荐方法研究。针对常见病害多样化处方推荐应用场景,基于CdsBERT-RCNN和诊断推理构建了作物病害多样化处方推荐模型,提升了面向32种常见病害的诊断准确度及处方推荐的多样化水平;针对未训练少见病害和新添处方应用场景,基于MC-SEM和语义检索构建了作物病害可拓展处方推荐模型,提升了语义匹配准确性和案例库检索速度,实现对未训练病害的处方推荐功能;针对多种模态信息采集和输入应用场景,基于BATNet多层特征融合构建了多模态作物病害处方推荐模型,提升了多模态数据输入的处方推荐性能。实验结果表明,CdsBERT-RCNN模型对32种常见病害的诊断准确率达到85.65%,F1值达到85.63%;不同完整性输入测试中,仅输入症状信息即可达到81.19%的准确率,而添加环境信息和作物信息分别使准确率进一步提高1.65、3.61个百分点;MC-SEM模型对电子病历语义匹配任务达到皮尔森相关系数86.34%和斯皮尔曼相关系数77.67%;封闭集和开放集上处方推荐准确率分别达到88.20%和82.04%,验证了模型对未训练病害的推荐能力;BATNet对于多模态输入处方推荐任务的准确率和F1值达到98.88%和98.83%;应用场景分析和测试验证了模型在不完整模态(纯文本或纯图像)和不完整信息输入(作物、环境、症状)情况下泛化能力。该研究为数字化赋能作物病害防治决策提供了新的思路。 展开更多
关键词 作物病害处方推荐 自然语言处理 语义检索 多模态融合 电子病历
在线阅读 下载PDF
面向法律领域的实体和关系抽取
20
作者 刘美玲 梁龙昌 《深圳大学学报(理工版)》 北大核心 2025年第1期77-84,共8页
中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在... 中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在关系与全局对应(legal potential relationship and global correspondence,LPRGC)模型理解法律文本中术语、规则和上下文信息的能力,从而提高了实体和关系的识别准确性,进而提升了实体和关系抽取算法的性能.为解决重叠实体问题,设计了一种基于潜在关系和实体对齐的关系抽取方法.通过精确标注实体位置,筛选潜在关系,并利用全局矩阵对齐实体,解决重叠实体的关系抽取问题,能够更准确地捕捉到重叠实体之间的关系,并有效地将其映射到正确的实体对上,从而提高抽取结果的准确性.在中国法律智能技术评测数据集上进行实体和关系抽取实验,结果表明,LPRGC模型的准确率、召回率和F_(1)值分别为85.21%、81.19%和83.15%,均优于对比模型,特别是在处理实体重叠问题时,LPRGC模型在单实体重叠类型的抽取中,F_(1)值达到了81.45%;在多实体重叠类型的抽取中,F_(1)值达80.67%.LPRGC模型在实体和关系抽取的准确性上较现有方法有明显改进,在处理复杂法律文本中的实体重叠问题上取得了显著效果. 展开更多
关键词 人工智能 自然语言处理 司法领域关系抽取 深度学习 信息增强 重叠实体
在线阅读 下载PDF
上一页 1 2 72 下一页 到第
使用帮助 返回顶部