期刊文献+
共找到1,473篇文章
< 1 2 74 >
每页显示 20 50 100
基于自然语言处理(NLP)的生态环境准入清单政策内容分析
1
作者 魏泽洋 汪自书 +3 位作者 宫曼莉 谢丹 杨洋 刘毅 《环境工程技术学报》 北大核心 2025年第1期1-10,共10页
生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入... 生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入清单管控的对象、方式与力度是支撑生态环境分区管控政策实施的重要基础。本研究基于自然语言机器无监督学习技术对生态环境准入清单进行政策词汇模式挖掘并对政策文本设定多维定量化标签,应用自然语言深度学习模型对生态环境准入清单管控措施进行文本分类评估。河北省是我国产业门类最齐全、资源环境问题最复杂的省份之一,其生态环境准入管控具有典型性和代表性。以河北省生态环境准入清单的产业管控措施为例,识别了10类政策关键词特征、64项主要政策关键词,对全清单中对应关键词所在的语句覆盖率达95%;构造了24个管控措施-行业的分类标签,应用并比较了BERT、RoBERTa和ALBERT深度学习模型对政策文本的分类识别效果,预测精度、召回率和F1得分最高分别可达到0.95、0.79和0.86,训练模型可较好地识别准入清单政策内容。结果显示河北省准入清单在管控措施明确化、具体化、定量化方面仍存在不足,产业精细化管控、考核指标型以及时限型内容有待补充和细化。本研究提出的方法具有较好的适用前景,建议在此基础上结合前沿人工智能方法,进一步提高模型自动处理效率、动态分析以及提供精细化政策调整建议的能力。 展开更多
关键词 生态环境分区管控 生态环境准入清单 政策文本 自然语言处理(nlp)
在线阅读 下载PDF
基于大语言模型的NLP数据增强方法综述 被引量:1
2
作者 许德龙 林民 +1 位作者 王玉荣 张树钧 《计算机科学与探索》 北大核心 2025年第6期1395-1413,共19页
当前,大语言模型在自然语言处理(NLP)领域展现出巨大的潜力,但其训练过程依赖于大量高质量样本。在低资源场景下,随着模型规模不断扩大,现有数据样本数量难以支撑模型训练收敛,这一问题激发了相关领域科研工作者对于数据增强方法的研究... 当前,大语言模型在自然语言处理(NLP)领域展现出巨大的潜力,但其训练过程依赖于大量高质量样本。在低资源场景下,随着模型规模不断扩大,现有数据样本数量难以支撑模型训练收敛,这一问题激发了相关领域科研工作者对于数据增强方法的研究。然而,传统数据增强方法在NLP领域大模型背景下存在应用范围有限和数据失真的问题。相比之下,基于大语言模型的数据增强方法能够更有效地应对这一挑战。全面探讨了现阶段NLP领域大语言模型数据增强方法,采用了综合性的视角研究NLP领域数据增强。对NLP领域传统数据增强方法进行分析与总结。将现阶段NLP领域多种大语言模型数据增强方法归纳总结,并深入探讨了每一种方法的适用范围、优点以及局限性。介绍了NLP领域数据增强评估方法。通过对当前方法的对比实验和结果分析讨论了NLP领域大语言模型数据增强方法的未来研究方向,并提出了前瞻性建议。 展开更多
关键词 数据增强方法 大语言模型 自然语言处理 深度学习 人工智能
在线阅读 下载PDF
基于NLP方法的城市公园生物多样性感知与影响因素
3
作者 苏畅 欧阳聿婧 +2 位作者 陈一秀 田雪 郭诗怡 《中国城市林业》 2025年第2期1-9,共9页
【目的】探讨公众在城市公园的生物多样性感知,厘清公园特征对其影响因素与公众情绪福祉的增益作用,为城市生物多样性保护提供实证与理论参考。【方法】以武汉市14座城市公园为研究对象,应用网络爬虫工具获取公园用户评论众包文本数据;... 【目的】探讨公众在城市公园的生物多样性感知,厘清公园特征对其影响因素与公众情绪福祉的增益作用,为城市生物多样性保护提供实证与理论参考。【方法】以武汉市14座城市公园为研究对象,应用网络爬虫工具获取公园用户评论众包文本数据;运用自然语言处理技术量化生物多样性感知、情绪福祉感知指标以及情感得分;进一步构建回归模型,探究生物多样性感知的主要影响因素及其对公众情绪福祉的影响特征。【结果】不同类型公园在生物多样性感知偏好上呈现显著差异。公众对植物多样性和景观类型感知普遍较高,对动物多样性感知相对较低,对生物多样性保护意识及外来物种和濒危植物识别能力不足。周边环境特征(如公交站点数量、公共服务设施数量等)能显著影响公众的生物多样性感知。生物多样性感知会影响公众的情感得分、身心健康感知与生态保护意欲,其中植物季相变化、自然声音等因素对公众情绪福祉具有积极影响。【结论】城市公园生物多样性感知呈现类型差异化特征;空间尺度与周边设施配置显著影响公众感知;植物季相变化和自然声音促进公众情绪福祉;湿地类公园在多感官体验和心理恢复功能方面具有显著优势。 展开更多
关键词 城市公园 生物多样性感知 自然语言处理 众包数据 情绪福祉
在线阅读 下载PDF
大语言模型综述与展望 被引量:9
4
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
基于XLNet和多粒度对比学习的新闻主题文本分类方法 被引量:1
5
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 XLNet 对比学习
在线阅读 下载PDF
自然语言处理的深度学习模型综述 被引量:2
6
作者 何雪锋 周洁 +1 位作者 陈德光 廖海 《计算机应用与软件》 北大核心 2025年第2期1-19,101,共20页
模型作为自然语言处理的关键,直接关系到最终性能。该文介绍自然语言处理中涉及到的模型。按照规则与统计的方法从发布时间、特点、优缺点与适用范围等方面对传统自然语言处理模型进行介绍;重点将神经网络依据不同的技术划分为不同的类... 模型作为自然语言处理的关键,直接关系到最终性能。该文介绍自然语言处理中涉及到的模型。按照规则与统计的方法从发布时间、特点、优缺点与适用范围等方面对传统自然语言处理模型进行介绍;重点将神经网络依据不同的技术划分为不同的类型,对每种类型进行介绍并总结其相应特性;对以BERT为基础的两大类改进模型进行具体介绍并对每种模型进行归纳;分析目前自然语言处理模型面临的挑战与对应的解决办法;对未来工作进行展望。 展开更多
关键词 自然语言处理 语言模型 人工智能
在线阅读 下载PDF
层次融合多元知识的命名实体识别框架——HTLR
7
作者 吕学强 王涛 +1 位作者 游新冬 徐戈 《计算机应用》 北大核心 2025年第1期40-47,共8页
中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hi... 中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFECNN(Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT(Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 词汇增强 字形增强
在线阅读 下载PDF
基于知识图谱的钻井顶部驱动装置故障智能诊断方法 被引量:1
8
作者 陈冬 肖远山 +2 位作者 尹志勇 张彦龙 叶智慧 《天然气工业》 北大核心 2025年第2期125-135,共11页
钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井... 钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井顶部驱动装置故障诊断方法,利用以Transformer为基础的双向编码器模型(Bidirectional Encoder Representations from Transformers,BERT)构建了混合神经网络模型BERT-BiLSTM-CRF与BERT-BiLSTM-Attention,分别实现了顶驱故障文本数据的命名实体识别和关系抽取,并通过相似度计算,实现了故障知识的有效融合和智能问答,最终构建了顶部驱动装置故障诊断方法。研究结果表明:①在故障实体识别任务上,BERT-BiLSTM-CRF模型的精确度达到95.49%,能够有效识别故障文本中的信息实体;②在故障关系抽取上,BERT-BiLSTM-Attention模型的精确度达到93.61%,实现了知识图谱关系边的正确建立;③开发的问答系统实现了知识图谱的智能应用,其在多个不同类型问题上的回答准确率超过了90%,能够满足现场使用需求。结论认为,基于知识图谱的故障诊断方法能够有效利用顶部驱动装置的先验知识,实现故障的快速定位与智能诊断,具备良好的应用前景。 展开更多
关键词 钻井装备 顶部驱动装置 故障诊断 深度学习 知识图谱 自然语言处理 命名实体识别 智能问答系统
在线阅读 下载PDF
深层语义特征增强的ReLM中文拼写纠错模型
9
作者 张伟 牛家祥 +1 位作者 马继超 沈琼霞 《计算机应用》 北大核心 2025年第8期2484-2490,共7页
ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分... ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell(Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。 展开更多
关键词 自然语言处理 特征增强 中文拼写纠错 语义融合 文本纠错 预训练语言模型
在线阅读 下载PDF
面向跨域自然语言生成SQL语句的超图神经网络
10
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成SQL语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
数学应用题的题意自动理解研究及发展
11
作者 刘清堂 贾祥成 +2 位作者 吴林静 陈亮 涂凤娇 《计算机应用与软件》 北大核心 2025年第6期10-20,共11页
面向教育的题意理解和机器解题方法研究受到世界各国学者的高度关注,并逐步成为人工智能应用领域研究的热点之一。问题自动求解理论方法虽取得长足进步,但进一步提升性能的难度巨大,其根源在于题意理解的准确度。从数学应用题题意分析... 面向教育的题意理解和机器解题方法研究受到世界各国学者的高度关注,并逐步成为人工智能应用领域研究的热点之一。问题自动求解理论方法虽取得长足进步,但进一步提升性能的难度巨大,其根源在于题意理解的准确度。从数学应用题题意分析模型及方法、题意理解表征和题意的语义理解三个方面对当前该领域的研究进展进行综述。通过分析,进一步指出深度学习模型的可解释性不足、缺乏标准化数据集、缺乏大型常识知识库和求解过程可视化不足是当前研究中所面临的主要挑战课题。 展开更多
关键词 题意理解 数学应用题 自动求解 自然语言处理
在线阅读 下载PDF
基于双超图神经网络特征融合的文本分类
12
作者 郑诚 李鹏飞 《计算机工程》 北大核心 2025年第6期127-135,共9页
近年来,图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图,然后使用GNN对文本图进行特征传播与聚合,但是此类方法有两点不足:一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系;... 近年来,图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图,然后使用GNN对文本图进行特征传播与聚合,但是此类方法有两点不足:一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系;二是现有模型无法捕获文本中的关键语义信息。为了解决上述问题,提出一种基于双超图卷积网络特征融合的文本分类模型。一方面,使用原始文本建立文本超图;另一方面,为短文本引入外部知识,使用基于SenticNet词库的外部知识对文本进行语义增强,构建语义超图。经过超图卷积后通过注意力机制对双超图特征进行融合,实现短文本分类。在4个文本分类数据集上的实验结果表明,该模型优于基线模型,具有优越的文本分类性能。 展开更多
关键词 文本分类 超图 特征融合 SenticNet词库 自然语言处理
在线阅读 下载PDF
一种注意力引导知识增强的事件因果关系识别方法
13
作者 徐博 孙晋辰 +1 位作者 林鸿飞 宗林林 《中文信息学报》 北大核心 2025年第1期89-100,共12页
事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT... 事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT模型对事件对及其上下文进行编码;然后,提出零跳混合匹配方案挖掘事件相关的描述型知识和关系型知识,通过注意力机制对事件的描述型知识序列进行编码,通过稠密图神经网络对事件对的关系型知识进行编码。最后,融合前三个编码模块识别事件因果关系。基于EventStoryLine和Causal-TimeBank数据集的实验结果表明,该文所构建模型的识别效果优于现有模型,在零跳概念匹配、描述性和关系型知识编码等层面均获得了识别性能的提升。 展开更多
关键词 事件抽取 因果识别 知识图谱 注意力机制 自然语言处理
在线阅读 下载PDF
大语言模型参数高效微调技术综述
14
作者 秦董洪 李政韬 +3 位作者 白凤波 董路宽 张慧 徐晨 《计算机工程与应用》 北大核心 2025年第16期38-63,共26页
近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,... 近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,显著降低成本并保持性能。对近年来参数高效微调技术中最具代表性和最前沿的方法进行了简要介绍和系统分析,涵盖设计理念与核心算法,并对不同方法的特性、优势、不足以及适用场景进行了归纳和分析,并进一步对比了不同种类中同系列的多种方法,分析了同系列方法在设计理念上的演进趋势,提供了当前研究现状的全面概述。最后对参数高效微调技术进行整体的分析与展望,提出未来该技术可能的优化方向,并结合实践提出该技术在实际工程应用中可行的技术方案。 展开更多
关键词 参数高效微调技术 深度学习 自然语言处理 模型优化
在线阅读 下载PDF
基于句法、语义和情感知识的方面级情感分析
15
作者 郑诚 杨楠 《计算机科学》 北大核心 2025年第7期218-225,共8页
方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定... 方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定用于情感分析的工具,不能直接有效地捕获方面词的情感表达,而这一点正是方面级情感分析的关键之处。为了更准确地识别方面词的情感表达,构造了融合句法、语义和情感知识的网络。具体来说,利用句法依赖树中的句法知识构建句法图,并将外部情感知识库信息融合在句法图中。同时,采用自注意力机制获得句子中各单词的语义知识,并通过方面感知注意力机制使语义图关注与方面词相关的信息。此外,采用双向消息传播机制同时学习这两个图中的信息并更新节点表示。在3个基准数据集上的实验结果验证了所提模型的有效性。 展开更多
关键词 方面级情感分析 图卷积网络 注意力机制 句法依赖树 情感知识 自然语言处理 深度学习
在线阅读 下载PDF
融合知识图谱的多行为职位推荐
16
作者 刘滨 雷晓雨 +3 位作者 刘格格 詹世源 高歆 杨晓艳 《河北科技大学学报》 北大核心 2025年第3期333-341,共9页
为提高职位推荐准确率,基于求职者和招聘者在“浏览岗位→投递简历→招聘者反馈”等环节表现出的行为隐含的求聘双方偏好信息,提出了一种融合知识图谱的多行为职位推荐模型(multi-behavior job recommendation integrating knowledge gr... 为提高职位推荐准确率,基于求职者和招聘者在“浏览岗位→投递简历→招聘者反馈”等环节表现出的行为隐含的求聘双方偏好信息,提出了一种融合知识图谱的多行为职位推荐模型(multi-behavior job recommendation integrating knowledge graph, MB-JRIKG)。该方法基于真实的职位数据构建求职领域知识图谱,并在偏好传播理论的基础上提出多行为偏好传播策略,将求聘各环节中“招聘者认可”设为目标行为,求职者浏览岗位和投递简历设定为辅助行为,综合预测求职者的偏好。首先,分别以用户在不同行为下的历史记录作为用户感兴趣的种子集,并在知识图谱中沿着节点之间的关系进行偏好传播以推理出用户的潜在偏好,增强用户表示;然后,将用户表示向量和职位表示向量输入预测函数中,计算用户在每个行为类型下的交互概率,并加权求和作为目标行为的交互概率;最后,使用阿里巴巴人岗智能匹配的比赛数据集进行点击率预测实验。结果表明,在与MF、XGBoost、KGCN、RippleNet 4个基准模型的对比中,MB-JRIKG相比次优基准模型RippleNet在指标AUC和ACC上分别提高了0.014 5和0.028 8,验证了模型的有效性,实现了数据的充分利用。该模型有效结合求聘双方的交互行为进行推荐,引入职位知识图谱的属性关联,对实现个性化的职位推荐有参考价值。 展开更多
关键词 自然语言处理 职位推荐 知识图谱 多行为 偏好传播
在线阅读 下载PDF
基于双向译码的实体关系抽取方法
17
作者 刘辉 张智 陈宇鹏 《应用科学学报》 北大核心 2025年第3期491-503,共13页
针对现有关系三元组提取方法存在的误差传播、嵌套三元组难提取和主客体难对齐等问题,从实体抽取、主客体对齐和关系判断3个子任务的全新视角出发,提出了一种新的基于联合实体关系抽取框架的双向译码解码模型。其中,双向抽取框架极大地... 针对现有关系三元组提取方法存在的误差传播、嵌套三元组难提取和主客体难对齐等问题,从实体抽取、主客体对齐和关系判断3个子任务的全新视角出发,提出了一种新的基于联合实体关系抽取框架的双向译码解码模型。其中,双向抽取框架极大地减少了级联误差传播;基于注意力机制的译码解码方法能够有效处理常规方法嵌套三元组难提取的问题,并有效对齐了主体和客体;关系判断模块的二部图方法充分挖掘了实体对之间的关系,实现了准确高效的关系判断。公开数据集上的实验结果验证了所提模型的性能。 展开更多
关键词 自然语言处理 信息提取 实体抽取 关系抽取 误差传播 三元组
在线阅读 下载PDF
结合对比学习和提示调优的层次文本分类方法
18
作者 郑诚 纪子威 《小型微型计算机系统》 北大核心 2025年第8期1878-1885,共8页
层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和... 层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和微调阶段的不同策略也限制了模型挖掘预训练模型的知识.本文提出一种结合对比学习和提示调优的层次文本分类方法,将层次标签信息嵌入到文本编码过程,同时设计提示模板整合标签信息,捕获文本与标签的关联性,弥合预训练模型与下游任务间的差距.借助对比学习,根据标签信息生成正样本,强化模型对关键特征的学习与保留,使模型有效指导文本特征表示的学习.在两个公开数据集上的大量实验表明了方法的有效性. 展开更多
关键词 层次文本分类 提示调优 对比学习 深度学习 自然语言处理
在线阅读 下载PDF
方面语义增强的融合网络用于方面级情感分析
19
作者 郑诚 陈雪灵 《小型微型计算机系统》 北大核心 2025年第9期2105-2112,共8页
方面级情感分析旨在识别方面词表达的情感.最近,基于依赖树的图卷积网络已被证明在方面级情感分析任务中是有效的.然而,句法依赖树并不是特定于情感分析的工具,不能关注到特定的方面词.针对上述问题,本文提出一种方面语义增强的融合网... 方面级情感分析旨在识别方面词表达的情感.最近,基于依赖树的图卷积网络已被证明在方面级情感分析任务中是有效的.然而,句法依赖树并不是特定于情感分析的工具,不能关注到特定的方面词.针对上述问题,本文提出一种方面语义增强的融合网络模型,该模型将句法,语义和词法信息与方面词相结合,用于方面级情感分析.首先,使用快速梯度对抗训练算法进行数据增强.其次,为了充分利用句法依赖树中的有效信息,分别使用图卷积网络和注意力机制学习依赖树中的句法信息和词法信息.同时,将方面增强注意力机制与自注意力机制相结合,来增强句子的方面语义感知能力.最后,使用非对称损失作为损失函数.在基准数据集上进行了实验,验证了本文模型的有效性. 展开更多
关键词 自然语言处理 方面级情感分析 数据增强 注意力机制 句法依赖树
在线阅读 下载PDF
基于电子病历多模态数据的作物病害多元场景处方推荐方法研究
20
作者 张领先 丁俊琦 +2 位作者 陈菲菲 李宜滨 张一丁 《农业机械学报》 北大核心 2025年第1期25-36,46,共13页
针对作物品种及病害种类繁杂、样本数据严重不平衡、处方类别多样及数据多模态等特点和难点,本文基于电子病历多模态数据整合,开展面向多样化、可拓展和多模态3种应用场景需求的作物病害处方推荐方法研究。针对常见病害多样化处方推荐... 针对作物品种及病害种类繁杂、样本数据严重不平衡、处方类别多样及数据多模态等特点和难点,本文基于电子病历多模态数据整合,开展面向多样化、可拓展和多模态3种应用场景需求的作物病害处方推荐方法研究。针对常见病害多样化处方推荐应用场景,基于CdsBERT-RCNN和诊断推理构建了作物病害多样化处方推荐模型,提升了面向32种常见病害的诊断准确度及处方推荐的多样化水平;针对未训练少见病害和新添处方应用场景,基于MC-SEM和语义检索构建了作物病害可拓展处方推荐模型,提升了语义匹配准确性和案例库检索速度,实现对未训练病害的处方推荐功能;针对多种模态信息采集和输入应用场景,基于BATNet多层特征融合构建了多模态作物病害处方推荐模型,提升了多模态数据输入的处方推荐性能。实验结果表明,CdsBERT-RCNN模型对32种常见病害的诊断准确率达到85.65%,F1值达到85.63%;不同完整性输入测试中,仅输入症状信息即可达到81.19%的准确率,而添加环境信息和作物信息分别使准确率进一步提高1.65、3.61个百分点;MC-SEM模型对电子病历语义匹配任务达到皮尔森相关系数86.34%和斯皮尔曼相关系数77.67%;封闭集和开放集上处方推荐准确率分别达到88.20%和82.04%,验证了模型对未训练病害的推荐能力;BATNet对于多模态输入处方推荐任务的准确率和F1值达到98.88%和98.83%;应用场景分析和测试验证了模型在不完整模态(纯文本或纯图像)和不完整信息输入(作物、环境、症状)情况下泛化能力。该研究为数字化赋能作物病害防治决策提供了新的思路。 展开更多
关键词 作物病害处方推荐 自然语言处理 语义检索 多模态融合 电子病历
在线阅读 下载PDF
上一页 1 2 74 下一页 到第
使用帮助 返回顶部