期刊文献+
共找到230篇文章
< 1 2 12 >
每页显示 20 50 100
图基础模型研究进展与挑战:图神经网络的视角
1
作者 吴涛 聂发志 +4 位作者 先兴平 王超 袁霖 乔少杰 牛伟纳 《通信学报》 北大核心 2025年第7期226-248,共23页
图基础模型(GFM)是基础模型思想在图学习领域中的延伸,是在广泛图数据上预训练并微调适配多种下游任务的图模型。与借助大语言模型(LLM)实现GFM的技术路线不同,主要关注从图神经网络(GNN)的角度构建GFM。首先,分析了GFM的研究现状并定... 图基础模型(GFM)是基础模型思想在图学习领域中的延伸,是在广泛图数据上预训练并微调适配多种下游任务的图模型。与借助大语言模型(LLM)实现GFM的技术路线不同,主要关注从图神经网络(GNN)的角度构建GFM。首先,分析了GFM的研究现状并定义了关键概念。其次,总结了GFM骨干架构和基础表示单元的研究成果。再次,根据代理任务和微调策略的不同,分别总结了图模型的预训练技术与微调方法。然后,介绍了与GFM相关的评价指标。最后,分析了面临的挑战并展望了未来的研究方向。 展开更多
关键词 图基础模型 图神经网络 预训练 模型微调 提示调优
在线阅读 下载PDF
基于多侧面信息表征联合的实体相似性度量及对齐方法
2
作者 朱红 王阔然 朱彤 《计算机工程》 北大核心 2025年第3期64-75,共12页
实体对齐旨在发现不同知识图谱中相同对象的不同实例,但图谱之间的异构性导致等价实例结构及表征不一致,从而影响实体对齐准确性。提出一种实体主信息与多侧面信息表征相联合的异构图谱实体相似性度量方法,并用于实体对齐任务。实体主... 实体对齐旨在发现不同知识图谱中相同对象的不同实例,但图谱之间的异构性导致等价实例结构及表征不一致,从而影响实体对齐准确性。提出一种实体主信息与多侧面信息表征相联合的异构图谱实体相似性度量方法,并用于实体对齐任务。实体主信息包括实体名称及描述,侧面信息包括实体属性、关系及关联实体描述等信息。针对图谱间等价实体结构异构带来的对齐干扰,提出了一种结合实体多侧面信息语义表征的相似性度量方法UnMuSIR-SM&EA用于实体对齐。为提升信息同义词的表示一致性,引入表示学习模型以获取实体各信息的语义表征,为解决表示学习模型嵌入空间各向异性带来的同义词度量尺度不一致问题,设计了一种基于实体主信息对比学习的微调方法,优化实体信息的语义表征。实验结果表明,该方法在结构差异较大的数据集DIS_(ZH-EN)上的Hits@1达到了95.2%,比基于侧面信息的模型BERT-INT高出了16.8百分点;在DBP15K的DBP15K_(ZH-EN)、DBP15K_(JA-EN)和DBP15K_(FR-EN)数据子集上的Hits@1分别达到了95.7%、96.0%和98.9%;在DBP-WD数据集上的Hits@1达到了99.4%。所提模型在实体对齐任务上具有优异的效果。 展开更多
关键词 实体对齐 知识图谱 相似性度量 对比学习 预训练模型
在线阅读 下载PDF
基于图结构增强的番茄叶部病害识别方法
3
作者 刘博 王斌成 +2 位作者 陶旭 郭娜炜 马寅驰 《中国农机化学报》 北大核心 2025年第5期125-132,共8页
番茄作为重要的蔬菜作物,其产量和质量常受到各类叶部病害的影响。针对此问题,计算机视觉技术已被广泛应用于病害的自动识别中。现有方法主要分为基于手工特征提取与深度学习两大类。基于手工特征的方法虽然简洁高效,但在鲁棒性方面存... 番茄作为重要的蔬菜作物,其产量和质量常受到各类叶部病害的影响。针对此问题,计算机视觉技术已被广泛应用于病害的自动识别中。现有方法主要分为基于手工特征提取与深度学习两大类。基于手工特征的方法虽然简洁高效,但在鲁棒性方面存在限制;而基于深度学习的方法,尽管能有效提升识别准确性,但往往需要较大的数据标注量与较高的计算复杂性。为解决这些问题,提出一种基于图结构增强的番茄叶部病害识别框架(TDR—EGS)。TDR—EGS通过整合样本间的拓扑关系,实现图学习与单样本学习的交替训练,从而在不增加模型推理阶段复杂度的前提下有效提升分类性能。首先通过卷积神经网络提取单样本特征,然后利用这些特征构建k近邻图以挖掘样本间的结构信息。这种方法使得图学习和单样本学习能够在共享的网络结构和外部存储机制的支持下协同工作。在11种番茄病害上的试验结果表明,TDR—EGS能在不增加推理复杂度的前提下有效提升多种主流基准模型的性能,最高达到98.61%的识别精度。此外,即使在仅使用60%标签信息的条件下,TDR—EGS的性能仍可以接近或超过完全监督学习的基准模型,充分证明该框架的有效性和泛化能力,为农业病害识别应用提供一种高效且通用的解决方案。 展开更多
关键词 番茄叶部 病害识别 图学习 k近邻图 交替训练 深度学习
在线阅读 下载PDF
KAACNN:融合知识图谱和预训练模型的短文本多标签分类方法
4
作者 陶冶 徐锴 +2 位作者 刘天宇 鲁超峰 王浩杰 《中文信息学报》 北大核心 2025年第3期96-106,共11页
短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训... 短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训练语言模型提高短文本的文本表示能力;另一方面从外部知识库中检索短文本概念知识,并利用注意力机制将其与短文本结合用于分类任务。此外,针对数据集类别分布不均衡的问题,该文提出基于领域类别知识图谱的数据增强方法。在三个公共数据集和一个汽车领域客户原话数据集上进行了实验,结果表明,引入知识图谱和预训练语言模型的分类方法优于目前先进的短文本分类方法,证明了外部知识库和预训练语言模型的先验知识在短文本分类中的有效性。 展开更多
关键词 知识图谱 注意力机制 预训练语言模型 数据增强 短文本分类
在线阅读 下载PDF
基于预训练语言模型的知识图谱研究综述 被引量:5
5
作者 曾泽凡 胡星辰 +2 位作者 成清 司悦航 刘忠 《计算机科学》 北大核心 2025年第1期1-33,共33页
大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已... 大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已经成为了知识图谱研究的主要手段。系统梳理了基于预训练语言模型的知识图谱研究的相关工作,包括知识图谱构建、表示学习、推理、问答等,介绍了相关模型和方法的核心思路,并依据技术路径建立了分类体系,对不同类型方法的优缺点进行了对比分析。此外,对预训练语言模型在事件知识图谱和多模态知识图谱这两种新型知识图谱中的应用现状进行了综述。最后,总结了当前基于预训练语言模型的知识图谱研究面临的挑战,展望了未来的研究方向。 展开更多
关键词 知识图谱 预训练语言模型 大语言模型 多模态 事件知识图谱
在线阅读 下载PDF
基于结构多维特征构建图卷积神经网络的结构损伤识别方法
6
作者 杨建辉 赵清瑄 蒲脯林 《湖南大学学报(自然科学版)》 北大核心 2025年第8期158-171,共14页
以数据为驱动的深度学习结构损伤识别(structural damage identification,SDI)效果受结构复杂程度、模型构建方法及数据规模等因素影响较大.本文引入图卷积神经网络(graph convolutional neural network,GCN)以整合结构节点间的属性特征... 以数据为驱动的深度学习结构损伤识别(structural damage identification,SDI)效果受结构复杂程度、模型构建方法及数据规模等因素影响较大.本文引入图卷积神经网络(graph convolutional neural network,GCN)以整合结构节点间的属性特征,从图的视角挖掘节点间的复杂属性关系,为SDI提供多维度学习信息.为此,设计了一种融合结构多维特征的图卷积神经网络模型(graph convolutional neural network integrating multi-dimensional features of structure,S-GCN),基于结构振动数据构造损伤特征矩阵,并通过衍生图网络,以图的节点和边表征结构节点的连接关系,构建边索引矩阵,将结构损伤状态、振动数据及节点属性等多维特征信息输入GCN进行结构损伤特征提取及预测识别,探索结构多维特征信息驱动下的GCN在损伤预测中的应用效果.通过两个钢结构验证方法的可行性及有效性,结果表明,S-GCN能够整合结构多维特征信息,对两个结构对象均实现了较高的损伤预测准确性,并展现出良好的噪声鲁棒性.进一步的对比分析显示,相较于三种非GCN模型,S-GCN能够高效地依托节点间关系快速更新节点特征并预测节点损伤状态,其损伤识别准确率、计算效率及网络各层演进过程均优于对比模型,验证了在结构损伤识别中融合结构空间特征的有效性. 展开更多
关键词 结构损伤识别 图卷积神经网络 结构多维特征融合 噪声鲁棒性 训练效率
在线阅读 下载PDF
融合多模态数据的地震灾害知识图谱构建及应用 被引量:1
7
作者 吴麒瑞 田苗 +3 位作者 谢忠 邱芹军 陈占龙 陶留锋 《地质科技通报》 北大核心 2025年第4期90-106,共17页
地震灾害观测数据多源异构、蕴含知识分散且关联程度低,导致难以高效利用数据进行信息整合和查询,进而提供风险评估、救援决策辅助支持。知识图谱是一种有效的数据关联和融合的手段。首先,基于自顶向下方法梳理地震灾害领域概念,构建地... 地震灾害观测数据多源异构、蕴含知识分散且关联程度低,导致难以高效利用数据进行信息整合和查询,进而提供风险评估、救援决策辅助支持。知识图谱是一种有效的数据关联和融合的手段。首先,基于自顶向下方法梳理地震灾害领域概念,构建地震灾害数据、地质/地理环境、地震灾害事件、地震灾害应急任务、地震灾害模型本体,形成地震灾害本体层;结合自底向上方法构建高质量数据层,通过卷积神经网络对遥感影像进行灾害前后变化识别,实现从影像信息到文本知识的智能结构化转换;融合微调后通用信息抽取框架(universal information extraction,简称UIE)预训练模型对文本数据进行命名实体及关系属性知识抽取,精确率分别为82.04%和70.66%。通过计算词向量语义相似度实现数据融合与统一表达。以2023年12月18日甘肃省临夏州积石山县地震为例,通过本体构建、数据抽取、统一表达形成高质量地震灾害知识图谱,实现地震灾害多源异构地震数据到统一知识表达的转化。基于所构建的地震灾害知识图谱实现了灾害损失、应急链决策支持的查询展示,及结合相关地质数据推理和查询潜在次生灾害。该方法结合深度学习与预训练技术,融合多模态数据,构建了地震灾害知识图谱构建,为快速准确的地震灾害信息查询与次生灾害发生提供辅助支撑。 展开更多
关键词 积石山地震 地震灾害知识图谱 信息查询 预训练模型 多模态数据
在线阅读 下载PDF
融合知识和语义信息的双编码器自动摘要模型 被引量:1
8
作者 贾莉 马廷淮 +1 位作者 桑晨扬 潘倩 《计算机工程与应用》 北大核心 2025年第7期213-221,共9页
为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating kn... 为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating knowledge and semantic information,KSDASum)。该方法采用双编码器对原文语义信息进行充分编码,文本编码器获取全文的语义信息,图结构编码器维护全文上下文结构信息。解码器部分采用基于Transformer结构和指针网络,更好地捕捉文本和结构信息进行交互,并利用指针网络的优势提高生成摘要的准确性。同时,训练过程中采用强化学习中自我批判的策略梯度优化模型能力。该方法在CNN/Daily Mail和XSum公开数据集上与GSUM生成式摘要方法相比,在评价指标上均获得最优的结果,证明了所提模型能够有效地利用知识和语义信息,提升了生成文本摘要的能力。 展开更多
关键词 知识图谱编码器 图注意力机制 指针网络 增强训练 自动摘要
在线阅读 下载PDF
文本信息与图结构信息相融合的知识图谱补全 被引量:1
9
作者 范厚龙 房爱莲 林欣 《华东师范大学学报(自然科学版)》 北大核心 2025年第1期111-123,共13页
提出了一种基于路径查询信息的图注意力模型,可以将知识图谱中的文本信息与图结构信息有效融合,进而提高知识图谱的补全效果.对于文本信息,使用基于预训练语言模型的双编码器来分别获得实体的嵌入表示和路径查询信息的嵌入表示.通过注... 提出了一种基于路径查询信息的图注意力模型,可以将知识图谱中的文本信息与图结构信息有效融合,进而提高知识图谱的补全效果.对于文本信息,使用基于预训练语言模型的双编码器来分别获得实体的嵌入表示和路径查询信息的嵌入表示.通过注意力机制来进行路径查询信息的聚合,以捕获图结构信息,更新实体的嵌入表示.模型使用对比学习进行训练,在多个知识图谱数据集上进行实验,如直推式、归纳式的方式,都取得了良好的效果.结果表明,将预训练语言模型与图神经网络的优势相结合,可以有效捕获知识图谱中文本信息与图结构信息,进而提高知识图谱的补全效果. 展开更多
关键词 知识图谱补全 预训练语言模型 对比学习 图神经网络
在线阅读 下载PDF
基于多源知识注入的常识问答方法研究 被引量:1
10
作者 朱嘉骏 包美凯 +2 位作者 张凯 刘烨 刘淇 《计算机工程与科学》 北大核心 2025年第2期349-360,共12页
常识问答任务致力于让模型回答人类常识问题。针对该任务的一类方法是检索相关的知识来辅助模型回答常识问题。该类方法主要分为知识查询和知识推理2个步骤。知识查询是指根据问题检索到与之相关联的知识,而知识推理是指利用检索到的知... 常识问答任务致力于让模型回答人类常识问题。针对该任务的一类方法是检索相关的知识来辅助模型回答常识问题。该类方法主要分为知识查询和知识推理2个步骤。知识查询是指根据问题检索到与之相关联的知识,而知识推理是指利用检索到的知识辅助回答常识问题。对此,常识问答面临的一个挑战是如何找到合适的外部知识来帮助回答问题。现有的许多常识问答模型通常依赖于单个外部知识源,但鉴于常识知识的广泛性和多样性,单一来源很难全面覆盖所需的所有知识。针对这一问题,提出了一种基于多源知识注入的常识问答方法。首先,在知识查询过程中为了应对知识覆盖度问题,利用预训练语言模型整合来自多个来源的知识(包括结构化和非结构化的知识),形成统一的知识表征;其次,在知识推理过程中为了充分利用结构化知识蕴含的语义关系,模型识别文本中的实体概念和实体之间的关系路径从而构建实体关系图,然后,利用图注意力网络对实体关系图建模;最后,利用实体关系图和实体知识表征中的证据信息对问题进行推理和解答。所提方法经预训练得到的模型在CommonsenseQA数据集上的测试结果显示,基于多源知识注入的常识问答方法在验证集和测试集上的准确率分别达到79.20%和75.02%,超过了最好的基线模型。实验结果表明了多源知识注入方法在常识问答任务中的有效性。 展开更多
关键词 常识问答 知识注入 预训练语言模型 图神经网络 注意力机制
在线阅读 下载PDF
路径掩码自编码器引导无监督属性图节点聚类
11
作者 丁新宇 孔兵 +2 位作者 陈红梅 包崇明 周丽华 《计算机科学》 北大核心 2025年第1期160-169,共10页
图聚类的目的在于发现网络的社区结构。针对目前聚类方法无法很好地获取网络深层潜在社区信息,且不能对特征进行合适的信息整合导致节点社区语义不清晰的问题,提出了一种路径掩码自编码器引导无监督属性图节点聚类模型(Path-Masked Auto... 图聚类的目的在于发现网络的社区结构。针对目前聚类方法无法很好地获取网络深层潜在社区信息,且不能对特征进行合适的信息整合导致节点社区语义不清晰的问题,提出了一种路径掩码自编码器引导无监督属性图节点聚类模型(Path-Masked Autoencoder Guiding Unsupervised Attribute Graph Node Clustering, PAUGC)。该模型通过对网络进行随机路径掩码后使用自编码器来深度挖掘网络拓扑结构,从而获得良好的全局结构语义信息,利用规范性方法来对特征进行信息整合,使节点特征能够更好地表征特征的类别信息。此外,模型结合模块最大化来抓取整个图中的底层社区群落信息,目的在于更合理地将其融合到低维度节点特征中。最后通过自训练聚类来不断迭代优化更新聚类表示以获得最终的节点特征。通过在8个基准数据集上与11种经典方法进行大量实验对比,证明了PAUGC的有效性。 展开更多
关键词 深度图聚类 无监督学习 特征信息整合 模块最大化 聚类自训练
在线阅读 下载PDF
基于分布式环境的图神经网络模型训练效率与训练性能评估
12
作者 涂银川 郭勇 +3 位作者 毛恒 任怡 张建锋 李宝 《计算机应用》 北大核心 2025年第8期2409-2420,共12页
随着图数据规模的快速增长,图神经网络(GNN)在处理大规模图结构数据时面临计算和存储方面的挑战。传统的单机训练方法已不足以应对日益庞大的数据集和复杂的GNN模型,分布式训练凭借并行计算能力和可扩展性,成为解决这些问题的有效途径... 随着图数据规模的快速增长,图神经网络(GNN)在处理大规模图结构数据时面临计算和存储方面的挑战。传统的单机训练方法已不足以应对日益庞大的数据集和复杂的GNN模型,分布式训练凭借并行计算能力和可扩展性,成为解决这些问题的有效途径。然而,一方面,已有的分布式GNN训练评估主要关注以模型精度为代表的性能指标和以训练时间为代表的效率指标,而较少关注数据处理效率和计算资源利用方面的指标;另一方面,算法效率评估的主要场景为单机单卡或单机多卡,而已有的评估方法在分布式环境中的应用相对简单。针对这些不足,提出针对分布式场景的模型训练的评估方法,涵盖评估指标、数据集和模型这3个方面。根据评估方法,选取3个代表性GNN模型,在4个具有不同数据特征的大型公开图数据集上进行分布式训练实验,并收集和分析得到的评估指标。实验结果表明,分布式训练中的模型架构和数据结构特征对模型复杂度、训练时间、计算节点吞吐量和计算节点平均吞吐量之比(NATR)均有影响;样本处理与数据拷贝占用了模型训练较多时间,计算节点互相等待的时间也不容忽视;相较于单机训练,分布式训练的计算节点吞吐量有显著降低,且需要进一步优化分布式系统中的资源利用。可见,所提评估方法为GNN模型在分布式环境中的训练性能优化提供了参考依据,并为模型的进一步优化和算法的改进奠定了实验基础。 展开更多
关键词 模型评估 图神经网络 分布式训练 训练效率 训练性能
在线阅读 下载PDF
基于图注意力机制和对抗训练的语音反欺骗方法 被引量:1
13
作者 陆华庆 葛子瑞 +2 位作者 王天朗 郭海燕 杨震 《信号处理》 北大核心 2025年第1期161-173,共13页
语音反欺骗任务旨在通过设计网络结构和学习算法来区分真实语音和欺骗语音,以提升语音系统安全性。本文提出了一种结合图注意力机制和对抗训练的语音反欺骗方法,以应对语音反欺骗任务中的挑战。具体地,基于说话人吸引子多中心单类(speak... 语音反欺骗任务旨在通过设计网络结构和学习算法来区分真实语音和欺骗语音,以提升语音系统安全性。本文提出了一种结合图注意力机制和对抗训练的语音反欺骗方法,以应对语音反欺骗任务中的挑战。具体地,基于说话人吸引子多中心单类(speaker attractor multi-center one-class, SAMO)学习算法,利用图信号处理(graph signal processing, GSP)理论,本文提出了采用图注意力网络(graph attention network, GAT)提取说话人吸引子中心的方法。通过引入注意力机制来聚合说话人特征表示,以计算出更具代表性的说话人吸引子中心,从而提高系统对真实语音和欺骗语音的区分能力。另外,考虑到当网络只学习到训练集中已知欺骗类型的特定欺骗伪影时,则分类网络可能无法有效应对未知类型的欺骗攻击。本文在反欺骗网络结构中引入欺骗类型分类对抗网络,通过特征表示学习模块和欺骗类型分类辅助网络的对抗训练,促使网络能够从不同类型的欺骗语音中学习到共同的欺骗伪影特征,从而提升系统对实际测试中未知类型欺骗语音的检测能力。在ASVspoof 2019 LA、CFAD和ASVspoof 2021 LA数据集上进行了实验,实验结果表明所提方法在性能上优于基线系统和其他对比系统。此外,本文还采用了t分布随机邻居嵌入(t-distributed stochastic neighbor embedding, t-SNE)和相似度矩阵热力图的可视化方法,直观展示了所提方法在准确区分真实语音和欺骗语音方面的优势,并验证了对抗训练技术在学习共同欺骗伪影特征方面的有效性。 展开更多
关键词 语音反欺骗 图注意力机制 单分类 对抗训练 多任务学习
在线阅读 下载PDF
基于图的Co-Training网页分类 被引量:9
14
作者 侯翠琴 焦李成 《电子学报》 EI CAS CSCD 北大核心 2009年第10期2173-2180,2219,共9页
本文充分利用网页数据的超链接关系和文本信息,提出了一种用于网页分类的归纳式半监督学习算法:基于图的Co-training网页分类算法(Graph based Co-training algorithmfor web page classification),简称GCo-training,并从理论上证明了... 本文充分利用网页数据的超链接关系和文本信息,提出了一种用于网页分类的归纳式半监督学习算法:基于图的Co-training网页分类算法(Graph based Co-training algorithmfor web page classification),简称GCo-training,并从理论上证明了算法的有效性.GCo-training在Co-training算法框架下,迭代地学习一个基于由超链接信息构造的图的半监督分类器和一个基于文本特征的Bayes分类器.基于图的半监督分类器只利用少量的标记数据,通过挖掘数据间大量的关系信息就可达到比较高的预测精度,可为Bayes分类器提供大量的标记信息;反过来学习大量标记信息后的Bayes分类器也可为基于图的分类器提供有效信息.迭代过程中,二者互相帮助,不断提高各自的性能,而后Bayes分类器可以用来预测大量未见数据的类别.在Web→KB数据集上的实验结果表明,与利用文本特征和锚文本特征的Co-training算法和基于EM的Bayes算法相比,GCo-training算法性能优越. 展开更多
关键词 半监督 CO-trainING 归纳式 网页分类
在线阅读 下载PDF
BiGCN-TL:软件错误部分定位场景下二分图图卷积神经网络Transformer定位模型
15
作者 施恩译 常舒予 +2 位作者 陈可佳 张扬 黄海平 《计算机科学》 北大核心 2025年第S1期862-872,共11页
在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更... 在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更集或软件错误语义特征的提取,往往只分别独立地依赖各自的上下文。现代软件项目规模庞大,代码依赖错综复杂、这样分别独立的语义提取方式,降低了单个文本语义特征的质量与鲁棒性,导致最终的定位性能下滑。为实现对软件错误相关代码的全面追溯,提出了BiGCN-TL模型。BiGCN-TL重点聚焦训练模型促进不同文本之间信息交互的能力,旨在降低对单个文本语义特征质量的依赖,使得在现代软件项目规模庞大、代码依赖错综复杂、单个文本语义特征提取困难的场景下,仍能通过高效的信息交互,提取到高质量语义特征,提高定位准确率。首先根据已知的部分定位关系,微调基于Transformer的预训练模型。然后,创新性地将软件错误和代码变更集建模成二分图的数据结构,借此充分利用已知的“多对多”关系,并使用微调后的编码器得到节点特征的初始表示。之后,基于二分图设计链接预测任务,训练GCN与二分类鉴别器。借助图卷积操作和注意力机制动态更新节点特征,重点训练模型促进文本信息的交互,动态更新节点特征的能力,从而得到高质量全局分类特征,最终输出匹配预测得分。在多个数据集上开展了对比实验,结果验证了BiGCN-TL相比传统方案的优越性,并通过消融实验确认了各模块的有效性。此外,通过探索多种预训练模型与GCN的组合,并结合具体案例和可视化分析,进一步验证了BiGCN-TL的通用性与鲁棒性。 展开更多
关键词 错误定位 预训练模型 链接预测 二分图 图神经网络
在线阅读 下载PDF
融合ERNIE的自然灾害舆情事理图谱构建及次生衍生事件探测研究 被引量:1
16
作者 李诗轩 王璐 +2 位作者 沈愿 陈烨 周禾深 《情报杂志》 北大核心 2025年第3期128-138,共11页
[研究目的]基于规则模版和大语言模型构建面向自然灾害的网络舆情事理图谱,结合情感分析进行舆情演化分析,进而实现次生衍生事件探测,为突发事件舆情管理与预警提供理论和实践参考。[研究方法]分别利用规则模板和预训练模型ERNIE提取关... [研究目的]基于规则模版和大语言模型构建面向自然灾害的网络舆情事理图谱,结合情感分析进行舆情演化分析,进而实现次生衍生事件探测,为突发事件舆情管理与预警提供理论和实践参考。[研究方法]分别利用规则模板和预训练模型ERNIE提取关系事件对,并利用K-means和BERTopic进行事件泛化,构建自然灾害网络舆情抽象事理图谱。同时利用情感词典进行情感演化分析,结合同类灾害事件的相似度计算,构建同类事件的网络舆情预测事理图谱。[研究结果/结论]自然灾害舆情抽象事理图谱能够分析事件的因果与顺承关系,揭示舆情演化过程中的关键事件。预测事理图谱可以辅助次生衍生事件探测,实现舆情预警。对比发现基于预训练模型ERNIE结合BERTopic构建的图谱抽象事件较少,事件集中于中心节点,而规则模板结合K-means得到的图谱抽象事件较多,关系较为分散。 展开更多
关键词 网络舆情 自然灾害 事理图谱 预训练模型ERNIE 情感演化分析 次生衍生事件探测
在线阅读 下载PDF
列控车载设备故障诊断的知识图谱构建与应用
17
作者 刘丹 张振海 +1 位作者 翟秋宇 余家乐 《铁道标准设计》 北大核心 2025年第5期184-192,共9页
车载设备是列车运行控制系统的核心组成部分,为减少车载设备故障发生频次和故障处理的时间损耗,需要对车载设备的运行状态和故障现象进行准确地分析和诊断。知识图谱技术作为人工智能领域的研究热点,在现有传统故障诊断方法未有效利用... 车载设备是列车运行控制系统的核心组成部分,为减少车载设备故障发生频次和故障处理的时间损耗,需要对车载设备的运行状态和故障现象进行准确地分析和诊断。知识图谱技术作为人工智能领域的研究热点,在现有传统故障诊断方法未有效利用非结构化的先验知识和处理结果不具解释性的问题上可提供新的解决思路,因此,提出一种基于知识图谱的列控车载设备故障诊断方法。实体识别是构建图谱的关键技术之一,结合传统中文实体识别方法存在识别效果不佳和全局语义难以共享问题,采用Graph Attention和CRF相结合的神经网络模型来实现实体识别。首先,以近三年某铁路局的列控车载设备典型故障分析报告作为实验数据集进行预处理;接着,对Graph Attention神经网络模型进行训练与优化,由条件随机场模型(CRF)得到最优的文本标签序列;为验证该方法在实体识别中的有效性,在同一语料环境下,将Graph Attention-CRF神经网络模型与其他3种模型作对比,结果表明,本文提出的模型F1值可达94.24%,实体识别准确率较当前主流的BiLSTM-CRF模型提升4.51%,较FLAT模型提升2.42%,测试时间也只比用时最短的BiLSTM-CRF模型多0.41 s。最后,利用设定的关系匹配规则将识别的实体进行链接和匹配来完成包含车载设备故障信息的知识图谱,并以图谱问答的故障诊断方式给维修工作人员提供决策辅助。 展开更多
关键词 列控车载设备 故障诊断 知识图谱 graph Attention-CRF算法 智能问答 辅助决策
在线阅读 下载PDF
融合降噪微调与图注意力机制的藏文长文本分类
18
作者 敬容 万福成 +2 位作者 黄锐 于洪志 马宁 《计算机工程与科学》 北大核心 2025年第6期1133-1140,共8页
在藏文长文本分类任务中,长距离依赖问题尤为突出。同时,多语言预训练模型在处理藏文文本分类任务时也存在一定的偏差。针对以上问题,基于预训练语言模型CINO-Large,提出融合降噪微调与图注意力机制的藏文长文本分类方法。首先,在CINO-L... 在藏文长文本分类任务中,长距离依赖问题尤为突出。同时,多语言预训练模型在处理藏文文本分类任务时也存在一定的偏差。针对以上问题,基于预训练语言模型CINO-Large,提出融合降噪微调与图注意力机制的藏文长文本分类方法。首先,在CINO-Large中引入不完全信任损失函数In-trust,通过任务适应性损失增强模型在下游任务中的泛化能力。其次,在图结构建模中引入滑动窗口和线性分类,选择性增加文档与文档边缘,提高节点间的特征区分度。最后,利用图注意力机制GAT捕捉不同节点在图中的重要性,完成藏文长文本分类任务。在TNCC中的新闻长文本上,由所提方法构建的模型的分类准确率达到了71.66%,与预训练语言模型CINO-Large相比,其准确率、精确度和F1分数分别提高了1.77%、2.67%和2.03%,在部分分类困难的子类别上,模型的F1分数能显著提升20%左右。 展开更多
关键词 预训练模型 降噪微调 图注意力机制 藏文长文本分类
在线阅读 下载PDF
基于知识图谱的露天矿爆破安全管理问答系统
19
作者 孙嘉怡 李萍丰 +5 位作者 管伟明 谭洁 赵明生 余红兵 温颖远 唐洪佩 《爆破》 北大核心 2025年第2期188-201,共14页
在爆破作业中,安全管理发挥着至关重要的作用,爆破安全与“钻孔、爆破、采装、运输、排土”等工艺流程密切相关,工序之间相互作用显著。然而,由于现有爆破安全数据来源多样、结构复杂,缺乏系统化集成,导致现场作业人员在面对复杂工况时... 在爆破作业中,安全管理发挥着至关重要的作用,爆破安全与“钻孔、爆破、采装、运输、排土”等工艺流程密切相关,工序之间相互作用显著。然而,由于现有爆破安全数据来源多样、结构复杂,缺乏系统化集成,导致现场作业人员在面对复杂工况时难以准确获取关键安全知识,给安全管理带来了挑战。因此将基于BERT-BiLSTM-CRF的命名实体识别方法应用于爆破安全管理领域。首先采用BERT预训练模型获取动态词向量,其次采用BiLSTM-CRF进行实体最佳标签序列标注,构建了涵盖7类实体和9类关系的知识图谱,并利用开源图数据库系统Neo4j存储知识图谱数据。结果表明:模型所有实体类型的F 1值均在60%以上,证明该模型较传统模型实体识别提取精度显著提高。并基于知识图谱模型开发了露天煤矿爆破工艺安全管理知识问答系统,完成领域知识查询及各类爆破工艺与安全标准的迅速匹配。通过问答系统的支持,现场工程师能够在复杂的爆破安全管理中迅速做出科学决策。 展开更多
关键词 知识图谱 问答系统 爆破安全 工艺流程 预训练语言模型
在线阅读 下载PDF
面向电子商务社交知识图谱高效增量预训练的双向模仿蒸馏
20
作者 朱渝珊 张文 +5 位作者 王晓珂 李志宇 陈名杨 姚祯 陈辉 陈华钧 《软件学报》 北大核心 2025年第3期1218-1239,共22页
知识图谱(knowledge graph,KG)预训练模型有助于电子商务应用中各种下游任务,然而,对于具有高动态性的大规模电商社交知识图谱来说,预训练模型需要及时更新以感知由用户交互引起的节点特征变化.提出一种针对电商社交知识图谱预训练模型... 知识图谱(knowledge graph,KG)预训练模型有助于电子商务应用中各种下游任务,然而,对于具有高动态性的大规模电商社交知识图谱来说,预训练模型需要及时更新以感知由用户交互引起的节点特征变化.提出一种针对电商社交知识图谱预训练模型的高效增量学习方法,该方法通过基于双向模仿蒸馏的训练策略充分挖掘不同样本对模型更新的作用,并通过基于样本常规性和反常性的采样策略来减少训练数据规模,提升模型更新效率.此外,还提出一种逆重放机制,为社交知识图谱预训练模型的增量训练生成高质量的负样本.在真实的电子商务数据集和相关下游任务上的实验结果表明,相较于最先进的方法,所提方法可以更有效且高效地增量更新社交知识图谱预训练模型. 展开更多
关键词 知识图谱 知识图谱预训练 增量学习 知识蒸馏
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部