期刊文献+
共找到232篇文章
< 1 2 12 >
每页显示 20 50 100
基于图的Co-Training网页分类 被引量:9
1
作者 侯翠琴 焦李成 《电子学报》 EI CAS CSCD 北大核心 2009年第10期2173-2180,2219,共9页
本文充分利用网页数据的超链接关系和文本信息,提出了一种用于网页分类的归纳式半监督学习算法:基于图的Co-training网页分类算法(Graph based Co-training algorithmfor web page classification),简称GCo-training,并从理论上证明了... 本文充分利用网页数据的超链接关系和文本信息,提出了一种用于网页分类的归纳式半监督学习算法:基于图的Co-training网页分类算法(Graph based Co-training algorithmfor web page classification),简称GCo-training,并从理论上证明了算法的有效性.GCo-training在Co-training算法框架下,迭代地学习一个基于由超链接信息构造的图的半监督分类器和一个基于文本特征的Bayes分类器.基于图的半监督分类器只利用少量的标记数据,通过挖掘数据间大量的关系信息就可达到比较高的预测精度,可为Bayes分类器提供大量的标记信息;反过来学习大量标记信息后的Bayes分类器也可为基于图的分类器提供有效信息.迭代过程中,二者互相帮助,不断提高各自的性能,而后Bayes分类器可以用来预测大量未见数据的类别.在Web→KB数据集上的实验结果表明,与利用文本特征和锚文本特征的Co-training算法和基于EM的Bayes算法相比,GCo-training算法性能优越. 展开更多
关键词 半监督 CO-trainING 归纳式 网页分类
在线阅读 下载PDF
近亲结点图编辑的Self-Training算法 被引量:1
2
作者 刘学文 王继奎 +3 位作者 杨正国 易纪海 李冰 聂飞平 《计算机工程与应用》 CSCD 北大核心 2022年第14期144-152,共9页
Self-Training算法的性能很大程度上取决于高置信度样本的识别准确度。受DPC算法启发,利用密度峰值定义样本间的原型关系,并构造出近亲结点图这一新型数据结构。在此基础上,提出了一种近亲结点图编辑的Self Training算法(self-training ... Self-Training算法的性能很大程度上取决于高置信度样本的识别准确度。受DPC算法启发,利用密度峰值定义样本间的原型关系,并构造出近亲结点图这一新型数据结构。在此基础上,提出了一种近亲结点图编辑的Self Training算法(self-training algorithm with editing direct relative node graph-DRNG)。DRNG采用假设检验的方法选择高置信度样本,将其加入有标签样本集进行迭代训练。因误分的高密度样本点对Self-Training算法的分类性能影响较大,所以,DRNG综合考虑距离和密度两个方面定义了近亲结点图中割边的非对称权重,增大了高密度点的割边权重,使其落在拒绝域外的概率增加,减小了因其误分类而产生的风险。为了验证DRNG的性能,在8个基准数据集上与类似算法进行对比实验,实验结果验证了DRNG的有效性。 展开更多
关键词 近亲结点图 半监督分类 密度峰值 自训练
在线阅读 下载PDF
基于融合评价指标BERT-RGCN的油田评价区块调整措施推荐方法
3
作者 王梅 朱晓丽 +2 位作者 孙洪国 王海艳 濮御 《东北石油大学学报》 北大核心 2025年第5期110-120,I0008,共12页
为解决油田领域区块调整措施推荐过程中存在的样本数据稀疏和语义特征复杂等问题,提出基于融合评价指标(EI)的变换器双向编码(BERT)与关系图卷积神经网络(RGCN)的油田评价区块调整措施推荐方法(EI-BERT-RGCN方法)。根据评价指标、评价... 为解决油田领域区块调整措施推荐过程中存在的样本数据稀疏和语义特征复杂等问题,提出基于融合评价指标(EI)的变换器双向编码(BERT)与关系图卷积神经网络(RGCN)的油田评价区块调整措施推荐方法(EI-BERT-RGCN方法)。根据评价指标、评价区块及措施之间的交互信息构建异构图,利用BERT模型生成评价指标、评价区块及措施术语词向量,共同作为输入词向量,将融合评价指标信息的异构图和输入词向量放入RGCN模型训练,学习评价区块的有效表征;在某油田评价区块提供的数据集上进行实验对比。结果表明:EI-BERT-RGCN方法能够捕捉文本中隐含的复杂语义并缓解数据稀疏问题,能更好理解未观察到的评价指标与调整措施之间的潜在关系,提升节点的表示质量。EI-BERT-RGCN模型在精确率、召回率、F_(1)分数及ROC曲线下面积等评价指标上优于其他基准模型,在保持较高精确率的同时,展现更好的泛化能力和鲁棒性。该结果为油田评价区块调整措施推荐提供参考。 展开更多
关键词 异构图 变换器双向编码(BERT) 预训练模型 关系图卷积神经网络(RGCN) 推荐算法 措施推荐 油田评价区块
在线阅读 下载PDF
基于预训练语言模型的知识图谱研究综述 被引量:11
4
作者 曾泽凡 胡星辰 +2 位作者 成清 司悦航 刘忠 《计算机科学》 北大核心 2025年第1期1-33,共33页
大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已... 大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已经成为了知识图谱研究的主要手段。系统梳理了基于预训练语言模型的知识图谱研究的相关工作,包括知识图谱构建、表示学习、推理、问答等,介绍了相关模型和方法的核心思路,并依据技术路径建立了分类体系,对不同类型方法的优缺点进行了对比分析。此外,对预训练语言模型在事件知识图谱和多模态知识图谱这两种新型知识图谱中的应用现状进行了综述。最后,总结了当前基于预训练语言模型的知识图谱研究面临的挑战,展望了未来的研究方向。 展开更多
关键词 知识图谱 预训练语言模型 大语言模型 多模态 事件知识图谱
在线阅读 下载PDF
基于图结构增强的番茄叶部病害识别方法
5
作者 刘博 王斌成 +2 位作者 陶旭 郭娜炜 马寅驰 《中国农机化学报》 北大核心 2025年第5期125-132,共8页
番茄作为重要的蔬菜作物,其产量和质量常受到各类叶部病害的影响。针对此问题,计算机视觉技术已被广泛应用于病害的自动识别中。现有方法主要分为基于手工特征提取与深度学习两大类。基于手工特征的方法虽然简洁高效,但在鲁棒性方面存... 番茄作为重要的蔬菜作物,其产量和质量常受到各类叶部病害的影响。针对此问题,计算机视觉技术已被广泛应用于病害的自动识别中。现有方法主要分为基于手工特征提取与深度学习两大类。基于手工特征的方法虽然简洁高效,但在鲁棒性方面存在限制;而基于深度学习的方法,尽管能有效提升识别准确性,但往往需要较大的数据标注量与较高的计算复杂性。为解决这些问题,提出一种基于图结构增强的番茄叶部病害识别框架(TDR—EGS)。TDR—EGS通过整合样本间的拓扑关系,实现图学习与单样本学习的交替训练,从而在不增加模型推理阶段复杂度的前提下有效提升分类性能。首先通过卷积神经网络提取单样本特征,然后利用这些特征构建k近邻图以挖掘样本间的结构信息。这种方法使得图学习和单样本学习能够在共享的网络结构和外部存储机制的支持下协同工作。在11种番茄病害上的试验结果表明,TDR—EGS能在不增加推理复杂度的前提下有效提升多种主流基准模型的性能,最高达到98.61%的识别精度。此外,即使在仅使用60%标签信息的条件下,TDR—EGS的性能仍可以接近或超过完全监督学习的基准模型,充分证明该框架的有效性和泛化能力,为农业病害识别应用提供一种高效且通用的解决方案。 展开更多
关键词 番茄叶部 病害识别 图学习 k近邻图 交替训练 深度学习
在线阅读 下载PDF
图基础模型研究进展与挑战:图神经网络的视角
6
作者 吴涛 聂发志 +4 位作者 先兴平 王超 袁霖 乔少杰 牛伟纳 《通信学报》 北大核心 2025年第7期226-248,共23页
图基础模型(GFM)是基础模型思想在图学习领域中的延伸,是在广泛图数据上预训练并微调适配多种下游任务的图模型。与借助大语言模型(LLM)实现GFM的技术路线不同,主要关注从图神经网络(GNN)的角度构建GFM。首先,分析了GFM的研究现状并定... 图基础模型(GFM)是基础模型思想在图学习领域中的延伸,是在广泛图数据上预训练并微调适配多种下游任务的图模型。与借助大语言模型(LLM)实现GFM的技术路线不同,主要关注从图神经网络(GNN)的角度构建GFM。首先,分析了GFM的研究现状并定义了关键概念。其次,总结了GFM骨干架构和基础表示单元的研究成果。再次,根据代理任务和微调策略的不同,分别总结了图模型的预训练技术与微调方法。然后,介绍了与GFM相关的评价指标。最后,分析了面临的挑战并展望了未来的研究方向。 展开更多
关键词 图基础模型 图神经网络 预训练 模型微调 提示调优
在线阅读 下载PDF
基于多侧面信息表征联合的实体相似性度量及对齐方法
7
作者 朱红 王阔然 朱彤 《计算机工程》 北大核心 2025年第3期64-75,共12页
实体对齐旨在发现不同知识图谱中相同对象的不同实例,但图谱之间的异构性导致等价实例结构及表征不一致,从而影响实体对齐准确性。提出一种实体主信息与多侧面信息表征相联合的异构图谱实体相似性度量方法,并用于实体对齐任务。实体主... 实体对齐旨在发现不同知识图谱中相同对象的不同实例,但图谱之间的异构性导致等价实例结构及表征不一致,从而影响实体对齐准确性。提出一种实体主信息与多侧面信息表征相联合的异构图谱实体相似性度量方法,并用于实体对齐任务。实体主信息包括实体名称及描述,侧面信息包括实体属性、关系及关联实体描述等信息。针对图谱间等价实体结构异构带来的对齐干扰,提出了一种结合实体多侧面信息语义表征的相似性度量方法UnMuSIR-SM&EA用于实体对齐。为提升信息同义词的表示一致性,引入表示学习模型以获取实体各信息的语义表征,为解决表示学习模型嵌入空间各向异性带来的同义词度量尺度不一致问题,设计了一种基于实体主信息对比学习的微调方法,优化实体信息的语义表征。实验结果表明,该方法在结构差异较大的数据集DIS_(ZH-EN)上的Hits@1达到了95.2%,比基于侧面信息的模型BERT-INT高出了16.8百分点;在DBP15K的DBP15K_(ZH-EN)、DBP15K_(JA-EN)和DBP15K_(FR-EN)数据子集上的Hits@1分别达到了95.7%、96.0%和98.9%;在DBP-WD数据集上的Hits@1达到了99.4%。所提模型在实体对齐任务上具有优异的效果。 展开更多
关键词 实体对齐 知识图谱 相似性度量 对比学习 预训练模型
在线阅读 下载PDF
KAACNN:融合知识图谱和预训练模型的短文本多标签分类方法
8
作者 陶冶 徐锴 +2 位作者 刘天宇 鲁超峰 王浩杰 《中文信息学报》 北大核心 2025年第3期96-106,共11页
短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训... 短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训练语言模型提高短文本的文本表示能力;另一方面从外部知识库中检索短文本概念知识,并利用注意力机制将其与短文本结合用于分类任务。此外,针对数据集类别分布不均衡的问题,该文提出基于领域类别知识图谱的数据增强方法。在三个公共数据集和一个汽车领域客户原话数据集上进行了实验,结果表明,引入知识图谱和预训练语言模型的分类方法优于目前先进的短文本分类方法,证明了外部知识库和预训练语言模型的先验知识在短文本分类中的有效性。 展开更多
关键词 知识图谱 注意力机制 预训练语言模型 数据增强 短文本分类
在线阅读 下载PDF
基于多源知识注入的常识问答方法研究 被引量:1
9
作者 朱嘉骏 包美凯 +2 位作者 张凯 刘烨 刘淇 《计算机工程与科学》 北大核心 2025年第2期349-360,共12页
常识问答任务致力于让模型回答人类常识问题。针对该任务的一类方法是检索相关的知识来辅助模型回答常识问题。该类方法主要分为知识查询和知识推理2个步骤。知识查询是指根据问题检索到与之相关联的知识,而知识推理是指利用检索到的知... 常识问答任务致力于让模型回答人类常识问题。针对该任务的一类方法是检索相关的知识来辅助模型回答常识问题。该类方法主要分为知识查询和知识推理2个步骤。知识查询是指根据问题检索到与之相关联的知识,而知识推理是指利用检索到的知识辅助回答常识问题。对此,常识问答面临的一个挑战是如何找到合适的外部知识来帮助回答问题。现有的许多常识问答模型通常依赖于单个外部知识源,但鉴于常识知识的广泛性和多样性,单一来源很难全面覆盖所需的所有知识。针对这一问题,提出了一种基于多源知识注入的常识问答方法。首先,在知识查询过程中为了应对知识覆盖度问题,利用预训练语言模型整合来自多个来源的知识(包括结构化和非结构化的知识),形成统一的知识表征;其次,在知识推理过程中为了充分利用结构化知识蕴含的语义关系,模型识别文本中的实体概念和实体之间的关系路径从而构建实体关系图,然后,利用图注意力网络对实体关系图建模;最后,利用实体关系图和实体知识表征中的证据信息对问题进行推理和解答。所提方法经预训练得到的模型在CommonsenseQA数据集上的测试结果显示,基于多源知识注入的常识问答方法在验证集和测试集上的准确率分别达到79.20%和75.02%,超过了最好的基线模型。实验结果表明了多源知识注入方法在常识问答任务中的有效性。 展开更多
关键词 常识问答 知识注入 预训练语言模型 图神经网络 注意力机制
在线阅读 下载PDF
文本信息与图结构信息相融合的知识图谱补全 被引量:1
10
作者 范厚龙 房爱莲 林欣 《华东师范大学学报(自然科学版)》 北大核心 2025年第1期111-123,共13页
提出了一种基于路径查询信息的图注意力模型,可以将知识图谱中的文本信息与图结构信息有效融合,进而提高知识图谱的补全效果.对于文本信息,使用基于预训练语言模型的双编码器来分别获得实体的嵌入表示和路径查询信息的嵌入表示.通过注... 提出了一种基于路径查询信息的图注意力模型,可以将知识图谱中的文本信息与图结构信息有效融合,进而提高知识图谱的补全效果.对于文本信息,使用基于预训练语言模型的双编码器来分别获得实体的嵌入表示和路径查询信息的嵌入表示.通过注意力机制来进行路径查询信息的聚合,以捕获图结构信息,更新实体的嵌入表示.模型使用对比学习进行训练,在多个知识图谱数据集上进行实验,如直推式、归纳式的方式,都取得了良好的效果.结果表明,将预训练语言模型与图神经网络的优势相结合,可以有效捕获知识图谱中文本信息与图结构信息,进而提高知识图谱的补全效果. 展开更多
关键词 知识图谱补全 预训练语言模型 对比学习 图神经网络
在线阅读 下载PDF
BiGCN-TL:软件错误部分定位场景下二分图图卷积神经网络Transformer定位模型 被引量:1
11
作者 施恩译 常舒予 +2 位作者 陈可佳 张扬 黄海平 《计算机科学》 北大核心 2025年第S1期862-872,共11页
在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更... 在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更集或软件错误语义特征的提取,往往只分别独立地依赖各自的上下文。现代软件项目规模庞大,代码依赖错综复杂、这样分别独立的语义提取方式,降低了单个文本语义特征的质量与鲁棒性,导致最终的定位性能下滑。为实现对软件错误相关代码的全面追溯,提出了BiGCN-TL模型。BiGCN-TL重点聚焦训练模型促进不同文本之间信息交互的能力,旨在降低对单个文本语义特征质量的依赖,使得在现代软件项目规模庞大、代码依赖错综复杂、单个文本语义特征提取困难的场景下,仍能通过高效的信息交互,提取到高质量语义特征,提高定位准确率。首先根据已知的部分定位关系,微调基于Transformer的预训练模型。然后,创新性地将软件错误和代码变更集建模成二分图的数据结构,借此充分利用已知的“多对多”关系,并使用微调后的编码器得到节点特征的初始表示。之后,基于二分图设计链接预测任务,训练GCN与二分类鉴别器。借助图卷积操作和注意力机制动态更新节点特征,重点训练模型促进文本信息的交互,动态更新节点特征的能力,从而得到高质量全局分类特征,最终输出匹配预测得分。在多个数据集上开展了对比实验,结果验证了BiGCN-TL相比传统方案的优越性,并通过消融实验确认了各模块的有效性。此外,通过探索多种预训练模型与GCN的组合,并结合具体案例和可视化分析,进一步验证了BiGCN-TL的通用性与鲁棒性。 展开更多
关键词 错误定位 预训练模型 链接预测 二分图 图神经网络
在线阅读 下载PDF
基于自适应差异化图卷积的图注意力网络表示学习算法
12
作者 吴誉兰 舒建文 《现代电子技术》 北大核心 2025年第2期51-54,共4页
为解决传统图卷积网络在处理节点间复杂关系时存在的局限性,提出一种基于自适应差异化图卷积的图注意力网络表示学习算法。采用差异化图卷积网络,依据每个节点自身特征和邻居信息进行差异化采样,捕捉节点间的复杂关系;再结合二阶段关键... 为解决传统图卷积网络在处理节点间复杂关系时存在的局限性,提出一种基于自适应差异化图卷积的图注意力网络表示学习算法。采用差异化图卷积网络,依据每个节点自身特征和邻居信息进行差异化采样,捕捉节点间的复杂关系;再结合二阶段关键相邻采样方式优先挖掘重要节点并保留随机性,完成关键邻居节点的采样;然后结合图注意力网络,通过局部关注和自适应学习权重分配将关键邻居节点特征聚合到自身节点上,增强节点的特征表示;最后经网络训练,进一步增强网络表示学习能力。实验结果表明,所提出的算法优化了节点聚合程度和边界清晰度,提高了节点分类的准确性和可视化效果,并且通过关注二阶邻居和使用双头注意力,在网络表示学习上也展现出了优越性能。 展开更多
关键词 网络表示学习 图卷积网络 自适应差异化机制 节点采样 特征聚合 网络训练 图注意力网络
在线阅读 下载PDF
基于异构合约图多维度特征深度融合的漏洞检测方法
13
作者 周涛 杜永萍 +1 位作者 谢润锋 韩红桂 《计算机科学》 北大核心 2025年第9期368-375,共8页
智能合约是在区块链上自动执行的代码,具有不可逆性且与金融交易密切相关,故其安全问题至关重要。然而,当前智能合约漏洞检测技术仍面临特征提取效率低、检测精度低以及过度依赖专家规则等问题。对此,提出一种基于异构合约图多维度特征... 智能合约是在区块链上自动执行的代码,具有不可逆性且与金融交易密切相关,故其安全问题至关重要。然而,当前智能合约漏洞检测技术仍面临特征提取效率低、检测精度低以及过度依赖专家规则等问题。对此,提出一种基于异构合约图多维度特征深度融合的漏洞检测方法。首先,针对智能合约数据集的代码进行去噪处理,采用代码函数交换等数据增强方法扩充数据集,进而将其表示为异构合约图。其次,结合图嵌入技术以及代码预训练技术高效获取智能合约图以及对应操作码中节点的高维度语义表示。最后,设计双层异构图注意力网络深度融合在两种维度下学习到的节点特征,以实现高效的漏洞检测。针对不同类型漏洞的实验结果表明,所提方法整体表现较对比方法均有所提升,F1指标平均值高于77.72%,在拒绝服务漏洞类型的检测上表现最佳,F1值最高达到84.88%,较传统的深度学习方法和图拓扑检测方法分别提升了10.62%和22.34%。所提方法不仅提高了检测的效率和准确性,而且通过学习节点特征减少了对专家规则的依赖,为智能合约的安全性提供了更为可靠的保障。 展开更多
关键词 智能合约 预训练模型 图嵌入 图注意力网络 漏洞检测 区块链
在线阅读 下载PDF
ZHA_TGCN:面向低资源壮文的主题分类方法
14
作者 赵卓洋 秦董洪 +6 位作者 白凤波 梁贤烨 徐晨 郑月华 梁宇锋 蓝盛 周国平 《计算机科学》 北大核心 2025年第S2期92-99,共8页
传统图卷积网络方法在数据有限的条件下能够有效建模图结构,但由于依赖稀疏的独热编码,其捕捉词与词之间上下文关系的能力存在局限性。这一问题在低资源语言环境中尤为突出。以壮文文本主题分类任务为例,该任务不仅面临数据稀缺的困境,... 传统图卷积网络方法在数据有限的条件下能够有效建模图结构,但由于依赖稀疏的独热编码,其捕捉词与词之间上下文关系的能力存在局限性。这一问题在低资源语言环境中尤为突出。以壮文文本主题分类任务为例,该任务不仅面临数据稀缺的困境,还需应对复杂语言结构的挑战。针对这些挑战,提出了一种适用于低资源环境的壮文主题分类方法——ZHA_TGCN。该方法利用壮文预训练模型ZHA_BERT提取文本特征,并将文本特征与壮文声调特征相结合,输入BiGRU以学习深层语义表示,将学习到的表示向量作为文档节点的特征提供给GCN,通过在GCN中执行标签传播来学习训练数据和未标记测试数据的特征表示。最后,利用Softmax层输出分类结果。实验结果表明,提出的方法在低资源壮文主题分类任务中的准确率为82.12%,精确率为90.08%,召回率为92.46%,F1值为90.18%,验证了该方法的有效性。 展开更多
关键词 低资源语言 壮文 主题分类 预训练模型 图卷积网络
在线阅读 下载PDF
基于图提示的半监督开放词汇多标记学习
15
作者 李仲年 皇甫志宇 +3 位作者 杨凯杰 营鹏 孙统风 许新征 《计算机研究与发展》 北大核心 2025年第2期432-442,共11页
半监督多标记学习利用有标记数据和无标记数据进行模型的训练,降低了多标记数据的标记成本并取得了不错的结果,吸引了很多研究者不断进行研究.然而,在半监督标注过程中,由于标记的数量较多,往往会出现某些标记缺失标注样本的情况,这些... 半监督多标记学习利用有标记数据和无标记数据进行模型的训练,降低了多标记数据的标记成本并取得了不错的结果,吸引了很多研究者不断进行研究.然而,在半监督标注过程中,由于标记的数量较多,往往会出现某些标记缺失标注样本的情况,这些标记被称为开放词汇.开放词汇会导致模型无法学习到该类别的标记信息,使得模型性能下降. 针对上述问题,提出了基于图提示的半监督开放词汇多标记 学习方法. 具体地,该方法利用基于提示的图神经网络对预训练大模型进行微调,挖掘和探索开放词汇与 监督样本之间的关系. 通过使用包含图像与文本的多模态数据构造图神经网络作为预训练大模型的文本 输入进行学习. 其次利用预训练大模型在开放词汇上的泛化能力,对无监督样本生成伪标记,实现对输出 分类层的微调,使模型在对开放词汇进行分类时能获得更加理想的效果. 多个基准数据集上的实验结果 均显示,基于图提示的半监督开放词汇多标记学习方法优于目前的主流方法,在 VOC,COCO,CUB,NUS 等基准数据集上均取得了最优的效果. 展开更多
关键词 半监督多标记学习 预训练模型 图神经网络 开放词汇 提示
在线阅读 下载PDF
融合多模态数据的地震灾害知识图谱构建及应用 被引量:1
16
作者 吴麒瑞 田苗 +3 位作者 谢忠 邱芹军 陈占龙 陶留锋 《地质科技通报》 北大核心 2025年第4期90-106,共17页
地震灾害观测数据多源异构、蕴含知识分散且关联程度低,导致难以高效利用数据进行信息整合和查询,进而提供风险评估、救援决策辅助支持。知识图谱是一种有效的数据关联和融合的手段。首先,基于自顶向下方法梳理地震灾害领域概念,构建地... 地震灾害观测数据多源异构、蕴含知识分散且关联程度低,导致难以高效利用数据进行信息整合和查询,进而提供风险评估、救援决策辅助支持。知识图谱是一种有效的数据关联和融合的手段。首先,基于自顶向下方法梳理地震灾害领域概念,构建地震灾害数据、地质/地理环境、地震灾害事件、地震灾害应急任务、地震灾害模型本体,形成地震灾害本体层;结合自底向上方法构建高质量数据层,通过卷积神经网络对遥感影像进行灾害前后变化识别,实现从影像信息到文本知识的智能结构化转换;融合微调后通用信息抽取框架(universal information extraction,简称UIE)预训练模型对文本数据进行命名实体及关系属性知识抽取,精确率分别为82.04%和70.66%。通过计算词向量语义相似度实现数据融合与统一表达。以2023年12月18日甘肃省临夏州积石山县地震为例,通过本体构建、数据抽取、统一表达形成高质量地震灾害知识图谱,实现地震灾害多源异构地震数据到统一知识表达的转化。基于所构建的地震灾害知识图谱实现了灾害损失、应急链决策支持的查询展示,及结合相关地质数据推理和查询潜在次生灾害。该方法结合深度学习与预训练技术,融合多模态数据,构建了地震灾害知识图谱构建,为快速准确的地震灾害信息查询与次生灾害发生提供辅助支撑。 展开更多
关键词 积石山地震 地震灾害知识图谱 信息查询 预训练模型 多模态数据
在线阅读 下载PDF
融合ERNIE的自然灾害舆情事理图谱构建及次生衍生事件探测研究 被引量:2
17
作者 李诗轩 王璐 +2 位作者 沈愿 陈烨 周禾深 《情报杂志》 北大核心 2025年第3期128-138,共11页
[研究目的]基于规则模版和大语言模型构建面向自然灾害的网络舆情事理图谱,结合情感分析进行舆情演化分析,进而实现次生衍生事件探测,为突发事件舆情管理与预警提供理论和实践参考。[研究方法]分别利用规则模板和预训练模型ERNIE提取关... [研究目的]基于规则模版和大语言模型构建面向自然灾害的网络舆情事理图谱,结合情感分析进行舆情演化分析,进而实现次生衍生事件探测,为突发事件舆情管理与预警提供理论和实践参考。[研究方法]分别利用规则模板和预训练模型ERNIE提取关系事件对,并利用K-means和BERTopic进行事件泛化,构建自然灾害网络舆情抽象事理图谱。同时利用情感词典进行情感演化分析,结合同类灾害事件的相似度计算,构建同类事件的网络舆情预测事理图谱。[研究结果/结论]自然灾害舆情抽象事理图谱能够分析事件的因果与顺承关系,揭示舆情演化过程中的关键事件。预测事理图谱可以辅助次生衍生事件探测,实现舆情预警。对比发现基于预训练模型ERNIE结合BERTopic构建的图谱抽象事件较少,事件集中于中心节点,而规则模板结合K-means得到的图谱抽象事件较多,关系较为分散。 展开更多
关键词 网络舆情 自然灾害 事理图谱 预训练模型ERNIE 情感演化分析 次生衍生事件探测
在线阅读 下载PDF
基于MiniRBT-LSTM-GAT与标签平滑的台区电力工单分类
18
作者 李嘉欣 莫思特 《计算机应用》 北大核心 2025年第4期1356-1362,共7页
台区电力工单记录反映了台区运行工况和用户需求,是制定台区用电安全管理制度和满足台区用户用电需求的重要依据。针对台区电力工单高复杂性和强专业性给台区工单分类带来的难题,提出一种融合标签平滑(LS)与预训练语言模型的台区电力工... 台区电力工单记录反映了台区运行工况和用户需求,是制定台区用电安全管理制度和满足台区用户用电需求的重要依据。针对台区电力工单高复杂性和强专业性给台区工单分类带来的难题,提出一种融合标签平滑(LS)与预训练语言模型的台区电力工单分类模型(MiniRBT-LSTM-GAT)。首先,利用预训练模型计算电力工单文本中的字符级特征向量表示;其次,采用双向长短期记忆网络(BiLSTM)捕捉电力文本序列中的依赖关系;再次,通过图注意力网络(GAT)聚焦对文本分类贡献大的特征信息;最后,利用LS改进损失函数以提高模型的分类精度。所提模型与当前主流的文本分类算法在农网台区电力工单数据集(RSPWO)、浙江省95598电力工单数据集(ZJPWO)和THUCNews(TsingHua University Chinese News)数据集上的实验结果表明,与电力审计文本多粒度预训练语言模型(EPAT-BERT)相比,所提模型在RSPWO、ZJPWO上的查准率和F1值分别提升了2.76、2.02个百分点和1.77、1.40个百分点;与胶囊神经网络模型BRsyn-caps(capsule network based on BERT and dependency syntax)相比,所提模型在THUCNews数据集上的查准率和准确率分别提升了0.76和0.71个百分点。可见,所提模型有效提升了台区电力工单分类的性能,并在THUCNews数据集上表现良好,验证了模型的通用性。 展开更多
关键词 台区电力工单 文本分类 预训练模型 图注意力网络 标签平滑
在线阅读 下载PDF
列控车载设备故障诊断的知识图谱构建与应用 被引量:2
19
作者 刘丹 张振海 +1 位作者 翟秋宇 余家乐 《铁道标准设计》 北大核心 2025年第5期184-192,共9页
车载设备是列车运行控制系统的核心组成部分,为减少车载设备故障发生频次和故障处理的时间损耗,需要对车载设备的运行状态和故障现象进行准确地分析和诊断。知识图谱技术作为人工智能领域的研究热点,在现有传统故障诊断方法未有效利用... 车载设备是列车运行控制系统的核心组成部分,为减少车载设备故障发生频次和故障处理的时间损耗,需要对车载设备的运行状态和故障现象进行准确地分析和诊断。知识图谱技术作为人工智能领域的研究热点,在现有传统故障诊断方法未有效利用非结构化的先验知识和处理结果不具解释性的问题上可提供新的解决思路,因此,提出一种基于知识图谱的列控车载设备故障诊断方法。实体识别是构建图谱的关键技术之一,结合传统中文实体识别方法存在识别效果不佳和全局语义难以共享问题,采用Graph Attention和CRF相结合的神经网络模型来实现实体识别。首先,以近三年某铁路局的列控车载设备典型故障分析报告作为实验数据集进行预处理;接着,对Graph Attention神经网络模型进行训练与优化,由条件随机场模型(CRF)得到最优的文本标签序列;为验证该方法在实体识别中的有效性,在同一语料环境下,将Graph Attention-CRF神经网络模型与其他3种模型作对比,结果表明,本文提出的模型F1值可达94.24%,实体识别准确率较当前主流的BiLSTM-CRF模型提升4.51%,较FLAT模型提升2.42%,测试时间也只比用时最短的BiLSTM-CRF模型多0.41 s。最后,利用设定的关系匹配规则将识别的实体进行链接和匹配来完成包含车载设备故障信息的知识图谱,并以图谱问答的故障诊断方式给维修工作人员提供决策辅助。 展开更多
关键词 列控车载设备 故障诊断 知识图谱 graph Attention-CRF算法 智能问答 辅助决策
在线阅读 下载PDF
基于文本和多视角局部结构特征的知识图谱推理
20
作者 刘海 石佛波 +2 位作者 张昭理 何嘉文 李家豪 《计算机工程》 北大核心 2025年第11期80-89,共10页
近年来,知识图谱已经逐渐成为问答系统、信息检索和推荐系统等下游任务的基石。知识图谱推理作为知识图谱技术中的一项关键研究,其推理结果的准确性决定了知识图谱的质量和服务效果。当前知识图谱推理研究主要集中于以知识嵌入作为知识... 近年来,知识图谱已经逐渐成为问答系统、信息检索和推荐系统等下游任务的基石。知识图谱推理作为知识图谱技术中的一项关键研究,其推理结果的准确性决定了知识图谱的质量和服务效果。当前知识图谱推理研究主要集中于以知识嵌入作为知识载体的方式,通过强大的神经网络模型来学习可表示事实知识隐含语义的实体和关系嵌入。面对当前海量异质知识涌现且持续增长的现状,知识图谱中出现了知识结构缺失、知识分布长尾效应显著和推理过程可解释性弱等挑战。为此,本研究提出一种基于文本和多视角局部结构特征的知识图谱推理模型TSNet,通过有效融合知识图谱中实体-关系文本特征和多视角局部结构特征,缓解了知识图谱中的结构缺失和数据长尾分布问题。实验结果表明,TSNet模型在4个常用公开数据集FB15k、WN18、FB15k-237和WN18RR上均获得了有竞争力的结果。 展开更多
关键词 知识图谱推理 预训练模型 特征融合 结构特征
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部