期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于自监督异质图神经网络的图分类框架 被引量:1
1
作者 袁鸣 赵彤 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2024年第6期830-841,共12页
图数据以各种各样的形式广泛存在着,图分类任务对于许多问题有重要指导意义。然而图分类任务依然面临很多挑战,包括如何充分利用图结构蕴含的语义信息、进一步降低计算复杂度及获取标签的成本。提出一种超节点异质网络的构建方法,并由... 图数据以各种各样的形式广泛存在着,图分类任务对于许多问题有重要指导意义。然而图分类任务依然面临很多挑战,包括如何充分利用图结构蕴含的语义信息、进一步降低计算复杂度及获取标签的成本。提出一种超节点异质网络的构建方法,并由此提出可应用于图分类问题的新型框架GChgnn。该框架通过引入双视角的图表示机制以及自监督的对比学习,实现了:1)对大规模图分类任务目标间的相似性进行度量;2)借鉴图匹配方法,通过跨图思想提高相似性度量的准确度,并弥补其无法给出图嵌入显式表达式的不足;3)规避了在网络中设计复杂的卷积与池化算子。通过在一些公开数据集上的测试证明,该框架的综合效果优于现有的解决图分类问题的其他方法。 展开更多
关键词 分类 异质图神经网络 自监督学习 对比学习
在线阅读 下载PDF
基于异质图神经网络预训练的多标签文档分类研究
2
作者 吴家伟 方全 +1 位作者 胡骏 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第1期143-149,共7页
多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考... 多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考虑标签的长尾分布,因此忽略了文档及其元数据之间的高阶关系和标签的分布规律等信息,从而影响到多标签文档分类的准确性。因此,文中提出一种新的基于异质图神经网络预训练的多标签文档分类方法。该方法通过构造文档与其元数据的异质图,采用两种对比学习预训练方法捕获文档与其元数据之间的关系,并通过平衡标签长尾分布的损失函数来提高多标签文档分类的准确性。在基准数据集上的实验结果表明,所提方法的准确率比Transformer提高了8%,比BertXML提高了4.75%,比MATCH提高了1.3%。 展开更多
关键词 多标签文档分类 元数据 异质图神经网络 预训练 长尾分布
在线阅读 下载PDF
基于异质图表达学习的跨境电商推荐模型 被引量:6
3
作者 张瑾 朱桂祥 +2 位作者 王宇琛 郑烁佳 陈镜潞 《电子与信息学报》 EI CSCD 北大核心 2022年第11期4008-4017,共10页
跨境电商产品推荐已经成为电子商务领域新兴的研究议题之一。由于电商产品信息复杂多样、“用户-产品”关联矩阵极为稀疏并且冷启动问题突出,因此传统的协同过滤推荐模型很难奏效。而改进的深度协同过滤模型,只考虑了用户对产品的“显... 跨境电商产品推荐已经成为电子商务领域新兴的研究议题之一。由于电商产品信息复杂多样、“用户-产品”关联矩阵极为稀疏并且冷启动问题突出,因此传统的协同过滤推荐模型很难奏效。而改进的深度协同过滤模型,只考虑了用户对产品的“显式”和“隐式”的反馈信息,忽视了由用户与项目组成的图结构信息,推荐性能很难满足平台和用户的要求。为了解决这些难题,该文提出基于异质图表达学习的图神经网络模型(HGNR)用于个性化的跨境电商产品推荐,该模型具有2个显著的优势:(1)构造“用户-产品-主题”3部图作为模型的输入,通过图卷积神经网络(GCN)在异质图上进行高质量信息传播和聚合;(2)能够获取高质量的用户和产品表征向量,实现了用户和产品复杂交互关系的建模。在真实的跨境电商订单数据集上的实验结果表明,HGNR模型不仅在推荐性能上表现出色,还能有效提升冷启动用户的推荐准确率,与9种推荐基准算法相比,HGNR在评价指标HitRate@10,Item-coverage@10,MRR@10上至少提升了3.33%,0.91%,0.54%。 展开更多
关键词 推荐系统 神经网络 异质图神经网络 冷启动推荐 跨境电商
在线阅读 下载PDF
基于联邦学习的主动半监督短文本分类方法 被引量:1
4
作者 孔德焱 冀振燕 +2 位作者 杨燕燕 刘洋 刘吉强 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3517-3526,共10页
短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered H... 短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered Heterogeneous Graph ATtention network model based on Federated learning,Fed-ASSL-HGAT),通过设计新颖的主动半监督学习(Active Semi-Supervised Learning,ASSL)框架生成高质量标注样本赋能异质图注意力网络(Heterogeneous Graph ATttention network model,HGAT),引入联邦学习对部署在不同节点的模型进行联合训练以满足数据隐私保护需求.所提出的ASSL框架通过将主动学习的多类别标注转化成二元类别标注,可大大降低标注难度;设计基于信息增益的选择策略筛选软、硬标签,以防止信息损失;通过半监督学习选择高准确率、高稳定性的正负样本打伪标签以确保标注质量.实验结果表明,所提出的ASSL-HGAT(S)在AGNews、Snippets、TagMyNews数据集上相比HGAT基线模型F1值分别提升2.45%、8.11%、7.46%.融合联邦学习所进一步提出的Fed-ASSL-HGAT模型可在不泄漏隐私数据的情况下满足性能要求. 展开更多
关键词 异质图神经网络 主动学习 半监督学习 联邦学习
在线阅读 下载PDF
大粒度Pull Request描述自动生成 被引量:2
5
作者 邝砾 施如意 +2 位作者 赵雷浩 张欢 高洪皓 《软件学报》 EI CSCD 北大核心 2021年第6期1597-1611,共15页
在GitHub平台中,许多项目贡献者在提交Pull Request(PR)时往往会忽略提交PR描述,这使得提交的PR容易被评审者忽略或者拒绝.因此,自动生成PR描述以帮助项目贡献者提高PR通过率是很有必要的.然而,现有PR描述生成方法的表现会受到PR粒度影... 在GitHub平台中,许多项目贡献者在提交Pull Request(PR)时往往会忽略提交PR描述,这使得提交的PR容易被评审者忽略或者拒绝.因此,自动生成PR描述以帮助项目贡献者提高PR通过率是很有必要的.然而,现有PR描述生成方法的表现会受到PR粒度影响,无法有效为大粒度的PR生成描述.因此,该工作专注于大粒度PR描述的自动生成.首先对PR中的文本信息进行预处理,将文本中的单词作为辅助节点构建词-句异质图,以建立PR语句间的联系;随后对异质图进行特征提取,并将提取后的特征输入至图神经网络进行图表示学习,通过节点间的消息传递,使句子节点学习到更丰富的内容信息;最后,选择带有关键信息的句子组成PR描述.此外,针对PR数据集缺少人工标注的真实标签而无法进行监督学习的问题,使用强化学习指导PR描述的生成,以最小化获得奖励的负期望为目标训练模型,该过程与标签无关,并且直接提升了生成结果的表现.在真实的数据集上进行了实验,实验结果表明,提出的大粒度PR描述生成方法在F1值和可读性上优于现有方法. 展开更多
关键词 Pull Request描述 异质图神经网络 强化学习 非结构性文档 摘要生成
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部