-
题名基于联邦学习的主动半监督短文本分类方法
被引量:1
- 1
-
-
作者
孔德焱
冀振燕
杨燕燕
刘洋
刘吉强
-
机构
北京交通大学软件学院
北京交通大学网络空间安全学院智能交通数据安全与隐私保护北京市重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第10期3517-3526,共10页
-
基金
国家自然科学基金(No.52175493,No.51935002)。
-
文摘
短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered Heterogeneous Graph ATtention network model based on Federated learning,Fed-ASSL-HGAT),通过设计新颖的主动半监督学习(Active Semi-Supervised Learning,ASSL)框架生成高质量标注样本赋能异质图注意力网络(Heterogeneous Graph ATttention network model,HGAT),引入联邦学习对部署在不同节点的模型进行联合训练以满足数据隐私保护需求.所提出的ASSL框架通过将主动学习的多类别标注转化成二元类别标注,可大大降低标注难度;设计基于信息增益的选择策略筛选软、硬标签,以防止信息损失;通过半监督学习选择高准确率、高稳定性的正负样本打伪标签以确保标注质量.实验结果表明,所提出的ASSL-HGAT(S)在AGNews、Snippets、TagMyNews数据集上相比HGAT基线模型F1值分别提升2.45%、8.11%、7.46%.融合联邦学习所进一步提出的Fed-ASSL-HGAT模型可在不泄漏隐私数据的情况下满足性能要求.
-
关键词
异质图神经网络
主动学习
半监督学习
联邦学习
-
Keywords
heterogeneous graph neural network
active learning
semi-supervised learning
federated learning
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-