-
题名融合CNN-SAM与GAT的多标签文本分类模型
被引量:7
- 1
-
-
作者
杨春霞
马文文
陈启岗
桂强
-
机构
南京信息工程大学自动化学院
江苏省大数据分析技术重点实验室
江苏省大气环境与装备技术协同创新中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第5期106-114,共9页
-
基金
国家自然科学基金(61273229)
江苏省青蓝工程资助项目。
-
文摘
现有基于神经网络的多标签文本分类研究方法存在两方面不足,一是不能全面提取文本信息特征,二是很少从图结构数据中挖掘全局标签之间的关联性。针对以上两个问题,提出融合卷积神经网络-自注意力机制(CNNSAM)与图注意力网络(GAT)的多标签文本分类模型(CS-GAT)。该模型利用多层卷积神经网络与自注意力机制充分提取文本局部与全局信息并进行融合,得到更为全面的特征向量表示;同时将不同文本标签之间的关联性转变为具有全局信息的边加权图,利用多层图注意力机制自动学习不同标签之间的关联程度,将其与文本上下文语义信息进行交互,获取具有文本语义联系的全局标签信息表示;使用自适应融合策略进一步提取两者特征信息,提高模型的泛化能力。在AAPD、RCV1-V2与EUR-Lex三个公开英文数据集上的实验结果表明,该模型所达到的多标签分类效果明显优于其他主流基线模型。
-
关键词
多标签文本分类
多层卷积神经网络
自注意力机制
多头图注意力机制
-
Keywords
multi-label text classification
multi-layer convolutional neural network
self attention mechanism
multiheaded graph attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-