-
题名基于标签增强的细粒度文本分类
被引量:1
- 1
-
-
作者
郭瑞强
杨世龙
贾晓文
魏谦强
-
机构
河北师范大学计算机与网络空间安全学院
河北师范大学河北省供应链大数据分析与数据安全工程研究中心
河北师范大学河北省网络与信息安全重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第21期134-141,共8页
-
基金
2023年度河北省引才引智创新平台项目(606080123003)。
-
文摘
文本分类是自然语言处理的一个重要分支,旨在通过训练给数据标注标签。但现有的方法仅仅考虑了标签和文本之间最浅显的语义关系,并没有考虑标签本身的额外语义信息,导致文本分类的准确率难以提升。针对此问题,提出一种基于标签增强的细粒度文本分类模型(FGTC),它根据已知信息对标签进行解释,丰富了标签和文档之间的语义联系。此外,FGTC进一步建模标签中短语的序列关系,并采用单词级别的细粒度标签注意力方法,充分挖掘了标签的有效信息。在四个基准数据集上进行了对比实验,结果表明,该模型在文本分类任务上的准确率得到有效提升。
-
关键词
文本分类
标签增强
细粒度标签注意力
-
Keywords
text classification
label interpretation
fine-grained label attattention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-