-
题名基于标签语义相似的动态多标签文本分类算法
被引量:10
- 1
-
-
作者
姚佳奇
徐正国
燕继坤
熊钢
李智翔
-
机构
盲信号处理重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第19期94-98,共5页
-
文摘
针对标签随着时间变化的动态多标签文本分类问题,提出了一种基于标签语义相似的动态多标签文本分类算法。该算法在训练阶段,首先按照标签固定训练得到一个基于卷积神经网络的多标签文本分类器,然后以该分类器的倒数第二层的输出为文本的特征向量。由于该特征向量是在有标签训练得到的,因而相对于基于字符串即文本内容而言,该特征向量含有标签语义信息。在测试阶段,将测试文档输入训练阶段的多标签文本分类器获取相应的特征向量,然后计算相似性,同时乘以时间衰减因子修正,使得时间越近的文本具有较高的相似性。最后,采用最近邻算法分类。实验结果表明,该算法在处理动态多标签文本分类问题上具有较优的性能。
-
关键词
动态多标签
文本分类
神经网络
标签语义相似
-
Keywords
dynamic multi-label
text classification
neural networks
label semantic similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-