期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词向量预训练的不平衡文本情绪分类 被引量:8
1
作者 林怀逸 刘箴 +2 位作者 柴玉梅 刘婷婷 柴艳杰 《中文信息学报》 CSCD 北大核心 2019年第5期132-142,共11页
深度学习中处理不平衡问题的方法多为代价敏感和采样。该文在词向量迁移的基础上提出预训练任务选择方法。用利于小类别区分的预训练词向量来初始化目标模型,并结合均衡过采样充分利用样本信息保持模型在大类别上的精度,使模型提取的文... 深度学习中处理不平衡问题的方法多为代价敏感和采样。该文在词向量迁移的基础上提出预训练任务选择方法。用利于小类别区分的预训练词向量来初始化目标模型,并结合均衡过采样充分利用样本信息保持模型在大类别上的精度,使模型提取的文本特征在大小类别上具有公平性,从特征层面实现了平衡效果。实验结果表明,在文本情绪分类任务中,对比过采样方法,该方法在大部分无严重过拟合情况下有更好的平衡效果。当存在较严重过拟合时,该方法在目标分类数为三时平衡效果显著,并通过实验验证了预训练方法可与代价敏感方法相结合提升平衡性能。 展开更多
关键词 不平衡分类 情绪分类 均衡过采样 预训练词向量
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部