期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向文本的结构——内容联合表示学习模型
1
作者 张旭 王旭强 +1 位作者 杨青 王扬 《计算机应用研究》 CSCD 北大核心 2020年第S01期66-68,共3页
随着信息技术的发展,包含文本信息的数据正在爆炸式增长,如何从中获取有用信息具有重要研究价值。由此,文本表示学习成为了自然语言处理领域的一个热点问题。现如今广泛存在的文本数据不仅包含其本身的文字内容,而且还具有文本之间的结... 随着信息技术的发展,包含文本信息的数据正在爆炸式增长,如何从中获取有用信息具有重要研究价值。由此,文本表示学习成为了自然语言处理领域的一个热点问题。现如今广泛存在的文本数据不仅包含其本身的文字内容,而且还具有文本之间的结构关系,如论文引用、微博转发等关系。但现有方法通常仅考虑文本内容,忽略了文本间的结构关系。针对该问题,提出一种面向文本的结构—内容联合表示学习模型(SCJL)。该模型可以同时建模文本的内容信息和结构信息,进而得到更全面的表示。在公开数据集上进行了文本分类实验,实验结果证明了该模型的有效性。 展开更多
关键词 文本表示学习 文本结构关系 文本分类
在线阅读 下载PDF
结合表示学习和迁移学习的跨领域情感分类 被引量:9
2
作者 廖祥文 吴晓静 +2 位作者 桂林 黄锦辉 陈国龙 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期37-46,共10页
针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分... 针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分层注意力网络,对文本中重要单词与句子的情感信息进行建模,从而学习源领域与目标领域的文档级分布式表示。随后,采用类噪声估计方法,对源领域中的迁移数据进行检测,剔除负面迁移样例,挑选高质量样例来扩充目标领域的训练集。最后,训练支持向量机对目标领域文本进行情感分类。在大规模公开数据集上进行的两个实验结果表明,与基准方法相比,所提方法的均方根误差分别降低1.5%和1.0%,说明该方法可以有效地提高跨领域情感分类性能。 展开更多
关键词 文本表示学习 迁移学习 类噪声估计 跨领域 情感分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部