期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于词向量空间模型的中文文本分类方法 被引量:15
1
作者 胡学钢 董学春 谢飞 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第10期1261-1264,共4页
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵... 大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。 展开更多
关键词 文本分类 向量空间模型 K-最近邻居 词向量空间模型
在线阅读 下载PDF
基于多分类器的藏文文本分类方法 被引量:15
2
作者 王莉莉 杨鸿武 宋志蒙 《南京邮电大学学报(自然科学版)》 北大核心 2020年第1期102-110,共9页
文本分类是信息检索与数据挖掘领域的关键技术,可以有效解决信息杂乱问题并定位有效信息。提出了基于深度学习的卷积神经网络、循环神经网络、长短时记忆网络和双向长短时记忆网络的藏文文本分类方法。首先提出长短时记忆加条件随机场... 文本分类是信息检索与数据挖掘领域的关键技术,可以有效解决信息杂乱问题并定位有效信息。提出了基于深度学习的卷积神经网络、循环神经网络、长短时记忆网络和双向长短时记忆网络的藏文文本分类方法。首先提出长短时记忆加条件随机场模型的方法对藏文分类文本进行分词,接着去除停用词、计算词频、提取特征词构建词向量空间模型获得词向量,然后将该词向量传输给分类模型训练藏文文本分类器,最后使用训练好的分类器对待分类藏文文本进行分类。实验数据表明,数据量较大时,深度神经网络模型分类效果均比传统机器学习模型分类效果好,且其中双向长短时记忆网络分类器得到的藏文文本分类效果最好;当数据量较少时,支持向量机分类效果较好。 展开更多
关键词 藏文文本分类 文本表示 词向量空间模型 深度神经网络 机器学习模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部