期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词向量空间模型的中文文本分类方法
被引量:
15
1
作者
胡学钢
董学春
谢飞
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2007年第10期1261-1264,共4页
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵...
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。
展开更多
关键词
文本分类
向量
空间
模型
K-最近邻居
词向量空间模型
在线阅读
下载PDF
职称材料
基于多分类器的藏文文本分类方法
被引量:
15
2
作者
王莉莉
杨鸿武
宋志蒙
《南京邮电大学学报(自然科学版)》
北大核心
2020年第1期102-110,共9页
文本分类是信息检索与数据挖掘领域的关键技术,可以有效解决信息杂乱问题并定位有效信息。提出了基于深度学习的卷积神经网络、循环神经网络、长短时记忆网络和双向长短时记忆网络的藏文文本分类方法。首先提出长短时记忆加条件随机场...
文本分类是信息检索与数据挖掘领域的关键技术,可以有效解决信息杂乱问题并定位有效信息。提出了基于深度学习的卷积神经网络、循环神经网络、长短时记忆网络和双向长短时记忆网络的藏文文本分类方法。首先提出长短时记忆加条件随机场模型的方法对藏文分类文本进行分词,接着去除停用词、计算词频、提取特征词构建词向量空间模型获得词向量,然后将该词向量传输给分类模型训练藏文文本分类器,最后使用训练好的分类器对待分类藏文文本进行分类。实验数据表明,数据量较大时,深度神经网络模型分类效果均比传统机器学习模型分类效果好,且其中双向长短时记忆网络分类器得到的藏文文本分类效果最好;当数据量较少时,支持向量机分类效果较好。
展开更多
关键词
藏文文本分类
文本表示
词向量空间模型
深度神经网络
机器学习
模型
在线阅读
下载PDF
职称材料
题名
基于词向量空间模型的中文文本分类方法
被引量:
15
1
作者
胡学钢
董学春
谢飞
机构
合肥工业大学计算机与信息学院
出处
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2007年第10期1261-1264,共4页
基金
安徽省自然科学基金资助项目(050420207)
文摘
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。
关键词
文本分类
向量
空间
模型
K-最近邻居
词向量空间模型
Keywords
text categorization
vector space model
K-nearest neighbor
word vector space model
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于多分类器的藏文文本分类方法
被引量:
15
2
作者
王莉莉
杨鸿武
宋志蒙
机构
西北师范大学物理与电子工程学院
甘肃省智能信息技术与应用工程研究中心
互联网教育数据学习分析技术国家地方联合工程实验室
出处
《南京邮电大学学报(自然科学版)》
北大核心
2020年第1期102-110,共9页
基金
国家自然科学基金(11664036,61263036)
甘肃省高等学校科技创新团队项目(2017C-03)资助项目。
文摘
文本分类是信息检索与数据挖掘领域的关键技术,可以有效解决信息杂乱问题并定位有效信息。提出了基于深度学习的卷积神经网络、循环神经网络、长短时记忆网络和双向长短时记忆网络的藏文文本分类方法。首先提出长短时记忆加条件随机场模型的方法对藏文分类文本进行分词,接着去除停用词、计算词频、提取特征词构建词向量空间模型获得词向量,然后将该词向量传输给分类模型训练藏文文本分类器,最后使用训练好的分类器对待分类藏文文本进行分类。实验数据表明,数据量较大时,深度神经网络模型分类效果均比传统机器学习模型分类效果好,且其中双向长短时记忆网络分类器得到的藏文文本分类效果最好;当数据量较少时,支持向量机分类效果较好。
关键词
藏文文本分类
文本表示
词向量空间模型
深度神经网络
机器学习
模型
Keywords
Tibetan text classification
text representation
word vector space model
deep neural network
machine learning model
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于词向量空间模型的中文文本分类方法
胡学钢
董学春
谢飞
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2007
15
在线阅读
下载PDF
职称材料
2
基于多分类器的藏文文本分类方法
王莉莉
杨鸿武
宋志蒙
《南京邮电大学学报(自然科学版)》
北大核心
2020
15
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部