期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Naive Bayes的维吾尔文文本分类算法及其性能分析
被引量:
7
1
作者
艾海麦提江.阿布来提
吐尔地.托合提
艾斯卡尔.艾木都拉
《计算机应用与软件》
CSCD
北大核心
2012年第12期27-29,共3页
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数...
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数。在包含10大类共计3 000多个较大规模文本语料库基础上给出分类实验结果,再通过x2统计方法选择不同数目的特征,也分别给出分类实验结果。结果表明,预处理后的维吾尔文特征空间中只有1%-3%特征是最佳的,因而进一步确定哪些是最佳特征或降低特征空间维数是有可能的。
展开更多
关键词
维吾尔文
文本分类
NAIVE
bayes词干提取
停用词
在线阅读
下载PDF
职称材料
题名
基于Naive Bayes的维吾尔文文本分类算法及其性能分析
被引量:
7
1
作者
艾海麦提江.阿布来提
吐尔地.托合提
艾斯卡尔.艾木都拉
机构
新疆大学信息科学与工程学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第12期27-29,共3页
基金
国家自然科学基金项目(61063022
61163033)
文摘
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数。在包含10大类共计3 000多个较大规模文本语料库基础上给出分类实验结果,再通过x2统计方法选择不同数目的特征,也分别给出分类实验结果。结果表明,预处理后的维吾尔文特征空间中只有1%-3%特征是最佳的,因而进一步确定哪些是最佳特征或降低特征空间维数是有可能的。
关键词
维吾尔文
文本分类
NAIVE
bayes词干提取
停用词
Keywords
Uyghur Text classification Naive
bayes
Stem Extract Stop words
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Naive Bayes的维吾尔文文本分类算法及其性能分析
艾海麦提江.阿布来提
吐尔地.托合提
艾斯卡尔.艾木都拉
《计算机应用与软件》
CSCD
北大核心
2012
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部