期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Naive Bayes的维吾尔文文本分类算法及其性能分析
被引量:
7
1
作者
艾海麦提江.阿布来提
吐尔地.托合
提
艾斯卡尔.艾木都拉
《计算机应用与软件》
CSCD
北大核心
2012年第12期27-29,共3页
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数...
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数。在包含10大类共计3 000多个较大规模文本语料库基础上给出分类实验结果,再通过x2统计方法选择不同数目的特征,也分别给出分类实验结果。结果表明,预处理后的维吾尔文特征空间中只有1%-3%特征是最佳的,因而进一步确定哪些是最佳特征或降低特征空间维数是有可能的。
展开更多
关键词
维吾尔文
文本分类
NAIVE
Bayes词干提取
停用词
在线阅读
下载PDF
职称材料
一种结合GAAC和K-means的维吾尔文文本聚类算法
被引量:
5
2
作者
吐尔地.托合
提
艾海麦提江.阿布来提
+1 位作者
米也塞.艾尼玩
艾斯卡尔.艾木都拉
《计算机工程与科学》
CSCD
北大核心
2013年第7期149-155,共7页
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分...
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分依赖性及不稳定性缺点以及GAAC的高计算复杂性,提出了一种结合GACC和K-means的维吾尔文聚类算法。本算法分两步完成聚类操作,首先是GAAC模块从少量文本集中获取最优的初始类中心,然后是K-means模块对大量文本集进行快速聚类。实验结果表明,新算法在聚类准确率和时间复杂度上都有了显著的提高。
展开更多
关键词
维吾尔文
文本聚类
K—means
GAAC
结合算法
在线阅读
下载PDF
职称材料
题名
基于Naive Bayes的维吾尔文文本分类算法及其性能分析
被引量:
7
1
作者
艾海麦提江.阿布来提
吐尔地.托合
提
艾斯卡尔.艾木都拉
机构
新疆大学信息科学与工程学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第12期27-29,共3页
基金
国家自然科学基金项目(61063022
61163033)
文摘
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数。在包含10大类共计3 000多个较大规模文本语料库基础上给出分类实验结果,再通过x2统计方法选择不同数目的特征,也分别给出分类实验结果。结果表明,预处理后的维吾尔文特征空间中只有1%-3%特征是最佳的,因而进一步确定哪些是最佳特征或降低特征空间维数是有可能的。
关键词
维吾尔文
文本分类
NAIVE
Bayes词干提取
停用词
Keywords
Uyghur Text classification Naive Bayes Stem Extract Stop words
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种结合GAAC和K-means的维吾尔文文本聚类算法
被引量:
5
2
作者
吐尔地.托合
提
艾海麦提江.阿布来提
米也塞.艾尼玩
艾斯卡尔.艾木都拉
机构
新疆大学信息科学与工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2013年第7期149-155,共7页
基金
国家自然科学基金资助项目(61063022
61262062
+3 种基金
61163033)
新疆维吾尔自治区高技术研究发展计划项目(201212124)
新疆维吾尔自治区高校科研计划重点项目(XJEDU2012I11)
教育部新世纪优秀人才支持计划资助项目(NCET-10-0969)
文摘
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分依赖性及不稳定性缺点以及GAAC的高计算复杂性,提出了一种结合GACC和K-means的维吾尔文聚类算法。本算法分两步完成聚类操作,首先是GAAC模块从少量文本集中获取最优的初始类中心,然后是K-means模块对大量文本集进行快速聚类。实验结果表明,新算法在聚类准确率和时间复杂度上都有了显著的提高。
关键词
维吾尔文
文本聚类
K—means
GAAC
结合算法
Keywords
Uyghur text
text clustering
K-means
GAAC combined algorithm
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Naive Bayes的维吾尔文文本分类算法及其性能分析
艾海麦提江.阿布来提
吐尔地.托合
提
艾斯卡尔.艾木都拉
《计算机应用与软件》
CSCD
北大核心
2012
7
在线阅读
下载PDF
职称材料
2
一种结合GAAC和K-means的维吾尔文文本聚类算法
吐尔地.托合
提
艾海麦提江.阿布来提
米也塞.艾尼玩
艾斯卡尔.艾木都拉
《计算机工程与科学》
CSCD
北大核心
2013
5
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部