期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Naive Bayes的维吾尔文文本分类算法及其性能分析 被引量:7
1
作者 艾海麦提江.阿布来提 吐尔地.托合 艾斯卡尔.艾木都拉 《计算机应用与软件》 CSCD 北大核心 2012年第12期27-29,共3页
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数... 以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法为分类引擎,用C#实现分类系统。预处理中,结合维吾尔语的词法特征,通过引入词干提取方法大大降低特征维数。在包含10大类共计3 000多个较大规模文本语料库基础上给出分类实验结果,再通过x2统计方法选择不同数目的特征,也分别给出分类实验结果。结果表明,预处理后的维吾尔文特征空间中只有1%-3%特征是最佳的,因而进一步确定哪些是最佳特征或降低特征空间维数是有可能的。 展开更多
关键词 维吾尔文 文本分类 NAIVE Bayes词干提取 停用词
在线阅读 下载PDF
一种结合GAAC和K-means的维吾尔文文本聚类算法 被引量:5
2
作者 吐尔地.托合 艾海麦提江.阿布来提 +1 位作者 米也塞.艾尼玩 艾斯卡尔.艾木都拉 《计算机工程与科学》 CSCD 北大核心 2013年第7期149-155,共7页
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分... 介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分依赖性及不稳定性缺点以及GAAC的高计算复杂性,提出了一种结合GACC和K-means的维吾尔文聚类算法。本算法分两步完成聚类操作,首先是GAAC模块从少量文本集中获取最优的初始类中心,然后是K-means模块对大量文本集进行快速聚类。实验结果表明,新算法在聚类准确率和时间复杂度上都有了显著的提高。 展开更多
关键词 维吾尔文 文本聚类 K—means GAAC 结合算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部