-
题名基于字符串核的免分词中文文本分类方法
- 1
-
-
作者
游智
李战怀
张阳
-
机构
西北工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第26期170-172,共3页
-
文摘
文本分类是获取文本信息的重要一步,现有的分类方法主要是基于统计理论和机器学习的,其中著名的有Bayes[1]、KNN[2]、SVM[3]、神经网络等方法。实验证明这些方法对英文分类都表现出较好的准确性和稳定性[4]。对于中文文本分类,涉及对文本进行分词的工作。但是中文分词本身又是一件困难的事情[5]。论文尝试一种基于字符串核函数的支持矢量机方法来避开分词对中文文本分类,实验表明此方法表现出较好的分类性能。
-
关键词
核函数
SVM
字符串核
-
Keywords
kernel function,SVM,string kernel
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于改进K-modes聚类的KNN分类算法
被引量:25
- 2
-
-
作者
王志华
刘绍廷
罗齐
-
机构
郑州大学软件与应用科技学院
-
出处
《计算机工程与设计》
北大核心
2019年第8期2228-2234,共7页
-
基金
国家社会科学基金项目(15BTQ064)
河南省科技攻关基金项目(182102210007)
-
文摘
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。
-
关键词
K-modes算法
KNN算法
分类
簇中心
K-modes-KNN算法
字符串核函数
-
Keywords
K-modes algorithm
KNN algorithm
classification
cluster center
K-modes-KNN algorithm
string kernel function
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-