-
题名变精度粗糙集的加权KNN文本分类算法
被引量:10
- 1
-
-
作者
刘发升
董清龙
李文静
-
机构
江西理工大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2019年第5期1339-1342,1364,共5页
-
基金
江西省研究生创新专项基金项目(YC2017-S314)
-
文摘
针对训练样本较大时KNN算法(K最近邻算法)的分类效率较低和训练样本不均衡时算法的分类性能受到影响这两个问题,提出变精度粗糙集的加权KNN文本分类算法。利用变精度粗糙集上下近似的概念,将各个类别的训练集分为β正区域和β边界域。分类过程中根据测试样本与样本中心的相似度,得到样本的归属区域。其中属于β正区域的样本可以直接判断其类别,其它区域的样本用基于数量加权的KNN算法判断其类别。实验结果表明,该算法能有效提高分类的性能和效率。
-
关键词
K最近邻
文本分类
变精度粗糙集
上近似
下近似
数量加权
-
Keywords
K-nearest neighbor (KNN)
text classification
variable precision rough set
upper approximation
lower approximation
quantity weighting
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的CK度量套件
被引量:3
- 2
-
-
作者
李晓航
胡晓鹏
-
机构
西南交通大学信息科学与技术学院
-
出处
《西南交通大学学报》
EI
CSCD
北大核心
2008年第1期35-39,共5页
-
文摘
为弥补CK套件中每类加权方法数量、继承树深度和方法内聚缺乏度等度量指标的缺陷,提出了如下改进的度量指标:每类加权方法参数复杂性(WMACC)、每类加权方法属性复杂性(WACC)、相对继承树深度(RDIT)、方法内聚性(CM)和封装率(ER).用Java的Util包中的类作为测试数据比较了ICK度量套件和CK套件,结果表明,WMACC和CM更准确地反映了方法的复杂性和内聚性,RDIT更适合于纯面向对象系统的环境.WACC和ER提供了对属性复杂性和封装性的度量.
-
关键词
软件度量
CK套件
软件工程
每类加权方法数量
继承树深度
方法内聚性缺乏度
-
Keywords
software metrics
CK suite
software engineering
WMC
DIT
LCOM
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-