-
题名基于灰关联分析的连续值属性约减算法
被引量:5
- 1
-
-
作者
张健
王晋东
余定坤
-
机构
信息工程大学
-
出处
《计算机应用》
CSCD
北大核心
2014年第2期401-405,共5页
-
基金
国防预研项目
-
文摘
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。
-
关键词
属性约减
灰关联分析
重叠度
连续值属性
-
Keywords
attribute reduction
grey correlation analysis
overlap degree
continuous-valued attribute
-
分类号
TP301.4
[自动化与计算机技术—计算机系统结构]
-
-
题名基于聚类的连续值属性最佳离散化算法
被引量:6
- 2
-
-
作者
席静
欧阳为民
-
机构
中国科学院计算技术研究所
安徽大学计算中心
-
出处
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第10期1025-1027,共3页
-
基金
国家自然科学基金项目资助
-
文摘
在机器学习和 KDD研究中 ,大多数算法都是以离散值为处理对象的 .然而 ,在现实世界数据库中 ,存在着大量的连续值属性 .因此 ,常常需要对连续值属性进行离散化 .本文提出了一种基于聚类的连续值属性最佳离散化算法 .
-
关键词
机器学习
知识发现
连续值属性
聚类
离散化算法
-
Keywords
Machine learning
Knowledge discovery
Continuous valued attributes
Discretization
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种实现分类问题中连续值属性离散化的方法
被引量:1
- 3
-
-
作者
刘东荣
王熙照
-
机构
河北大学数学与计算机学院
河北师范大学数学与信息科学学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第23期108-109,247,共3页
-
文摘
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
-
关键词
分类问题
连续值属性离散化
遗传算法
规则映射
适应度函数
-
Keywords
Classification,Discretization,Genetic Algorithm(GA)
-
分类号
O242.23
[理学—计算数学]
TP30
[自动化与计算机技术—计算机系统结构]
-
-
题名基于统计学法则的连续属性值划分方法
- 4
-
-
作者
高洪涛
陆伟
杨余旺
-
机构
中国刑事警察学院网络犯罪侦查系
南京理工大学计算机科学与工程学院
-
出处
《科学技术与工程》
北大核心
2018年第16期237-240,共4页
-
基金
国家自然科学基金(61640020)资助
-
文摘
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。
-
关键词
连续属性值
学习精度
统计学法则
分类算法
-
Keywords
continuous attributes
learning accuracy
statistical criterion classification algorithms
-
分类号
TP393.03
[自动化与计算机技术—计算机应用技术]
-
-
题名一种区间属性值离散化的新方法
被引量:5
- 5
-
-
作者
关欣
衣晓
何友
周一宇
-
机构
海军航空工程学院信息融合技术研究所
国防科学技术大学电子科学与工程学院
-
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2009年第3期1164-1167,1206,共5页
-
基金
国家自然科学基金(60672140)
全国优秀博士论文作者专项资金(200443)
-
文摘
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的连续属性值的,实际应用中大量存在着连续区间属性值的情况。文中针对这一问题,提出了一种连续区间属性值离散化的新方法,并利用辐射源信号进行了仿真试验。结果表明,该方法能有效离散区间属性,从而拓展了粗糙集理论的应用范围。
-
关键词
粗糙集
离散化
连续区间值属性
-
Keywords
Rough set
Discretization
Continuous interval-valued attributes
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于改进遗传算法的连续属性离散化方法
被引量:1
- 6
-
-
作者
夏战国
夏士雄
牛强
张磊
-
机构
中国矿业大学计算机科学与技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第16期4275-4276,4279,共3页
-
基金
国家自然科学基金项目(50674086)
江苏省社会发展科技计划基金项目(B52006002)
+1 种基金
高等学校博士学科点专项科研基金项目(20060290508)
中国矿业大学青年科研基金项目(2005A044)
-
文摘
粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散化问题设计了相应的编码方式和交叉方法。实验结果表明,采用改进的遗传算法求解连续属性值最优断点集合是可行的。
-
关键词
离散化
决策表
粗糙集
遗传算法
连续属性值
-
Keywords
discretization
decision table
rough set, genetic algorithm
continuous attributes value
-
分类号
TP398.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于逐级均值聚类的信息熵的离散化算法
被引量:1
- 7
-
-
作者
刘静
罗卫敏
刘井波
-
机构
重庆三峡学院实验中心
重庆三峡学院数学与计算机科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第9期3368-3371,共4页
-
文摘
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集,然后用基于信息熵的离散化算法完成断点的选取并对连续值属性进行离散化。实验结果表明,该方法在识别率相当的情况下比传统的离散化方法的时间代价更低。
-
关键词
粗糙集
离散化
连续值属性
逐级均值聚类
信息熵
-
Keywords
rough set
discretization
continuous attribute values
ranking means clustering
information entropy
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于灰色绝对关联度的变精度粗糙集模型
被引量:5
- 8
-
-
作者
王磊
王金山
沈浮
-
机构
解放军陆军军官学院数学教研室
-
出处
《重庆理工大学学报(自然科学)》
CAS
2012年第5期123-126,共4页
-
文摘
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于重要度的约简算法对模型进行属性约简。通过实例说明了模型建立和约简的具体过程。
-
关键词
连续值属性决策表
变精度粗糙集模型
灰色绝对关联度
属性约简
重要度
-
Keywords
continuous valued attribute decision table
variable precision rough set model
grey ab-solute correlation degree
indicator reduction
significant degree
-
分类号
O29
[理学—应用数学]
-
-
题名天地一体化智能网络流量实时分类
被引量:1
- 9
-
-
作者
杨力
王龙青
潘成胜
蔡睿妍
-
机构
大连大学通信与网络重点实验室
大连大学信息工程学院
南京信息工程大学电子与信息工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第7期1547-1552,共6页
-
基金
国家自然科学基金项目(61931004)资助.
-
文摘
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理分配和利用.SFC算法是在C4.5决策树算法的基础上结合了改进后的快速相关滤波算法(Fast Correlation-Based Filter Solution,FCBF)和连续型属性值离散化算法,可以在有效去除冗余特征和降低模型复杂度的同时,提高模型分类的速度和准确率.仿真结果表明,SFC决策树分类模型相比传统的流量分类模型具有较好的稳定性和较高的准确率,可以很好的适应复杂多变的网络环境.同时,Spark大数据分布式平台的应用大幅度提高了大规模网络下流量分类的速度,能够对海量流量进行实时分类.
-
关键词
天地一体化智能网络
FCBF
连续型属性值离散化算法
SPARK
流量实时分类
-
Keywords
space-earth integrated intelligent network
FCBF
continuous attribute value discretization algorithm
Spark
real-time classification
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-