期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于灰关联分析的连续值属性约减算法 被引量:5
1
作者 张健 王晋东 余定坤 《计算机应用》 CSCD 北大核心 2014年第2期401-405,共5页
针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关... 针对目前大多数属性约减算法只能用于离散值决策表的情况,将条件属性与决策属性的关联度作为属性约减的重要性测度,同时基于条件属性间的关联度和重要度定义了条件属性的重叠性测度,据此对条件属性进行去重叠化处理,提出了一种基于灰关联分析的连续值属性约减算法CARAG,实现了对连续值属性集的约减,并在仿真实验中对算法的可行性和有效性进行了对比验证。 展开更多
关键词 属性约减 灰关联分析 重叠度 连续值属性
在线阅读 下载PDF
基于聚类的连续值属性最佳离散化算法 被引量:6
2
作者 席静 欧阳为民 《小型微型计算机系统》 EI CSCD 北大核心 2000年第10期1025-1027,共3页
在机器学习和 KDD研究中 ,大多数算法都是以离散值为处理对象的 .然而 ,在现实世界数据库中 ,存在着大量的连续值属性 .因此 ,常常需要对连续值属性进行离散化 .本文提出了一种基于聚类的连续值属性最佳离散化算法 .
关键词 机器学习 知识发现 连续值属性 聚类 离散化算法
在线阅读 下载PDF
一种实现分类问题中连续值属性离散化的方法 被引量:1
3
作者 刘东荣 王熙照 《计算机工程与应用》 CSCD 北大核心 2002年第23期108-109,247,共3页
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
关键词 分类问题 连续值属性离散化 遗传算法 规则映射 适应度函数
在线阅读 下载PDF
基于统计学法则的连续属性值划分方法
4
作者 高洪涛 陆伟 杨余旺 《科学技术与工程》 北大核心 2018年第16期237-240,共4页
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高... 目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。 展开更多
关键词 连续属性 学习精度 统计学法则 分类算法
在线阅读 下载PDF
一种区间属性值离散化的新方法 被引量:5
5
作者 关欣 衣晓 +1 位作者 何友 周一宇 《宇航学报》 EI CAS CSCD 北大核心 2009年第3期1164-1167,1206,共5页
粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的... 粗糙集理论作为一种新的处理含糊和不确定性问题的数学工具,已成为国际学术界的一个前沿的研究领域。传统的粗糙集理论只能对数据库中的离散属性进行处理,因此,连续属性值的离散化问题不容忽视。已有的离散化方法主要是针对固定点上的连续属性值的,实际应用中大量存在着连续区间属性值的情况。文中针对这一问题,提出了一种连续区间属性值离散化的新方法,并利用辐射源信号进行了仿真试验。结果表明,该方法能有效离散区间属性,从而拓展了粗糙集理论的应用范围。 展开更多
关键词 粗糙集 离散化 连续区间属性
在线阅读 下载PDF
基于改进遗传算法的连续属性离散化方法 被引量:1
6
作者 夏战国 夏士雄 +1 位作者 牛强 张磊 《计算机工程与设计》 CSCD 北大核心 2008年第16期4275-4276,4279,共3页
粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散... 粗糙集中的离散化要求在保持原有决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,而求取连续属性值的最优断点集合是一个NP难题。把连续属性值离散化问题作为一种约束优化问题,采用一种改进的遗传算法来获得最优解,并针对离散化问题设计了相应的编码方式和交叉方法。实验结果表明,采用改进的遗传算法求解连续属性值最优断点集合是可行的。 展开更多
关键词 离散化 决策表 粗糙集 遗传算法 连续属性
在线阅读 下载PDF
基于逐级均值聚类的信息熵的离散化算法 被引量:1
7
作者 刘静 罗卫敏 刘井波 《计算机应用研究》 CSCD 北大核心 2010年第9期3368-3371,共4页
目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集... 目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾,针对粗糙集给出了基于逐级均值聚类的信息熵的离散化算法。首先使用改进的逐级均值聚类算法分别对单个属性的候选断点按其信息熵值进行聚类分析,生成新的规模更小的候选断点集,然后用基于信息熵的离散化算法完成断点的选取并对连续值属性进行离散化。实验结果表明,该方法在识别率相当的情况下比传统的离散化方法的时间代价更低。 展开更多
关键词 粗糙集 离散化 连续值属性 逐级均聚类 信息熵
在线阅读 下载PDF
一种基于灰色绝对关联度的变精度粗糙集模型 被引量:5
8
作者 王磊 王金山 沈浮 《重庆理工大学学报(自然科学)》 CAS 2012年第5期123-126,共4页
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于... 应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于重要度的约简算法对模型进行属性约简。通过实例说明了模型建立和约简的具体过程。 展开更多
关键词 连续值属性决策表 变精度粗糙集模型 灰色绝对关联度 属性约简 重要度
在线阅读 下载PDF
天地一体化智能网络流量实时分类 被引量:1
9
作者 杨力 王龙青 +1 位作者 潘成胜 蔡睿妍 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1547-1552,共6页
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理... 天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理分配和利用.SFC算法是在C4.5决策树算法的基础上结合了改进后的快速相关滤波算法(Fast Correlation-Based Filter Solution,FCBF)和连续型属性值离散化算法,可以在有效去除冗余特征和降低模型复杂度的同时,提高模型分类的速度和准确率.仿真结果表明,SFC决策树分类模型相比传统的流量分类模型具有较好的稳定性和较高的准确率,可以很好的适应复杂多变的网络环境.同时,Spark大数据分布式平台的应用大幅度提高了大规模网络下流量分类的速度,能够对海量流量进行实时分类. 展开更多
关键词 天地一体化智能网络 FCBF 连续属性离散化算法 SPARK 流量实时分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部