期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于微粒群优化的连续属性离散化算法 被引量:9
1
作者 张腾飞 王锡淮 肖健梅 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期44-46,共3页
连续属性的离散化是粗糙集理论的主要问题之一,也是影响粗糙集理论实用性的瓶颈之一。由于没有最佳离散化形式的统一标准,大多离散化算法采用的启发式带有较强的主观性,也难以得到较满意的离散效果。该文提出了基于微粒群优化的连续属... 连续属性的离散化是粗糙集理论的主要问题之一,也是影响粗糙集理论实用性的瓶颈之一。由于没有最佳离散化形式的统一标准,大多离散化算法采用的启发式带有较强的主观性,也难以得到较满意的离散效果。该文提出了基于微粒群优化的连续属性离散化方法,将各属性的离散化划分点初始化为一群粒子,在保证决策表分类能力不变的情况下,通过粒子间的相互作用寻求理想的离散化划分点,使得决策表引入较少的冲突。实验结果验证了该方法的有效性。 展开更多
关键词 微粒群优 粗糙集 属性离散化
在线阅读 下载PDF
一种基于进化算法的连续属性离散化方法 被引量:7
2
作者 姚望舒 商琳 陈兆乾 《计算机应用与软件》 CSCD 北大核心 2005年第3期37-39,85,共4页
连续属性离散化是知识系统中的一个重要环节 ,一个好的离散化方法能够起到简化知识的描述和便于对知识系统的处理。而求取连续属性值的最优断点集合是一个NP难题 ,本文把连续属性值离散化问题作为一种约束优化问题 ,采用遗传算法来获得... 连续属性离散化是知识系统中的一个重要环节 ,一个好的离散化方法能够起到简化知识的描述和便于对知识系统的处理。而求取连续属性值的最优断点集合是一个NP难题 ,本文把连续属性值离散化问题作为一种约束优化问题 ,采用遗传算法来获得最优解 ,并针对离散化问题设计了相应的编码方式、交叉算子和变异算子。实验结果表明 。 展开更多
关键词 数据库 数据挖掘 知识发现 算法 连续属性离散化方法
在线阅读 下载PDF
基于决策的剥离式连续属性离散化算法 被引量:5
3
作者 潘巍 李晋川 +1 位作者 王阳生 杨宏戟 《计算机科学》 CSCD 北大核心 2007年第8期208-210,共3页
针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属性重要度,完成对连续属性的初步离散。此外,本文提出候选断点... 针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属性重要度,完成对连续属性的初步离散。此外,本文提出候选断点集的推移原则,可逐步减小候选断点集的范围。由于每次都是针对尚不能明确分类的样本进行细化,因此随着候选断点集的减少和明确分类样本的增加,系统能够迅速收敛,并且离散化后的决策表总是相容的,这与目前很多离散方法不考虑决策相容性相比,能够最大限度地保留系统的有用信息。本文提出的离散化方法是领域独立的,不需要领域知识,可应用于不同领域的连续属性的离散化。 展开更多
关键词 粗糙集理论 属性离散化 候选断点 决策相容性
在线阅读 下载PDF
基于改进离散粒子群优化的连续属性离散化 被引量:10
4
作者 张荣光 胡晓辉 宗永胜 《计算机工程与应用》 CSCD 北大核心 2017年第18期108-114,235,共8页
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样... 为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样性和寻找全局最优解的能力。利用粗糙集理论中决策属性对条件属性的依赖度来衡量决策表的一致性,从而达到连续属性离散化的目的,最后采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验,实验结果表明此算法是有效的。 展开更多
关键词 离散粒子群 模拟退火 粗糙集 连续属性离散化
在线阅读 下载PDF
基于改进粒子群优化的粗糙集连续属性离散化 被引量:8
5
作者 汪凌 胡培 《计算机工程与应用》 CSCD 北大核心 2010年第15期115-117,158,共4页
提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种群初始化和自适应调整粒子的惯性权重,提高了粒子群优化算法的全局寻优能力。在粗糙集属性离散化方面,主... 提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种群初始化和自适应调整粒子的惯性权重,提高了粒子群优化算法的全局寻优能力。在粗糙集属性离散化方面,主要是通过将最小断点集作为优化目标,粗糙集属性依赖度作为约束条件。仿真结果表明,该方法能有效地解决决策表连续属性离散化问题,计算速度快,收敛性好。 展开更多
关键词 改进粒子群优 粗糙集 连续属性离散化
在线阅读 下载PDF
一种连续属性离散化的新方法 被引量:5
6
作者 凌方 王建东 《数据采集与处理》 CSCD 2002年第2期179-182,共4页
提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属... 提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属性选择 ,即从已离散化的属性集中选择出属性重要度最高的属性 ,再把它和待离散化的连续属性一起进行聚类学习 ,得到该连续属性的离散区间。文中介绍了该方法的算法描述 ,并通过实验与其他算法进行了比较。实验结果表明 ,由于这种方法在离散化过程中结合了粗集理论的思想 ,考虑了属性间的相互影响 ,从而产生了比较合理的划分点 ,提高了规则的分类精度。 展开更多
关键词 连续属性离散化 数据挖掘 粗集 聚类学习 数据库
在线阅读 下载PDF
连续属性离散化的Imp-Chi2算法 被引量:2
7
作者 桑雨 闫德勤 +1 位作者 刘磊 梁宏霞 《计算机工程》 CAS CSCD 北大核心 2008年第17期39-41,共3页
连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2算法,该算法依据属性重要性程度对属... 连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2算法,该算法依据属性重要性程度对属性离散化的顺序进行了合理的调整,能够更准确地对连续属性进行离散化。文章通过C4.5和支持向量机分别对离散化后的结果进行了实验,在实验过程中,提出一种训练集类比例抽取方法,避免了训练集随机抽取的不均匀性。实验结果证明了所提算法的有效性。 展开更多
关键词 连续属性离散化 CHI2算法 属性重要性 训练集类比例抽取
在线阅读 下载PDF
基于语言场理论的连续属性离散化方法及实现 被引量:3
8
作者 周颖 杨炳儒 《计算机科学》 CSCD 北大核心 2003年第5期63-66,共4页
The paper introduces author's job on realization of continuous attribute discretization based on languagefield theory that Prof. Yang put forward. It applies a new algorithm of seeking border values and its increm... The paper introduces author's job on realization of continuous attribute discretization based on languagefield theory that Prof. Yang put forward. It applies a new algorithm of seeking border values and its incremental onerather than seeking boundary ones that is a difficulty. The theory of the algorithm is self-contained, and its realiza-tion is simple. And the paper introduces simply four thoughts about defining language values and then discretizing fornon-numerical value that author already realized in KDD * . 展开更多
关键词 知识表示 知识发现 机器学习 语言场理论 连续属性离散化方法
在线阅读 下载PDF
连续属性离散化算法SHD及其改进 被引量:3
9
作者 刘玲 肖嵘 《计算机工程与应用》 CSCD 北大核心 2001年第9期97-99,116,共4页
为了让规则抽取算法能更好地适用于连续属性领域的问题,文章提出了一种有导师的连续属性离散化算法SHD,并将该算法扩展到多连续属性处理领域。在此基础上,文章对该算法的数据预处理过程进行了探讨,提出了一种基于类间离散度矩阵... 为了让规则抽取算法能更好地适用于连续属性领域的问题,文章提出了一种有导师的连续属性离散化算法SHD,并将该算法扩展到多连续属性处理领域。在此基础上,文章对该算法的数据预处理过程进行了探讨,提出了一种基于类间离散度矩阵分析属性空间重构造算法,并将其应用到属性预处理过程中。算法测试证明,对于连续属性领域的问题,使用SHD属性离散化算法将明显改进后继规则抽取算法的效果。 展开更多
关键词 规则抽取 有导师学习 神经网络 连续属性离散化算法 SHD
在线阅读 下载PDF
连续属性离散化的Integral Chi2算法 被引量:2
10
作者 闫德勤 张丽平 《小型微型计算机系统》 CSCD 北大核心 2008年第4期691-693,共3页
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法基于统计学理论方法,对连续属性离散化研究产生着重要影响.在对Chi2及相关算法中统计量χ2应用意义讨... 连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法基于统计学理论方法,对连续属性离散化研究产生着重要影响.在对Chi2及相关算法中统计量χ2应用意义讨论的基础上,提出了一种新的(IntegralChi2)算法,该算法基于概率统计理论把统计量χ2与分位点χ2α间对应的积分(概率)作为区间合并的依据,能够更合理更准确地对连续属性进行离散化.实验结果证明了算法的有效性. 展开更多
关键词 连续属性离散化 CHI2算法 数据挖掘
在线阅读 下载PDF
一种基于改进粒子群的连续属性离散化算法 被引量:8
11
作者 汪凌 《计算机工程与应用》 CSCD 2013年第21期29-32,共4页
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,... 提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。 展开更多
关键词 改进粒子群 智能优 粗糙集 连续属性离散化
在线阅读 下载PDF
基于信息论的连续属性离散化 被引量:1
12
作者 徐如燕 鲁汉榕 郭齐胜 《计算机工程与设计》 CSCD 2002年第2期62-64,共3页
使用信息论的方法进行连续属性的离散化。引入 Hellinger偏差 HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。... 使用信息论的方法进行连续属性的离散化。引入 Hellinger偏差 HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限。 展开更多
关键词 连续属性离散化 信息论 知识发现 机器学习
在线阅读 下载PDF
文本分类中连续属性离散化方法的研究
13
作者 董乐红 耿国华 周明全 《小型微型计算机系统》 CSCD 北大核心 2009年第11期2222-2225,共4页
针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征词空间,然后判断原特征空间... 针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征词空间,然后判断原特征空间中每个特征词属于或不属于某给定子区间,将问题转换成二值表示方式,以使得这些分类算法适用于连续属性值.实验结果表明,该算法离散过程简单高效,预测精度高,可理解性强. 展开更多
关键词 机器学习 文本分类 信息增益 连续属性离散化 BOOSTING算法
在线阅读 下载PDF
一种基于粗糙集理论的连续属性离散化新算法 被引量:7
14
作者 李慧 闫德勤 韩丽 《计算机应用研究》 CSCD 北大核心 2010年第1期77-78,共2页
粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对... 粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对连续属性进行离散化。实验通过C4.5和支持向量机分别对离散化后的数据进行识别与分类预测,实验结果证明了算法的有效性。 展开更多
关键词 连续属性离散化 粗糙集 决策表 离散区间 数据挖掘
在线阅读 下载PDF
Rough Set中基于聚类的连续属性离散化方法 被引量:5
15
作者 韩秋明 赵轶群 《计算机工程》 CAS CSCD 北大核心 2003年第4期81-82,87,共3页
分析了一些Rough Set中连续属性离散化的方法,指出了其中的某些不足,并给出了一个基于聚类的连续属性离散化的方法。对当前的论域中的例子根据相似性进行聚类, 对每个聚类在各属性轴上的投影的边界设离散断点。该方法考虑了各属性之... 分析了一些Rough Set中连续属性离散化的方法,指出了其中的某些不足,并给出了一个基于聚类的连续属性离散化的方法。对当前的论域中的例子根据相似性进行聚类, 对每个聚类在各属性轴上的投影的边界设离散断点。该方法考虑了各属性之间的相关性,能得到比较合理的离散结果。 展开更多
关键词 聚类 连续属性离散化方法 粗糙集理论 知识表达 数据挖掘
在线阅读 下载PDF
一种基于信息论的决策表连续属性离散化算法 被引量:3
16
作者 岳海亮 闫德勤 《计算机科学》 CSCD 北大核心 2010年第4期231-233,237,共4页
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程... 连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程中为了尽可能保证决策表分类能力不变,使用不一致率对该过程进行控制。最后选取多组实验数据,使用当前流行的分类算法——支持向量机(SVM)对离散化后的数据进行分类预测,并与其它离散算法进行对比,结果表明本算法是有效的。 展开更多
关键词 连续属性离散化 决策表 信息熵 不一致率
在线阅读 下载PDF
连续属性离散化的Bayesian-Chi2算法 被引量:1
17
作者 刘磊 闫德勤 桑雨 《计算机工程与应用》 CSCD 北大核心 2008年第18期39-40,43,共3页
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。连续属性离散化方法是否合理决定着对信息的表达和提取的准确性。Chi2算法在对连续属性进行离散化处理时,无冲突的数据能够得到较好的结果,但是,对不协调和不完全的数据实验... 连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。连续属性离散化方法是否合理决定着对信息的表达和提取的准确性。Chi2算法在对连续属性进行离散化处理时,无冲突的数据能够得到较好的结果,但是,对不协调和不完全的数据实验结果不是很理想。利用了Bayseian模型允许一定程度错误分类存在的性质,对Chi2算法进行了改进。改进后的Chi2算法不仅更适合不协调和不完全的数据,还使得区间的合并更加合理。实验结果证明了算法的有效性。 展开更多
关键词 连续属性离散化 CHI2算法 贝叶斯
在线阅读 下载PDF
一种实现分类问题中连续值属性离散化的方法 被引量:1
18
作者 刘东荣 王熙照 《计算机工程与应用》 CSCD 北大核心 2002年第23期108-109,247,共3页
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
关键词 分类问题 连续值属性离散化 遗传算法 规则映射 适应度函数
在线阅读 下载PDF
基于词出现和信息增益的连续属性离散化方法 被引量:2
19
作者 孙挺 耿国华 周明全 《计算机应用研究》 CSCD 北大核心 2009年第2期485-487,499,共4页
连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on ... 连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on term presence and information gain,MTPIG)。并将MTPIG算法应用到了分类算法AdaBoost.MH中,给出实验结果及分析。实验结果表明,使用MTPIG算法处理文本分类中的数据,其过程简单高效,预测精度高,可理解性强。采用该算法离散化数据集后,分类算法的分类性能有所提高。 展开更多
关键词 连续属性离散 信息增益 文本分类
在线阅读 下载PDF
信息偏差在连续属性离散化中的应用
20
作者 岳海亮 闫德勤 《计算机工程与应用》 CSCD 北大核心 2010年第20期103-105,共3页
对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行度量,在离散化过程中使用不一致率进行控制以保证决策表的相容性不发生变化。最后通过使用C4.5和支持向量... 对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行度量,在离散化过程中使用不一致率进行控制以保证决策表的相容性不发生变化。最后通过使用C4.5和支持向量机(SVM)对该算法和其他算法进行性能对比,验证了该算法的有效性。 展开更多
关键词 连续属性离散化 决策表 信息偏差 不一致率
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部