期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
一种基于进化算法的连续属性离散化方法 被引量:7
1
作者 姚望舒 商琳 陈兆乾 《计算机应用与软件》 CSCD 北大核心 2005年第3期37-39,85,共4页
连续属性离散化是知识系统中的一个重要环节 ,一个好的离散化方法能够起到简化知识的描述和便于对知识系统的处理。而求取连续属性值的最优断点集合是一个NP难题 ,本文把连续属性值离散化问题作为一种约束优化问题 ,采用遗传算法来获得... 连续属性离散化是知识系统中的一个重要环节 ,一个好的离散化方法能够起到简化知识的描述和便于对知识系统的处理。而求取连续属性值的最优断点集合是一个NP难题 ,本文把连续属性值离散化问题作为一种约束优化问题 ,采用遗传算法来获得最优解 ,并针对离散化问题设计了相应的编码方式、交叉算子和变异算子。实验结果表明 。 展开更多
关键词 数据库 数据挖掘 知识发现 算法 连续属性离散化方法
在线阅读 下载PDF
基于改进离散粒子群优化的连续属性离散化 被引量:10
2
作者 张荣光 胡晓辉 宗永胜 《计算机工程与应用》 CSCD 北大核心 2017年第18期108-114,235,共8页
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样... 为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样性和寻找全局最优解的能力。利用粗糙集理论中决策属性对条件属性的依赖度来衡量决策表的一致性,从而达到连续属性离散化的目的,最后采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验,实验结果表明此算法是有效的。 展开更多
关键词 离散粒子群 模拟退火 粗糙集 连续属性离散化
在线阅读 下载PDF
基于改进粒子群优化的粗糙集连续属性离散化 被引量:8
3
作者 汪凌 胡培 《计算机工程与应用》 CSCD 北大核心 2010年第15期115-117,158,共4页
提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种群初始化和自适应调整粒子的惯性权重,提高了粒子群优化算法的全局寻优能力。在粗糙集属性离散化方面,主... 提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种群初始化和自适应调整粒子的惯性权重,提高了粒子群优化算法的全局寻优能力。在粗糙集属性离散化方面,主要是通过将最小断点集作为优化目标,粗糙集属性依赖度作为约束条件。仿真结果表明,该方法能有效地解决决策表连续属性离散化问题,计算速度快,收敛性好。 展开更多
关键词 改进粒子群优 粗糙集 连续属性离散化
在线阅读 下载PDF
一种连续属性离散化的新方法 被引量:5
4
作者 凌方 王建东 《数据采集与处理》 CSCD 2002年第2期179-182,共4页
提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属... 提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属性选择 ,即从已离散化的属性集中选择出属性重要度最高的属性 ,再把它和待离散化的连续属性一起进行聚类学习 ,得到该连续属性的离散区间。文中介绍了该方法的算法描述 ,并通过实验与其他算法进行了比较。实验结果表明 ,由于这种方法在离散化过程中结合了粗集理论的思想 ,考虑了属性间的相互影响 ,从而产生了比较合理的划分点 ,提高了规则的分类精度。 展开更多
关键词 连续属性离散化 数据挖掘 粗集 聚类学习 数据库
在线阅读 下载PDF
连续属性离散化的Imp-Chi2算法 被引量:2
5
作者 桑雨 闫德勤 +1 位作者 刘磊 梁宏霞 《计算机工程》 CAS CSCD 北大核心 2008年第17期39-41,共3页
连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2算法,该算法依据属性重要性程度对属... 连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2算法,该算法依据属性重要性程度对属性离散化的顺序进行了合理的调整,能够更准确地对连续属性进行离散化。文章通过C4.5和支持向量机分别对离散化后的结果进行了实验,在实验过程中,提出一种训练集类比例抽取方法,避免了训练集随机抽取的不均匀性。实验结果证明了所提算法的有效性。 展开更多
关键词 连续属性离散化 CHI2算法 属性重要性 训练集类比例抽取
在线阅读 下载PDF
基于语言场理论的连续属性离散化方法及实现 被引量:3
6
作者 周颖 杨炳儒 《计算机科学》 CSCD 北大核心 2003年第5期63-66,共4页
The paper introduces author's job on realization of continuous attribute discretization based on languagefield theory that Prof. Yang put forward. It applies a new algorithm of seeking border values and its increm... The paper introduces author's job on realization of continuous attribute discretization based on languagefield theory that Prof. Yang put forward. It applies a new algorithm of seeking border values and its incremental onerather than seeking boundary ones that is a difficulty. The theory of the algorithm is self-contained, and its realiza-tion is simple. And the paper introduces simply four thoughts about defining language values and then discretizing fornon-numerical value that author already realized in KDD * . 展开更多
关键词 知识表示 知识发现 机器学习 语言场理论 连续属性离散化方法
在线阅读 下载PDF
连续属性离散化算法SHD及其改进 被引量:3
7
作者 刘玲 肖嵘 《计算机工程与应用》 CSCD 北大核心 2001年第9期97-99,116,共4页
为了让规则抽取算法能更好地适用于连续属性领域的问题,文章提出了一种有导师的连续属性离散化算法SHD,并将该算法扩展到多连续属性处理领域。在此基础上,文章对该算法的数据预处理过程进行了探讨,提出了一种基于类间离散度矩阵... 为了让规则抽取算法能更好地适用于连续属性领域的问题,文章提出了一种有导师的连续属性离散化算法SHD,并将该算法扩展到多连续属性处理领域。在此基础上,文章对该算法的数据预处理过程进行了探讨,提出了一种基于类间离散度矩阵分析属性空间重构造算法,并将其应用到属性预处理过程中。算法测试证明,对于连续属性领域的问题,使用SHD属性离散化算法将明显改进后继规则抽取算法的效果。 展开更多
关键词 规则抽取 有导师学习 神经网络 连续属性离散化算法 SHD
在线阅读 下载PDF
连续属性离散化的Integral Chi2算法 被引量:2
8
作者 闫德勤 张丽平 《小型微型计算机系统》 CSCD 北大核心 2008年第4期691-693,共3页
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法基于统计学理论方法,对连续属性离散化研究产生着重要影响.在对Chi2及相关算法中统计量χ2应用意义讨... 连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法基于统计学理论方法,对连续属性离散化研究产生着重要影响.在对Chi2及相关算法中统计量χ2应用意义讨论的基础上,提出了一种新的(IntegralChi2)算法,该算法基于概率统计理论把统计量χ2与分位点χ2α间对应的积分(概率)作为区间合并的依据,能够更合理更准确地对连续属性进行离散化.实验结果证明了算法的有效性. 展开更多
关键词 连续属性离散化 CHI2算法 数据挖掘
在线阅读 下载PDF
一种基于改进粒子群的连续属性离散化算法 被引量:8
9
作者 汪凌 《计算机工程与应用》 CSCD 2013年第21期29-32,共4页
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,... 提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。 展开更多
关键词 改进粒子群 智能优 粗糙集 连续属性离散化
在线阅读 下载PDF
基于信息论的连续属性离散化 被引量:1
10
作者 徐如燕 鲁汉榕 郭齐胜 《计算机工程与设计》 CSCD 2002年第2期62-64,共3页
使用信息论的方法进行连续属性的离散化。引入 Hellinger偏差 HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。... 使用信息论的方法进行连续属性的离散化。引入 Hellinger偏差 HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限。 展开更多
关键词 连续属性离散化 信息论 知识发现 机器学习
在线阅读 下载PDF
文本分类中连续属性离散化方法的研究
11
作者 董乐红 耿国华 周明全 《小型微型计算机系统》 CSCD 北大核心 2009年第11期2222-2225,共4页
针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征词空间,然后判断原特征空间... 针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征词空间,然后判断原特征空间中每个特征词属于或不属于某给定子区间,将问题转换成二值表示方式,以使得这些分类算法适用于连续属性值.实验结果表明,该算法离散过程简单高效,预测精度高,可理解性强. 展开更多
关键词 机器学习 文本分类 信息增益 连续属性离散化 BOOSTING算法
在线阅读 下载PDF
一种基于粗糙集理论的连续属性离散化新算法 被引量:7
12
作者 李慧 闫德勤 韩丽 《计算机应用研究》 CSCD 北大核心 2010年第1期77-78,共2页
粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对... 粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对连续属性进行离散化。实验通过C4.5和支持向量机分别对离散化后的数据进行识别与分类预测,实验结果证明了算法的有效性。 展开更多
关键词 连续属性离散化 粗糙集 决策表 离散区间 数据挖掘
在线阅读 下载PDF
Rough Set中基于聚类的连续属性离散化方法 被引量:5
13
作者 韩秋明 赵轶群 《计算机工程》 CAS CSCD 北大核心 2003年第4期81-82,87,共3页
分析了一些Rough Set中连续属性离散化的方法,指出了其中的某些不足,并给出了一个基于聚类的连续属性离散化的方法。对当前的论域中的例子根据相似性进行聚类, 对每个聚类在各属性轴上的投影的边界设离散断点。该方法考虑了各属性之... 分析了一些Rough Set中连续属性离散化的方法,指出了其中的某些不足,并给出了一个基于聚类的连续属性离散化的方法。对当前的论域中的例子根据相似性进行聚类, 对每个聚类在各属性轴上的投影的边界设离散断点。该方法考虑了各属性之间的相关性,能得到比较合理的离散结果。 展开更多
关键词 聚类 连续属性离散化方法 粗糙集理论 知识表达 数据挖掘
在线阅读 下载PDF
一种基于信息论的决策表连续属性离散化算法 被引量:3
14
作者 岳海亮 闫德勤 《计算机科学》 CSCD 北大核心 2010年第4期231-233,237,共4页
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程... 连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程中为了尽可能保证决策表分类能力不变,使用不一致率对该过程进行控制。最后选取多组实验数据,使用当前流行的分类算法——支持向量机(SVM)对离散化后的数据进行分类预测,并与其它离散算法进行对比,结果表明本算法是有效的。 展开更多
关键词 连续属性离散化 决策表 信息熵 不一致率
在线阅读 下载PDF
连续属性离散化的Bayesian-Chi2算法 被引量:1
15
作者 刘磊 闫德勤 桑雨 《计算机工程与应用》 CSCD 北大核心 2008年第18期39-40,43,共3页
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。连续属性离散化方法是否合理决定着对信息的表达和提取的准确性。Chi2算法在对连续属性进行离散化处理时,无冲突的数据能够得到较好的结果,但是,对不协调和不完全的数据实验... 连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。连续属性离散化方法是否合理决定着对信息的表达和提取的准确性。Chi2算法在对连续属性进行离散化处理时,无冲突的数据能够得到较好的结果,但是,对不协调和不完全的数据实验结果不是很理想。利用了Bayseian模型允许一定程度错误分类存在的性质,对Chi2算法进行了改进。改进后的Chi2算法不仅更适合不协调和不完全的数据,还使得区间的合并更加合理。实验结果证明了算法的有效性。 展开更多
关键词 连续属性离散化 CHI2算法 贝叶斯
在线阅读 下载PDF
基于词出现和信息增益的连续属性离散化方法 被引量:2
16
作者 孙挺 耿国华 周明全 《计算机应用研究》 CSCD 北大核心 2009年第2期485-487,499,共4页
连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on ... 连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on term presence and information gain,MTPIG)。并将MTPIG算法应用到了分类算法AdaBoost.MH中,给出实验结果及分析。实验结果表明,使用MTPIG算法处理文本分类中的数据,其过程简单高效,预测精度高,可理解性强。采用该算法离散化数据集后,分类算法的分类性能有所提高。 展开更多
关键词 连续属性离散 信息增益 文本分类
在线阅读 下载PDF
信息偏差在连续属性离散化中的应用
17
作者 岳海亮 闫德勤 《计算机工程与应用》 CSCD 北大核心 2010年第20期103-105,共3页
对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行度量,在离散化过程中使用不一致率进行控制以保证决策表的相容性不发生变化。最后通过使用C4.5和支持向量... 对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行度量,在离散化过程中使用不一致率进行控制以保证决策表的相容性不发生变化。最后通过使用C4.5和支持向量机(SVM)对该算法和其他算法进行性能对比,验证了该算法的有效性。 展开更多
关键词 连续属性离散化 决策表 信息偏差 不一致率
在线阅读 下载PDF
一种实现分类问题中连续值属性离散化的方法 被引量:1
18
作者 刘东荣 王熙照 《计算机工程与应用》 CSCD 北大核心 2002年第23期108-109,247,共3页
在处理分类问题时,通常首先要对连续值属性值进行离散化,用传统的方法难以找到较好的区间划分,该文采用基于变长染色体的遗传算法,并引入淘汰机制,较好地解决了这一问题。
关键词 分类问题 连续属性离散 遗传算法 规则映射 适应度函数
在线阅读 下载PDF
海量数据离散化算法的并行设计与实现 被引量:1
19
作者 张永 张红蕊 路婧威 《计算机应用与软件》 CSCD 北大核心 2014年第6期21-23,28,共4页
连续属性的离散化是机器学习和数据挖掘的重要预处理步骤,如何高效处理海量数据连续属性离散化已成为急需要解决的问题。近年来兴起的Hadoop技术能够有效处理基于海量数据的应用。为此,设计和实现一种基于MapReduce编程模型的连续属性... 连续属性的离散化是机器学习和数据挖掘的重要预处理步骤,如何高效处理海量数据连续属性离散化已成为急需要解决的问题。近年来兴起的Hadoop技术能够有效处理基于海量数据的应用。为此,设计和实现一种基于MapReduce编程模型的连续属性离散化并行算法,并给出算法设计的方法和策略。在保证离散效果的情况下,使用不同大小数据集在不同节点的集群环境下的实验结果表明,所设计的并行离散化算法具有较高的执行效率和较好的可扩展性,适合用于海量数据的快速离散化处理。 展开更多
关键词 海量数据 并行 连续属性离散化 HADOOP
在线阅读 下载PDF
雾化性能预测驱动的航空发动机燃油喷嘴选配
20
作者 程祥辉 胡志星 +2 位作者 张亚辉 胡小锋 刘跃雄 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第12期105-115,共11页
为减少航空发动机燃油喷嘴装配中的反复拆卸重装,提高一次装配成功率,提出了一种基于雾化性能预判的关键零部件选配方法。首先,基于喷嘴历史装配数据构建喷嘴几何精度-雾化性能实例库;然后,考虑到样本空间大小和喷嘴几何精度波动较大、... 为减少航空发动机燃油喷嘴装配中的反复拆卸重装,提高一次装配成功率,提出了一种基于雾化性能预判的关键零部件选配方法。首先,基于喷嘴历史装配数据构建喷嘴几何精度-雾化性能实例库;然后,考虑到样本空间大小和喷嘴几何精度波动较大、一致性差的影响,采用自适应综合过采样方法对样本空间进行扩充,同时利用改进的K-means聚类算法对连续属性离散化处理;最后,通过关联规则挖掘算法建立几何精度与雾化性能之间的关联关系,并利用规则适应度评价方法量化每条规则的准确性,基于这些关联规则集构建喷嘴雾化性能预判模型,用于指导喷嘴装配。研究结果表明,利用某双油路离心喷嘴的旋流器和副喷口的装配数据进行验证,与决策树、支持向量机和人工神经网络等方法进行比较,本方法提出的喷嘴雾化性能预判模型的预测效果最好,预测精度高达98.33%。可以对不同零件组合后的喷嘴雾化性能进行有效预判,进而减少无效装配,提高喷嘴的装配效率。 展开更多
关键词 燃油喷嘴 选配 关联规则挖掘 样本扩充 连续属性离散化
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部