期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于信息论的连续属性离散化 被引量:2
1
作者 徐如燕 鲁汉榕 郭齐胜 《空军雷达学院学报》 2001年第2期20-23,共4页
使用信息论的方法进行连续属性的离散化。引入Hellinger偏差HD (Hellinger Di-vergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均... 使用信息论的方法进行连续属性的离散化。引入Hellinger偏差HD (Hellinger Di-vergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限。 展开更多
关键词 连续属性离散化 算法 归并 度量 信息论 信息熵 切分 离散方法 平均 区间
在线阅读 下载PDF
基于类-属性关系依赖度的数据离散化方法 被引量:2
2
作者 张小梅 《兰州交通大学学报》 CAS 2012年第3期125-129,共5页
提出了一种基于类-属性关系依赖度的数据离散化方法,其特点是:借助统计学的λ相关系数,有效地捕获类-属性间的相互依赖,以此来选取最佳断点.并利用粗糙集属性依赖度分析方法,对实验数据进行有效分析,挖掘出对决策分析影响大的属性,去掉... 提出了一种基于类-属性关系依赖度的数据离散化方法,其特点是:借助统计学的λ相关系数,有效地捕获类-属性间的相互依赖,以此来选取最佳断点.并利用粗糙集属性依赖度分析方法,对实验数据进行有效分析,挖掘出对决策分析影响大的属性,去掉对决策分析影响小的冗余属性,以此构造数据挖掘模型.实例测试表明:该方法显著提高了决策树的分类学习精度,尤其在乳腺癌的症诊断上效果显著. 展开更多
关键词 连续属性离散化 粗糙集 关系依赖 决策树
在线阅读 下载PDF
雾化性能预测驱动的航空发动机燃油喷嘴选配
3
作者 程祥辉 胡志星 +2 位作者 张亚辉 胡小锋 刘跃雄 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第12期105-115,共11页
为减少航空发动机燃油喷嘴装配中的反复拆卸重装,提高一次装配成功率,提出了一种基于雾化性能预判的关键零部件选配方法。首先,基于喷嘴历史装配数据构建喷嘴几何精度-雾化性能实例库;然后,考虑到样本空间大小和喷嘴几何精度波动较大、... 为减少航空发动机燃油喷嘴装配中的反复拆卸重装,提高一次装配成功率,提出了一种基于雾化性能预判的关键零部件选配方法。首先,基于喷嘴历史装配数据构建喷嘴几何精度-雾化性能实例库;然后,考虑到样本空间大小和喷嘴几何精度波动较大、一致性差的影响,采用自适应综合过采样方法对样本空间进行扩充,同时利用改进的K-means聚类算法对连续属性离散化处理;最后,通过关联规则挖掘算法建立几何精度与雾化性能之间的关联关系,并利用规则适应度评价方法量化每条规则的准确性,基于这些关联规则集构建喷嘴雾化性能预判模型,用于指导喷嘴装配。研究结果表明,利用某双油路离心喷嘴的旋流器和副喷口的装配数据进行验证,与决策树、支持向量机和人工神经网络等方法进行比较,本方法提出的喷嘴雾化性能预判模型的预测效果最好,预测精度高达98.33%。可以对不同零件组合后的喷嘴雾化性能进行有效预判,进而减少无效装配,提高喷嘴的装配效率。 展开更多
关键词 燃油喷嘴 选配 关联规则挖掘 样本扩充 连续属性离散化
在线阅读 下载PDF
样本信息处理中一种属性约简方法的研究 被引量:11
4
作者 夏克文 沈钧毅 李昌彪 《西安交通大学学报》 EI CAS CSCD 北大核心 2005年第6期558-561,602,共5页
为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似精度科学地定义了条件属性重要性,进而提出一种对样本信息进行属性约简的有效、简便方法.该方法主要包括... 为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似精度科学地定义了条件属性重要性,进而提出一种对样本信息进行属性约简的有效、简便方法.该方法主要包括信息核的求取、可省条件属性的重要性计算和相对属性约简集的确定.其中,为连续属性的离散化处理提供了一种基于模糊相似比原理的快速离散化算法,它能起到剔除模糊噪声的作用.典型实例计算和在油水层识别系统中的实际应用表明,这种属性约简方法的识别准确率可达90%以上,应用效果显著. 展开更多
关键词 属性约简 样本信息 近似精度 连续属性离散化 模糊相似比
在线阅读 下载PDF
一种基于可信度最优的数量关联规则挖掘算法 被引量:2
5
作者 吉根林 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第2期31-34,共4页
研究了数量关联规则挖掘过程中的连续属性离散化问题 ,描述了连续属性离散化方法 ,包括连续属性区间划分算法和数据库样本大小的确定 ,提出了基于可信度最优的数量关联规则挖掘算法 .该算法首先利用等深度划分算法对连续属性进行离散化 ... 研究了数量关联规则挖掘过程中的连续属性离散化问题 ,描述了连续属性离散化方法 ,包括连续属性区间划分算法和数据库样本大小的确定 ,提出了基于可信度最优的数量关联规则挖掘算法 .该算法首先利用等深度划分算法对连续属性进行离散化 ,然后利用凸包处理技术提取强规则中可信度最高的数量关联区间 ,它对于数量关联规则的优化有着重要的应用价值 .应用该算法对股票行情进行了数量关联分析 ,提取股票涨跌与股票价格之间可信度最高的关联规则 .实验表明该算法是非常有效的 . 展开更多
关键词 数量关联规则 数据挖掘 连续属性离散化 可信度最优
在线阅读 下载PDF
基于白鲸优化的堆石坝安全检测规则库构建
6
作者 周钰龙 张著洪 朱宝强 《水利规划与设计》 2025年第5期128-135,共8页
针对堆石坝安全检测规则库构建难的问题,提出连续属性断点优化模型及堆石坝安全检测规则库构建算法。借助决策属性对条件属性的依赖度及信息增益模型构建以断点为决策变量的最大化模型,且建立求解的改进型白鲸优化算法,并融入C4.5决策树... 针对堆石坝安全检测规则库构建难的问题,提出连续属性断点优化模型及堆石坝安全检测规则库构建算法。借助决策属性对条件属性的依赖度及信息增益模型构建以断点为决策变量的最大化模型,且建立求解的改进型白鲸优化算法,并融入C4.5决策树,获高效、准确提取连续属性集规则的白鲸优化决策树算法。实验表明,该算法不仅能有效获取连续属性集的断点集,且与冗余规则检测方法融合,可有效规避规则瓶颈问题,为堆石坝安全智能检测提供参考。 展开更多
关键词 白鲸优 连续属性离散化 C4.5 规则库构建 堆石坝安全检测规则
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部