期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种用于数据挖掘算法的数据生成方法 被引量:7
1
作者 魏伟杰 张斌 +1 位作者 王波 张明卫 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第3期328-331,共4页
由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩... 由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程. 展开更多
关键词 数据挖掘 算法测试 模拟数据集生成 遗传算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部