期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
一种面向生产调度规则挖掘的数据离散化方法 被引量:6
1
作者 焦磊 刘晓军 +1 位作者 刘庭煜 倪中华 《计算机集成制造系统》 EI CSCD 北大核心 2016年第1期257-264,共8页
针对车间生产数据的特点及数据挖掘技术对离散处理的客观需求,建立一种基于动态聚类的连续值离散化方法,并利用决策系统的相容性原则建立目标函数。对基于密度的聚类算法进行改进,提出一种单维度多半径聚类算法。将该聚类算法应用于离... 针对车间生产数据的特点及数据挖掘技术对离散处理的客观需求,建立一种基于动态聚类的连续值离散化方法,并利用决策系统的相容性原则建立目标函数。对基于密度的聚类算法进行改进,提出一种单维度多半径聚类算法。将该聚类算法应用于离散处理,阐述了基于动态聚类离散算法的整体过程。实验数据表明,该离散算法可以保持决策系统原有的相容度,具有速度快、内存占用率低和自动化程度高等优点,且具有良好的通用性,适用于生产数据的离散处理。 展开更多
关键词 离散 生产调度 数据挖掘 基于密度的聚类算法
在线阅读 下载PDF
数据挖掘中基于可辨识矩阵的连续属性离散化方法 被引量:6
2
作者 刘云霞 曾五一 《统计研究》 CSSCI 北大核心 2007年第4期8-11,共4页
连续属性的离散化在数据挖掘中有着非常重要的作用。本文基于可辨识矩阵提出一种连续属性离散化的方法,并利用平均互信息量对离散化结果进行修正。该方法通过统计模拟取得了良好的效果。
关键词 数据挖掘 可辨识矩阵 连续属性 离散
在线阅读 下载PDF
数据挖掘中基于似然比假设检验的连续属性离散化方法 被引量:3
3
作者 刘云霞 《统计与决策》 CSSCI 北大核心 2007年第8期11-13,共3页
连续属性的离散化在数据挖掘中有着非常重要的作用。本文从独立性角度考虑,提出一种基于似然比假设检验的连续属性离散化方法,有效避免了chi2算法中的局限性并在统计模拟中取得了良好的效果。
关键词 数据挖掘 连续属性 离散 似然比统计量 假设检验
在线阅读 下载PDF
流动分析中离散数据的可视化处理
4
作者 黄凤良 任立义 《沈阳工业大学学报》 EI CAS 1998年第6期72-75,共4页
为了完成流动分析中可视化技术最一般描述问题,对其控制方程、插值方法、积分方法以及积分精度进行了相应的阐述;并对该控制方程的求解作了详细的讨论,得到了由离散数据进行流动可视化处理的一套算法,经由某定常系统验证了该算法具... 为了完成流动分析中可视化技术最一般描述问题,对其控制方程、插值方法、积分方法以及积分精度进行了相应的阐述;并对该控制方程的求解作了详细的讨论,得到了由离散数据进行流动可视化处理的一套算法,经由某定常系统验证了该算法具有一定的可靠性. 展开更多
关键词 离散数据 坐标转换 可视处理 流动分析 流体
在线阅读 下载PDF
一种支持可视化数据挖掘的图像后处理方法 被引量:2
5
作者 任永功 于戈 《小型微型计算机系统》 CSCD 北大核心 2005年第11期1955-1959,共5页
可视化数据挖掘是当前数据挖掘的研究重点之一,国际上近几年发展起来的几类可视化数据挖掘技术,主要有基于计算机图形学的技术.本文提出了一种支持可视化数据挖掘方法的计算机图像处理技术,利用一种类邻域平均方法(Resemble Neighborhoo... 可视化数据挖掘是当前数据挖掘的研究重点之一,国际上近几年发展起来的几类可视化数据挖掘技术,主要有基于计算机图形学的技术.本文提出了一种支持可视化数据挖掘方法的计算机图像处理技术,利用一种类邻域平均方法(Resemble Neighborhood Averaging Method)对数据挖掘结果图像进行后处理,可帮助用户准确把握数据的主要特征,进而从数据中发现有用的模式.实验表明,该方法具有很强的直观性、便利性、有效性,为可视化数据挖掘提供了一个新途径. 展开更多
关键词 可视数据挖掘 数据可视 图像处理
在线阅读 下载PDF
基于粗集理论的数据离散化新算法 被引量:27
6
作者 赵军 王国胤 +1 位作者 吴中福 李华 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第3期18-21,共4页
连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一 ,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方... 连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一 ,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方法的特点和基本思路 ,研究了候选断点重要性的衡量方式 ,在此基础上提出两种新的从候选集合中最终确定离散化断点的启发式算法。这两种算法考虑并体现了粗集理论的基本特点和优点 ,选择的断点都能够保证信息系统的分辨关系 ,并能够取得较理想的离散化结果。 展开更多
关键词 粗集理论 数据离散 算法 分辨关系 断点 数据挖掘 决策系统
在线阅读 下载PDF
基于改进χ2统计的数据离散化算法 被引量:4
7
作者 桑雨 李克秋 闫德勤 《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第3期443-447,共5页
在基于χ2统计独立性的离散化算法中,自由度与期望频数的选取直接影响χ2计算的准确性,从而影响离散化的性能.为此,提出了一种基于改进χ2统计的数据离散化算法,提高了基于统计独立性离散化算法的质量.首先,分析了χ2函数中自由度选取... 在基于χ2统计独立性的离散化算法中,自由度与期望频数的选取直接影响χ2计算的准确性,从而影响离散化的性能.为此,提出了一种基于改进χ2统计的数据离散化算法,提高了基于统计独立性离散化算法的质量.首先,分析了χ2函数中自由度选取的不足,给出了自由度选取的修正方案;其次,根据数据类分布等特点,提出了期望频数的改进方案,克服了不同数据集赋予相同期望频数的缺陷,提高了χ2计算的准确性.实验结果表明,改进的方法显著提高了C4.5决策树与Naive贝叶斯分类器的学习精度. 展开更多
关键词 离散 数据挖掘 χ2统计
在线阅读 下载PDF
沃尔什数据离散化方法及在油藏描述中的应用 被引量:1
8
作者 黄龙 鲍志东 张文瑞 《石油物探》 EI CSCD 2008年第6期563-566,共4页
在油藏描述中必须对具有时序特征的连续型测井数据进行数据离散化,以往的一些离散方法需要人为地规定划分维数,或者需要预先给定一个参数。针对此,提出了一种在沃尔什变换基础上的连续数据离散化方法。该方法不需要给定划分维数,将连续... 在油藏描述中必须对具有时序特征的连续型测井数据进行数据离散化,以往的一些离散方法需要人为地规定划分维数,或者需要预先给定一个参数。针对此,提出了一种在沃尔什变换基础上的连续数据离散化方法。该方法不需要给定划分维数,将连续数据经过沃尔什低通滤波后划分成离散区间,再用整数和符号标示。在应用沃尔什变换实现测井数据的地层分层及离散化数据中,分层的精细度可以通过调整截止序率以及截止值来控制。实际应用结果证实,该方法简单,易于实现,计算效率高。 展开更多
关键词 沃尔什变换 离散 数据挖掘 油藏描述 测井曲线
在线阅读 下载PDF
基于统计相关系数的数据离散化方法 被引量:5
9
作者 解亚萍 《计算机应用》 CSCD 北大核心 2011年第5期1409-1412,共4页
很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制... 很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制数据的信息丢失。将所提方法在乳腺癌症诊断以及其他领域数据上进行了应用,实验结果表明,该方法显著地提高了See5决策树的分类学习精度。 展开更多
关键词 离散 数据挖掘 类属性相互依赖 变精度粗糙集 决策树
在线阅读 下载PDF
基于任务分解模型的离散数据格网化并行优化 被引量:5
10
作者 王家润 谢海峰 《计算机工程与设计》 北大核心 2018年第6期1774-1781,共8页
针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与统一计算设备... 针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与统一计算设备架构(CUDA)的线程任务分解模型(TTDM),具有线程访问安全(不越界)、计算无冗余(无重复)、计算完整(无遗漏)等特点,具有较好的计算均衡性(负载均衡)。通过国产及商用多环境实验,加速比分别是3.6和5.9,验证了PIDW算法的性能提升能力。 展开更多
关键词 多核技术 离散数据 格网 线程任务分解模型 反距离权重 开放多核处理 统一计算设备架构
在线阅读 下载PDF
基于数据挖掘技术的企业信息化建设 被引量:2
11
作者 侯长红 《档案管理》 北大核心 2011年第2期93-93,共1页
数据挖掘是一种新的信息处理技术,其主要特点是对企业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,提取辅助经营决策的关键性数据,在企业信息化建设中应用前景广阔。
关键词 企业信息建设 数据挖掘技术 信息处理技术 企业数据 业务数据 经营决策 模型
在线阅读 下载PDF
VisualDM:一个灵活的可视化数据挖掘系统 被引量:3
12
作者 王见 郭娜 陈晓云 《计算机工程与科学》 CSCD 2005年第5期39-41,共3页
如果要建造一个健壮的数据挖掘系统,仅仅依靠挖掘算法是不够的。目前的挖掘算法还没有完全"智能"化,所以挖掘有用的信息常常不是很有效。不过可视化技术给了我们很大的帮助,我们将挖掘算法和可视化技术结合起来,从而实现了数... 如果要建造一个健壮的数据挖掘系统,仅仅依靠挖掘算法是不够的。目前的挖掘算法还没有完全"智能"化,所以挖掘有用的信息常常不是很有效。不过可视化技术给了我们很大的帮助,我们将挖掘算法和可视化技术结合起来,从而实现了数据挖掘系统VisualDM。 展开更多
关键词 可视数据挖掘系统 VisualDM 数据 数据处理 数据查询
在线阅读 下载PDF
大数据挖掘中的MapReduce并行聚类优化算法研究 被引量:21
13
作者 吕国 肖瑞雪 +1 位作者 白振荣 孟凡兴 《现代电子技术》 北大核心 2019年第11期161-164,共4页
针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据... 针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据分析需求,完成低成本、高性能的数据并行挖掘与处理。 展开更多
关键词 数据 MAPREDUCE 并行处理 聚类算法 数据挖掘 Map任务
在线阅读 下载PDF
装备质量数据离散化方法 被引量:1
14
作者 李馥林 孟晨 +1 位作者 王成 范书义 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第9期143-148,共6页
数据挖掘技术已经成为一种利用装备数据资源获取知识的重要手段,数据预处理是装备质量信息分析的重要环节。为解决数据类型不适应数据挖掘方法的问题,提出了一种装备质量数据离散化方法。对经典类别属性最大相互依赖算法的原理和流程进... 数据挖掘技术已经成为一种利用装备数据资源获取知识的重要手段,数据预处理是装备质量信息分析的重要环节。为解决数据类型不适应数据挖掘方法的问题,提出了一种装备质量数据离散化方法。对经典类别属性最大相互依赖算法的原理和流程进行了介绍,分析了存在的问题,提出了改进方法;引入了粗糙集理论和属性分辨率,限制了过度离散化;提出了属性重要性评价方法,减少了信息损失。对比实验结果表明,所提出的方法具有优越性,能提高数据离散化效果。以某型装备为例,将所提方法应用于关联规则挖掘之前的数据预处理,获得了与装备寿命周期内质量变化规律相关的知识,验证了该方法的有效性。 展开更多
关键词 装备质量 数据离散 数据挖掘 数据处理 关联规则
在线阅读 下载PDF
装备模拟训练系统数据离散化 被引量:2
15
作者 邓青 薛青 +1 位作者 杜楠 付朝博 《科学技术与工程》 北大核心 2021年第27期11674-11680,共7页
离散化是装备模拟训练系统数据预处理的重要组成部分。针对传统数据离散化方法对单个属性依次处理,往往忽视属性间的相关性,造成装备模拟训练系统数据离散化后的误差。提出基于层次聚类和相容度的数据离散化方法。采用逐层泛化构建离散... 离散化是装备模拟训练系统数据预处理的重要组成部分。针对传统数据离散化方法对单个属性依次处理,往往忽视属性间的相关性,造成装备模拟训练系统数据离散化后的误差。提出基于层次聚类和相容度的数据离散化方法。采用逐层泛化构建离散化总体框架,完成对装备模拟训练系统数据混合型决策表处理。设计动态确定簇数的层次聚类,实现对属性的初始整体划分;结合类别属性信息和相容度合并相邻区间,去除冗余的离散划分。实验结果表明,基于层次聚类和相容度的数据离散化方法在区间总数、精度方面有明显优势。 展开更多
关键词 装备模拟训练系统 数据离散 层次聚类 相容度 数据挖掘
在线阅读 下载PDF
基于RGMM的离散基因表达数据关联规则挖掘
16
作者 黄睿 《计算机应用与软件》 CSCD 北大核心 2014年第9期191-193,共3页
由于具有良好的可解释性,关联规则在基于疾病诊断的基因表达数据中表现出优越性,然而,高维基因表达数据中的大量规则阻碍了它的应用。为了缓解这个问题,提出正则化高斯混合模型RGMM(Regularized Gaussian Mixture Model),根据最小描述... 由于具有良好的可解释性,关联规则在基于疾病诊断的基因表达数据中表现出优越性,然而,高维基因表达数据中的大量规则阻碍了它的应用。为了缓解这个问题,提出正则化高斯混合模型RGMM(Regularized Gaussian Mixture Model),根据最小描述长度框架,挖掘离散化模型复杂度及信息丢失准则,通过离散化连续的基因表达数据,缓解监督方法中的过拟合现象,并且改善无监督方法中的一些缺点。在六个分类数据集上的大量实验验证了所提方法的有效性。实验结果表明,与其他几种最先进的方法相比,所提的RGMM方法在现实的基因表达数据集中更具实用性。 展开更多
关键词 离散 基因表达数据 正则高斯混合模型 关联规则 数据挖掘
在线阅读 下载PDF
基于粗糙集和决策树的数据挖掘方法 被引量:15
17
作者 吴成东 许可 +1 位作者 韩中华 裴涛 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第5期481-484,共4页
从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法... 从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果· 展开更多
关键词 粗糙集 决策树 数据离散 数据挖掘 谱系聚类 属性约简
在线阅读 下载PDF
一种基于粗糙集理论的连续属性离散化方法 被引量:18
18
作者 陶志 许宝栋 +1 位作者 汪定伟 李冉 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第8期747-750,共4页
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力... 基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的· 展开更多
关键词 粗糙集理论 决策表 决策属性支持度 离散 数据挖掘
在线阅读 下载PDF
一种高效的连续属性离散化算法 被引量:13
19
作者 赵静娴 倪春鹏 +1 位作者 詹原瑞 杜子平 《系统工程与电子技术》 EI CSCD 北大核心 2009年第1期195-199,共5页
分析了基于熵的离散化标准的切点特性,提出并证明了一种基于边界点属性值合并和不一致度检验的离散化算法。与传统离散化算法相比,此算法只对边界点属性值进行合并,切点个数无需设定,自动生成,且合并规则简单易行,大大减小了计算量,适... 分析了基于熵的离散化标准的切点特性,提出并证明了一种基于边界点属性值合并和不一致度检验的离散化算法。与传统离散化算法相比,此算法只对边界点属性值进行合并,切点个数无需设定,自动生成,且合并规则简单易行,大大减小了计算量,适用于处理大规模高维数据库的离散化。同时由于采用了不一致度对备选切点集合进行调整,使本算法具有全局性。试验表明,该算法有效提高了分类规则的简明性和预测精度。 展开更多
关键词 离散 决策树 数据挖掘
在线阅读 下载PDF
基于粗糙集的两种离散化算法的研究 被引量:12
20
作者 吴山产 毛锋 +1 位作者 王文渊 卓晴 《计算机工程与应用》 CSCD 北大核心 2004年第26期68-69,159,共3页
随着知识发现和数据挖掘的迅速发展,出现了很多的方法,这些方法很多都依赖于离散的数据。但是,大部分现实中应用的数据都带有连续变量的属性。为了使得数据挖掘的技术能够用在这些数据上面,必须进行离散化。文章探讨了基于粗糙集的离散... 随着知识发现和数据挖掘的迅速发展,出现了很多的方法,这些方法很多都依赖于离散的数据。但是,大部分现实中应用的数据都带有连续变量的属性。为了使得数据挖掘的技术能够用在这些数据上面,必须进行离散化。文章探讨了基于粗糙集的离散化方法。论文做实验来比较局部和全局离散化算法,实验结果表明,这两种算法对于数据集有敏感性。 展开更多
关键词 粗糙集 断点 离散 数据挖掘
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部