期刊文献+
共找到462篇文章
< 1 2 24 >
每页显示 20 50 100
Efficient privacy-preserving classification construction model with differential privacy technology 被引量:2
1
作者 Lin Zhang Yan Liu +2 位作者 Ruchuan Wang Xiong Fu Qiaomin Lin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2017年第1期170-178,共9页
To address the problem of privacy disclosure during data mining, a new privacy-preserving decision tree classification construction model based on a differential privacy-protection mechanism is presented. An efficient... To address the problem of privacy disclosure during data mining, a new privacy-preserving decision tree classification construction model based on a differential privacy-protection mechanism is presented. An efficient classifier that uses feedback to add two types of noise via Laplace and exponential mechanisms to perturb the calculation results are introduced to the construction algorithm that provides a secure data access interface for users. Different split solutions for attributes of continuous and discrete values are provided and used to optimize the search scheme to reduce the error rate of the classifier. By choosing an available quality function with lower sensitivity for making decisions and improving the privacy budget allocation methods, the algorithm effectively resists malicious attacks that depend on the background knowledge. The potential problem of obtaining personal information by guessing unknown sensitive nodes of tree-type data is solved correspondingly. The better privacy preservation and accuracy of this new algorithm are shown by simulation experiments. © 1990-2011 Beijing Institute of Aerospace Information. 展开更多
关键词 Budget control data mining decision trees trees (mathematics)
在线阅读 下载PDF
Application of Data Mining and Process Knowledge Discovery in Sheet Metal Assembly Dimensional Variation Diagnostic 被引量:1
2
作者 LIAN Jun, LAI Xin-min, LIN Zhong-qin, YAO Fu-sheng (School of Mechanical Engineering, Shanghai Jiaotong University, Shanghai 200030, China) 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第S1期37-,共1页
Sheet metal is widely used on auto-bodies, plane-bodies and metal furniture, etc. For instance, a typical auto-body commonly consists of hundreds of sheet metal stamping parts. Because of its complexity of structure a... Sheet metal is widely used on auto-bodies, plane-bodies and metal furniture, etc. For instance, a typical auto-body commonly consists of hundreds of sheet metal stamping parts. Because of its complexity of structure and manufacturing process, auto-bodies inevitably have geometrical variation results from a number of different sources, such as the geometrical variation of stamping parts, the transformation of assembly process parameters and even the improper design concept. As more than 30% quality defects of an auto-body are born from the dimensional deviation of Body-In-White originated during the manufacturing process, effective diagnosis and control of dimensional faults are essential to the continuous improvement of the quality of vehicles. Especially during the period of new car launching or model changing when the assembly process was changed and adjusted frequently. For continuously improving the quality of modern cars, rapid dimensional variation causes identification becomes a challenging but essential work. In this paper, main variation causes of auto-body was firstly been cataloged and analyzed, then, a dimensional variation diagnostic reasoning and decision approach was developed through the combination of data mining and knowledge discovery techniques. This approach is driven by variation pattern identification which can be discovered from the dispersive, isolated massive measured data: Correlation Analysis (CA) and Maximal Tree (MT) methods were applied to extract the large variation group from massive multidimensional measured data, while multivariate statistical analysis (MSA) approach was used to discovery the principle variation pattern. A Decision Tree (DT) approach based on the knowledge of product and assembly process was developed to fulfill the "Hypothesis and Validation" characterized variation causes reasoning procedure. An practical application case with sudden and severe dimension variation on rear end panel in up/down direction was analyzed and successfully solved aided by the devloped variation diagnostic method, which have proved that the approach is effective and efficient. 展开更多
关键词 auto-body variation diagnosis data mining decision tree
在线阅读 下载PDF
DBMiner数据挖掘平台及其应用 被引量:10
3
作者 杨杰 叶晨洲 陈念贻 《系统仿真学报》 EI CAS CSCD 2001年第6期740-742,共3页
数据挖掘是智能信息处理的重要工具。介绍DBMiner数据挖掘平台的组成和原理,提出了多重知识模型的分层数据挖掘方法。基于综合衡量准则的决策树生成算法改善了生成决策树的结构和分类精度,基于遗传算法的n维空间优化参数的搜... 数据挖掘是智能信息处理的重要工具。介绍DBMiner数据挖掘平台的组成和原理,提出了多重知识模型的分层数据挖掘方法。基于综合衡量准则的决策树生成算法改善了生成决策树的结构和分类精度,基于遗传算法的n维空间优化参数的搜索算法。该数据挖掘平台已应用于多个应用领域均取得满意结果,介绍了在多元合金材料预报和家庭远程医疗监护方面的应用。 展开更多
关键词 数据挖掘 人工神经网络 遗传算法 决策树 DBMiner 数据库
在线阅读 下载PDF
数据挖掘原型系统GenMiner中分类挖掘模块的设计与实现 被引量:1
4
作者 吴湘洲 田盛丰 《计算机工程》 CAS CSCD 北大核心 2002年第12期111-112,130,共3页
通用数据挖掘原型系统GenMiner中分类挖掘模块采用耗时短、分类效率高、较为成熟的决策树C4.5,介绍了该系统中分类挖掘模块的设计与实现,并说明了分类挖掘模块采用决策树C4.5的方法。
关键词 数据挖掘原型系统 GenMiner 分类挖掘模块 设计 数据库 决策树 数据预处理
在线阅读 下载PDF
基于CART决策树的分布式数据离群点检测算法 被引量:3
5
作者 朱华 乔勇进 董国钢 《现代电子技术》 北大核心 2024年第16期157-162,共6页
在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环... 在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环境下高效地发现离群点。因此,提出一种基于CART决策树的分布式数据离群点检测算法。在构建CART决策树时,使用类间中心距离作为分裂准则,根据分离类别对训练数据进行分类,从而确定数据的类型。在上述基础上,考虑到离群点的分布模式与其周围数据对象不同,使用空间局部偏离因子(SLDF)对空间内各个数据对象之间的离群程度展开度量,同时在高维空间内展开网格划分,引入SLDF算法检测剩余离群点集,最终实现分布式数据离群点检测。实验结果表明,所提方法的离散点检测错误率在0.010以内,可以更加精准地实现分布式数据离群点检测,具有良好的检测性能。 展开更多
关键词 CART决策树 分布式数据 离群点检测 类间距离 数据分类 空间局部偏离因子
在线阅读 下载PDF
数据挖掘算法在作业车间调度问题中的应用 被引量:3
6
作者 王艳红 赵也践 刘文鑫 《计算机集成制造系统》 EI CSCD 北大核心 2024年第2期520-536,共17页
为了从与日俱增的车间生产数据中提取调度规则来指导生产调度任务,提出一种基于数据挖掘的调度算法。将最小化最大完工时间设置为性能指标,从作业车间的离线生产数据中建立合适的调度样本集;将建立的调度样本集按合适的比例分为训练集... 为了从与日俱增的车间生产数据中提取调度规则来指导生产调度任务,提出一种基于数据挖掘的调度算法。将最小化最大完工时间设置为性能指标,从作业车间的离线生产数据中建立合适的调度样本集;将建立的调度样本集按合适的比例分为训练集和测试集;用数据挖掘算法中的分类回归树(CART)从训练集中获取有效的调度知识,形成CART树状调度规则库;为了验证所得调度规则的有效性,将调度规则与遗传算法结合,设计了一种基于数据挖掘和调度规则的遗传算法作为调度算法来求解作业车间调度问题。通过对不同作业车间经典算例进行仿真与测试,验证了所提调度规则和调度算法的有效性与优越性。 展开更多
关键词 数据挖掘 作业车间调度 分类回归树 调度规则
在线阅读 下载PDF
多源遥感技术支持下的滑坡地灾隐患识别——以常澧地区为例 被引量:3
7
作者 张利军 贺思睿 +5 位作者 张建东 彭光雄 徐质彬 谢渐成 唐凯 卜建财 《自然资源遥感》 CSCD 北大核心 2024年第2期173-187,共15页
湘北常澧山地-丘陵地区地理地质环境复杂,滑坡地质灾害点多、面广、零散、频发,是造成人员伤亡和经济损失最主要的地质灾害类型。InSAR、光学遥感、LiDAR、GIS多源遥感综合技术,是目前可行性高、精度良好的滑坡地灾隐患识别和监测技术方... 湘北常澧山地-丘陵地区地理地质环境复杂,滑坡地质灾害点多、面广、零散、频发,是造成人员伤亡和经济损失最主要的地质灾害类型。InSAR、光学遥感、LiDAR、GIS多源遥感综合技术,是目前可行性高、精度良好的滑坡地灾隐患识别和监测技术方法,能够满足宏观大范围、时效性等要求。该文基于InSAR形变速率数据、多光谱影像和DEM数据对湖南常澧地区的滑坡地灾隐患进行了识别和提取:首先用2种决策树分类方法对多光谱图像进行了土地利用分类,以便于观察研究区的用地类别及分布情况;然后运用DEM数据提取了高程、坡度、坡向、起伏度和曲率等5项地形地貌因子对研究区进行了滑坡危险性评价;再基于SBAS-InSAR技术对研究区进行地表时序微形变测量;最后在GIS系统内综合危险性评价结果和形变速率对研究区滑坡隐患进行提取和圈定,并基于CART决策树分类结果和研究区水系分布情况,对研究区内除圈定的滑坡隐患点以外的形变速率大于-0.01 m/a的区域进行了危险性推断。本次研究在植被覆盖区和裸露区识别出了数处隐蔽性高、规模小的滑坡隐患,并圈定了滑坡隐患的空间分布范围,面积0.126 km 2,证明了技术方法的有效性,具有一定的实践应用价值。 展开更多
关键词 滑坡隐患 DEM数据 决策树分类 SBAS-InSAR 湖南常澧地区
在线阅读 下载PDF
基于决策树的社交网络隐式用户行为数据挖掘方法 被引量:3
8
作者 韩永印 王侠 王志晓 《沈阳工业大学学报》 CAS 北大核心 2024年第3期312-317,共6页
为了解决社交网络隐式用户行为数据挖掘过程中关联相似性计算较为困难的问题,提出了基于决策树的社交网络隐式用户行为数据挖掘方法。将社交网络视为包含不同维度的向量空间,计算特定维度上用户的兴趣空间和兴趣点。确定样本属性集后,... 为了解决社交网络隐式用户行为数据挖掘过程中关联相似性计算较为困难的问题,提出了基于决策树的社交网络隐式用户行为数据挖掘方法。将社交网络视为包含不同维度的向量空间,计算特定维度上用户的兴趣空间和兴趣点。确定样本属性集后,根据已知行为数据建立测试分支,计算该分支下子集的属性权重,不断迭代直至挖掘到同等属性的数据点为止。测试结果表明:该方法可对不同种类隐式用户行为精准挖掘,目标行为数据查找效果较好,实用性较强。 展开更多
关键词 决策树 社交网络 隐式用户行为 向量空间 属性集 数据挖掘 权重值 属性元素
在线阅读 下载PDF
决策树算法在船舶自主巡航数据消冗中的应用
9
作者 生力军 陈施奇 《舰船科学技术》 北大核心 2024年第12期157-161,共5页
船舶在进行智能化管理和航行时,需依据可靠的自主巡航数据完成,将大量的传感器数据和监测信息作为输入,以便系统能够作出正确的决策。然而,这些数据可能存在冗余信息干扰,影响着智能决策系统的可靠性,因此研究决策树算法在船舶自主巡航... 船舶在进行智能化管理和航行时,需依据可靠的自主巡航数据完成,将大量的传感器数据和监测信息作为输入,以便系统能够作出正确的决策。然而,这些数据可能存在冗余信息干扰,影响着智能决策系统的可靠性,因此研究决策树算法在船舶自主巡航数据消冗中的应用。采用滤波、插值以及混合式时序数据生成的方式,进行船舶自主巡航数据的时序处理,生成规范的船舶自主巡航时序数据;依据处理后的数据生成决策树,划分船舶自主巡航数据类别;通过计算同类间数据相似度,并设计消除器,实现船舶自主巡航数据消冗处理,获取没有冗余的巡航数据。测试结果显示,该算法的数据时序处理效果较好,可以完成不同数据类别之间的划分,同时能够计算同类数据之间的相似度,最大空间缩减比为27.8%。 展开更多
关键词 决策树算法 船舶自主巡航 数据消冗 时序数据 数据相似度 数据分类
在线阅读 下载PDF
决策树采掘技术及发展趋势 被引量:35
10
作者 朱绍文 胡宏银 +3 位作者 王泉德 张大斌 黄浩 陆玉昌 《计算机工程》 EI CAS CSCD 北大核心 2000年第10期1-3,35,共4页
介绍了决策树采掘技术的主要内容和最新应用,对决策树的生长和剪枝算法进行了比较,指出了决策树采掘技术的研究方向.
关键词 知识发现 数据采掘 决策树 数据库
在线阅读 下载PDF
数据挖掘技术初探 被引量:18
11
作者 周晓宇 李慎之 +1 位作者 戚晓芳 徐宝文 《小型微型计算机系统》 CSCD 北大核心 2002年第3期342-346,共5页
数据挖掘技术已成为机器学习、数据库系统、人工智能等领域内热门的研究方向 .本文将讨论数据挖掘的基本概念 ,并在此基础上介绍、分析挖掘关联规则技术、决策树、聚类分析。
关键词 数据挖掘 关联规则 决策树 聚类 数据管道 数据库
在线阅读 下载PDF
数据挖掘中决策树算法的最新进展 被引量:47
12
作者 韩慧 毛锋 王文渊 《计算机应用研究》 CSCD 北大核心 2004年第12期5-8,共4页
概述了传统决策树方法的基本原理和优越性,指出了该方法应用于超大数据集的数据挖掘环境时的局限性;着重分五个方面概括了近年来决策树方法在数据挖掘中的主要进展,并讨论了决策树方法面临的挑战及其发展趋势。
关键词 决策树 分类 数据挖掘
在线阅读 下载PDF
基于信息熵的决策树在慢性胃炎中医辨证中的应用 被引量:38
13
作者 徐蕾 贺佳 +4 位作者 孟虹 王忆勤 贺宪民 范思昌 郎庆波 《第二军医大学学报》 CAS CSCD 北大核心 2004年第9期1009-1012,共4页
目的 :探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用。 方法 :采用 bootstrap方法对 4 0 6例样本进行扩增以满足数据挖掘对样本量的要求 ,采用基于信息熵的决策树 C4 .5算法建立中医辨证模型。结果 :决策树 C4 .5算法筛选出... 目的 :探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用。 方法 :采用 bootstrap方法对 4 0 6例样本进行扩增以满足数据挖掘对样本量的要求 ,采用基于信息熵的决策树 C4 .5算法建立中医辨证模型。结果 :决策树 C4 .5算法筛选出对中医辨证分型有意义的 2 6个因素并对其重要性进行排序 ;产生清楚易懂可用于分类的决策规则 ;建立辨证模型 ,模型分类符合率为 :训练集 83.6 0 % ,验证集 80 .6 7% ,测试集 81.2 5 % ;模型区分各类证型的灵敏度和特异度也较高。 结论 :决策树C4 .5算法建立的模型效果较好 。 展开更多
关键词 信息熵 决策树 中医 数据挖掘
在线阅读 下载PDF
人力资源数据挖掘技术及其应用 被引量:17
14
作者 张宜生 刘凡 梁书云 《计算机工程与应用》 CSCD 北大核心 2002年第6期187-189,共3页
文章描述了数据挖掘技术原理和实现数据挖掘的基本方法,采用了选择树分类器,将选择树模型用于人力资源数据仓库的挖掘系统中,获得了成功的应用。
关键词 数据挖掘 文本挖掘 分类 决策树 数据仓库 数据库 人力资源
在线阅读 下载PDF
基于隐私保护的分类挖掘 被引量:20
15
作者 葛伟平 汪卫 +1 位作者 周皓峰 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2006年第1期39-45,共7页
基于隐私保护的分类挖掘是近年来数据挖掘领域的热点之一,如何对原始真实数据进行变换,然后在变换后的数据集上构造判定树是研究的重点·基于转移概率矩阵提出了一个新颖的基于隐私保护的分类挖掘算法,可以适用于非字符型数据(布尔... 基于隐私保护的分类挖掘是近年来数据挖掘领域的热点之一,如何对原始真实数据进行变换,然后在变换后的数据集上构造判定树是研究的重点·基于转移概率矩阵提出了一个新颖的基于隐私保护的分类挖掘算法,可以适用于非字符型数据(布尔类型、分类类型和数字类型)和非均匀分布的原始数据,可以变换标签属性·实验表明该算法在变换后的数据集上构造的分类树具有较高的精度· 展开更多
关键词 数据挖掘 分类 判定树 隐私保护 转移概率矩阵
在线阅读 下载PDF
一种基于关联性度量的决策树分类方法 被引量:11
16
作者 王大玲 于戈 +1 位作者 鲍玉斌 王国仁 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第5期481-484,共4页
在介绍了一些典型的决策树分类算法的基础上 ,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法 ,该算法集中了ID3、C4 5和MedGen等典型算法的思想 ,并进行了改进·在建立决策树过程中采用关联性度... 在介绍了一些典型的决策树分类算法的基础上 ,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法 ,该算法集中了ID3、C4 5和MedGen等典型算法的思想 ,并进行了改进·在建立决策树过程中采用关联性度量的计算来确定划分条件属性的顺序 ,通过阈值设定和处理简化了决策树的剪枝和优化过程 ,准确性高 ,分类速度快·系统已在某大型企业质量控制中得到了应用 ,取得了一定的经济和社会效益·文章详述了算法的执行过程、应用于冶金企业中的实例以及正确性证明和时间复杂性分析· 展开更多
关键词 决策树 分类规则 数据挖掘 关联性度量 先进制造企业 ScopeMiner系统 质量控制
在线阅读 下载PDF
决策树算法的并行性研究 被引量:26
17
作者 郭景峰 米浦波 刘国华 《计算机工程》 CAS CSCD 北大核心 2002年第8期77-78,共2页
在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出... 在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出了决策树算法的并行机制,并对并行性的性能进行探讨。 展开更多
关键词 决策树算法 并行性 数据挖掘 数据库 计算机
在线阅读 下载PDF
基于贝叶斯方法的决策树分类算法 被引量:20
18
作者 樊建聪 张问银 梁永全 《计算机应用》 CSCD 北大核心 2005年第12期2882-2884,共3页
针对数据挖掘的特点和本质,充分利用贝叶斯方法和决策树分类的优点,将贝叶斯的先验信息方法与决策树分类的信息增益方法相结合,提出了一种新的数据挖掘分类算法(BD1.0算法),并对此算法进行了设计和分析。实验分析表明,该算法可以处理不... 针对数据挖掘的特点和本质,充分利用贝叶斯方法和决策树分类的优点,将贝叶斯的先验信息方法与决策树分类的信息增益方法相结合,提出了一种新的数据挖掘分类算法(BD1.0算法),并对此算法进行了设计和分析。实验分析表明,该算法可以处理不一致或者不完整数据等“脏数据”,比单纯使用贝叶斯方法或决策树方法具有更高的准确率,而且与C4.5算法具有近似的时间复杂度。 展开更多
关键词 数据挖掘 分类 贝叶斯原理 决策树
在线阅读 下载PDF
基于信息熵的决策属性分类挖掘算法及应用 被引量:18
19
作者 舒红平 游志胜 蒋建民 《计算机工程与应用》 CSCD 北大核心 2004年第1期186-189,共4页
在利用判定树进行分类挖掘时,需事先知道属性的分类。对不具体的或未知的属性分类,利用“高类聚、低耦合”原理对属性进行最优分类。在属性分类的基础上,利用基于信息熵的属性期望信息及对应的信息增益理论选择最佳分类决策属性,并按最... 在利用判定树进行分类挖掘时,需事先知道属性的分类。对不具体的或未知的属性分类,利用“高类聚、低耦合”原理对属性进行最优分类。在属性分类的基础上,利用基于信息熵的属性期望信息及对应的信息增益理论选择最佳分类决策属性,并按最佳分类决策属性引出分枝形成判定树。该文对属性的最优分类理论及算法进行了描述,并讨论了选择最佳决策属性构造判定树的算法,结合具体应用实例进行了验证并构造了判定树。 展开更多
关键词 属性 分类 数据挖掘 信息熵 判定树
在线阅读 下载PDF
决策树算法在医学图像数据挖掘中的应用 被引量:22
20
作者 王曙燕 耿国华 李丙春 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第3期262-265,共4页
目的研究决策树算法在医学图像数据挖掘中的应用。方法利用决策树算法对乳腺癌图像数据进行分类,提出了一个基于决策树算法的医学图像分类器。结果实现了ID3和C4.5算法对图像数据的分类,获得了分类的实验结果。结论该模型系统达到了较... 目的研究决策树算法在医学图像数据挖掘中的应用。方法利用决策树算法对乳腺癌图像数据进行分类,提出了一个基于决策树算法的医学图像分类器。结果实现了ID3和C4.5算法对图像数据的分类,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明数据挖掘在辅助医疗诊断中有着广泛的应用前景。 展开更多
关键词 数据挖掘 决策树 分类 医学图像
在线阅读 下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部