期刊文献+
共找到396篇文章
< 1 2 20 >
每页显示 20 50 100
Application of Data Mining and Process Knowledge Discovery in Sheet Metal Assembly Dimensional Variation Diagnostic 被引量:1
1
作者 LIAN Jun, LAI Xin-min, LIN Zhong-qin, YAO Fu-sheng (School of Mechanical Engineering, Shanghai Jiaotong University, Shanghai 200030, China) 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第S1期37-,共1页
Sheet metal is widely used on auto-bodies, plane-bodies and metal furniture, etc. For instance, a typical auto-body commonly consists of hundreds of sheet metal stamping parts. Because of its complexity of structure a... Sheet metal is widely used on auto-bodies, plane-bodies and metal furniture, etc. For instance, a typical auto-body commonly consists of hundreds of sheet metal stamping parts. Because of its complexity of structure and manufacturing process, auto-bodies inevitably have geometrical variation results from a number of different sources, such as the geometrical variation of stamping parts, the transformation of assembly process parameters and even the improper design concept. As more than 30% quality defects of an auto-body are born from the dimensional deviation of Body-In-White originated during the manufacturing process, effective diagnosis and control of dimensional faults are essential to the continuous improvement of the quality of vehicles. Especially during the period of new car launching or model changing when the assembly process was changed and adjusted frequently. For continuously improving the quality of modern cars, rapid dimensional variation causes identification becomes a challenging but essential work. In this paper, main variation causes of auto-body was firstly been cataloged and analyzed, then, a dimensional variation diagnostic reasoning and decision approach was developed through the combination of data mining and knowledge discovery techniques. This approach is driven by variation pattern identification which can be discovered from the dispersive, isolated massive measured data: Correlation Analysis (CA) and Maximal Tree (MT) methods were applied to extract the large variation group from massive multidimensional measured data, while multivariate statistical analysis (MSA) approach was used to discovery the principle variation pattern. A Decision Tree (DT) approach based on the knowledge of product and assembly process was developed to fulfill the "Hypothesis and Validation" characterized variation causes reasoning procedure. An practical application case with sudden and severe dimension variation on rear end panel in up/down direction was analyzed and successfully solved aided by the devloped variation diagnostic method, which have proved that the approach is effective and efficient. 展开更多
关键词 auto-body variation diagnosis data mining decision tree
在线阅读 下载PDF
CKDB-Tree:一种有效的高维动态索引结构 被引量:2
2
作者 孙劲光 王淑娥 《计算机工程与应用》 CSCD 北大核心 2009年第30期157-160,共4页
在高维数据空间中提出了一种新的索引结构:CKDB-Tree(Compact KDB-Tree),该索引结构采用一种新的分裂策略,在进行分裂时,引入插入安全点和删除安全点的概念,不仅考虑到将来的数据,而且对已经进行索引的数据也进行考虑;给出了CK-DB-Tree... 在高维数据空间中提出了一种新的索引结构:CKDB-Tree(Compact KDB-Tree),该索引结构采用一种新的分裂策略,在进行分裂时,引入插入安全点和删除安全点的概念,不仅考虑到将来的数据,而且对已经进行索引的数据也进行考虑;给出了CK-DB-Tree的定义以及节点结构的特点,针对CKDB-Tree,给出了相应的插入、查找、删除操作的算法;对该索引结构的存储性能进行定量分析和推理;最后经实验证明,CKDB-Tree是高维空间中一种有效的动态索引结构。 展开更多
关键词 高维数据空间 压缩KDB树 分裂策略 动态索引结构
在线阅读 下载PDF
基于决策树的社交网络隐式用户行为数据挖掘方法 被引量:4
3
作者 韩永印 王侠 王志晓 《沈阳工业大学学报》 CAS 北大核心 2024年第3期312-317,共6页
为了解决社交网络隐式用户行为数据挖掘过程中关联相似性计算较为困难的问题,提出了基于决策树的社交网络隐式用户行为数据挖掘方法。将社交网络视为包含不同维度的向量空间,计算特定维度上用户的兴趣空间和兴趣点。确定样本属性集后,... 为了解决社交网络隐式用户行为数据挖掘过程中关联相似性计算较为困难的问题,提出了基于决策树的社交网络隐式用户行为数据挖掘方法。将社交网络视为包含不同维度的向量空间,计算特定维度上用户的兴趣空间和兴趣点。确定样本属性集后,根据已知行为数据建立测试分支,计算该分支下子集的属性权重,不断迭代直至挖掘到同等属性的数据点为止。测试结果表明:该方法可对不同种类隐式用户行为精准挖掘,目标行为数据查找效果较好,实用性较强。 展开更多
关键词 决策树 社交网络 隐式用户行为 向量空间 属性集 数据挖掘 权重值 属性元素
在线阅读 下载PDF
面向变电站机器人巡检的加权嵌套决策树数据质量协同评价方法 被引量:3
4
作者 谷梦瑶 徐新胜 何雨辰 《智慧电力》 北大核心 2024年第9期65-71,共7页
针对现有数据质量评价存在完成主体单一、方法主观性强等问题,提出面向变电站机器人巡检的加权嵌套决策树数据质量协同评价方法。首先,构建一种变电站机器人巡检数据质量的协同评价框架;然后,构建包含数据及时性、数据完整性、数据准确... 针对现有数据质量评价存在完成主体单一、方法主观性强等问题,提出面向变电站机器人巡检的加权嵌套决策树数据质量协同评价方法。首先,构建一种变电站机器人巡检数据质量的协同评价框架;然后,构建包含数据及时性、数据完整性、数据准确性和数据重复性4个指标及其评价规则的指标体系,并据此建立基于加权嵌套决策树的数据质量评价模型;最后,通过某变电站巡检机器人A的巡检数据验证所提方法的有效性和优越性。案例分析表明,所提方法的评价结果不仅与专家评议结果一致且优于加权决策树的评价结果,所提协同评价框架有助于实现巡检数据质量的实时评价。 展开更多
关键词 变电站 机器人巡检数据 数据质量评价 加权嵌套决策树 评价指标
在线阅读 下载PDF
Efficient privacy-preserving classification construction model with differential privacy technology 被引量:2
5
作者 Lin Zhang Yan Liu +2 位作者 Ruchuan Wang Xiong Fu Qiaomin Lin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2017年第1期170-178,共9页
To address the problem of privacy disclosure during data mining, a new privacy-preserving decision tree classification construction model based on a differential privacy-protection mechanism is presented. An efficient... To address the problem of privacy disclosure during data mining, a new privacy-preserving decision tree classification construction model based on a differential privacy-protection mechanism is presented. An efficient classifier that uses feedback to add two types of noise via Laplace and exponential mechanisms to perturb the calculation results are introduced to the construction algorithm that provides a secure data access interface for users. Different split solutions for attributes of continuous and discrete values are provided and used to optimize the search scheme to reduce the error rate of the classifier. By choosing an available quality function with lower sensitivity for making decisions and improving the privacy budget allocation methods, the algorithm effectively resists malicious attacks that depend on the background knowledge. The potential problem of obtaining personal information by guessing unknown sensitive nodes of tree-type data is solved correspondingly. The better privacy preservation and accuracy of this new algorithm are shown by simulation experiments. © 1990-2011 Beijing Institute of Aerospace Information. 展开更多
关键词 Budget control data mining decision trees trees (mathematics)
在线阅读 下载PDF
决策树采掘技术及发展趋势 被引量:35
6
作者 朱绍文 胡宏银 +3 位作者 王泉德 张大斌 黄浩 陆玉昌 《计算机工程》 EI CAS CSCD 北大核心 2000年第10期1-3,35,共4页
介绍了决策树采掘技术的主要内容和最新应用,对决策树的生长和剪枝算法进行了比较,指出了决策树采掘技术的研究方向.
关键词 知识发现 数据采掘 决策树 数据库
在线阅读 下载PDF
基于信息熵的决策树在慢性胃炎中医辨证中的应用 被引量:38
7
作者 徐蕾 贺佳 +4 位作者 孟虹 王忆勤 贺宪民 范思昌 郎庆波 《第二军医大学学报》 CAS CSCD 北大核心 2004年第9期1009-1012,共4页
目的 :探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用。 方法 :采用 bootstrap方法对 4 0 6例样本进行扩增以满足数据挖掘对样本量的要求 ,采用基于信息熵的决策树 C4 .5算法建立中医辨证模型。结果 :决策树 C4 .5算法筛选出... 目的 :探讨基于信息熵的决策树在慢性胃炎中医辨证分型中的应用。 方法 :采用 bootstrap方法对 4 0 6例样本进行扩增以满足数据挖掘对样本量的要求 ,采用基于信息熵的决策树 C4 .5算法建立中医辨证模型。结果 :决策树 C4 .5算法筛选出对中医辨证分型有意义的 2 6个因素并对其重要性进行排序 ;产生清楚易懂可用于分类的决策规则 ;建立辨证模型 ,模型分类符合率为 :训练集 83.6 0 % ,验证集 80 .6 7% ,测试集 81.2 5 % ;模型区分各类证型的灵敏度和特异度也较高。 结论 :决策树C4 .5算法建立的模型效果较好 。 展开更多
关键词 信息熵 决策树 中医 数据挖掘
在线阅读 下载PDF
决策树算法的并行性研究 被引量:26
8
作者 郭景峰 米浦波 刘国华 《计算机工程》 CAS CSCD 北大核心 2002年第8期77-78,共2页
在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出... 在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出了决策树算法的并行机制,并对并行性的性能进行探讨。 展开更多
关键词 决策树算法 并行性 数据挖掘 数据库 计算机
在线阅读 下载PDF
基于改进决策树算法的日特征负荷预测研究 被引量:30
9
作者 栗然 刘宇 +3 位作者 黎静华 顾雪平 牛东晓 刘永奇 《中国电机工程学报》 EI CSCD 北大核心 2005年第23期36-41,共6页
针对决策树ID3算法的缺陷,提出了属性-值对的两次信息增益优化算法,该算法是ID3的改进算法,它能克服ID3算法在选取属性进行扩展时易偏向属性值多的属性及ID3算法属性间相关性考虑较少的缺点;通过对熵阈值的设定,采用预剪枝技术,又能部... 针对决策树ID3算法的缺陷,提出了属性-值对的两次信息增益优化算法,该算法是ID3的改进算法,它能克服ID3算法在选取属性进行扩展时易偏向属性值多的属性及ID3算法属性间相关性考虑较少的缺点;通过对熵阈值的设定,采用预剪枝技术,又能部分克服ID3算法对噪音敏感的不足。该算法可用以生成日特征负荷决策树预测模型。该模型结合预测日的气象、星期等信息,可进行日特征负荷的预测。采用等深直方图分析思想,可对负荷变化率数据离散化,将层次聚类和信息熵相结合,对气象数据离散化。数据预处理后,通过属性-值对的2次信息增益优化算法生成负荷预测决策树模型,在给出预测日气象及星期信息后可对特征负荷进行预测,预测结果能够满足并超过负荷预测实用化标准的要求并具有较高的预测精度。如果将日24点或96点负荷及相应影响因素数据均用该算法进行模型训练,形成24个或96个预测模型,则可进行日24点或96点负荷预测。 展开更多
关键词 电力系统 决策树 数据挖掘 负荷预测 改进ID3算法
在线阅读 下载PDF
基于数据挖掘决策树的犯罪风险预测模型 被引量:23
10
作者 金光 钱家麒 +1 位作者 钱江波 黄蔚民 《计算机工程》 CAS CSCD 北大核心 2003年第9期183-185,共3页
简要介绍了数据挖掘技术在犯罪行为分析上的利用和决策树构造方法,结合一个犯罪人员数据集市的样本数据,采用决策树分析方法进行了尝试性的数据挖掘,给出了一个较为成功的挖掘思路和模式,得出了有效的分析结论。
关键词 数据挖掘 犯罪行为分析 决策树
在线阅读 下载PDF
数据挖掘中决策树算法的最新进展 被引量:47
11
作者 韩慧 毛锋 王文渊 《计算机应用研究》 CSCD 北大核心 2004年第12期5-8,共4页
概述了传统决策树方法的基本原理和优越性,指出了该方法应用于超大数据集的数据挖掘环境时的局限性;着重分五个方面概括了近年来决策树方法在数据挖掘中的主要进展,并讨论了决策树方法面临的挑战及其发展趋势。
关键词 决策树 分类 数据挖掘
在线阅读 下载PDF
数据挖掘技术初探 被引量:18
12
作者 周晓宇 李慎之 +1 位作者 戚晓芳 徐宝文 《小型微型计算机系统》 CSCD 北大核心 2002年第3期342-346,共5页
数据挖掘技术已成为机器学习、数据库系统、人工智能等领域内热门的研究方向 .本文将讨论数据挖掘的基本概念 ,并在此基础上介绍、分析挖掘关联规则技术、决策树、聚类分析。
关键词 数据挖掘 关联规则 决策树 聚类 数据管道 数据库
在线阅读 下载PDF
基于决策树的土壤质量等级研究 被引量:23
13
作者 孙微微 胡月明 +1 位作者 刘才兴 薛月菊 《华南农业大学学报》 CAS CSCD 北大核心 2005年第3期108-110,共3页
将广东省土壤资源类型图和各种评价因子的单要素图层进行叠置分析,以土壤资源类型图的图斑作为土壤质量评价单元,从各生成图层的PAT文件中提取高程、坡度、土壤有机质含量、土壤质地、土壤pH、土壤利用类型、地貌类型和土壤类型等评价属... 将广东省土壤资源类型图和各种评价因子的单要素图层进行叠置分析,以土壤资源类型图的图斑作为土壤质量评价单元,从各生成图层的PAT文件中提取高程、坡度、土壤有机质含量、土壤质地、土壤pH、土壤利用类型、地貌类型和土壤类型等评价属性,用决策树方法预测土壤质量等级,并以定量规则方式表达所获取的知识.结果表明,其知识表达易于理解,预测准确率为96.61%. 展开更多
关键词 空间数据挖掘 决策树 土壤质量 地理信息系统
在线阅读 下载PDF
C4.5决策树展示算法的设计 被引量:20
14
作者 姜欣 徐六通 张雷 《计算机工程与应用》 CSCD 北大核心 2003年第4期93-94,97,共3页
分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和... 分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和展示的直观性。 展开更多
关键词 机器学习 C4.5算法 决策树展示算法 设计 多叉树结构
在线阅读 下载PDF
利用决策树进行数据挖掘中的信息熵计算 被引量:30
15
作者 张维东 张凯 +1 位作者 董青 孙维华 《计算机工程》 CAS CSCD 北大核心 2001年第3期71-72,89,共3页
介绍了怎样通过信息量或熵的比较来构造一个决策树的数据挖掘算法,并且就一些特殊的地方进行了讨论分析,例如怎样处理高分枝属性、数值属性和缺失数据以及怎样剪枝.利用模型系统的一些源代码来具体地实现算法中的一些模块,并且描述... 介绍了怎样通过信息量或熵的比较来构造一个决策树的数据挖掘算法,并且就一些特殊的地方进行了讨论分析,例如怎样处理高分枝属性、数值属性和缺失数据以及怎样剪枝.利用模型系统的一些源代码来具体地实现算法中的一些模块,并且描述了国内外的有关数据挖掘的研究情况. 展开更多
关键词 数据挖掘 决策树 信息量 信息熵 人工智能 数据库
在线阅读 下载PDF
数据挖掘中决策树的探讨 被引量:51
16
作者 马秀红 宋建社 董晟飞 《计算机工程与应用》 CSCD 北大核心 2004年第1期185-185,214,共2页
决策树方法是数据挖掘中的一个重要内容。该文叙述了决策树的构建过程,并指出了其技术难点及构建算法,最后,通过一个实例给出了该算法选取决策属性的详细过程。
关键词 决策树 数据挖掘 知识发现
在线阅读 下载PDF
一种高效的连续属性离散化算法 被引量:13
17
作者 赵静娴 倪春鹏 +1 位作者 詹原瑞 杜子平 《系统工程与电子技术》 EI CSCD 北大核心 2009年第1期195-199,共5页
分析了基于熵的离散化标准的切点特性,提出并证明了一种基于边界点属性值合并和不一致度检验的离散化算法。与传统离散化算法相比,此算法只对边界点属性值进行合并,切点个数无需设定,自动生成,且合并规则简单易行,大大减小了计算量,适... 分析了基于熵的离散化标准的切点特性,提出并证明了一种基于边界点属性值合并和不一致度检验的离散化算法。与传统离散化算法相比,此算法只对边界点属性值进行合并,切点个数无需设定,自动生成,且合并规则简单易行,大大减小了计算量,适用于处理大规模高维数据库的离散化。同时由于采用了不一致度对备选切点集合进行调整,使本算法具有全局性。试验表明,该算法有效提高了分类规则的简明性和预测精度。 展开更多
关键词 离散化 决策树 数据挖掘
在线阅读 下载PDF
数据挖掘技术在全断面掘进机故障诊断中的应用 被引量:25
18
作者 张天瑞 于天彪 +1 位作者 赵海峰 王宛山 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第4期527-531,541,共6页
分析了全断面掘进机复杂的故障机理和运行参数,研究了将粗糙集和决策树应用到数据挖掘中的方法.以全断面掘进机刀盘的一些实时数据为例,采用MATLAB 7.0对数据进行离散化处理,结合粗糙集属性约简的算法对故障样本进行冗余属性的约简;然后... 分析了全断面掘进机复杂的故障机理和运行参数,研究了将粗糙集和决策树应用到数据挖掘中的方法.以全断面掘进机刀盘的一些实时数据为例,采用MATLAB 7.0对数据进行离散化处理,结合粗糙集属性约简的算法对故障样本进行冗余属性的约简;然后,利用决策树算法对约简后的故障样本集进行规则提取,利用数据挖掘工具Clementine实现了C4.5算法和改进的C4.5算法,对其结果进行了对比分析;最后,运用VB编程对全断面掘进机采集的部分数据进行测试,结果表明该融合算法是一种快速、有效、可靠的故障检测与诊断的新途径. 展开更多
关键词 全断面掘进机 数据挖掘 粗糙集 决策树 融合算法
在线阅读 下载PDF
数据挖掘在高校学生学习成绩分析中的应用 被引量:44
19
作者 丁智斌 袁方 董贺伟 《计算机工程与设计》 CSCD 北大核心 2006年第4期590-592,共3页
随着高校的扩招,学生的数量越来越大,传统的对学生成绩的统计分析方法已不适应深入分析的需要。针对学生情况数据库应用数据挖掘中的ID3算法进行了情况分类,并对得到的结果进行了分析,得出了影响学生成绩的内部原因以及其它一些结论。
关键词 数据挖掘 学习成绩分析 决策树 ID3算法
在线阅读 下载PDF
数据挖掘方法在石油勘探开发中的应用研究 被引量:30
20
作者 谭锋奇 李洪奇 +2 位作者 孟照旭 郭海峰 李雄炎 《石油地球物理勘探》 EI CSCD 北大核心 2010年第1期85-91,共7页
随着石油勘探开发的不断深入,要想从海量的地震数据中创造新的效益,有必要将数据挖掘方法应用于石油勘探和开发中,以获取高性能的地质、油藏、储层及流体性质评价的预测模型。该方法由特征选择、模型参数优化、性能评估等三大循环组成,... 随着石油勘探开发的不断深入,要想从海量的地震数据中创造新的效益,有必要将数据挖掘方法应用于石油勘探和开发中,以获取高性能的地质、油藏、储层及流体性质评价的预测模型。该方法由特征选择、模型参数优化、性能评估等三大循环组成,核心技术是将遗传算法用于特征选择和参数优化,通过重复交叉验证得到泛化准确率的无偏估计以及从多种学习方法中优选出最终模型。本文以克拉玛依油田砾岩油藏水淹层评价为例,研究了6种特征子集方案和决策树、神经网络、支持向量机、贝叶斯网络及组合学习等5种方法,综合考虑预测模型的准确率和生成规则的可操作性,并选择决策树模型作为砾岩油藏水淹级别评价的最终预测模型。与传统的地球物理勘探方法相比较,采用该数据挖掘方法的优势在于:可以充分利用多专业数据;获得丰富的预测模型;探查和发现规律;提高预测准确度,因而能更好地为油气勘探开发服务。 展开更多
关键词 石油勘探开发 挖掘方法 应用 地球物理勘探方法 水淹层评价 预测模型 决策树模型 砾岩油藏
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部