期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
钢铁企业生产成本关键工序数据挖掘应用研究 被引量:3
1
作者 宋旭东 刘晓冰 +1 位作者 程晓兰 翟坤 《计算机工程与应用》 CSCD 北大核心 2008年第28期184-186,195,共4页
在钢铁企业的成本分析中,工艺路线关键工序消耗的分析和控制成为钢铁企业生产成本决策分析中首要的任务。通过以工艺路线为切入点,结合企业的成本分析项目,对生产成本工序进行数据仓库维度建模。采用基于抽样的C4.5算法对生产成本工序... 在钢铁企业的成本分析中,工艺路线关键工序消耗的分析和控制成为钢铁企业生产成本决策分析中首要的任务。通过以工艺路线为切入点,结合企业的成本分析项目,对生产成本工序进行数据仓库维度建模。采用基于抽样的C4.5算法对生产成本工序数据进行挖掘,挖掘出工艺路线中的关键工序和影响钢铁企业成本的分类规则,为企业的成本管理提供了科学依据。 展开更多
关键词 钢铁企业 成本分析 工艺路线 数据仓库 维度建模 数据挖据
在线阅读 下载PDF
基于Hadoop的数据挖掘算法在葡萄酒信息数据分析系统中的应用 被引量:6
2
作者 郝艳妮 田维丽 《计算机应用》 CSCD 北大核心 2017年第A01期72-74,79,共4页
针对宁夏贺兰山东麓葡萄酒庄在销售自产葡萄酒的过程中存在葡萄酒信息数据分析不准确、销售渠道窄、销售信息更新慢、销量不高等问题,提出了一种基于Hadoop分布式框架的数据挖掘算法,对极大量的葡萄酒信息数据分析系统的数据进行采集、... 针对宁夏贺兰山东麓葡萄酒庄在销售自产葡萄酒的过程中存在葡萄酒信息数据分析不准确、销售渠道窄、销售信息更新慢、销量不高等问题,提出了一种基于Hadoop分布式框架的数据挖掘算法,对极大量的葡萄酒信息数据分析系统的数据进行采集、分析,并根据分析结果为用户推荐适合其口味的葡萄酒饮品。该系统以宁夏贺兰山东麓葡萄酒庄为实验基地,自主开发葡萄酒信息数据分析系统,并利用数据挖据算法中的聚类算法K-means算法和分类算法中的C4.5算法进行数据挖据;其中针对聚类算法中的K-means算法和分类算法中的C4.5算法实现分布式研究,实现了基于Map Reduce的分布式聚类和分类算法,并且在此基础上对其各自的缺点进行相应的改进。实验证明了基于Hadoop框架的数据挖掘算法在算法的稳定性和准确率上均有很好的提升,并且可以对葡萄酒信息数据分析系统的海量数据进行很好的处理。 展开更多
关键词 HADOOP 数据挖据算法 C4.5算法 K-MEANS算法 葡萄酒 数据分析
在线阅读 下载PDF
基于Web Service技术分布式并行数据挖掘的研究与实现 被引量:1
3
作者 金春霞 白秋产 《现代电子技术》 2008年第10期42-44,共3页
主要介绍基于Web Service技术的一个数据挖掘系统,在一个关联规则挖掘的并行算法—CD算法的基础上,结合一种基于动态数据集划分的并行关联规则挖掘算法,利用动态方式分配数据量,使每个处理器获得相同多的数据集,解决在网络中大量分散的... 主要介绍基于Web Service技术的一个数据挖掘系统,在一个关联规则挖掘的并行算法—CD算法的基础上,结合一种基于动态数据集划分的并行关联规则挖掘算法,利用动态方式分配数据量,使每个处理器获得相同多的数据集,解决在网络中大量分散的数据因通信等问题而引起的负载平衡,从而提高了数据挖掘效率。 展开更多
关键词 WEB服务 关联规则 并行数据挖据 动态数据
在线阅读 下载PDF
数据挖掘在预测组织事故防控效果中的应用 被引量:5
4
作者 付净 聂方超 +2 位作者 荆德吉 刘虹 陈微微 《中国安全生产科学技术》 CAS CSCD 北大核心 2020年第10期152-157,共6页
为进一步探索数据挖据技术在组织事故预防工作中的融入性与适用性,基于24Model构建事故预控基础模型,通过预测准确率数值及接受者操作特性曲线(ROC曲线)对比分析随机森林(RF)、支持向量机(SVM)、决策树(DT)与神经网络(NN)4种方法对组织... 为进一步探索数据挖据技术在组织事故预防工作中的融入性与适用性,基于24Model构建事故预控基础模型,通过预测准确率数值及接受者操作特性曲线(ROC曲线)对比分析随机森林(RF)、支持向量机(SVM)、决策树(DT)与神经网络(NN)4种方法对组织事故防控效果的预测性能。结果表明:针对事故率控制(Y1)、职业危害预防(Y2)、财产损失3类预测目标(Y3),RF方法均能达到较高的准确率及稳定性,具有较优的预测性能。根据特征重要度(FI)排序,明确对组织事故水平影响最显著的因素为安全实践活动认知(SC5)及安全管理程序文件(SMS3),FI值均大于0.1500。研究结果可为有效预测组织事故防控效果提供方法依据,同时为企业安全工作的规划设计提供思路。 展开更多
关键词 组织事故 事故预防 数据挖据 24Model
在线阅读 下载PDF
多关系数据挖掘研究综述 被引量:4
5
作者 张伟 杨炳儒 宋威 《计算机工程与应用》 CSCD 北大核心 2006年第2期1-6,共6页
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能完成单一关系中的模式发现,多关系数据挖掘能够从复杂结构化数据中发现涉及多个关系的复杂模式。该文综述了多关系数据挖掘的研究状况。首先分析了多... 多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能完成单一关系中的模式发现,多关系数据挖掘能够从复杂结构化数据中发现涉及多个关系的复杂模式。该文综述了多关系数据挖掘的研究状况。首先分析了多关系数据挖掘领域发生的原因和背景,其次总结了多关系数据挖掘研究的一般方法,然后介绍、分析了最具代表性的多关系数据挖掘算法。最后,总结了多关系数据挖掘将来发展需重点解决的问题和面临的挑战。 展开更多
关键词 多关系数据 掘归纳逻辑程序设计 多关系决策树 关系距离测度 多关系关联规则 统计关系学习
在线阅读 下载PDF
一种基于划分的带项目约束的频繁项集挖掘算法 被引量:1
6
作者 陈慧萍 朱峰 +1 位作者 王建东 周小芹 《系统工程与电子技术》 EI CSCD 北大核心 2006年第7期1082-1086,共5页
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。... 为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。 展开更多
关键词 数据挖据 关联规则 频繁项集 划分
在线阅读 下载PDF
基于权重调整的Generator表达与挖掘方法 被引量:1
7
作者 王秉政 李飞高 《科学技术与工程》 北大核心 2013年第22期6476-6482,共7页
Generator项集是频繁项集的一种简洁表示形式,但当为数据项附以不同权值时,传统Generator定义和计算方法将不再有效;同时其具有的反单调性也不再成立;而此特性在现实应用中具有重要作用。提出以设计权重约束下的支持度计算方法为基础,... Generator项集是频繁项集的一种简洁表示形式,但当为数据项附以不同权值时,传统Generator定义和计算方法将不再有效;同时其具有的反单调性也不再成立;而此特性在现实应用中具有重要作用。提出以设计权重约束下的支持度计算方法为基础,重新定义加权Generator,调整加权Generator与频繁项集的计算关系,从而维持其反单调性。在加权支持度树结构的基础上,给出挖掘加权Generator的方法。实验表明,提出的方法能够使得权重较大的项被优先挖掘出来,并保证了Genera-tor的反单调性,提出的挖掘方法能够正确有效挖掘频繁加权Generator。 展开更多
关键词 关联规则 GENERATOR 加权项集 数据挖据
在线阅读 下载PDF
模拟故障数据的构造算法研究 被引量:1
8
作者 赵高长 《西安科技大学学报》 CAS 北大核心 2011年第2期230-235,共6页
基于统计学方法,对故障诊断及故障处理过程中可能遇到的典型故障现象,提出一系列稳定可靠的故障数据模拟新算法,由此可灵活组配各种需要的模拟数据方案。建立了模拟故障数据构造的层次组合模型,总结出不同实际情况需求的模拟故障数据算... 基于统计学方法,对故障诊断及故障处理过程中可能遇到的典型故障现象,提出一系列稳定可靠的故障数据模拟新算法,由此可灵活组配各种需要的模拟数据方案。建立了模拟故障数据构造的层次组合模型,总结出不同实际情况需求的模拟故障数据算法步骤。结合配电网中2个实例,通过等价类划分进行实验。结果表明所建议的方法在故障数据模拟过程中简单实用。该算法尽可能抽象故障数据中最本质的内容,对数据挖据及故障模拟方案的设计及实施有一定的实际意义。 展开更多
关键词 配电网 等价类 相对平均偏差 数据挖据 故障区域
在线阅读 下载PDF
基于云理论的智能电能表故障数据分析 被引量:39
9
作者 江剑峰 张垠 +1 位作者 田书欣 杨喜军 《电力科学与技术学报》 CAS 北大核心 2020年第2期163-169,共7页
智能电能表是智能电网中重要的高级计量设备,其故障类型具有复杂的随机模糊特性,对用户的用电安全和计量的公平公正具有重大直接影响。为了分析智能电能表故障数据中的随机、模糊信息及其之间关联性,该文根据聚类算法和云理论,对数据进... 智能电能表是智能电网中重要的高级计量设备,其故障类型具有复杂的随机模糊特性,对用户的用电安全和计量的公平公正具有重大直接影响。为了分析智能电能表故障数据中的随机、模糊信息及其之间关联性,该文根据聚类算法和云理论,对数据进行挖据,建立智能电能表故障信息的分类诊断云模型,确定智能电能表的薄弱环节或影响电能表可靠运行的关键信息。最后,以某地区2015年度主站采集到的智能电能表异常事件记录为数据源进行挖掘分析,验证该文所提方法的有效性和实用性。 展开更多
关键词 智能电能表 故障分析 聚类算法 云理论 数据挖据
在线阅读 下载PDF
智能时代的教育文本挖掘模型与应用 被引量:18
10
作者 刘清堂 贺黎鸣 +2 位作者 吴林静 杨炜钦 李晶 《现代远程教育研究》 CSSCI 北大核心 2020年第5期95-103,共9页
教育文本挖掘是指通过数据采集和处理,利用数据挖掘算法或工具,从非结构化文本文档中提取有意义的模式或知识的过程。教育文本蕴含着丰富的学习者认知、行为和情感等信息,对其进行深度挖掘和分析,有助于深入探索教育教学的基本规律,解... 教育文本挖掘是指通过数据采集和处理,利用数据挖掘算法或工具,从非结构化文本文档中提取有意义的模式或知识的过程。教育文本蕴含着丰富的学习者认知、行为和情感等信息,对其进行深度挖掘和分析,有助于深入探索教育教学的基本规律,解释教育中存在的问题和现象。大数据支持下的教育文本挖掘模型包括数据生产和使用的主体(利益相关者)、教学环境、数据和挖掘工具等核心要素,涉及数据产生、数据采集、数据处理、知识发现、评估解释、教学应用等过程和方法。其常用的数据来源包含问卷调查、在线互动、学习反馈、在线评论、社交媒体和教学文件,主要用于学习者成绩预测、学习者建模、学习者水平评价、教学材料结构分析、学习者反馈和内容可视化等。当前教育文本挖掘在海量数据处理、数据降维保真、结果评估与解释等方面还面临挑战,研究者需深度融合教育学、认知心理学、语言学等多学科研究方法,结合教育教学的基本理论和具体的教育情境,注重多模态分析和验证,保证将其应用于教育研究的科学性。随着相关技术的突破和应用发展,教育文本数据将成为教育现代化发展的推动力,在深度学习、精准教学等领域中发挥更大作用。 展开更多
关键词 教育大数据 数据挖据 学习分析 教育文本
在线阅读 下载PDF
水体污染控制与治理科技重大专项“国家流域水环境管理大数据平台构建”课题
11
《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第3期F0002-F0002,共1页
2017年12月5日,由北京师范大学水科学研究院承担的"国家流域水环境管理大数据平台构建"课题获中华人民共和国生态环境部和住房城乡建设部批复,列入水体污染防控与治理科技重大专项组织实施。水科学研究院紧密围绕国家"... 2017年12月5日,由北京师范大学水科学研究院承担的"国家流域水环境管理大数据平台构建"课题获中华人民共和国生态环境部和住房城乡建设部批复,列入水体污染防控与治理科技重大专项组织实施。水科学研究院紧密围绕国家"水十条"及水专项总体目标要求,重点攻克数据挖据、融合与水环境多模集合模拟等关键技术,深化大数据应用,构建国家流域水环境管理大数据平台。该平台包括数据汇集、流域管理、决策支持和指挥调度4大模块,为我国水环境改革和技术发展提供了技术支撑。 展开更多
关键词 数据平台 科技重大专项 数据汇集 数据挖据 数据应用 污染防控 生态环境 指挥调度
在线阅读 下载PDF
中小企业股票市场化发行定价的半参数自组织模型与实证 被引量:2
12
作者 何应龙 田益祥 《南方经济》 北大核心 2006年第2期107-115,共9页
随着深圳交易所中小企业板块的正式启动,我国中小企业新股发行的市场化定价方式必将启用。本文采用基于自组织数据挖掘GMDH算法的半参数模型的定价方法,将GMDH算法与半参数模型方法结合起来,不仅利用计算机的自动拟合优选最优复杂度模型... 随着深圳交易所中小企业板块的正式启动,我国中小企业新股发行的市场化定价方式必将启用。本文采用基于自组织数据挖掘GMDH算法的半参数模型的定价方法,将GMDH算法与半参数模型方法结合起来,不仅利用计算机的自动拟合优选最优复杂度模型,从而大大简化了非参数部分估计,创造了半参数模型崭新的实现方式,并达到了理想的定价效果,而且可以发挥半参数模型的特有优势,进行模型结构分析。经过实证和检验证明了这种模型用于我国股票发行定价的有效性和合理性。为完全市场化股票发行方式下确定股票的发行价格提供了新的方法。 展开更多
关键词 IPO市场化定价 中小企业 自组织数据挖据GMDH算法 半参数模型
在线阅读 下载PDF
基于时空关键点和运动模板相结合的船舶目标识别 被引量:1
13
作者 周广宏 曹小兵 《舰船科学技术》 北大核心 2018年第12X期49-51,共3页
随着信息技术及图像处理技术的发展,基于模式识别及时空关键点的动作特征抓捕技术成为现代船舶目标识别的研究热点,其能对快速移动的海上目标进行准确识别。相对于传统的红外线﹑视频捕捉等识别方法,时空关键点动作特征捕捉与运动模板... 随着信息技术及图像处理技术的发展,基于模式识别及时空关键点的动作特征抓捕技术成为现代船舶目标识别的研究热点,其能对快速移动的海上目标进行准确识别。相对于传统的红外线﹑视频捕捉等识别方法,时空关键点动作特征捕捉与运动模板经验库相结合,实时对特征向量矩阵进行训练分类,进一步提高了海上目标识别的准确性。 展开更多
关键词 时空关键点 数据挖据 局部最优点
在线阅读 下载PDF
以互信息为度量的一种规则可视化
14
作者 谢霖铨 章恩 《计算机工程与应用》 CSCD 2014年第17期146-149,共4页
概念格是一种有效的知识表示和知识发现的工具,已被成功应用于许多领域,然而在建格上大多是利用最小支持度以及置信度来进行约简操作,同时利用置信度来进行规则提取。提出以信息论的互信息来构造具有强关联规则的Hasse图,并利用互信息... 概念格是一种有效的知识表示和知识发现的工具,已被成功应用于许多领域,然而在建格上大多是利用最小支持度以及置信度来进行约简操作,同时利用置信度来进行规则提取。提出以信息论的互信息来构造具有强关联规则的Hasse图,并利用互信息进行规则提取。 展开更多
关键词 强关联规则 概念格 互信息 规则提取 数据挖据
在线阅读 下载PDF
建筑用户行为节能潜力评估新方法 被引量:5
15
作者 胡宾 俞准 +1 位作者 李郡 张国强 《土木建筑与环境工程》 CSCD 北大核心 2018年第2期103-108,共6页
现有建筑用户行为节能潜力评估方法未能充分考虑不同用户之间的差异性,从而显著降低了评估结果的准确性。针对此种不足,提出一种行为节能潜力评估的新方法。通过主成分分析对用户行为影响因素进行降维处理,在此基础上,采用数据挖掘方法... 现有建筑用户行为节能潜力评估方法未能充分考虑不同用户之间的差异性,从而显著降低了评估结果的准确性。针对此种不足,提出一种行为节能潜力评估的新方法。通过主成分分析对用户行为影响因素进行降维处理,在此基础上,采用数据挖掘方法中的聚类分析技术对样本用户进行合理分类,并针对不同类用户特征分别进行节能潜力评估。由于该方法既全面考虑了同一用户不同因素的影响,又充分体现了不同用户之间的差异性,可显著提高评估结果的准确性。通过将其应用于湖南省3所高校100名研究生用户电脑待机行为的节能潜力评估表明,该方法有效可行。 展开更多
关键词 用户行为 节能潜力评估 数据挖据 聚类分析 主成分分析
在线阅读 下载PDF
基于文献调查的中医治疗中风后遗症期用药规律分析 被引量:11
16
作者 彭智远 刘旺华 曹雯 《中华中医药学刊》 CAS 北大核心 2016年第4期823-826,I0005,共5页
目的:探讨中医治疗中风后遗症期的用药规律,以便更好有效的指导临床用药。方法:在中文期刊数据库、万方数据库中以"中风后遗症期"为主题词,"中医治疗"、"中医药治疗"为副主题词,搜索2000年—2015年的相... 目的:探讨中医治疗中风后遗症期的用药规律,以便更好有效的指导临床用药。方法:在中文期刊数据库、万方数据库中以"中风后遗症期"为主题词,"中医治疗"、"中医药治疗"为副主题词,搜索2000年—2015年的相关文献,共搜索文献317篇,其中符合条件的64篇,将这64篇文献中所涉及到的单味药物输入EXCEL2003建立数据库,运用频数分析,系统聚类分析等数据挖据技术对药物进行分析,得出高频药物、药类、常用药以及相互关系密切的药物组成的聚类方。结果:61篇文献中,共涉及复方61首,药物128种,用药频次达688次,其中,用药频次大于20次的分别为当归、黄芪、地龙、川芎、丹参、桃仁、红花、石菖蒲,按照中药类别分析,用药味数最多的类别分别是补虚药、活血化瘀药、平肝熄风药。用药归经中以归肝为主,脾经次之,心经再次之。对使用频次10以上的18味药物进行聚类分析,得到2个聚类组。结论:补益气血、活血化瘀、平肝熄风对于中风后遗症期的治疗具有较好的疗效。 展开更多
关键词 中医治疗 中风后遗症期 数据挖据 用药规律
在线阅读 下载PDF
关联规则在DB开发中的应用
17
作者 张海洋 《科学技术与工程》 2009年第9期2480-2483,共4页
随着DB(DataBase)技术的迅速发展和不断完善,许多行业和部门的大量生产、管理及科研信息都采用DB进行存储和管理,如何把关联规则应用到DB开发中具有广阔的前景。
关键词 DATABASE 关联规则 数据挖据
在线阅读 下载PDF
一个最优分类关联规则算法 被引量:1
18
作者 李闯 杨胜 李仁发 《计算机工程与科学》 CSCD 北大核心 2009年第4期63-65,共3页
分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最... 分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示OCARA具有更好的性能,证明OCARA是一个有效的分类关联规则挖掘算法。 展开更多
关键词 分类关联规则 关联规则 分类 数据
在线阅读 下载PDF
Model of generic project risk element transmission theory based on data mining 被引量:3
19
作者 李存斌 王建军 《Journal of Central South University of Technology》 EI 2008年第1期132-135,共4页
In order to construct the data mining frame for the generic project risk research, the basic definitions of the generic project risk element were given, and then a new model of the generic project risk element was pre... In order to construct the data mining frame for the generic project risk research, the basic definitions of the generic project risk element were given, and then a new model of the generic project risk element was presented with the definitions. From the model, data mining method was used to acquire the risk transmission matrix from the historical databases analysis. The quantitative calculation problem among the generic project risk elements was solved. This method deals with well the risk element transmission problems with limited states. And in order to get the limited states, fuzzy theory was used to discrete the historical data in historical databases. In an example, the controlling risk degree is chosen as P(Rs≥2) ≤0.1, it means that the probability of risk state which is not less than 2 in project is not more than 0.1, the risk element R3 is chosen to control the project, respectively. The result shows that three risk element transmission matrix can be acquired in 4 risk elements, and the frequency histogram and cumulative frequency histogram of each risk element are also given. 展开更多
关键词 data mining risk element risk management project management
在线阅读 下载PDF
THRFuzzy:Tangential holoentropy-enabled rough fuzzy classifier to classification of evolving data streams 被引量:1
20
作者 Jagannath E.Nalavade T.Senthil Murugan 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第8期1789-1800,共12页
The rapid developments in the fields of telecommunication, sensor data, financial applications, analyzing of data streams, and so on, increase the rate of data arrival, among which the data mining technique is conside... The rapid developments in the fields of telecommunication, sensor data, financial applications, analyzing of data streams, and so on, increase the rate of data arrival, among which the data mining technique is considered a vital process. The data analysis process consists of different tasks, among which the data stream classification approaches face more challenges than the other commonly used techniques. Even though the classification is a continuous process, it requires a design that can adapt the classification model so as to adjust the concept change or the boundary change between the classes. Hence, we design a novel fuzzy classifier known as THRFuzzy to classify new incoming data streams. Rough set theory along with tangential holoentropy function helps in the designing the dynamic classification model. The classification approach uses kernel fuzzy c-means(FCM) clustering for the generation of the rules and tangential holoentropy function to update the membership function. The performance of the proposed THRFuzzy method is verified using three datasets, namely skin segmentation, localization, and breast cancer datasets, and the evaluated metrics, accuracy and time, comparing its performance with HRFuzzy and adaptive k-NN classifiers. The experimental results conclude that THRFuzzy classifier shows better classification results providing a maximum accuracy consuming a minimal time than the existing classifiers. 展开更多
关键词 data stream classification fuzzy rough set tangential holoentropy concept change
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部