期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
关联规则挖掘中改进型Diffsets算法 被引量:1
1
作者 孙志长 冯祖洪 《现代电子技术》 2008年第22期80-83,87,共5页
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定... 频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。 展开更多
关键词 数据挖掘 关联规则挖掘 频繁项集挖掘 Diffsets
在线阅读 下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律 被引量:1
2
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:96
3
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
在线阅读 下载PDF
多尺度数据挖掘方法 被引量:28
4
作者 柳萌萌 赵书良 +3 位作者 韩玉辉 苏东海 李晓超 陈敏 《软件学报》 EI CSCD 北大核心 2016年第12期3030-3050,共21页
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了... 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的. 展开更多
关键词 多尺度 频繁项集 关联规则 尺度转换 多尺度关联规则挖掘
在线阅读 下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
5
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 大数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
在线阅读 下载PDF
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 被引量:25
6
作者 陆楠 王喆 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词 数据挖掘 关联规则 频繁项集 无候选项集 FP-tree频集模式 FP-GROWTH算法
在线阅读 下载PDF
基于向量内积的关联规则挖掘算法研究 被引量:15
7
作者 刘以安 刘强 +1 位作者 邹晓华 王士同 《计算机工程与应用》 CSCD 北大核心 2006年第21期172-174,182,共4页
针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量... 针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量内存空间等优点。在处理超大型数据库和分布式数据库方面均能得到较好的应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集
在线阅读 下载PDF
一种自顶向下挖掘长频繁项的有效方法 被引量:27
8
作者 王晓峰 王天然 赵越 《计算机研究与发展》 EI CSCD 北大核心 2004年第1期148-155,共8页
Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目 )该方法会遇到非常耗时的巨大计算问... Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目 )该方法会遇到非常耗时的巨大计算问题 采用了一种新的自上而下挖掘方法 ,提出了事务项目关联信息表、关键项目、项目约简、投影数据库等新概念 ,利用投影、约简等方法在候选项集生成过程中及时修剪重复分支 ,使算法的实际效率大为提高 ,较好地解决了长频繁项的挖掘问题 通过计算机实验和算法分析证明了这种挖掘方法的有效性和完备性 新算法的计算复杂度与项目集平均约简项长度有关 ,估计为 0 5×M3 N×O(2 S×N′2 ) 其中 ,S为系统在用户给定最小支持度条件下的平均约简项长度 ,N′是数据库所对应关系的元组数 ,N为记录数 ,M为项目集平均长度 对于长频繁项来说S很小 。 展开更多
关键词 自顶向下 数据挖掘 关联规则 项目约简 频繁项
在线阅读 下载PDF
基于项目序列集操作的关联规则挖掘算法 被引量:37
9
作者 毛国君 刘椿年 《计算机学报》 EI CSCD 北大核心 2002年第4期417-422,共6页
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探... 最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能 .该文首先给出项目序列集和它的基本操作的严格定义 ,然后在此基础上提出一个称为 ISS- DM的最大频繁项目序列集生成算法 .ISS- DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的 . 展开更多
关键词 数据挖掘 关联规则 项目序列集 频繁项目序列集 算法 数据库
在线阅读 下载PDF
一种量化关联规则挖掘算法 被引量:10
10
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第10期34-35,69,共3页
提出了一种新的挖掘量化关联规则的方法。该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间。实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可... 提出了一种新的挖掘量化关联规则的方法。该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间。实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可能遗漏的重要的规则。 展开更多
关键词 数据挖掘 量化关联规则 频集 聚类
在线阅读 下载PDF
关联规则挖掘中对Apriori算法的一种改进研究 被引量:53
11
作者 刘以安 羊斌 《计算机应用》 CSCD 北大核心 2007年第2期418-420,共3页
针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。... 针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。研究和分析表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间和处理项目集维数大等优点。对于处理超大型事务数据库和分布式事务数据库,同样也有较好的应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集
在线阅读 下载PDF
FP-Growth算法的改进 被引量:25
12
作者 杨云 罗艳霞 《计算机工程与设计》 CSCD 北大核心 2010年第7期1506-1509,共4页
基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维... 基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一次遍历,大大缩短了建立FP树的时间。实验结果表明,该算法的改进优于经典算法。 展开更多
关键词 数据挖掘 关联规则 频繁模式 频繁项集 FP树
在线阅读 下载PDF
基于幂集的关联规则挖掘算法研究 被引量:16
13
作者 闫炜 崔杜武 付长龙 《计算机工程与应用》 CSCD 北大核心 2004年第1期192-193,200,共3页
首次提出了利用幂集作为挖掘关联规则的工具,给出了基于幂集的关联规则挖掘算法。该算法有效解决了传统算法中需对数据库多次扫描的不足,实现了对数据库一次扫描就可挖掘出所有频繁集的功能。
关键词 数据挖掘 关联规则 幂集 频繁集
在线阅读 下载PDF
数据挖掘中关联规则挖掘算法比较研究 被引量:36
14
作者 何小东 刘卫国 《计算机工程与设计》 CSCD 北大核心 2005年第5期1265-1268,共4页
分析数据挖掘中关联规则挖掘算法的研究现状,提出关联规则新的价值衡量方法和关联规则挖掘今后进一步的研究方向。以核心Apriori算法为基点,运用文献查询和比较分析方法对典型的关联规则挖掘算法进行了综合研究:①Apriori方法即使进行... 分析数据挖掘中关联规则挖掘算法的研究现状,提出关联规则新的价值衡量方法和关联规则挖掘今后进一步的研究方向。以核心Apriori算法为基点,运用文献查询和比较分析方法对典型的关联规则挖掘算法进行了综合研究:①Apriori方法即使进行了优化,一些固有的缺陷仍然无法克服,还需进一步研究;②今后的研究方向将是提高处理极大量数据和非结构化数据算法的效率、与OLAP相结合以及生成结果的可视化。 展开更多
关键词 数据挖掘 关联规则 算法 频集
在线阅读 下载PDF
数据挖掘中一种增强的Apriori算法分析 被引量:16
15
作者 胡雪 封化民 +1 位作者 李明伟 丁钊 《信息网络安全》 2015年第11期77-83,共7页
在当今这个信息极度发达的社会,网络数据急剧膨胀,激增的数据背后隐藏着许多重要的信息,所以对大量数据进行分析是必要的。Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖... 在当今这个信息极度发达的社会,网络数据急剧膨胀,激增的数据背后隐藏着许多重要的信息,所以对大量数据进行分析是必要的。Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。可能产生大量的候选集,以及可能需要重复扫描数据库是Apriori算法的两大缺点。文中提出了一种需要更少的扫描时间的Apriori算法,在剪枝候选项集的同时也在消除冗余的子项集的产生。改进的Apriori算法通过消除数据库中不需要记录的传输有效减少了I/O所花费的时间,Apriori算法的效率得到了极大的优化。文章给出了算法实现思想及证明,并对传统的和改进的Apriori算法进行比较和分析。 展开更多
关键词 数据挖掘 关联规则 频繁项集 事务数 支持计数
在线阅读 下载PDF
基于高频模式树的项约束关联规则发现方法 被引量:6
16
作者 董雁适 程翼宇 潘云鹤 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2002年第4期445-450,共6页
项约束关联规则发现是在关联规则发现中加入先验知识、提高算法执行效率、精简所发现的规则数量的重要方法 .现有的项约束关联规则发现算法都基于 Apriori算法框架 ,在高密度数据库上的执行性能不佳 ,而且没有提出高效的约束条件检验方... 项约束关联规则发现是在关联规则发现中加入先验知识、提高算法执行效率、精简所发现的规则数量的重要方法 .现有的项约束关联规则发现算法都基于 Apriori算法框架 ,在高密度数据库上的执行性能不佳 ,而且没有提出高效的约束条件检验方法 .在一种新型高效关联规则发现算法 FP- Growth的基础上 ,提出了一种全新的项约束关联规则发现算法 FPC.FPC算法利用 FP- Growth算法逐步生成高频项集的方式 ,构造了一种约束树数据结构 ,及时检查高频项集满足约束条件的情况 ,尽早删去不满足约束的条件 .实验证明 ,此算法执行效率比 Reorder等基于 Apriori的算法高一个数量级 . 展开更多
关键词 高频模式树 项约束 关联规则发现 高频项集发现 高频模式发现 数据挖掘 Aprioir算法
在线阅读 下载PDF
基于云南气象数据的空间关联规则挖掘 被引量:8
17
作者 何婧 王丽珍 邹力鹍 《计算机工程与应用》 CSCD 北大核心 2003年第34期187-190,共4页
空间关联规则挖掘可以深入发现现实世界大量空间谓词和非空间谓词之间的特定空间关系。论文结合气象数据的特点和已有传统关联规则挖掘算法的优点,针对云南气象数据提出了一种基于项目序列集的空间关联规则挖掘算法。通过严格的算法分... 空间关联规则挖掘可以深入发现现实世界大量空间谓词和非空间谓词之间的特定空间关系。论文结合气象数据的特点和已有传统关联规则挖掘算法的优点,针对云南气象数据提出了一种基于项目序列集的空间关联规则挖掘算法。通过严格的算法分析和具体实验表明,该算法是有效、可行的。 展开更多
关键词 空间数据挖掘 空间关联规则 项目序列集 最大频繁项目集
在线阅读 下载PDF
基于Spark改进的最大频繁项集挖掘算法 被引量:8
18
作者 焦润海 张谦 陈超 《计算机工程与设计》 北大核心 2017年第7期1839-1843,共5页
为解决面向大规模高维数据的频繁项集挖掘问题,针对传统算法的时空复杂度和并行化策略进行优化,实现基于Spark改进的最大频繁项集挖掘算法。结合Spark的分布式框架和DMFIA算法的优点,提出深度路径搜索和长度优先超集检验两项改进方法,... 为解决面向大规模高维数据的频繁项集挖掘问题,针对传统算法的时空复杂度和并行化策略进行优化,实现基于Spark改进的最大频繁项集挖掘算法。结合Spark的分布式框架和DMFIA算法的优点,提出深度路径搜索和长度优先超集检验两项改进方法,进行深度路径递归搜索一次性生成最大频繁项候选集,对候选项集进行长度优先排序并检验超集,降低候选项集的规模和挖掘次数,解决传统最大频繁项集挖掘算法在数据量大、维度高时效率低的问题。实验结果表明,该算法在时间上优于同类算法2-4倍,对数据集规模具有良好的扩展性。 展开更多
关键词 频繁模式树 分布式计算 数据挖掘 关联规则 最大频繁项
在线阅读 下载PDF
关联规则挖掘中最大频繁集的双向查找算法 被引量:5
19
作者 宋雨 赵建利 王保义 《华北电力大学学报(自然科学版)》 CAS 北大核心 2005年第2期67-70,共4页
在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快... 在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。 展开更多
关键词 事务数据库 关联规则 数据挖掘 最大频繁集 双向查找算法
在线阅读 下载PDF
基于分解事务矩阵的关联规则挖掘算法 被引量:11
20
作者 胡维华 冯伟 《计算机应用》 CSCD 北大核心 2014年第A02期113-116,共4页
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法(CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息... Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法(CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k-1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集"与运算"快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 APRIORI算法 分解事务矩阵
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部