期刊文献+
共找到450篇文章
< 1 2 23 >
每页显示 20 50 100
PHUI-GA: GPU-based efficiency evolutionary algorithm for mining high utility itemsets
1
作者 JIANG Haipeng WU Guoqing +3 位作者 SUN Mengdan LI Feng SUN Yunfei FANG Wei 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第4期965-975,共11页
Evolutionary algorithms(EAs)have been used in high utility itemset mining(HUIM)to address the problem of discover-ing high utility itemsets(HUIs)in the exponential search space.EAs have good running and mining perform... Evolutionary algorithms(EAs)have been used in high utility itemset mining(HUIM)to address the problem of discover-ing high utility itemsets(HUIs)in the exponential search space.EAs have good running and mining performance,but they still require huge computational resource and may miss many HUIs.Due to the good combination of EA and graphics processing unit(GPU),we propose a parallel genetic algorithm(GA)based on the platform of GPU for mining HUIM(PHUI-GA).The evolution steps with improvements are performed in central processing unit(CPU)and the CPU intensive steps are sent to GPU to eva-luate with multi-threaded processors.Experiments show that the mining performance of PHUI-GA outperforms the existing EAs.When mining 90%HUIs,the PHUI-GA is up to 188 times better than the existing EAs and up to 36 times better than the CPU parallel approach. 展开更多
关键词 high utility itemset mining(HUIM) graphics process-ing unit(GPU)parallel genetic algorithm(GA) mining perfor-mance
在线阅读 下载PDF
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘
2
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 FP-GROWTH算法 滑坡影响因素 频繁组合挖掘
在线阅读 下载PDF
基于频繁项集和高效用项集挖掘的银行间市场对倒交易检测
3
作者 刘丹 金天成 +3 位作者 窦亮 肖春芸 詹杭龙 卢艳民 《计算机应用与软件》 北大核心 2024年第12期376-383,共8页
传统的银行间市场对倒交易检测采用直接建立规则的方法,忽略了对倒交易的策划性、协同性和交易主体的差异性,存在运行时间长、效率低和滞后性等问题。基于频繁项集和高效用项集挖掘找到多次共同交易的群体,结合对倒交易模式检测出对倒... 传统的银行间市场对倒交易检测采用直接建立规则的方法,忽略了对倒交易的策划性、协同性和交易主体的差异性,存在运行时间长、效率低和滞后性等问题。基于频繁项集和高效用项集挖掘找到多次共同交易的群体,结合对倒交易模式检测出对倒交易链。实验结果表明,该方法识别率高于97%,且检测时间减少了45%,在效率上有明显的提高,对检测对倒交易有一定的预判指导意义。 展开更多
关键词 对倒交易 数据挖掘 高效用项集 频繁项集 市场操纵
在线阅读 下载PDF
基于滑动窗口含负项的高效用模式挖掘
4
作者 武妍 荀亚玲 马煜 《计算机工程与设计》 北大核心 2024年第3期845-851,共7页
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有... 针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。 展开更多
关键词 频繁模式挖掘 滑动窗口 高效用模式挖掘 高效用项集 负效用 流数据 效用列表
在线阅读 下载PDF
基于隐结构模型和频繁项集的针刺治疗慢性前列腺炎辨证取穴规律 被引量:3
5
作者 胡创政 孙自学 +4 位作者 张宸铭 樊立鹏 华众 付晓君 门波 《世界中医药》 CAS 北大核心 2024年第8期1182-1187,共6页
目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢... 目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢性前列腺炎病历数据库,运用隐结构模型分析、频繁项集等方法,分析针刺治疗慢性前列腺炎的辨证取穴规律。结果:共纳入文献64篇,涉及穴位91个,症状248项。高频穴位如三阴交、中极等;高频症状包括舌体瘀点瘀斑、苔黄腻、滴白、尿急等;构建隐结构模型,得出慢性前列腺炎主要证型有湿热下注、肾阳不足等;挖掘出症状-穴位频繁项集、症状-证型-穴位频繁项集各4项。症状-穴位频繁项集如“尿急+滴白+阳痿+早泄+肾俞+足三里”,症状-证型-穴位频繁项集如“尿频+尿急+苔黄腻+滴白+舌体瘀点瘀斑+湿热瘀阻+三阴交+会阴”,提示治疗时可根据相应症状判定证型及选择对应穴位。结论:针刺治疗慢性前列腺炎多以三阴交、中极、关元等为主要穴位,穴位配伍依据临床情况辨证选穴,此可为临床治疗慢性前列腺炎提供参考。 展开更多
关键词 隐结构模型 频繁项集 慢性前列腺炎 数据挖掘 辨证取穴规律 针刺 穴位 APRIORI算法
在线阅读 下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律 被引量:1
6
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:96
7
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
在线阅读 下载PDF
关联规则挖掘综述 被引量:139
8
作者 蔡伟杰 张晓辉 +1 位作者 朱建秋 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2001年第5期31-33,49,共4页
介绍了关联规则挖掘的研究性况,提出了关联规则的分类方法,对一些典型算法进行了分析和秤价,指出传统关系规则衡量标准的不足,归纳出关联规则的价值衡量方,展望了关联规则挖掘的未来研究方向。
关键词 数据挖掘 关联规则 OLAP 数据库 知识发现
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
9
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
关联规则挖掘中若干关键技术的研究 被引量:62
10
作者 陈耿 朱玉全 +3 位作者 杨鹤标 陆介平 宋余庆 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解... Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· 展开更多
关键词 数据挖掘 关联规则 频繁项目集
在线阅读 下载PDF
一种有效的隐私保护关联规则挖掘方法 被引量:53
11
作者 张鹏 童云海 +2 位作者 唐世渭 杨冬青 马秀莉 《软件学报》 EI CSCD 北大核心 2006年第8期1764-1774,共11页
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据... 隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomizedresponsewithpartialhiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性. 展开更多
关键词 隐私保护 数据挖掘 关联规则 频繁项集 随机化回答
在线阅读 下载PDF
关联规则挖掘的矩阵算法 被引量:33
12
作者 曾万聃 周绪波 +2 位作者 戴勃 常桂然 李春平 《计算机工程》 CAS CSCD 北大核心 2006年第2期45-47,共3页
关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。... 关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Apriori算法性能瓶颈。试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。 展开更多
关键词 关联挖掘 APRIORI算法 频繁项集 矩阵算法
在线阅读 下载PDF
时间敏感数据流上的频繁项集挖掘算法 被引量:29
13
作者 李海峰 章宁 +1 位作者 朱建明 曹怀虎 《计算机学报》 EI CSCD 北大核心 2012年第11期2283-2293,共11页
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了... 数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率. 展开更多
关键词 频繁项集 数据流 时间敏感 滑动窗口 数据挖掘
在线阅读 下载PDF
数据库中关联规则的并行挖掘算法 被引量:11
14
作者 王运峰 张蕾 +1 位作者 韩纪富 黄勇 《计算机工程与应用》 CSCD 北大核心 2001年第16期99-100,共2页
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。
关键词 关联规则 并行算法 数据挖掘 频繁项目集 数据库
在线阅读 下载PDF
关联规则挖掘Apriori算法的研究与改进 被引量:121
15
作者 刘华婷 郭仁祥 姜浩 《计算机应用与软件》 CSCD 2009年第1期146-149,共4页
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,... 关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法。该算法基于新的数据结构,改进了产生候选项集的连接方法。在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法
在线阅读 下载PDF
基于DDMINER分布式数据库系统中频繁项目集的更新 被引量:15
16
作者 吉根林 杨明 +1 位作者 赵斌 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1387-1392,共6页
给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项... 给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项目集的更新算法UGF .该算法能够产生较少数量的候选频繁项目集 ,在求解全局频繁项目集过程中 ,传送候选局部频繁项目集支持数的通信量为O(n) ;将文章提出的算法用Java语言加以实现 ,并对算法性能进行了研究 ;实验结果表明这些算法是正确、可行的 ,并且具有较高的效率. 展开更多
关键词 分布式数据库系统 频繁项目集 分布式数据挖掘系统 体系结构 DDMINER
在线阅读 下载PDF
基于布尔矩阵的关联规则算法研究 被引量:18
17
作者 方炜炜 杨炳儒 +1 位作者 宋威 侯伟 《计算机应用研究》 CSCD 北大核心 2008年第7期1964-1966,共3页
针对可快速在大型交易事务数据库中挖掘关联规则的问题,基于布尔矩阵提出一种新的挖掘算法。该算法通过仅需存储布尔位节约了内存,通过简单布尔运算提高了求解频繁项集的效率。实验证明该算法较之于Apriori算法有更好的性能。
关键词 数据挖掘 关联规则 矩阵 APRIORI算法 频繁项集
在线阅读 下载PDF
快速更新频繁项集 被引量:63
18
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
在线阅读 下载PDF
利用项集有序特性改进Apriori算法 被引量:11
19
作者 刘美玲 徐章艳 +3 位作者 卢景丽 区玉明 袁鼎荣 吴信东 《广西师范大学学报(自然科学版)》 CAS 2004年第1期33-37,共5页
Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.
关键词 APRIORI算法 挖掘关联规则 非频繁项集 有序特性 数据挖掘
在线阅读 下载PDF
不确定数据频繁项集挖掘方法综述 被引量:19
20
作者 汪金苗 张龙波 +2 位作者 邓齐志 王凤英 王勇 《计算机工程与应用》 CSCD 北大核心 2011年第20期121-125,共5页
近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基... 近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基本算法,分析了在此基础上提出的适用于不确定数据以及不确定数据流的频繁项集挖掘的方法,并探讨了今后可能的研究方向。 展开更多
关键词 不确定数据 频繁项集 数据挖掘
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部