期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
一种改进的加权关联规则挖掘方法 被引量:22
1
作者 李成军 杨天奇 《计算机工程》 CAS CSCD 北大核心 2010年第7期55-57,共3页
考虑属性数量和属性权值对关联规则的影响,提出一种新的加权支持度和加权置信度计算方法,在挖掘加权关联规则时通过改进加权支持度设置模型保持Apriori算法的频繁集向下封闭特性。与Apriori算法和水平加权关联规则挖掘方法的比较结果证... 考虑属性数量和属性权值对关联规则的影响,提出一种新的加权支持度和加权置信度计算方法,在挖掘加权关联规则时通过改进加权支持度设置模型保持Apriori算法的频繁集向下封闭特性。与Apriori算法和水平加权关联规则挖掘方法的比较结果证明该方法能快速有效地挖掘重要的关联规则。 展开更多
关键词 加权关联规则 加权支持度 频繁项集
在线阅读 下载PDF
基于加权频繁项集的文本分类规则挖掘 被引量:3
2
作者 邱江涛 唐常杰 +2 位作者 乔少杰 段磊 刘齐宏 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2008年第6期110-114,共5页
针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向... 针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向量预处理方法,消除文本大小对挖掘分类规则的影响。实验表明,解决上述两个问题将可以很好的提高文本分类的性能。 展开更多
关键词 关联规则 文本分类 加权频繁项集
在线阅读 下载PDF
基于加权频繁模式树的通信网络告警规则挖掘方法 被引量:14
3
作者 罗明 孟传伟 黄海量 《计算机工程》 CAS CSCD 北大核心 2016年第4期190-196,共7页
传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则... 传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则自动挖掘方法,将原始告警数据按时间窗口方式进行分段处理,通过BP神经网络、支持向量机、层次分析法生成告警设备的权重信息,并采用WFP-tree算法自动挖掘加权频繁项集。实验结果表明,与传统Apriori和FP-growth算法相比,WFP-tree算法在通信网络告警分析方面具有更好的频繁项压缩效果及更强的重要关联规则发现能力。 展开更多
关键词 通信网络告警 关联规则 权重因子 加权频繁项集 FP-GROWTH算法 加权频繁模式树算法 支持度
在线阅读 下载PDF
一种加权时态关联规则挖掘算法 被引量:6
4
作者 戴月明 李彦伟 王金鑫 《计算机工程与应用》 CSCD 北大核心 2011年第26期156-158,161,共4页
许多现实数据库都存在时态语义问题,因此在挖掘关联规则时附加上时态约束会使规则更具有实际意义。但目前提出的大多数时态关联规则挖掘算法,一般都认为每个数据项的重要性相同,而从决策者角度出发,往往会优先考虑利润较高的项目。提出... 许多现实数据库都存在时态语义问题,因此在挖掘关联规则时附加上时态约束会使规则更具有实际意义。但目前提出的大多数时态关联规则挖掘算法,一般都认为每个数据项的重要性相同,而从决策者角度出发,往往会优先考虑利润较高的项目。提出了一种加权时态关联规则挖掘算法,以项目的生命周期作为时间特征,允许用户设定不同的项目权重。实验结果证明,该算法不仅能有效地发现加权时态关联规则,而且挖掘出的规则更有价值。 展开更多
关键词 数据挖掘 加权时态关联规则 加权时态频繁项集
在线阅读 下载PDF
扩展WIT-树融合Diffset策略的频繁加权项集快速挖掘算法 被引量:2
5
作者 张亚梅 张皓 +1 位作者 海本斋 廖晓飞 《计算机应用研究》 CSCD 北大核心 2015年第12期3574-3578,共5页
针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后... 针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后,利用Diffset策略允许以内存有效方式快速计算项集的加权支持度。实验结果表明,当输入数据库中FWI数较大时,提出的算法明显降低了FWI挖掘时间。相比基于先验的算法,算法平均可节省99.37%的耗时;相比基于位矩阵的加权频繁项集生成算法,提出的算法可节省99.06%的耗时,明显提升了频繁加权项集挖掘效率。 展开更多
关键词 频繁加权项集 数据挖掘 WIT-树 关联规则挖掘 Diffset策略
在线阅读 下载PDF
基于项权值变化的完全加权正负关联规则挖掘 被引量:14
6
作者 周秀梅 黄名选 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1545-1554,共10页
本文提出一种基于项权值变化的完全加权正负关联规则挖掘算法,解决了基于项权值变化的负模式挖掘问题.该算法考虑项权值依赖于事务记录的特点,采用新的项集剪枝方法和模式评价框架,通过项集的项内权值比和维数比的简单计算和比较,挖掘... 本文提出一种基于项权值变化的完全加权正负关联规则挖掘算法,解决了基于项权值变化的负模式挖掘问题.该算法考虑项权值依赖于事务记录的特点,采用新的项集剪枝方法和模式评价框架,通过项集的项内权值比和维数比的简单计算和比较,挖掘有效的完全加权正负关联规则.实验结果表明,与现有无加权正负关联规则挖掘算法比较,本文算法能避免无效的模式出现,其挖掘时间和候选项集数量明显减少,减幅最大分别可达94.09%和88.16%. 展开更多
关键词 数据挖掘 完全加权关联规则 负关联规则 频繁项集
在线阅读 下载PDF
一种挖掘加权频繁项集的改进算法 被引量:4
7
作者 李彦伟 戴月明 王金鑫 《计算机工程与应用》 CSCD 北大核心 2011年第15期165-167,共3页
分析了New-Apriori和MWFI(Mining Weighted Frequent Itemsets)算法之不足,提出了一种挖掘加权频繁项集的New-MWFI算法。该算法按属性的权值对事务进行分类,并依次求出每个类别内的加权频繁项集。由于每个类别内的频繁项集满足Apriori性... 分析了New-Apriori和MWFI(Mining Weighted Frequent Itemsets)算法之不足,提出了一种挖掘加权频繁项集的New-MWFI算法。该算法按属性的权值对事务进行分类,并依次求出每个类别内的加权频繁项集。由于每个类别内的频繁项集满足Apriori性质,因而可以利用Apriori算法或其他改进算法进行挖掘,从而克服了原来算法的不合理和效率低下的缺陷。实验表明该算法能更有效地从数据集中挖掘出加权频繁项集。 展开更多
关键词 数据挖掘 加权关联规则 加权频繁项集 New-MWFI算法
在线阅读 下载PDF
基于项权值变化的矩阵加权关联规则挖掘 被引量:9
8
作者 周秀梅 黄名选 《计算机应用研究》 CSCD 北大核心 2015年第10期2918-2923,2929,共7页
提出一种矩阵加权关联模式支持度计算方法及其相关定理,给出矩阵加权项集剪枝策略,基于该剪枝策略提出一种基于项权值变化的矩阵加权关联规则挖掘算法MWAR-Miner(matrix-weighted association rules-miner)。该算法克服现有的项无加权... 提出一种矩阵加权关联模式支持度计算方法及其相关定理,给出矩阵加权项集剪枝策略,基于该剪枝策略提出一种基于项权值变化的矩阵加权关联规则挖掘算法MWAR-Miner(matrix-weighted association rules-miner)。该算法克服现有的项无加权和项权值固定条件下挖掘关联规则的缺陷,采用新的剪枝技术和模式支持度计算方法挖掘有效的矩阵加权关联规则,避免无效的和无趣的模式产生。以中文数据集CWT200g和英文数据集NTCIR-5为实验数据,理论分析和实验结果表明,与现有矩阵加权模式挖掘算法和基于无加权的挖掘算法比较,该算法挖掘的候选项集数量和挖掘时间明显减少,挖掘效率得到极大提高。 展开更多
关键词 文本挖掘 矩阵加权关联规则 频繁项集 知识发现
在线阅读 下载PDF
一种利用差集的加权频繁项集挖掘算法 被引量:3
9
作者 翟悦 郭杨 王玉姣 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2016年第3期312-317,共6页
挖掘加权频繁项集是多种数据挖掘应用中的关键问题,为提高传统加权频繁项集挖掘算法的性能,在研究概念格模型和差集Diffsets理论的基础上,构建一种利用差集的加权频繁项集格结构,该格结构通过差集性质快速计算加权支持度,满足向下封闭特... 挖掘加权频繁项集是多种数据挖掘应用中的关键问题,为提高传统加权频繁项集挖掘算法的性能,在研究概念格模型和差集Diffsets理论的基础上,构建一种利用差集的加权频繁项集格结构,该格结构通过差集性质快速计算加权支持度,满足向下封闭特性,更有利于高效生成加权频繁项集.最后给出了相应的FWIL-Diffsets构造算法,该算法仅对数据库进行一次扫描,通过性质定理有效减少项集生成中的计算量.研究结果表明:该方法能显著提高生成加权频繁项集的效率. 展开更多
关键词 差集 加权频繁项集 概念格 加权支持度 加权向下封闭性
在线阅读 下载PDF
多最小支持度的加权关联规则挖掘算法 被引量:2
10
作者 李彦伟 戴月明 王金鑫 《计算机工程与设计》 CSCD 北大核心 2011年第3期955-957,962,共4页
针对数据集中交易记录和数据项的重要性不同问题,提出了一种多最小支持度的加权关联规则挖掘算法,允许用户设定多个最小支持度,给出交易记录不同的权重,从而发现有价值的关联规则。该算法按项目的最小支持度升序对交易记录进行分类,按... 针对数据集中交易记录和数据项的重要性不同问题,提出了一种多最小支持度的加权关联规则挖掘算法,允许用户设定多个最小支持度,给出交易记录不同的权重,从而发现有价值的关联规则。该算法按项目的最小支持度升序对交易记录进行分类,按类别依次求出每一类别内的加权频繁集。在挖掘过程中由于剔除了冗余项目并对相同项集累加计数,且不需多次重复扫描数据库,从而提高了挖掘效率。实验结果表明,新算法能有效地从数据集中挖掘出加权关联规则。 展开更多
关键词 数据挖掘 多最小支持度 垂直权值 加权关联规则 加权频繁项集
在线阅读 下载PDF
一种改进的加权关联规则挖掘算法 被引量:8
11
作者 刘海蓉 闫仁武 《现代电子技术》 2011年第12期51-54,共4页
基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要... 基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要扫描一次数据库,权值的定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据的特点。 展开更多
关键词 数据挖掘 APRIORI算法 加权关联规则 频繁项集
在线阅读 下载PDF
基于权值向量矩阵约简的Apriori算法 被引量:15
12
作者 杨秋翔 孙涵 《计算机工程与设计》 北大核心 2018年第3期690-693,762,共5页
为解决数据挖掘运算过程中频繁项集丢失及其生成效率低的问题,提出一种基于权值向量矩阵约简的Apriori算法。从数据库所有集合中选择一个子集作为挖掘对象,对集合中元素赋予权值;将数据库信息用布尔矩阵表示,在运算过程中不断约简矩阵结... 为解决数据挖掘运算过程中频繁项集丢失及其生成效率低的问题,提出一种基于权值向量矩阵约简的Apriori算法。从数据库所有集合中选择一个子集作为挖掘对象,对集合中元素赋予权值;将数据库信息用布尔矩阵表示,在运算过程中不断约简矩阵结构,提高频繁项集的生成效率。测试结果表明,该方法利用权值的引入和矩阵约简思想,实现了数据动态分析,降低了源数据和候选项集的规模,运算效率较基于压缩矩阵的Apriori算法有明显提升。 展开更多
关键词 数据分析 权值向量 矩阵约简 布尔矩阵 频繁项集
在线阅读 下载PDF
一种有效的完全加权正负关联模式挖掘算法AWAPM_SPRMI 被引量:1
13
作者 高亮 夏冰 黄名选 《计算机应用研究》 CSCD 北大核心 2015年第6期1642-1648,共7页
完全加权正负关联模式在文本挖掘、信息检索等方面具有重要的理论和应用价值。针对现有挖掘算法的不足,构建完全加权正负关联模式评价框架SPRMII(support-probability ratio-mutual information-interest),提出完全加权项集双兴趣度阈... 完全加权正负关联模式在文本挖掘、信息检索等方面具有重要的理论和应用价值。针对现有挖掘算法的不足,构建完全加权正负关联模式评价框架SPRMII(support-probability ratio-mutual information-interest),提出完全加权项集双兴趣度阈值剪枝策略,然后基于该剪枝策略提出一种新的基于SPRMII框架的完全加权正负关联模式挖掘算法AWAPM_SPRMII(all-weighted association patterns mining based on SPRMII)。该算法克服了传统挖掘算法缺陷并采用新剪枝方法从完全加权数据库中挖掘有趣的频繁项集和负项集,通过项集权重维数比的简单计算和SPRMII评价框架,从这些项集中挖掘有效的完全加权正负关联规则。理论分析和实验表明,该算法有效,具有良好的扩展性,与现有经典挖掘算法比较,获得了良好的挖掘性能。 展开更多
关键词 数据挖掘 正负关联模式 完全加权关联规则 频繁项集
在线阅读 下载PDF
基于动态贝叶斯网络的常发性拥堵传播机理分析 被引量:3
14
作者 程小云 屈霞萍 +1 位作者 张学宇 邓亚娟 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第11期25-34,共10页
为精确识别常发性拥堵传播路径,分析其传播机理,以达到疏导拥堵源头,阻断传播路径的目的,提出一种基于出租车GPS数据的拥堵传播机理研究方法。首先,在城市路网时空立方体数据模型框架下,采用车辆轨迹数与速度指标识别交通拥堵区域,基于... 为精确识别常发性拥堵传播路径,分析其传播机理,以达到疏导拥堵源头,阻断传播路径的目的,提出一种基于出租车GPS数据的拥堵传播机理研究方法。首先,在城市路网时空立方体数据模型框架下,采用车辆轨迹数与速度指标识别交通拥堵区域,基于常发性拥堵的相对时空稳定性,提出分时段的常发性交通拥堵网格识别方法;其次,建立拥堵时空传播树,针对交通拥堵传播的动态性,提出以频率加权的频繁传播关系集挖掘方法,构建频繁拥堵传播子树;再次,引入动态贝叶斯网络,通过贝叶斯估计进行参数学习,获取拥堵传播概率;最后,以西安市南二环路东段区域为例,运用所提出的方法进行实证分析,探讨拥堵传播路径及其概率。研究结果表明:基于时空立方体模型,采用车辆轨迹数与行程速度指标共同识别各时间帧内常发性拥堵网格,为拥堵传播机理的准确分析奠定了基础;利用STC算法构建拥堵传播树,提出考虑拥堵传播在时间上复现性特征的频繁项集挖掘方法,用以重构频繁拥堵传播子树、明确常发性拥堵传播路径;基于动态贝叶斯网络量化分析网格间拥堵传播可能性,为动态寻找拥堵传播网络中的关键路段,科学合理的制定缓堵方案及任务时序提供理论依据。 展开更多
关键词 常发性拥堵识别 加权频繁项集 常发性拥堵传播机理 动态贝叶斯网络 出租车GPS轨迹
在线阅读 下载PDF
基于位矩阵的加权频繁k项集生成算法 被引量:6
15
作者 陈文 《计算机工程》 CAS CSCD 北大核心 2010年第5期54-56,共3页
提出一种基于位矩阵的加权频繁k项集生成算法。该算法引入加权支持度和最小支持期望的概念,对数据库仅进行一次扫描,通过构建筛选条件对基于频繁2项集位矩阵的加权频繁k项集生成过程进行剪枝,有效提高了加权频繁项集的生成效率。
关键词 加权关联规则 最小支持期望 频繁项集
在线阅读 下载PDF
一种基于最大加权频繁项目集的数据库相似性判别算法 被引量:1
16
作者 杨明 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1774-1779,共6页
在引入最大加权频繁项目集之后 ,给出一种新的数据库相似性度量模型 ,并提出基于最大加权频繁项目集的数据库相似性度量算法 该算法可有效地改进基于最大频繁项目集的数据库相似性度量方法 ,提高数据库相似性度量准确性 在实际应用中 ... 在引入最大加权频繁项目集之后 ,给出一种新的数据库相似性度量模型 ,并提出基于最大加权频繁项目集的数据库相似性度量算法 该算法可有效地改进基于最大频繁项目集的数据库相似性度量方法 ,提高数据库相似性度量准确性 在实际应用中 ,改进模型为分布多库环境下数据挖掘的数据准备提供有效的框架 。 展开更多
关键词 数据挖掘 最大加权频繁项目集 数据库相似性度量
在线阅读 下载PDF
基于动态数据的加权频繁项集挖掘算法 被引量:2
17
作者 杨秋翔 王婷 《科学技术与工程》 北大核心 2019年第20期265-272,共8页
为解决在挖掘频繁项集过程中,因忽略不同项目间的重要程度而导致的挖掘有效性低以及忽略数据的动态更新而造成的挖掘效率低的问题,通过引入新的加权规则,从权值与频数两方面去体现项目间的重要性差异,并通过引入树形结构与关系矩阵提高... 为解决在挖掘频繁项集过程中,因忽略不同项目间的重要程度而导致的挖掘有效性低以及忽略数据的动态更新而造成的挖掘效率低的问题,通过引入新的加权规则,从权值与频数两方面去体现项目间的重要性差异,并通过引入树形结构与关系矩阵提高数据动态变化时频繁项集的挖掘效率。创新性地提出基于动态数据的加权频繁项集挖掘算法weighted dynamic date mining(WDDM)。实验结果表明,WDDM算法较以往算法挖掘效率与有效性显著提高,有利于发现更多有研究价值的信息。 展开更多
关键词 频繁项集 动态数据 加权规则 树形结构 关系矩阵
在线阅读 下载PDF
基于加权构造链表的频繁加权项集挖掘算法 被引量:1
18
作者 文凯 许萌萌 耿小海 《计算机工程与设计》 北大核心 2020年第7期1920-1925,共6页
针对当前加权频繁项集挖掘算法建树复杂、挖掘效率较低的问题,提出基于加权构造链表(WB-list)的加权频繁项集挖掘BFWI算法。构造高度压缩信息的加权构造树(WB-tree),由B-list扩展结构WB-list得到节点信息,以集合枚举树作为搜索空间,结... 针对当前加权频繁项集挖掘算法建树复杂、挖掘效率较低的问题,提出基于加权构造链表(WB-list)的加权频繁项集挖掘BFWI算法。构造高度压缩信息的加权构造树(WB-tree),由B-list扩展结构WB-list得到节点信息,以集合枚举树作为搜索空间,结合包含索引减少项集连接次数并利用超集等价性质加快加权频繁项集的产生,提高算法的效率。实验结果表明,BFWI算法在时间和空间效率性能上优于IWS和WIT-FWIs-Diff算法,无论是处理稀疏数据还是稠密数据均得到良好效果。 展开更多
关键词 加权构造链表 频繁加权项集挖掘 超集等价 包含索引 数据挖掘
在线阅读 下载PDF
基于哈希存储与事务加权的并行Apriori改进算法 被引量:9
19
作者 李洁 朱洪亮 +1 位作者 陈玉玲 辛阳 《计算机工程》 CAS CSCD 北大核心 2020年第11期109-116,共8页
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去... Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去重,以减少冗余计算。将项目与项集的映射存储到哈希结构中,避免计算候选集的支持度时多次扫描事务数据库。同时开启多个线程,并行计算候选集的支持度,从而提高Apriori算法的运行效率。在开源数据集上的实验结果表明,当数据集中事务条数以及重复事务数越多时,该算法相较于传统Apriori算法的性能提升越明显,其运行时间与FP-Growth算法相近但避免了FP-Growth算法内存占用过大的问题。 展开更多
关键词 关联规则 频繁项集 哈希存储 事务加权 并行计算
在线阅读 下载PDF
快速挖掘加权频繁项集的矩阵位串算法 被引量:4
20
作者 李娟 张明义 汪维清 《计算机工程与设计》 CSCD 北大核心 2007年第11期2533-2536,共4页
关联规则挖掘的应用日益广泛,但已经提出的大多关联规则挖掘算法都是把数据仓库中各个项目按平等一致的方式加以处理的。然而,在现实世界中,不同的项目往往有着不同的重要性。现有的有关加权关联规则的研究中,大多采用的加权方法不太好... 关联规则挖掘的应用日益广泛,但已经提出的大多关联规则挖掘算法都是把数据仓库中各个项目按平等一致的方式加以处理的。然而,在现实世界中,不同的项目往往有着不同的重要性。现有的有关加权关联规则的研究中,大多采用的加权方法不太好,或挖掘算法效率不够高。为此,提出了一种新的挖掘加权关联规则的算法,该算法采用矩阵和位串技术,只需要对数据库扫描一遍,可快速挖掘出所有的加权频繁项集,并且存放辅助信息所需要的空间也较少。研究表明该算法比已有的算法更高效。 展开更多
关键词 数据挖掘 关联规则 加权关联规则 频繁项集 最小支持期望
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部