期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
一种基于最大频繁项目集的挖掘事务间关联规则方法 被引量:2
1
作者 任永功 张琰渝 《计算机科学》 CSCD 北大核心 2008年第11期185-188,共4页
Web事务间关联规则挖掘是通过发现网页之间的关联关系来预测用户的兴趣。提出一种新的事务间关联规则挖掘方法,通过对MAFIA算法改进,得到最大频繁项目集的同时得到对应的共有用户集,通过对事务内到事务间最大频繁项目集的转换,分析不同... Web事务间关联规则挖掘是通过发现网页之间的关联关系来预测用户的兴趣。提出一种新的事务间关联规则挖掘方法,通过对MAFIA算法改进,得到最大频繁项目集的同时得到对应的共有用户集,通过对事务内到事务间最大频繁项目集的转换,分析不同用户之间的关系,分析用户对网站上不同网页的访问数据,直接发现不同用户之间的关联关系来预测用户的兴趣。该方法经试验证明能够更加全面的预测用户感兴趣的网页,更好地为用户提供个性化服务。 展开更多
关键词 Web事务关联规则 改进的MAFIA算法 最大频繁项目 用户兴趣模型
在线阅读 下载PDF
基于分解事务矩阵的关联规则挖掘算法 被引量:11
2
作者 胡维华 冯伟 《计算机应用》 CSCD 北大核心 2014年第A02期113-116,共4页
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法(CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息... Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法(CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k-1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集"与运算"快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。 展开更多
关键词 数据挖掘 关联规则 频繁项目 APRIORI算法 分解事务矩阵
在线阅读 下载PDF
关联规则挖掘中最大频繁集的双向查找算法 被引量:5
3
作者 宋雨 赵建利 王保义 《华北电力大学学报(自然科学版)》 CAS 北大核心 2005年第2期67-70,共4页
在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快... 在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。 展开更多
关键词 事务数据库 关联规则 数据挖掘 最大频繁 双向查找算法
在线阅读 下载PDF
基于项目集知识库的关联规则挖掘与更新的高效算法 被引量:4
4
作者 李华君 周海岩 《计算机工程与设计》 CSCD 2004年第12期2198-2201,共4页
通过对已有的诸关联规则挖掘与更新算法进行深入的分析和研究,指出了其共同存在的问题与不足,提出了一种基于项目集知识库的关联规则挖掘与更新方法。该方法既适应当数据库D中数据不变而用户指定的最小支持度和最小置信度这两个阈值变... 通过对已有的诸关联规则挖掘与更新算法进行深入的分析和研究,指出了其共同存在的问题与不足,提出了一种基于项目集知识库的关联规则挖掘与更新方法。该方法既适应当数据库D中数据不变而用户指定的最小支持度和最小置信度这两个阈值变化的情况,也适合事务数据库D中数据发生变化的情况。当事务数据库D中数据不变时,仅需扫描数据库一次,便可建立项目集知识库KBD,然后可反复调整最小支持度和最小置信度进行关联规则挖掘与更新。而当事务数据库D中数据发生变化时,仅需扫描数据集d+和d-各一次;通过对项目集知识库KBD的更新来达到对频繁项目集和关联规则的更新。 展开更多
关键词 关联规则挖掘 事务数据库 知识库 频繁项目 最小支持度 扫描 数据 KBD 变化 适应
在线阅读 下载PDF
基于事务数据库的关联规则采掘算法研究 被引量:5
5
作者 向阳 张巍 《山东科技大学学报(自然科学版)》 CAS 2001年第2期55-59,共5页
采掘关联规则是知识发现领域的一个重要问题 ,文中对采掘关联规则问题进行了简单的回顾 ,分析了传统的关联规则Apriori算法的优缺点 ,设计了一种基于事务数据库的快速采掘算法TB -MA。实例证明 ,与Apriori算法相比 ,TB -MA算法削减了数... 采掘关联规则是知识发现领域的一个重要问题 ,文中对采掘关联规则问题进行了简单的回顾 ,分析了传统的关联规则Apriori算法的优缺点 ,设计了一种基于事务数据库的快速采掘算法TB -MA。实例证明 ,与Apriori算法相比 ,TB -MA算法削减了数据库遍历次数 ,提高了采掘效率 。 展开更多
关键词 关联规则 频繁 可辨识向量 可辨识矩阵 事务数据库 数据采掘 知识发现 TB-MA算法
在线阅读 下载PDF
频繁项目集及相关事务集的挖掘算法 被引量:1
6
作者 陈嶷瑛 武强 李文斌 《计算机工程与应用》 CSCD 北大核心 2006年第15期176-178,共3页
发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该... 发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该算法具有仅需扫描一次事务数据库的特点。另外,还定义了“分散度”指标,用于指导“真频繁项目集”的挖掘。 展开更多
关键词 频繁项目 关联规则 事务 挖掘算法
在线阅读 下载PDF
基于事务线索树的一次扫描关联规则增量挖掘算法 被引量:1
7
作者 业宁 董逸生 王厚立 《应用科学学报》 CAS CSCD 2004年第2期200-204,共5页
首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集.该算法只需扫描事务数据库一次,由于采用... 首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集.该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少.该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能.通过大量的实验数据进行比较,该算法的速度约是Apriori算法的10倍. 展开更多
关键词 事务线索树 一次扫描关联规则 增量挖掘算法 可伸缩性 频繁 事务数据库
在线阅读 下载PDF
最大频繁集的关联规则矩阵视图
8
作者 余力 刘英杰 刘鲁 《计算机工程与应用》 CSCD 北大核心 2003年第24期1-4,36,共5页
文章研究了两个基本的关联规则推导关系,在此基础上建立了最大频繁集的关联规则矩阵视图,把一个频繁集生成的所有规则全部展现在一个矩阵中,并通过研究矩阵中的各规则元素的关系,得到一个频繁集或规则矩阵的基集和核(即最小规则集),可... 文章研究了两个基本的关联规则推导关系,在此基础上建立了最大频繁集的关联规则矩阵视图,把一个频繁集生成的所有规则全部展现在一个矩阵中,并通过研究矩阵中的各规则元素的关系,得到一个频繁集或规则矩阵的基集和核(即最小规则集),可以从大型事务数据库生成的大量关联规则中挖掘出最小规则集和有用户感兴趣的规则。 展开更多
关键词 关联规则 数据挖掘 二次挖掘 算法 最大频繁 矩阵视图 事务数据库
在线阅读 下载PDF
数据挖掘中关联规则的规范化描述 被引量:4
9
作者 郑晶晶 朱建平 《统计与信息论坛》 2006年第1期93-96,共4页
文章针对现有数据挖掘的书籍及文献中的关联规则的一些定义进行了剖析,指出其定义式不一致的原因,并在此基础上从集合和概率角度进行了规范化,提出了两个新的描述方式,为深入研究关联规则的理论及应用奠定了一定的基础。
关键词 数据挖掘 关联规则 事务 统计描述
在线阅读 下载PDF
一种新的关联规则增量式更新算法 被引量:12
10
作者 朱玉全 汪晓刚 《计算机工程》 CAS CSCD 北大核心 2002年第4期25-27,共3页
首先提出了一个新的概念—后备频繁项目集,其次给出了一种新的增量式更新算法NEWFUP,最后介绍了在某中小型商业企业的事务数据库中该算法的实现。
关键词 关联规则 事务数据库 频繁项目 后备频繁项目 增量式更新算法 数据挖掘
在线阅读 下载PDF
基于时序和兴趣度约束的加权关联规则挖掘算法研究 被引量:5
11
作者 杨泽民 《计算机科学》 CSCD 北大核心 2013年第3期259-262,共4页
为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约... 为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约束函数和剪枝定理进行事务集化简,然后根据支持度和k-支持期望进行加权频繁事务集抽取,最后依据置信度进行加权关联规则导出。实验结果证明,该算法能够快速有效地挖掘出符合用户兴趣度的关联规则。 展开更多
关键词 加权关联规则 时序挖掘 支持度 兴趣度约束 频繁事务
在线阅读 下载PDF
SAT-TC:基于关联的层次文档聚类 被引量:1
12
作者 李曲 龙昊 《计算机科学》 CSCD 北大核心 2004年第7期178-180,共3页
在一篇文档中,一个单词可以看作是一个项目,一组单词就是一个项目集。在以往的基于关联的文本聚类方法中,都是将一整篇文档看作是一个事务来挖掘频繁项目集和关联规则的。但是实际上,一篇文档中的基本语义单位是句子。在同一个句子中同... 在一篇文档中,一个单词可以看作是一个项目,一组单词就是一个项目集。在以往的基于关联的文本聚类方法中,都是将一整篇文档看作是一个事务来挖掘频繁项目集和关联规则的。但是实际上,一篇文档中的基本语义单位是句子。在同一个句子中同时出现的一组词在语义上或多或少都是相互关联的,与分布在多个句子中的同一组词相比,前者要有意义得多。因此,基于以上发现,我们考虑将文档中的每一个句子看作是一个事务。一篇文档就被看作是一个事务的集合,并由此提出了一种新的文本聚类方法:SAT—TC。通过在标准测试集上的实验证明,SAT-TC要优于传统的文本聚类算法。 展开更多
关键词 SAT-TC 关联 层次文档聚类 频繁项目 句子关联事务 聚簇
在线阅读 下载PDF
基于同步频繁树的时间序列关联规则分析 被引量:6
13
作者 李海林 龙芳菊 《智能系统学报》 CSCD 北大核心 2021年第3期502-510,共9页
针对经典算法Apriori和频繁模式增长算法(frequent pattern growth, FP-growth)不能直接对时间序列数据进行关联规则挖掘的问题,提出一种同步频繁树算法(synchronize frequent tree, SFT)。利用时间序列的时间属性具有一维性的特点,定... 针对经典算法Apriori和频繁模式增长算法(frequent pattern growth, FP-growth)不能直接对时间序列数据进行关联规则挖掘的问题,提出一种同步频繁树算法(synchronize frequent tree, SFT)。利用时间序列的时间属性具有一维性的特点,定义趋势项-位置表示法表示时间序列数据,将首条时间序列构建成一棵基础树,通过计算树叶子节点与列表项的信息交集,可判断其是否与该树枝中的所有节点构成频繁K项集。在SFT算法中,用趋势项-位置表示的数据内存占用情况要优于原始数据,并且在挖掘过程中不会产生候选频繁项集,使得算法在整个挖掘过程中表现出较好的时间性能。基于商品数据和股票数据的数值实验表明,SFT算法所得结果不仅与其他5种对比算法的结果一致,在各量级的数据和不同的支持度计数中,其时间复杂度都要优于对比算法。 展开更多
关键词 时间序列 线性分段 趋势项-位置 事务表示 频繁项 同步频繁树 关联规则 时间效率
在线阅读 下载PDF
基于格论的关联规则挖掘算法的研究
14
作者 蒋震 葛垚 +1 位作者 黄剑 文俊浩 《计算机科学》 CSCD 北大核心 2005年第8期158-160,共3页
本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法... 本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法进行了比较,实验结果表明,在特定的数据库中,改进的算法在挖掘效率上优于 Apriori算法。 展开更多
关键词 数据挖掘 关联规则 候选项 频繁项 闭项 格论 闹项 关联规则挖掘算法 Apriori算法 事务数据库
在线阅读 下载PDF
移动数据库中数据复制同步处理策略的研究 被引量:6
15
作者 王瑞峰 张小花 张迎春 《计算机工程与应用》 CSCD 北大核心 2016年第1期61-65,共5页
同步技术是保证复制移动数据库系统一致性的一项关键技术,鉴于目前移动复制同步技术存在通讯数据量大,存储空间消耗多,尤其是在网络带宽下降时,不能及时更新客户端的数据,导致移动事务执行失败等缺陷。通过UTLRSP(Union Transaction-Lev... 同步技术是保证复制移动数据库系统一致性的一项关键技术,鉴于目前移动复制同步技术存在通讯数据量大,存储空间消耗多,尤其是在网络带宽下降时,不能及时更新客户端的数据,导致移动事务执行失败等缺陷。通过UTLRSP(Union Transaction-Level Result-Set Propagation,关联事务结果集)复制同步模型结合数据广播技术,并利用基于优先级的增量更新算法实现客户端与中心数据库服务器的数据同步处理。实验结果表明,与两级复制机制相比,UTLRSP模型将事务作相关联处理,且只保存事务结果,有效降低了存贮空间的消耗,减小了同步过程中通讯数据量;基于优先级的增量更新算法根据数据新鲜度排列优先级,保证在无线网络带宽下降时新鲜度最高的数据先传输,提高了数据的传输效率、动态新鲜度以及客户端的可扩展性。 展开更多
关键词 移动数据库 关联事务结果(utlrsp) 复制 同步 冲突处理 动态新鲜度
在线阅读 下载PDF
一种基于人工免疫的新的频繁项挖掘算法 被引量:1
16
作者 王评 陈国龙 《计算机科学》 CSCD 北大核心 2005年第8期155-157,共3页
以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个... 以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个基于人工免疫的新频繁项集挖掘算法。本文详细介绍了算法设计等。新算法的复杂度与支持度,数据库总容量有关。验证实验的结果与其他算法相比较证明了该算法的可行性、有效性和完备性。 展开更多
关键词 免疫算法 频繁项 支持度 关联规则 挖掘算法 人工免疫 事务数据库 候选项 算法设计 候选项目
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部