期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
存储系统中的频繁访问模式挖掘
1
作者 朱旭东 卜庆忠 +2 位作者 柯剑 那文武 许鲁 《高技术通讯》 EI CAS CSCD 北大核心 2009年第7期699-705,共7页
研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支... 研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支裁剪和分支聚类方法来过滤噪音,对实际系统工作负载的模拟结果显示,Z-Miner指导的预取可以使缓存失效率降低40%~66%,平均响应时间降低26%~66%。相对经典挖掘方法,Z-Miner的挖掘开销有1~2个数量级的下降,而预取优化效果提高了1倍。 展开更多
关键词 频繁访问模式 数据块关系 序列模式挖掘 聚类 预取
在线阅读 下载PDF
Web挖掘中基于RD_Apriori算法发现用户频繁访问模式 被引量:5
2
作者 陈敏 欧阳一鸣 刘红樱 《微电子学与计算机》 CSCD 北大核心 2005年第5期4-7,共4页
从Web日志数据中发现用户的频繁访问模式,可分为两步进行。首先把经过预处理后的日志数据转换为最大前向引用的集合,然后使用Apriori算法挖掘出频繁访问模式。本文针对挖掘的第二步提出了一种基于缩减数据库(ReducedDatabase)的RD_Apri... 从Web日志数据中发现用户的频繁访问模式,可分为两步进行。首先把经过预处理后的日志数据转换为最大前向引用的集合,然后使用Apriori算法挖掘出频繁访问模式。本文针对挖掘的第二步提出了一种基于缩减数据库(ReducedDatabase)的RD_Apriori算法,此算法能够准确、高效地挖掘各种长度不同的频繁访问模式。 展开更多
关键词 WEB挖掘 访问模式 频繁访问模式 相邻访问模式 连续度 相邻访问模式
在线阅读 下载PDF
Web挖掘中基于交集算法发现用户频繁访问模式
3
作者 郭维 欧阳一鸣 郭骏 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第12期1511-1515,共5页
文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个... 文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个候选频繁访问模式的支持度计数;经理论分析和试验证明,交集算法具有一定的理论意义和应用价值。 展开更多
关键词 WEB日志挖掘 类Apriori算法 交集算法 最大前向引用 频繁访问模式
在线阅读 下载PDF
结合DL-safe规则发现日志本体频繁模式的方法 被引量:1
4
作者 孙明 陈波 周明天 《电子学报》 EI CAS CSCD 北大核心 2010年第2期376-381,共6页
为发现语义Web使用记录中所蕴含的有效信息,本文提出了一种挖掘日志本体频繁Web访问模式的方法.该方法引入应用访问规则集和观察集分别表示日志信息动态变化的语义规则和使用事实,并在DL安全的限定下将日志本体和应用访问规则集相结合... 为发现语义Web使用记录中所蕴含的有效信息,本文提出了一种挖掘日志本体频繁Web访问模式的方法.该方法引入应用访问规则集和观察集分别表示日志信息动态变化的语义规则和使用事实,并在DL安全的限定下将日志本体和应用访问规则集相结合构成一个推理过程可判定的混合知识库.在此基础上,利用日志本体中事件整分关系的语义构建访问模式学习的事务模型,并采用ILP的方法学习生成频繁用户访问模式树,解决了推理访问模式中非描述逻辑原子的问题.实验结果表明该方法的可用性和有效性. 展开更多
关键词 语义网使用挖掘 日志本体 频繁Web访问模式 DL-safe规则 归纳逻辑编程
在线阅读 下载PDF
Web日志中时态约束浏览模式挖掘算法研究 被引量:3
5
作者 宁慧 李红宇 吴培莲 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第9期1474-1480,共7页
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事... 为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值. 展开更多
关键词 WEB日志挖掘 频繁访问模式 有效时间
在线阅读 下载PDF
一种Web事务识别的新模型及其频繁路径挖掘 被引量:1
6
作者 战立强 刘大昕 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2005年第6期758-762,共5页
针对已有Web事务识别模型的缺点,提出一种识别Web事务的新模型———IPRC模型.该模型根据主索引页上的引用以及文档目录结构将网页分类,并以此作为识别Web事务的依据.在此基础上提出了一种挖掘频繁访问模式的算法WDHP,该算法继承了DHP... 针对已有Web事务识别模型的缺点,提出一种识别Web事务的新模型———IPRC模型.该模型根据主索引页上的引用以及文档目录结构将网页分类,并以此作为识别Web事务的依据.在此基础上提出了一种挖掘频繁访问模式的算法WDHP,该算法继承了DHP算法使用hash树过滤候选集以及裁剪数据库的基本方法,并以访问路径树的方式将数据库存储于内存,在内存中完成后继的挖掘,不仅减少了扫描数据库的次数,而且大大降低了算法的时间复杂性.实验表明WDHP算法不仅优于DHP算法,而且也优于典型的基于内存的WAP算法. 展开更多
关键词 频繁访问模式 AP-树 hash-表
在线阅读 下载PDF
基于Web使用数据挖掘的个性化推荐系统设计 被引量:1
7
作者 何洁 《数字技术与应用》 2012年第7期141-142,共2页
Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐... Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐系统架构。它包括三个方面:数据预处理、频繁访问路径挖掘及在线推荐。 展开更多
关键词 个性化服务 WEB使用挖掘 频繁访问模式 在线推荐
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部