期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
挖掘频繁波动的Web访问模式算法研究
1
作者 朱志国 邓贵仕 《大连理工大学学报》 EI CAS CSCD 北大核心 2009年第2期282-287,共6页
考虑到Web访问数据的动态特性,给出了一个从Web访问日志历史演变中挖掘频繁波动的Web访问模式的方法.首先采用无序树结构表示用户历史访问页面序列集合,然后给出了频繁波动Web访问模式的详细定义以及挖掘算法描述,最后,根据数据集中访... 考虑到Web访问数据的动态特性,给出了一个从Web访问日志历史演变中挖掘频繁波动的Web访问模式的方法.首先采用无序树结构表示用户历史访问页面序列集合,然后给出了频繁波动Web访问模式的详细定义以及挖掘算法描述,最后,根据数据集中访问序列的大小和数量变化对于算法扩展性和性能的影响进行了实验.结果表明,该算法具备良好扩展性的同时,能够比较高效地提取出频繁波动的Web访问模式. 展开更多
关键词 数据挖掘 web使用挖掘 web访问模式 动态数据挖掘
在线阅读 下载PDF
并行分布式的Web访问模式双层聚类 被引量:4
2
作者 贾晓莉 吴瑞 吴思颖 《计算机工程与应用》 CSCD 北大核心 2019年第23期216-221,264,共7页
Web日志挖掘可以通过对用户访问模式进行分析,以获取用户的访问兴趣程度。目前,大多数的web日志挖掘是基于频率的,其挖掘的信息没有太大的价值。而提出的聚类技术是基于访问时间的,使用模糊向量表示用户浏览模式,记录用户是否浏览过该... Web日志挖掘可以通过对用户访问模式进行分析,以获取用户的访问兴趣程度。目前,大多数的web日志挖掘是基于频率的,其挖掘的信息没有太大的价值。而提出的聚类技术是基于访问时间的,使用模糊向量表示用户浏览模式,记录用户是否浏览过该页面以及停留的时间。通过不同的聚类方法对用户的访问序列进行聚类分析。将模糊粗糙k-均值和夹角余弦相结合,提出了一种双层聚类技术,减少了对初始聚类中心的敏感性,并且通过一系列实验,论证了该聚类方法的可行性。而且,实验通过使用Davies-Bouldin指标来验证不同聚类方法的效果并进行比较。由于数据量大时,仍然存在算法效率低的问题,因此,使用MapReduce实现双层聚类的并行化,提高了聚类的效率。 展开更多
关键词 web挖掘 模糊粗糙聚类 web访问模式 夹角余弦 并行
在线阅读 下载PDF
Web用户访问模式挖掘 被引量:1
3
作者 王熙照 王丽娟 +1 位作者 袁方 湛燕 《河北大学学报(自然科学版)》 CAS 2002年第4期404-409,共6页
随着网站内容的不断丰富和访问量的增加 ,网站结构变得越来越复杂 ,导致信息获取和推送都比较困难 .将数据挖掘技术应用于用户访问模式 ,形成了Web访问模式挖掘 .Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息 ,据此可以形... 随着网站内容的不断丰富和访问量的增加 ,网站结构变得越来越复杂 ,导致信息获取和推送都比较困难 .将数据挖掘技术应用于用户访问模式 ,形成了Web访问模式挖掘 .Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息 ,据此可以形成关联规则、序列模式、聚类模式和分类模式等 4类信息 ,这对于优化站点结构、为不同类别的用户提供个性化服务 ,有效地实现信息获取和信息推送是非常必要的 .Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题 ,结合研究工作 ,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述 . 展开更多
关键词 数据挖掘 web日志 web访问模式挖掘 数据源 数据预处理 模式挖掘
在线阅读 下载PDF
面向Web活跃用户的树型访问模式挖掘算法
4
作者 贝毅君 陈刚 董金祥 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第6期1005-1013,1140,共10页
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAP-BUM).AUSM扫描一遍日志数据即可挖掘Web... 传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAP-BUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析. 展开更多
关键词 web使用挖掘 web访问模式 web日志 活跃用户 频繁子树
在线阅读 下载PDF
基于MFP方法的Web用户访问模式的模式发现
5
作者 吕橙 魏楚元 张瀚韬 《计算机应用》 CSCD 北大核心 2007年第3期565-569,共5页
针对Web用户访问模式问题,采用最大频繁访问路径(MFP)方法可以挖掘出更有普遍意义的模式。给出一种新的用户访问模式树WUAP-tree结构,并采用E-OEM模型,综合考虑了页面拓扑结构及用户浏览路径等多个数据源,进一步提出了一种Web访问模式... 针对Web用户访问模式问题,采用最大频繁访问路径(MFP)方法可以挖掘出更有普遍意义的模式。给出一种新的用户访问模式树WUAP-tree结构,并采用E-OEM模型,综合考虑了页面拓扑结构及用户浏览路径等多个数据源,进一步提出了一种Web访问模式挖掘算法WUAP-mine。该算法不用产生候选集和递归,只对事务数据库进行一次扫描,对WUAP-tree结构进行深度优先遍历一次,就可从WUAP-tree结构上直接查询出Web用户频繁访问模式。最后,从理论和实践上推导和验证了它的有效性和高效性。 展开更多
关键词 web用户访问模式 最大频繁访问路径方法 点击流
在线阅读 下载PDF
一种基于图结构挖掘WEB用户访问模式的方法 被引量:3
6
作者 张素兰 杨炳儒 范艳梅 《计算机工程与应用》 CSCD 北大核心 2004年第12期37-39,共3页
挖掘Web用户访问模式常用的技术有Web挖掘特有的路径分析技术和数据挖掘领域的传统技术。文章首先分析了现有路径分析技术的不足,然后从Web用户访问模式挖掘过程预处理的结果用户会话文件开始,提出了一种基于Web拓扑结构(图结构)挖掘用... 挖掘Web用户访问模式常用的技术有Web挖掘特有的路径分析技术和数据挖掘领域的传统技术。文章首先分析了现有路径分析技术的不足,然后从Web用户访问模式挖掘过程预处理的结果用户会话文件开始,提出了一种基于Web拓扑结构(图结构)挖掘用户访问模式的方法,提高了发现模式的精确性和效率,并在实验室对该方法进行了简单实现和实际日志数据的测试。 展开更多
关键词 web用户访问模式 数据挖掘 web拓扑结构
在线阅读 下载PDF
一种基于粗糙集的Web用户访问规则获取方法 被引量:3
7
作者 张永 杨志勇 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期84-85,146,共3页
用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数... 用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数据预处理但可以获得简洁有效的访问模式。 展开更多
关键词 web访问模式 粗糙集 数据挖掘
在线阅读 下载PDF
基于区域特征分布式Web用户兴趣迁移模式
8
作者 张克君 杨炳儒 +2 位作者 章小莉 宋泽锋 陈卓 《系统工程与电子技术》 EI CSCD 北大核心 2008年第10期1995-1998,共4页
提出一种基于区域特征的分布式Web用户兴趣迁移模式挖掘模型DWICP,以及基于该模型的具有区域特征的用户识别方法和局部浏览兴趣迁移模式更新算法/全局浏览兴趣迁移模式更新算法,用于发现具有区域特征的用户浏览兴趣迁移模式。实验表明,... 提出一种基于区域特征的分布式Web用户兴趣迁移模式挖掘模型DWICP,以及基于该模型的具有区域特征的用户识别方法和局部浏览兴趣迁移模式更新算法/全局浏览兴趣迁移模式更新算法,用于发现具有区域特征的用户浏览兴趣迁移模式。实验表明,该方法能够较好地解决分布式环境下Web访问行为模式研究中的区域分析需求,同时提高了用户浏览兴趣表示的准确性。 展开更多
关键词 分布式数据挖掘 兴趣迁移模式 web访问模式挖掘 区域特征
在线阅读 下载PDF
用户访问模式挖掘中数据预处理问题的研究 被引量:9
9
作者 邓英 李明 《计算机工程与应用》 CSCD 北大核心 2002年第1期188-190,共3页
首先给出了用户访问模式挖掘的概念,然后主要对用户访问模式挖掘中的数据预处理工作中碰到的一些问题及对这些问题的解决方法进行了较为详细的描述。
关键词 web挖掘 web用户访问模式挖掘 数据预处理
在线阅读 下载PDF
结合DL-safe规则发现日志本体频繁模式的方法 被引量:1
10
作者 孙明 陈波 周明天 《电子学报》 EI CAS CSCD 北大核心 2010年第2期376-381,共6页
为发现语义Web使用记录中所蕴含的有效信息,本文提出了一种挖掘日志本体频繁Web访问模式的方法.该方法引入应用访问规则集和观察集分别表示日志信息动态变化的语义规则和使用事实,并在DL安全的限定下将日志本体和应用访问规则集相结合... 为发现语义Web使用记录中所蕴含的有效信息,本文提出了一种挖掘日志本体频繁Web访问模式的方法.该方法引入应用访问规则集和观察集分别表示日志信息动态变化的语义规则和使用事实,并在DL安全的限定下将日志本体和应用访问规则集相结合构成一个推理过程可判定的混合知识库.在此基础上,利用日志本体中事件整分关系的语义构建访问模式学习的事务模型,并采用ILP的方法学习生成频繁用户访问模式树,解决了推理访问模式中非描述逻辑原子的问题.实验结果表明该方法的可用性和有效性. 展开更多
关键词 语义网使用挖掘 日志本体 频繁web访问模式 DL-safe规则 归纳逻辑编程
在线阅读 下载PDF
基于粗糙近似的Web事务聚类方法研究
11
作者 申情 韩燮 蒋云良 《计算机工程与设计》 CSCD 北大核心 2007年第18期4469-4471,共3页
Web使用挖掘是数据挖掘技术在Web信息仓库中的应用。Web使用挖掘通过挖掘Web服务器日志获取的知识来预测用户浏览行为,是Web挖掘技术中的一个重要研究方向。通常发现的知识或一些意外规则很可能是不精确的、不完备的,这就需要用软计算... Web使用挖掘是数据挖掘技术在Web信息仓库中的应用。Web使用挖掘通过挖掘Web服务器日志获取的知识来预测用户浏览行为,是Web挖掘技术中的一个重要研究方向。通常发现的知识或一些意外规则很可能是不精确的、不完备的,这就需要用软计算技术如粗糙集来解决。提出一种基于粗糙近似的聚类方法,该方法能够实现从Web访问日志中聚类Web事务。通过这种方法可以有效地挖掘Web日志记录,从而发现用户存取Web页面的模式。 展开更多
关键词 web使用挖掘 粗糙集 web访问模式 相似上近似 事务聚类
在线阅读 下载PDF
Web使用信息挖掘综述 被引量:50
12
作者 郭岩 白硕 于满泉 《计算机科学》 CSCD 北大核心 2005年第1期1-7,共7页
Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术... Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术与困难,Web使用信息挖掘中常用的方法和算法,以及主要应用。 展开更多
关键词 数据挖掘 web挖掘 web使用信息挖掘 web用户访问模式 数据预处理 模式发现
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部