期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
一个简单的Web日志挖掘系统 被引量:22
1
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
Web日志中挖掘用户浏览模式的研究 被引量:34
2
作者 施建生 伍卫国 +2 位作者 陆丽娜 Yang Yiling 杨怡玲 《西安交通大学学报》 EI CAS CSCD 北大核心 2001年第6期621-624,共4页
研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web... 研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web日志中抽取频繁遍历路径 . 展开更多
关键词 数据挖掘 web挖掘 用户浏览模式
在线阅读 下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
3
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 web日志挖掘 阈值 序列模式识别 IA^x算法
在线阅读 下载PDF
Web日志与浏览行为结合下的用户浏览兴趣数据挖掘分析 被引量:8
4
作者 李珊 刘继超 邵芬红 《现代电子技术》 北大核心 2017年第5期22-25,共4页
针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特... 针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特征提取和Qo S预测;然后采用Web日志与用户浏览行为结合的行为调度模式自适应检索用户浏览网页的兴趣特征点,实现语义特征匹配,达到用户浏览兴趣模式数据挖掘的目的;最后通过仿真实验实现性能验证。结果表明,该方法的用户浏览兴趣特征点的匹配度高,数据挖掘精度得到提升,展示了优越性能。 展开更多
关键词 web日志 用户浏览行为 兴趣模式 数据挖掘
在线阅读 下载PDF
一种基于Web日志用户浏览模式的数据挖掘 被引量:2
5
作者 徐红 张建喜 +1 位作者 朱旭刚 张永军 《信息技术与信息化》 2009年第1期40-42,共3页
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题。本文研究了Web日志挖掘的机理,在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频... Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题。本文研究了Web日志挖掘的机理,在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。 展开更多
关键词 web 日志用户 数据挖掘 数据库系统 计算机网络
在线阅读 下载PDF
面向Web活跃用户的树型访问模式挖掘算法
6
作者 贝毅君 陈刚 董金祥 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第6期1005-1013,1140,共10页
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAP-BUM).AUSM扫描一遍日志数据即可挖掘Web... 传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAP-BUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析. 展开更多
关键词 web使用挖掘 web访问模式 web日志 活跃用户 频繁子树
在线阅读 下载PDF
基于决策树的web模式挖掘框架研究
7
作者 林芳 《煤炭技术》 CAS 北大核心 2010年第11期188-190,共3页
分析了决策树的基本算法,作为数据挖掘的关键算法之一,决策树可以很好的实现模式的分类。结合WEB应用,给出了WEB模式挖掘和分类的具体框架,对相关人员有较好的参考价值。
关键词 数据挖掘 web 决策树 智能系统 模式识别
在线阅读 下载PDF
基于Web日志的序列模式挖掘应用研究
8
作者 王燕 《信息技术》 2009年第9期12-15,共4页
首先分析了序列模式挖掘算法——类Apriori算法,然后重点介绍了如何对Web服务产生的大量日志数据进行收集、预处理,并基于类Apriori算法对Web日志进行分析,发现新模式,为优化网站建设提供有价值数据。
关键词 数据挖掘 序列模式 类Aprior算法 web服务器日志
在线阅读 下载PDF
Web挖掘中基于交集算法发现用户频繁访问模式
9
作者 郭维 欧阳一鸣 郭骏 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第12期1511-1515,共5页
文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个... 文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个候选频繁访问模式的支持度计数;经理论分析和试验证明,交集算法具有一定的理论意义和应用价值。 展开更多
关键词 web日志挖掘 类Apriori算法 交集算法 最大前向引用 频繁访问模式
在线阅读 下载PDF
一种基于用户访问模式优化网站结构的算法 被引量:5
10
作者 冯洁 陶宏才 《微电子学与计算机》 CSCD 北大核心 2007年第7期122-124,共3页
提出一种算法,通过挖掘Web日志中的关联规则,发现用户访问兴趣间的关联度和站点拓扑结构的不一致,并结合网站既有的拓扑结构,对于通常在用户的某次浏览过程中同时被访问,但在网站拓扑中相距较远的内容页面集,增加页面间的直接链接,最终... 提出一种算法,通过挖掘Web日志中的关联规则,发现用户访问兴趣间的关联度和站点拓扑结构的不一致,并结合网站既有的拓扑结构,对于通常在用户的某次浏览过程中同时被访问,但在网站拓扑中相距较远的内容页面集,增加页面间的直接链接,最终实现网站系统结构的调整、优化,提高网站的访问效能。 展开更多
关键词 数据挖掘 web日志 用户访问模式 关联规则 网站结构
在线阅读 下载PDF
基于最大频繁序列模式树的个性化页面推荐 被引量:2
11
作者 谭小球 姚敏 顾沈明 《微电子学与计算机》 CSCD 北大核心 2006年第9期108-111,共4页
提出一种基于最大频繁序列模式的页面推荐技术,由于考虑了用户会话的页面访问顺序,比一些不考虑页面访问顺序的推荐技术有更高的准确率。通过引入一树型结构,其上压缩存储了所有最大频繁序列,由于前缀相同的序列共享共同的树结点,从而... 提出一种基于最大频繁序列模式的页面推荐技术,由于考虑了用户会话的页面访问顺序,比一些不考虑页面访问顺序的推荐技术有更高的准确率。通过引入一树型结构,其上压缩存储了所有最大频繁序列,由于前缀相同的序列共享共同的树结点,从而大大节省了存储空间。推荐引擎截取用户活动会话中最近被访问的页面子序列,与树的部分路径进行匹配,无需在整个模式库中搜索相同或相似的模式,加快模式匹配的速度,更好地满足页面推荐的实时要求。实验证明,方法是有效的。 展开更多
关键词 最大频繁序列模式 个性化推荐 web使用挖掘 页面关联规则
在线阅读 下载PDF
基于网页日志的频繁模式挖掘 被引量:1
12
作者 沈明 邓玉芬 张博 《现代电子技术》 2010年第9期180-183,186,共5页
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供... 频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。 展开更多
关键词 模式挖掘 序列挖掘 图形挖掘 网页日志挖掘
在线阅读 下载PDF
基于滑动窗口的浏览模式挖掘算法
13
作者 李玉霞 李红宇 《科技通报》 北大核心 2012年第2期149-151,共3页
Web日志中包含了大量的用户浏览信息,如何有效地从中挖掘出用户浏览模式就尤为重要了。本文在分析现有用户浏览模式挖掘算法存在问题的基础上,根据Web日志的特点,对关联规则挖掘算法进行改进,提出了基于滑动窗口的浏览模式挖掘算法TBPM... Web日志中包含了大量的用户浏览信息,如何有效地从中挖掘出用户浏览模式就尤为重要了。本文在分析现有用户浏览模式挖掘算法存在问题的基础上,根据Web日志的特点,对关联规则挖掘算法进行改进,提出了基于滑动窗口的浏览模式挖掘算法TBPM。并在此算法基础上设计了增量更新算法,对实际数据的实验结果验证了本算法的有效性。 展开更多
关键词 web日志挖掘 滑动窗口 浏览模式 增量更新
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部