期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
电子商务与Web数据挖掘 被引量:47
1
作者 邹显春 谢中 周彦晖 《计算机应用》 CSCD 北大核心 2001年第5期21-23,共3页
在电子商务中 ,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘 ,了解客户的访问行为 ,从而调整站点结构、市场策略等 ,使电子商务活动具有针对性。
关键词 电子商务 INTERNET web 数据挖掘 数据源
在线阅读 下载PDF
Web挖掘技术研究 被引量:21
2
作者 张蓉 《计算机工程》 EI CAS CSCD 北大核心 2006年第15期4-6,共3页
随着互联网的飞速发展,Web挖掘技术已成为数据挖掘技术的一个研究热点。该文对Web挖掘的特点、方法进行了讨论,设计了一种快速有效的Web文档聚类方法,给出了实际测试结果,验证了Web挖掘技术的有效性。提出的Web挖掘技术有效地提高了该... 随着互联网的飞速发展,Web挖掘技术已成为数据挖掘技术的一个研究热点。该文对Web挖掘的特点、方法进行了讨论,设计了一种快速有效的Web文档聚类方法,给出了实际测试结果,验证了Web挖掘技术的有效性。提出的Web挖掘技术有效地提高了该系统的协作能力。 展开更多
关键词 web挖掘 日志文件 文档聚类 矢量空间模型 关联规则
在线阅读 下载PDF
Web用户聚类中访问路径差异性度量方法的研究
3
作者 牛晓晨 王劲松 邢高峰 《计算机应用与软件》 CSCD 北大核心 2013年第3期196-199,共4页
用户访问路径是Web用户聚类时度量用户兴趣度的参数之一。结合日志记录的特点,从参数的数学特征出发,设计一种基于二进制数表示的访问路径矩阵来度量用户的兴趣度,并给出新的相异度矩阵构造法。实验表明,所提出的访问路径矩阵是可行的,... 用户访问路径是Web用户聚类时度量用户兴趣度的参数之一。结合日志记录的特点,从参数的数学特征出发,设计一种基于二进制数表示的访问路径矩阵来度量用户的兴趣度,并给出新的相异度矩阵构造法。实验表明,所提出的访问路径矩阵是可行的,生成的相异度矩阵在表现用户访问路径差异上是准确的。 展开更多
关键词 web用户聚类 访问路径矩阵 相异度矩阵 日志文件
在线阅读 下载PDF
Hadoop平台下的并行Web日志挖掘算法 被引量:6
4
作者 周诗慧 殷建 《计算机工程》 CAS CSCD 2013年第6期43-46,共4页
当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈。针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件。实验结果表明,该算... 当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈。针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件。实验结果表明,该算法的加速比能随着数据集的增大而提高,其执行效率优于串行FP-growth算法。 展开更多
关键词 Hadoop框架 web挖掘 web日志 MapReduce编程模式 HADOOP分布式文件系统 并行FP-growth算法
在线阅读 下载PDF
基于SQL的频繁项目集的研究 被引量:4
5
作者 王涛伟 胡锡伟 柴本成 《计算机工程与设计》 CSCD 北大核心 2006年第23期4494-4497,共4页
Apriori算法是关联规则中挖掘频繁项目集的典型算法。在Apriori算法的基础上,利用关系数据库管理系统的强大功能和SQL语言操作简单,效率高的特点,提出了基于SQL的Apriori算法。该算法实现简单快速,可有效缩小扫描数据库的大小。将该算... Apriori算法是关联规则中挖掘频繁项目集的典型算法。在Apriori算法的基础上,利用关系数据库管理系统的强大功能和SQL语言操作简单,效率高的特点,提出了基于SQL的Apriori算法。该算法实现简单快速,可有效缩小扫描数据库的大小。将该算法应用于经过数据预处理的Web日志文件数据库,实验结果显示该算法是有效的。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 SQL 数据预处理 web日志文件
在线阅读 下载PDF
基于Bayes概率的用户兴趣发现 被引量:3
6
作者 李晓丽 杜振龙 +1 位作者 李明 余冬梅 《计算机工程与科学》 CSCD 2003年第5期17-19,26,共4页
本文结合网页结构,充分考虑用户在网页的滞留时间和页面切换,基于Bayes概率提出了一种能挖掘出优良的用户兴趣迁移模式及感兴趣的页面。采用本文提出的思想及算法,再结合人工智能策略,将能更好地辅助网站设计,并为电子商务的决策提供充... 本文结合网页结构,充分考虑用户在网页的滞留时间和页面切换,基于Bayes概率提出了一种能挖掘出优良的用户兴趣迁移模式及感兴趣的页面。采用本文提出的思想及算法,再结合人工智能策略,将能更好地辅助网站设计,并为电子商务的决策提供充分依据。 展开更多
关键词 网页结构 Bayes概率 用户兴趣发现 电子商务
在线阅读 下载PDF
一种基于ExLF日志文件的用户会话识别启发式算法 被引量:4
7
作者 冯林 何明瑞 罗芬 《计算机应用》 CSCD 北大核心 2005年第2期314-316,共3页
在详细介绍ExLF日志文件格式的基础上,定义了会话表;阐述了用户会话识别图的概念;给出了生成此会话识别图的一种启发式算法。最后,用一个例子验证了算法的有效性。
关键词 EXLF日志文件格式 web挖掘 用户会话识别图
在线阅读 下载PDF
面向服务工作流补偿机制的研究与实现 被引量:3
8
作者 张华 王茜 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第1期40-46,共7页
为了解决面向服务工作流中异常的动态补偿问题,在传统工作流异常处理理论的基础上,结合Web Services的事务处理的特点,提出了基于工作流执行日志实施补偿的策略.补偿过程包括补偿判断、补偿路线产生和补偿行为调用,异常管理器控制补偿... 为了解决面向服务工作流中异常的动态补偿问题,在传统工作流异常处理理论的基础上,结合Web Services的事务处理的特点,提出了基于工作流执行日志实施补偿的策略.补偿过程包括补偿判断、补偿路线产生和补偿行为调用,异常管理器控制补偿的执行过程.因为服务具有动态调用、动态执行特点,异常管理器需要在业务运行时依据工作流基本模式和事务依赖关系确定补偿范围,动态生成补偿路线并调用相应的补偿操作.为了验证补偿策略的可行性和正确性,实现了基于Web Services的原型系统WFCF.实验表明,该机制在失效补偿范围和补偿行为调用2个方面提高了工作流异常恢复的效率. 展开更多
关键词 工作流异常 补偿机制 执行日志 回滚 web服务
在线阅读 下载PDF
基于server session约束的序列模式增长挖掘研究 被引量:1
9
作者 蔡宏果 元昌安 +2 位作者 罗锦光 张增银 石亚冰 《郑州大学学报(理学版)》 CAS 北大核心 2010年第1期24-28,共5页
在WUM(Web Usage Mining)中挖掘序列模式的背景下,提出了一种基于server session约束的序列模式增长挖掘算法.首先,为了更好地从网站服务器日志文件中挖掘模式和发现知识,提出了一种基于server session的服务器日志文件格式.同时,引入基... 在WUM(Web Usage Mining)中挖掘序列模式的背景下,提出了一种基于server session约束的序列模式增长挖掘算法.首先,为了更好地从网站服务器日志文件中挖掘模式和发现知识,提出了一种基于server session的服务器日志文件格式.同时,引入基于server session的约束概念,利用其能够减少初始序列模式和候选项集大小的特点来减少每次扫描后缀数据库的规模,再从预处理后的日志文件中挖掘WUM的频繁访问路径的序列模式.最后通过实验证明了算法的有效性和优越性. 展开更多
关键词 序列模式 服务器日志文件 服务器会话 web使用挖掘 数据挖掘
在线阅读 下载PDF
基于网络爬虫技术的数字资源检测软件的设计与实现 被引量:13
10
作者 王思敏 尹伊秋 +1 位作者 宣静雯 马冲 《现代电子技术》 北大核心 2019年第10期132-135,共4页
数字资源受网络状态的影响故障频发,图书馆作为高校信息文化的传播中心,做好资源的保障工作意义重大。文中设计实现一种基于爬虫技术的数字资源自动监测系统。该系统利用日志文件替代数据库软件,降低软件复杂度;利用爬虫技术及正则解析... 数字资源受网络状态的影响故障频发,图书馆作为高校信息文化的传播中心,做好资源的保障工作意义重大。文中设计实现一种基于爬虫技术的数字资源自动监测系统。该系统利用日志文件替代数据库软件,降低软件复杂度;利用爬虫技术及正则解析,获取监测URL的状态值和数据库定制名称,监测结果通过邮件自动发送给所有管理员。实验结果表明,该系统具有较好的扩展性能,在任何网络坏境和IP地址下,均能准确进行检测,对运行环境要求低,稳定性好,无需人工操作。 展开更多
关键词 数字资源 自动监测 网络爬虫 日志文件 正则解析 检测软件
在线阅读 下载PDF
基于UAP-T的网络日志挖掘技术在电子商务中的应用 被引量:1
11
作者 罗隽 魏品帅 贺贵明 《计算机应用》 CSCD 北大核心 2003年第5期55-57,共3页
在电子商务中,从大量的数据中挖掘出有意义的用户访问模式,进而划分客户群体和发现潜在的客户,对电子商务公司有着重要的意义。在WAP tree算法的基础上提出了改进的UAP T(useraccesspatterntree)算法,并根据该算法提出了一个有效的基于... 在电子商务中,从大量的数据中挖掘出有意义的用户访问模式,进而划分客户群体和发现潜在的客户,对电子商务公司有着重要的意义。在WAP tree算法的基础上提出了改进的UAP T(useraccesspatterntree)算法,并根据该算法提出了一个有效的基于Web日志挖掘的应用方案,分析了该方案在电子商务中的应用。 展开更多
关键词 web挖掘 电子商务 服务器日志文件 UAP-T 用户访问模式
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部