期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于Web日志的用户访问模式挖掘 被引量:15
1
作者 王新 马万青 潘文林 《计算机工程与应用》 CSCD 北大核心 2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词 web日志挖掘 访问模式 粗糙集 聚类
在线阅读 下载PDF
基于过滤器的Web访问模式挖掘 被引量:2
2
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第6期59-61,共3页
针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算... 针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算法。目前该方法已经广泛地应用于科学数据库系统中。 展开更多
关键词 数据挖掘 web日志 访问模式 频集
在线阅读 下载PDF
基于模糊粗糙近似的web浏览模式的聚类 被引量:3
3
作者 吴瑞 宁玉富 郭长友 《系统工程学报》 CSCD 北大核心 2010年第1期132-136,144,共6页
提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户... 提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户浏览模式被表示成等长的模糊向量的形式以表示该用户访问过的网页及网页上的浏览时间.最后使用粗糙近似的方法对这些表示用户浏览模式的模糊向量进行聚类.这种方法可以把具有相似浏览行为的用户聚成一类. 展开更多
关键词 web聚类 模糊变量 粗糙变量 用户浏览模式
在线阅读 下载PDF
一种基于粗糙集的Web用户访问规则获取方法 被引量:3
4
作者 张永 杨志勇 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期84-85,146,共3页
用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数... 用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数据预处理但可以获得简洁有效的访问模式。 展开更多
关键词 web访问模式 粗糙集 数据挖掘
在线阅读 下载PDF
基于粗糙近似的Web事务聚类方法研究
5
作者 申情 韩燮 蒋云良 《计算机工程与设计》 CSCD 北大核心 2007年第18期4469-4471,共3页
Web使用挖掘是数据挖掘技术在Web信息仓库中的应用。Web使用挖掘通过挖掘Web服务器日志获取的知识来预测用户浏览行为,是Web挖掘技术中的一个重要研究方向。通常发现的知识或一些意外规则很可能是不精确的、不完备的,这就需要用软计算... Web使用挖掘是数据挖掘技术在Web信息仓库中的应用。Web使用挖掘通过挖掘Web服务器日志获取的知识来预测用户浏览行为,是Web挖掘技术中的一个重要研究方向。通常发现的知识或一些意外规则很可能是不精确的、不完备的,这就需要用软计算技术如粗糙集来解决。提出一种基于粗糙近似的聚类方法,该方法能够实现从Web访问日志中聚类Web事务。通过这种方法可以有效地挖掘Web日志记录,从而发现用户存取Web页面的模式。 展开更多
关键词 web使用挖掘 粗糙集 web访问模式 相似上近似 事务聚类
在线阅读 下载PDF
以Web用户关联关系为属性的浏览模式聚类
6
作者 吴瑞 《计算机工程与应用》 CSCD 北大核心 2010年第30期20-22,共3页
在Web使用挖掘中,用户浏览模式的聚类结果有助于网站设计者理解Web用户的浏览特点和需要。设计了一种有效的Web浏览模式的聚类方法,网页是否被浏览及网页上的浏览时间反映了用户的浏览兴趣,它们被刻画成等长的用户浏览模式向量中的相应... 在Web使用挖掘中,用户浏览模式的聚类结果有助于网站设计者理解Web用户的浏览特点和需要。设计了一种有效的Web浏览模式的聚类方法,网页是否被浏览及网页上的浏览时间反映了用户的浏览兴趣,它们被刻画成等长的用户浏览模式向量中的相应分量,此外,浏览模式之间的关系被刻画并被作为属性加入到该向量中,形成扩展的用户浏览模式向量,对这些向量使用粗糙k-均值法可对用户浏览模式进行有效的聚类。实例和实验分析说明,使用该方法的聚类结果更合理。聚类结果可用于个性化网站的设计。 展开更多
关键词 用户浏览模式 web挖掘 聚类 粗糙集
在线阅读 下载PDF
基于WEKA平台的Web事务聚类算法的研究 被引量:5
7
作者 孟晓明 陈慧萍 张涛 《计算机工程与设计》 CSCD 北大核心 2009年第6期1332-1334,1338,共4页
Web上的数据规模大、动态性强,而通常发现的知识或规则很可能是不精确的、不完备的,为了克服以上困难,将粗糙集概念引入到Web挖掘中,进行Web事务聚类。介绍了将粗糙近似算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能... Web上的数据规模大、动态性强,而通常发现的知识或规则很可能是不精确的、不完备的,为了克服以上困难,将粗糙集概念引入到Web挖掘中,进行Web事务聚类。介绍了将粗糙近似算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能,扩充了WEKA系统的聚类算法,并对嵌入的算法进行了分析、测试。粗糙近似算法方法能够实现从Web访问日志中聚类Web事务,并且该算法对分类属性的数据具有很高的准确率。 展开更多
关键词 粗糙集 web挖掘 粗糙近似 事务聚类 相似上近似 WEKA平台
在线阅读 下载PDF
并行分布式的Web访问模式双层聚类 被引量:4
8
作者 贾晓莉 吴瑞 吴思颖 《计算机工程与应用》 CSCD 北大核心 2019年第23期216-221,264,共7页
Web日志挖掘可以通过对用户访问模式进行分析,以获取用户的访问兴趣程度。目前,大多数的web日志挖掘是基于频率的,其挖掘的信息没有太大的价值。而提出的聚类技术是基于访问时间的,使用模糊向量表示用户浏览模式,记录用户是否浏览过该... Web日志挖掘可以通过对用户访问模式进行分析,以获取用户的访问兴趣程度。目前,大多数的web日志挖掘是基于频率的,其挖掘的信息没有太大的价值。而提出的聚类技术是基于访问时间的,使用模糊向量表示用户浏览模式,记录用户是否浏览过该页面以及停留的时间。通过不同的聚类方法对用户的访问序列进行聚类分析。将模糊粗糙k-均值和夹角余弦相结合,提出了一种双层聚类技术,减少了对初始聚类中心的敏感性,并且通过一系列实验,论证了该聚类方法的可行性。而且,实验通过使用Davies-Bouldin指标来验证不同聚类方法的效果并进行比较。由于数据量大时,仍然存在算法效率低的问题,因此,使用MapReduce实现双层聚类的并行化,提高了聚类的效率。 展开更多
关键词 web挖掘 模糊粗糙聚类 web访问模式 夹角余弦 并行
在线阅读 下载PDF
关联规则和聚类分析在个性化推荐中的应用 被引量:18
9
作者 鲍玉斌 王大玲 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第12期1149-1152,共4页
提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测... 提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测度进行了比较·实验表明,将聚类分析作为关联规则的预处理的推荐方法可以显著地提高推荐的准确率,而将关联规则和聚类分析互补使用的推荐方法具有较高的推荐覆盖率·同时发现将聚类分析和关联规则结合使用并不能同时改善推荐的准确率和覆盖率· 展开更多
关键词 web使用挖掘 页面关联规则 访问模式聚类 个性化推荐 web挖掘
在线阅读 下载PDF
基于双层聚类方法的网页推荐模型 被引量:6
10
作者 吴瑞 《系统工程学报》 CSCD 北大核心 2013年第2期265-270,共6页
研究web用户访问模式的聚类问题,提出了双层的用户访问模式的聚类方法.第一层采用简单易实现的LVQ(学习向量量化)神经网络方法对日志中的用户访问模式进行简单聚类,在第二层的聚类中,采用加权的模糊c-均值的方法对第一层的聚类结果进行... 研究web用户访问模式的聚类问题,提出了双层的用户访问模式的聚类方法.第一层采用简单易实现的LVQ(学习向量量化)神经网络方法对日志中的用户访问模式进行简单聚类,在第二层的聚类中,采用加权的模糊c-均值的方法对第一层的聚类结果进行聚类.最后根据聚类结果产生描述该类用户行为的加权访问模式,并以此作为网页推荐依据.实验结果验证了该算法的有效性和可行性. 展开更多
关键词 web挖掘 web聚类 用户访问模式 模糊C-均值
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部