期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用 被引量:6
1
作者 姬浩博 王俊红 《计算机科学》 CSCD 北大核心 2016年第1期25-29,共5页
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接... 序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。 展开更多
关键词 序列模式挖掘 web日志挖掘 prefixspan算法
在线阅读 下载PDF
改进的PrefixSpan算法在Web挖掘中的应用 被引量:2
2
作者 谢清森 杨天奇 《科学技术与工程》 2009年第23期7176-7179,共4页
针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在... 针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。 展开更多
关键词 web挖掘 prefixspan算法 序列模式
在线阅读 下载PDF
一种基于日志分析的Web负载测试方法 被引量:8
3
作者 朱靖君 吴海燕 +1 位作者 高国柱 程志锐 《计算机工程》 CAS CSCD 北大核心 2010年第23期25-27,共3页
提出一种基于日志分析的Web负载测试方法。通过序列模式挖掘得到用户访问的频繁序列模式,日志分析得到负载的相关参数,并据此构造出逼近于真实的测试负载。利用性能测试工具LoadRunner对Web应用系统进行负载测试。将测试日志与真实日志... 提出一种基于日志分析的Web负载测试方法。通过序列模式挖掘得到用户访问的频繁序列模式,日志分析得到负载的相关参数,并据此构造出逼近于真实的测试负载。利用性能测试工具LoadRunner对Web应用系统进行负载测试。将测试日志与真实日志进行对比,验证了测试负载与真实负载的相似性。 展开更多
关键词 日志分析 负载测试 序列模式挖掘 prefixspan算法
在线阅读 下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
4
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 web日志挖掘 阈值 序列模式识别 IA^x算法
在线阅读 下载PDF
基于改进的AprioriAll算法的Web序列模式挖掘研究 被引量:5
5
作者 吴海燕 朱靖君 +1 位作者 高国柱 程志锐 《计算机工程与设计》 CSCD 北大核心 2010年第5期921-924,1034,共5页
为了减少AprioriAll算法挖掘过程中候选序列的生成以及对序列数据库的扫描次数,提高算法的挖掘效率,提出了一种基于改进的AprioriAll算法的Web序列模式挖掘方法。首先对数据进行预处理,然后利用经过改进的AprioriAll算法进行模式挖掘。... 为了减少AprioriAll算法挖掘过程中候选序列的生成以及对序列数据库的扫描次数,提高算法的挖掘效率,提出了一种基于改进的AprioriAll算法的Web序列模式挖掘方法。首先对数据进行预处理,然后利用经过改进的AprioriAll算法进行模式挖掘。算法的改进主要有两点:一个通过改变候选序列的连接方式来减少候选序列的产生;二是通过减少不必要的数据库扫描操作来提高算法的效率。通过实验验证了改进后算法在Web序列模式挖掘过程中的高效性和正确性。 展开更多
关键词 AprioriAll算法 序列模式 web日志挖掘 事务 最大向前路径
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
6
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 prefixspan算法 web日志挖掘
在线阅读 下载PDF
一种基于改进的AprioriAll算法的Web路径模式挖掘 被引量:4
7
作者 司应硕 杨世平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期172-175,共4页
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。
关键词 路径模式挖掘 web数据挖掘 大引用序列 AprioriAll算法
在线阅读 下载PDF
基于用户特性的Web会话模式聚类算法 被引量:2
8
作者 郑富兰 吴瑞 《计算机应用与软件》 CSCD 北大核心 2014年第2期283-286,共4页
Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differ... Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。 展开更多
关键词 web挖掘 web用户聚类 聚类算法 模式聚类 K-MEANS
在线阅读 下载PDF
Web挖掘中基于GITC算法发现用户频繁访问模式 被引量:1
9
作者 欧阳一鸣 郭维 +1 位作者 郭骏 孙超超 《计算机工程与应用》 CSCD 北大核心 2007年第7期191-194,共4页
用户频繁访问模式的发现是Web日志挖掘的重要研究内容。提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发... 用户频繁访问模式的发现是Web日志挖掘的重要研究内容。提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发现用户频繁访问模式。 展开更多
关键词 web日志挖掘 类Apriori算法 交集关系 最大前向引用 频繁访问模式
在线阅读 下载PDF
视频目标轨迹分析的改进PrefixSpan方法 被引量:2
10
作者 袁和金 《计算机工程与应用》 CSCD 北大核心 2011年第32期7-10,58,共5页
从序列模式挖掘的角度对视频目标运动轨迹的分析和应用问题进行了研究,提出了一种基于改进PrefixSpan的频繁轨迹模式挖掘算法,并给出了基于所挖掘的频繁模式进行在线目标运动异常检测的方法。该方法对目标的运动轨迹进行量化编码,采用... 从序列模式挖掘的角度对视频目标运动轨迹的分析和应用问题进行了研究,提出了一种基于改进PrefixSpan的频繁轨迹模式挖掘算法,并给出了基于所挖掘的频繁模式进行在线目标运动异常检测的方法。该方法对目标的运动轨迹进行量化编码,采用改进的PrefixSpan算法挖掘其中连续出现的频繁模式,通过字符串近似匹配的方法来检测当前运动轨迹所表示的目标行为是否异常。由于不需要计算两两轨迹之间的相似性,该方法可以应用于规模较大、分布模式数目难以确定场合下的视频目标轨迹分析问题。对仿真和真实场景的实验验证了该方法的有效性。 展开更多
关键词 轨迹模式 序列模式挖掘 prefixspan算法
在线阅读 下载PDF
基于会话分类的Web用户访问模式挖掘研究
11
作者 吴海燕 朱靖君 +1 位作者 高国柱 程志锐 《小型微型计算机系统》 CSCD 北大核心 2010年第9期1784-1789,共6页
随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础... 随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础上分别对3类用户的访问模式进行挖掘.通过会话分类可以提高挖掘的效率与准确性.其中重点研究了人类用户的访问模式挖掘,提出一种基于用户访问路径树的事务识别方法,并对PrefixSpan算法进行了改进.这套方法在实验中取得了很好的挖掘效果. 展开更多
关键词 web挖掘 会话分类 访问模式 序列模式 prefixspan
在线阅读 下载PDF
恶意代码检测中的PrefixSpan算法应用 被引量:3
12
作者 王丽娜 谭小彬 +1 位作者 潘剑锋 奚宏生 《计算机工程》 CAS CSCD 北大核心 2010年第7期119-121,共3页
结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码... 结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码行为序列库中挖掘关联规则,专家系统将获取的主机行为与规则匹配,从而达到检测恶意行为的目的。实验结果证明了该算法的正确性和有效性。 展开更多
关键词 恶意代码检测 基于行为检测 序列模式挖掘 prefixspan算法 投影数据库
在线阅读 下载PDF
Hadoop平台下的并行Web日志挖掘算法 被引量:6
13
作者 周诗慧 殷建 《计算机工程》 CAS CSCD 2013年第6期43-46,共4页
当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈。针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件。实验结果表明,该算... 当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈。针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件。实验结果表明,该算法的加速比能随着数据集的增大而提高,其执行效率优于串行FP-growth算法。 展开更多
关键词 Hadoop框架 web挖掘 web日志 MapReduce编程模式 HADOOP分布式文件系统 并行FP-growth算法
在线阅读 下载PDF
一种应用于推荐系统的Web挖掘算法:AIR算法 被引量:1
14
作者 张涛 丁二玉 骆斌 《计算机工程与应用》 CSCD 北大核心 2008年第1期168-170,201,共4页
针对互联网站点信息海量和结构复杂的趋势,推荐系统被用来协助互联网用户方便快捷地找到所需信息,培养用户忠诚度。Web挖掘技术在处理海量数据和稀疏数据上有着先天的优势,所以Web挖掘技术在推荐系统中得到了越来越广泛的研究和应用。基... 针对互联网站点信息海量和结构复杂的趋势,推荐系统被用来协助互联网用户方便快捷地找到所需信息,培养用户忠诚度。Web挖掘技术在处理海量数据和稀疏数据上有着先天的优势,所以Web挖掘技术在推荐系统中得到了越来越广泛的研究和应用。基于Web挖掘的推荐系统所使用的主要技术有聚类、关联规则、序列模式等等。然而,这些技术往往不能在推荐的准确性和覆盖范围方面做到两全。综合这几种技术,取其优点去其缺点,提出了一种新的算法(AIR算法)。通过基于实际使用数据的详尽的实验评估,可以证明该算法能够在准确性和覆盖范围方面明显提高推荐系统的整体性能。 展开更多
关键词 web挖掘 推荐系统 关联规则 序列模式 聚类算法 AIR算法
在线阅读 下载PDF
基于改进的Wap算法的Web序列模式的研究 被引量:1
15
作者 王慧 张骏温 《计算机科学》 CSCD 北大核心 2012年第2期206-208,239,共4页
序列模式挖掘是Web日志挖掘中的一个重要范畴。针对Wap算法中递归构建大量条件树的这一缺陷,提出了一种改进算法NGCWAP。NGCWAP算法采用前序遍历号和后序遍历号来跟踪频繁序列分布在哪些后缀树集中,避免了条件树的构建,从而减少了内存... 序列模式挖掘是Web日志挖掘中的一个重要范畴。针对Wap算法中递归构建大量条件树的这一缺陷,提出了一种改进算法NGCWAP。NGCWAP算法采用前序遍历号和后序遍历号来跟踪频繁序列分布在哪些后缀树集中,避免了条件树的构建,从而减少了内存消耗。通过实验验证了改进算法的正确性和高效性。 展开更多
关键词 数据挖掘 web日志挖掘 Wap算法 频繁序列
在线阅读 下载PDF
改进PrefixSpan的行为轨迹数据挖掘算法 被引量:6
16
作者 陈万志 赵帅 +1 位作者 方圆 王天元 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2023年第4期506-512,共7页
针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题,提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征,采用... 针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题,提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征,采用具有轨迹数据预处理的SMM(statistical mobility model)算法,通过分段合并和自适应调整方法去除异常数据,解决轨迹数据存在大量pingpong效应的问题。采用频繁项集逆序挖掘序列模式,通过已挖掘序列模式集迭代去除冗余项集得到待挖掘序列模式集,缩短扫描候选数据库时间。数据集测试结果表明:SMM算法预处理后,原始数据库数据规模减小;通过对比可知,TDM-PrefixSpan算法能够有效降低时间复杂度,提升挖掘效率。 展开更多
关键词 轨迹模型 prefixspan算法 pingpong效应 序列模式 投影数据库
在线阅读 下载PDF
Web挖掘中基于交集算法发现用户频繁访问模式
17
作者 郭维 欧阳一鸣 郭骏 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第12期1511-1515,共5页
文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个... 文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个候选频繁访问模式的支持度计数;经理论分析和试验证明,交集算法具有一定的理论意义和应用价值。 展开更多
关键词 web日志挖掘 类Apriori算法 交集算法 最大前向引用 频繁访问模式
在线阅读 下载PDF
NPLWAP:一种新的Web序列模式挖掘算法
18
作者 林维仲 张东站 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第1期25-31,共7页
Web序列模式挖掘是将数据挖掘技术应用于Web访问序列,通过对Web访问序列的模式挖掘可以发现用户与网站交互的频繁模式,利用这些模式可以建模并分析用户与网站交互的模型,进而预测未来的访问模式,这对于构建智能化Web站点和开展电子商务... Web序列模式挖掘是将数据挖掘技术应用于Web访问序列,通过对Web访问序列的模式挖掘可以发现用户与网站交互的频繁模式,利用这些模式可以建模并分析用户与网站交互的模型,进而预测未来的访问模式,这对于构建智能化Web站点和开展电子商务活动有非常重要的意义.介绍了传统的PLWAP(position coded preorder linked WAPtree)算法,并在此基础上提出了一种对PLWAP算法中Header table的新的构建方法的改进算法(NPLWAP).在NPL-WAP算法中Header table的构建过程中每一步都只基于当前处理的节点的后缀树集,且Header table并不存储所有的后缀树集节点,而是只存储后缀树集根节点,从而减少挖掘过程的相关判断.通过对真实数据的实验对比可以看出NPLWAP算法在运行时间上比传统的PLWAP算法有了很大的改进. 展开更多
关键词 web数据挖掘 序列模式 PLWAP-tree NPLWAP
在线阅读 下载PDF
基于属性相关和时间约束的PrefixSpan算法 被引量:1
19
作者 李春媚 蔡平良 《计算机工程》 CAS CSCD 北大核心 2008年第23期176-177,180,共3页
针对计算机入侵检测中网络安全审计数据的特点,提出一个改进的PrefixSpan算法,引入时间约束和属性相关的特征指导挖掘,应用M矩阵和Apriori特性减少投影数据库的数量,并缩减投影数据库规模,提高了序列模式挖掘的效率和有用性。通过检测... 针对计算机入侵检测中网络安全审计数据的特点,提出一个改进的PrefixSpan算法,引入时间约束和属性相关的特征指导挖掘,应用M矩阵和Apriori特性减少投影数据库的数量,并缩减投影数据库规模,提高了序列模式挖掘的效率和有用性。通过检测一个网络审计记录的实验,进行结果分析。 展开更多
关键词 序列模式挖掘 prefixspan算法 入侵检测
在线阅读 下载PDF
基于序列模式挖掘的读者借阅行为分析 被引量:12
20
作者 陈春颖 熊拥军 《图书情报知识》 CSSCI 北大核心 2011年第4期92-96,共5页
针对图书馆读者借阅事务中存在的序列特征,提出一种基于序列模式挖掘的读者借阅行为分析方法,其思想是通过将借阅事务转化为序列数据库,基于PrefixSpan算法来识别读者借阅行为序列模式。以某高校图书馆读者借阅事务数据为例,通过序列模... 针对图书馆读者借阅事务中存在的序列特征,提出一种基于序列模式挖掘的读者借阅行为分析方法,其思想是通过将借阅事务转化为序列数据库,基于PrefixSpan算法来识别读者借阅行为序列模式。以某高校图书馆读者借阅事务数据为例,通过序列模式挖掘实验表明,此方法可有效获取读者借阅行为的时序规律,其结果在图书馆信息服务中具有一定的应用价值。 展开更多
关键词 序列模式 读者借阅行为 prefixspan算法 数据挖掘
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部