-
题名Web-Logs中连续频繁访问路径的快速挖掘算法
被引量:6
- 1
-
-
作者
曹忠升
唐曙光
杨良聪
-
机构
华中科技大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2006年第1期216-219,共4页
-
文摘
研究了如何从W eb-Logs中高效挖掘出连续频繁访问路径,提出了一种快速有效的OB-M ine算法。该算法借助于访问路径树进行挖掘,只需扫描一次数据库,且通过构建频繁1-项集pi的HBP-树,能一次性挖掘出以pi为后缀的频繁访问路径,简化了挖掘过程,实验表明在执行效率上要优于WAP算法。
-
关键词
频繁访问路径
连续频繁访问路径
访问路径树
-
Keywords
frequent access path
continuous frequent access path
WAP-Tree
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名Web日志中RCFA路径的挖掘方法
- 2
-
-
作者
许晓东
李柯
朱士瑞
-
机构
南京理工大学计算机科学与技术学院
江苏大学网络中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第22期55-57,共3页
-
基金
江苏省教育厅高校科学研究基金资助项目(03KJD520073)
-
文摘
研究从Web日志中快速挖掘出可重复连续频繁访问路径的方法。针对现有挖掘算法存在的一些问题,将矩阵应用于挖掘过程中,给出CA矩阵的概念,并利用该矩阵来挖掘可重复连续挖掘频繁访问路径,从而无需多次扫描数据库,避免产生庞大的中间项,从一定程度上简化了挖掘过程。实验表明该算法的准确性和高效性。
-
关键词
WEB日志
连续频繁访问路径
CA矩阵
中间项
-
Keywords
Web log
continiuous frequent access path
Continuous Access(CA) matrix
intermediate item
-
分类号
TP393.07
[自动化与计算机技术—计算机应用技术]
-