-
题名Web使用挖掘数据预处理中的会话构造
被引量:11
- 1
-
-
作者
欧阳一鸣
汪曦东
郭骏
刘红樱
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第25期148-151,共4页
-
基金
合肥工业大学科研发展基金项目资助(编号:030503F)
-
文摘
文章主要论述了在Web使用挖掘数据预处理中如何构造用户与网站之间的会话。首先,根据对Web服务器日志数据格式的分析,对会话概念进行了形式化描述;然后在分析目前会话构造方法的基础上,利用基于时间和引用的启发式方法来构造会话;最后依据评估会话构造方法的标准,通过实验对给出的新会话构造方法与其他方法进行了分析比较。
-
关键词
WEB使用挖掘
数据预处理
会话构造
-
Keywords
Web usage mining,data preprocessing,session construction
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名Web会话构造中基于多窗口的路径补充
被引量:2
- 2
-
-
作者
黄金晶
赵雷
杨季文
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
2009年第7期46-47,51,共3页
-
基金
高等学校博士学科点专项科研基金(20060285008)
-
文摘
在W eb会话识别中,传统的路径补充算法仅考虑了点击"后退"按钮造成日志记录的不连续性。针对此问题,提出基于多窗口的路径补充思想,并结合确定的有限自动机(DFA)来实现该算法。对于用户从新窗口打开页面,异步并发访问网站时造成日志记录的不连续,该算法能避免按"后退"方式进行路径补充,而是采用多窗口方式。通过实例验证了该方法比传统路径补充算法更能准确地反映用户实际的访问路径。
-
关键词
WEB使用挖掘
会话构造
路径补充
多窗口
-
Keywords
Web usage mining
Session reconstruction
Path supplement
Multi window
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
TP274.2
[自动化与计算机技术—检测技术与自动化装置]
-