-
题名基于时间戳间距的用户在线时长聚类方法
- 1
-
-
作者
叶倩
高明
田亮亮
韦雨萌
刘翼
-
机构
延安大学教务处
延安大学数学与计算机科学学院
-
出处
《现代电子技术》
北大核心
2024年第16期47-50,共4页
-
基金
国家自然科学基金项目(62262067)
国家自然科学基金项目(61962059)
+3 种基金
陕西省教育厅自然科学专项(22JK0622)
延安市科技计划项目(2022SLGYGG-007)
陕西教育教学改革研究项目(23BY071)
延安大学教学改革重点项目(YDJGZD22-02)。
-
文摘
在网络用户行为分析中,以时序维度为基础,研究用户网络行为的变化趋势,提出并挖掘更多有价值的信息,可为管理或商业决策提供有力支持。为此,文中提出一种基于时间戳间距的用户在线时长聚类方法,以用户访问日志文件中时间戳之间的间距作为特征,首先将获取的日志数据进行预处理,获得用户的在线时长统计;然后采用K-Means聚类算法对用户进行聚类,并使用轮廓系数对K值进行评价分析,确定聚类K值范围,准确判定用户单次访问在线时长及类型。采用真实校园网用户访问日志数据对所提方法进行评价,实验结果表明,该方法的准确度达到0.9180,精确度达到0.7685,召回率达到0.8093。
-
关键词
用户在线时长
用户聚类
K-MEANS聚类算法
数据预处理
时间戳间距
轮廓系数
-
Keywords
user online duration
user clustering
K-Means clustering algorithm
data preprocessing
timestamp interval
silhouette coefficient
-
分类号
TN929.5-34
[电子电信—通信与信息系统]
TP393
[自动化与计算机技术—计算机应用技术]
-