期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
医院网站日志挖掘数据预处理的研究 被引量:1
1
作者 蒙华 苏静 +1 位作者 李立峰 翟玉兰 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第8期144-148,共5页
数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算... 数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算法输入的相似度矩阵。重点研究了医院网站日志的用户识别以及相似度矩阵的页面聚类标准化方法。实验结果表明:该方法极大降低了初始日志数据冗余度和维度,提高了预处理结果准确性,增强了数据挖掘算法输入的信息含量。 展开更多
关键词 医院网站日志挖掘 数据预处理 用户识别 页面聚类 相似度矩阵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部