期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
医院网站日志挖掘数据预处理的研究
被引量:
1
1
作者
蒙华
苏静
+1 位作者
李立峰
翟玉兰
《重庆理工大学学报(自然科学)》
CAS
北大核心
2019年第8期144-148,共5页
数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算...
数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算法输入的相似度矩阵。重点研究了医院网站日志的用户识别以及相似度矩阵的页面聚类标准化方法。实验结果表明:该方法极大降低了初始日志数据冗余度和维度,提高了预处理结果准确性,增强了数据挖掘算法输入的信息含量。
展开更多
关键词
医院网站日志挖掘
数据预处理
用户识别
页面聚类
相似度矩阵
在线阅读
下载PDF
职称材料
题名
医院网站日志挖掘数据预处理的研究
被引量:
1
1
作者
蒙华
苏静
李立峰
翟玉兰
机构
广西医科大学第一附属医院计算机管理中心
广西医科大学信息与管理学院教研科
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2019年第8期144-148,共5页
基金
广西高校科学研究技术项目(KY2015LX045)
广西医科大学青年科学基金资助项目(GXMUYSF201511)
文摘
数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算法输入的相似度矩阵。重点研究了医院网站日志的用户识别以及相似度矩阵的页面聚类标准化方法。实验结果表明:该方法极大降低了初始日志数据冗余度和维度,提高了预处理结果准确性,增强了数据挖掘算法输入的信息含量。
关键词
医院网站日志挖掘
数据预处理
用户识别
页面聚类
相似度矩阵
Keywords
hospital web log mining
data preprocessing
user identification
page clustering
similarity matrix
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
医院网站日志挖掘数据预处理的研究
蒙华
苏静
李立峰
翟玉兰
《重庆理工大学学报(自然科学)》
CAS
北大核心
2019
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部