期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
中文微博数据净化算法比较研究
1
作者 邹鸿程 周刚 +1 位作者 杨亚强 李旭东 《计算机工程》 CAS CSCD 2012年第20期41-44,48,共5页
针对微博语言口语化和不规范导致微博数据质量低下的问题,利用质心、度-中心值和特征向量-中心值3种算法对微博话题数据进行净化,从而提高数据质量。通过比较净化前后话题帖子的规范性、相关性和有益性等属性指标分析算法性能。实验结... 针对微博语言口语化和不规范导致微博数据质量低下的问题,利用质心、度-中心值和特征向量-中心值3种算法对微博话题数据进行净化,从而提高数据质量。通过比较净化前后话题帖子的规范性、相关性和有益性等属性指标分析算法性能。实验结果表明,经过3种净化算法处理,话题帖子的整体质量尤其是规范性指标均有所提高,质心算法对于有益性指标有较好的净化效果,度-中心值和特征向量-中心值算法有助于得到强相似度的话题帖子。 展开更多
关键词 微博 质量指标 过滤 中心值 数据净化
在线阅读 下载PDF
浅论数据抽取、净化和转换工具 被引量:13
2
作者 朱焱 《计算机应用》 CSCD 2000年第4期1-3,共3页
选择怎样的ECT(Extraction ,Cleanup ,Transformation)工具将是每个数据仓库构建者不可避免的问题。本文重点介绍ECT工具的类型 ,工作机理及它们之间的区别 ,一些著名商家的解决方法亦将作为例子给出。
关键词 数据仓库 数据抽取 数据净化 数据转换 软件工具
在线阅读 下载PDF
移动网管平台中数据仓库数据抽取、净化和集成
3
作者 熊丽荣 蔡家楣 +1 位作者 郑河荣 郭行波 《计算机应用研究》 CSCD 北大核心 2002年第4期140-141,共2页
将数据仓库运用到移动通信网络管理平台是当前比较受关注的一项技术。而数据抽取、净化和整合是数据仓库构建过程中最复杂的部分。
关键词 数据仓库 数据抽取 数据净化 数据整合 移动通信网络管理平台 数据集成
在线阅读 下载PDF
基于Web Log的数据预处理研究 被引量:4
4
作者 向坚持 陈晓红 +1 位作者 刘相滨 徐选华 《湖南师范大学自然科学学报》 EI CAS 北大核心 2004年第4期33-36,54,共5页
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、... Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法. 展开更多
关键词 WEB日志挖掘 数据预处理 基于Web WEB挖掘 日志文件 数据抽取 数据净化 过程 实际 实现方法
在线阅读 下载PDF
Web数据挖掘在高校教务考试中的应用 被引量:3
5
作者 黄永平 王健 《现代电子技术》 2009年第16期69-72,共4页
介绍Web数据挖掘概念的分类、校园内网络化考试考前练习中的数据资源以及校园网络化考试考前练习中Web数据挖掘的主要过程。将传统的数据挖掘与Web结合起来进行Web数据挖掘,通过此系统,可以大大简化传统的考试过程。实践证明,通过对学... 介绍Web数据挖掘概念的分类、校园内网络化考试考前练习中的数据资源以及校园网络化考试考前练习中Web数据挖掘的主要过程。将传统的数据挖掘与Web结合起来进行Web数据挖掘,通过此系统,可以大大简化传统的考试过程。实践证明,通过对学生平时练习的Web数据进行挖掘分析,可以更合理地控制网络化考试试题的难易程度,有利于进行个性化辅导以及有利于管理员维护试题库。 展开更多
关键词 WEB数据挖掘 日志挖掘 数据净化 数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部