-
题名Web数据挖掘中的可信数据来源
被引量:1
- 1
-
-
作者
鲍宇
曾国荪
管红杰
-
机构
同济大学计算机科学及技术系
中国矿业大学计算机科学与技术学院
嵌入式系统与服务计算教育部重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2009年第4期211-214,共4页
-
基金
863项目(2007AA01Z425)
973计划前期研究专项(2007CB316502)
+1 种基金
国家自然基金项目(60673157)
中国矿业大学青年基金(OD4544)资助
-
文摘
从大量Web信息中获取有用的信息是Web数据挖掘的关键问题。如何评价Web信息是否可信,现在主要方法是通过BadRank算法进行内容评测,或是通过链接权重进行相关引用数计算。可信数据来源是数据挖掘的前提,在基于关键词的数据挖掘中,通过评价挖掘所涉及的不同数据域,以及数据域自身的可信性,对在不同域所获得的挖掘数据给以权重,从而对挖掘结果的序列产生影响,提高挖掘算法在获取可信结果方面的效率。并通过试验测试了可信域评价的效果。
-
关键词
web数据挖掘
web可信数据
数据挖掘
-
Keywords
web data mining,web trusted data,Data mining
-
分类号
TP338
[自动化与计算机技术—计算机系统结构]
-