-
题名不完整数据库中的数据挖掘
被引量:3
- 1
-
-
作者
印鉴
周祥福
杨敏
-
机构
中山大学计算机科学系
中山大学附属第三医院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第12期34-36,共3页
-
基金
国家自然科学基金资助项目(60205007)
广东省自然科学基金资助项目(031558
+3 种基金
04300462)
国家科技计划基金资助项目(2004BA721A02)
广东省科技计划基金资助项目(2003C50118)
广州市科技计划基金资助项目(2002Z3-E0017)
-
文摘
数据挖掘是从数据中提取有用知识的过程。在现实生活中,数据丢失的情况是很常见的,尤其是在商业数据库中,由于文件错误、纪录缺失、存储策略的改变等都会引起数据丢失而造成数据库的不完整。这种不完整性会影响关联规则的挖掘过程,因为在有数据缺失时对规则的支持度以及可信度的计算都得不到确定值。把Apriori算法应用于不完整数据库,基于期望支持度和期望可信度,给出了一个挖掘不完整事务数据库中关联规则的算法。
-
关键词
不完整数据库
数据挖掘
关联规则
期望支持度
期望可信度
-
Keywords
Incomplete database
Data mining
Association rules
Expected support
Expected confidence
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名不完整数据库中关联规则的评估
- 2
-
-
作者
朱绍文
熊伟
张大斌
肖毅
陈绪君
-
机构
华中师范大学电子与计算机研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第11期39-41,共3页
-
基金
清华大学智能技术与系统国家重点实验宝开放课题资助项目
-
文摘
介绍了不完整关系数据库中的关联规则,以及它的支持率和置信度的评估方法,并定义了它的期望支持率和期望置信度,这些定义保证了关联规则挖掘的某些必需的性质。
-
关键词
知识发现
数据挖掘
关联规则
不完整数据库
关系数据库
-
Keywords
Knowledge discovery
Data mining
Association rules
Incomplete database
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于代价模型的不一致XML数据修复启发式计算
被引量:1
- 3
-
-
作者
吴爱华
王先胜
谈子敬
汪卫
-
机构
复旦大学计算机信息与技术系
上海海事大学计算机科学系
-
出处
《软件学报》
EI
CSCD
北大核心
2009年第4期918-929,共12页
-
基金
国家自然科学基金No.60603043~~
-
文摘
在实际应用中,为不一致的XML文档计算最优修复意义重大.但求解最优修复是一个NP完全问题,特别是在XML文档同时违反函数依赖约束和主键约束时.提出一个基于代价模型的、可以在多项式时间内完成的启发式修复求解算法.该算法首先借助索引表,在一遍扫描原始XML文档的情况下寻找不一致数据集,然后为每一类约束的不一致数据集构造候选修复,同时计算其修复代价,最后启发式地求解一个代价最小的修复方案.实验结果表明,该算法的时间复杂度不超过冲突类的3次方,即便是在不一致数据量很大、噪声比例很大以及涉及多类语义约束时,也能较快地完成修复.
-
关键词
不一致性
不一致数据
修复
一致的查询回答
XML数据清洗
不完整数据库
-
Keywords
inconsistency
inconsistent data
repair
consistent answer
XML data cleaning
incomplete database
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-