-
题名计算支持度和置信度的上下界
被引量:10
- 1
-
-
作者
路松峰
卢正鼎
-
机构
华中理工大学计算机学院应用系
-
出处
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第8期851-854,共4页
-
基金
:国防预研基金赞助
-
文摘
在对海量数据库进行关联规则开采时 ,项目集支持度和规则置信度的计算是一件十分耗时的工作 ,本文提出一种利用已知项目集的支持度信息来计算未知项目集支持度和规则置信度上下界的算法 ,可减少生成不必要的项目集 ,从而大大缩短数据开采的时间 .
-
关键词
数据开采
关联规则
支持度
置信度
数据库
-
Keywords
Data mining
Association rules
Support
Confidence
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名从关系数据库中快速发现候选关键字
被引量:1
- 2
-
-
作者
路松峰
卢正鼎
-
机构
华中理工大学计算机学院应用系
-
出处
《计算机工程与应用》
CSCD
北大核心
2000年第9期17-19,27,共4页
-
基金
该文得到国防预研基金!(94J3.4.2.J9W05)资助。
-
文摘
确定候选关键字是关系数据库的理论研究和应用设计中非常重要的问题,求解候选关键字是一个NP-完全问题。文章提出了一种快速求解候选关键字的算法,该算法利用关键字本身的属性,采用特殊的剪枝策略,可大大减少非关键字的生成,并显著地降低I/O时间和CPU时间,尤其是当候选关键字的维数较小时,可以急剧降低算法的复杂度。
-
关键词
候选关键字
关系数据库
支持度
NP-完全问题
-
Keywords
Candidate Key, Relational Database,Support, NP-Complete problem
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名加权关联规则的开采
被引量:27
- 3
-
-
作者
路松峰
胡和平
-
机构
华中理工大学计算机学院应用系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2001年第3期347-350,共4页
-
基金
国防预研基金! (94J3 .4.2 .J9W0 5 )赞助
-
文摘
关联规则可以揭示数据之间隐含的关系 ,并已在许多领域取得了广泛的应用 .目前已经提出了许多有效发现关联规则的算法 ,这些算法都认为每个数据对规则的重要性相同 .但在实际应用中 ,用户更关心近期发生的数据 ,即历史越久远的数据对规则的影响应该越小 ,应当削弱这些数据对规则的影响 ,为此 ,本文提出了垂直加权关联规则的问题 ;另外 ,用户有时可能希望加强或削弱某些项目对规则的影响 ,即所谓的水平加权关联规则 .最后 ,提出了混合加权关联规则的问题 ,并给出了一个解决该问题的算法 MWAL,实验证明了 MWAL
-
关键词
数据开采
关联规则
加权
数据库
-
Keywords
Data mining
Association rules
Weight
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名有效地检索HTML文档
被引量:23
- 4
-
-
作者
刘芳
卢正鼎
-
机构
华中理工大学计算机学院应用系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2000年第9期986-988,共3页
-
基金
:国防预研基金赞助
-
文摘
WWW上的资源大多以 HTML 格式的文档存储 ,同普通文档不同 ,HTML 文档的标签特性使得它具有一定的结构 .我们采取了一种检索方法 ,它扩展了传统的信息检索 ,利用 HTML文档结构提高了在 WWW环境下的检索效率 .本文介绍了 HTML的结构以及传统的向量空间信息检索 ;提出运用聚簇方法为标签分组 ;最后详细讨论了如何利用文档结构扩展加权框架 ,使得检索词能更贴切地描述文档 ,以提高检索的准确性 .
-
关键词
信息检索
向量空间模型
聚簇
HTML文档
WWW
-
Keywords
WWW HTML
Information retrieval
Vector space model
Clustering
-
分类号
G354.4
[文化科学—情报学]
-
-
题名快速开采意外的规则
被引量:5
- 5
-
-
作者
路松峰
卢正鼎
-
机构
华中理工大学计算机学院应用系
-
出处
《计算机工程与应用》
CSCD
北大核心
2000年第5期21-23,共3页
-
基金
国防预研基金!(94J3.4.2.J9W05)
-
文摘
数据开采研究的主要任务就是发现数据集合中隐含的规则,发现的规则分为常规性规则和意外规则。由于意外规则的支持度很小,因而常常被人们忽略,然而意外规则代表了知识的另外一面,非常有用。文章提出一种快速有效发现意外规则的算法,该算法允许规则的结果为合取范式。
-
关键词
数据开采
数据库
数据集合
意外规则
-
Keywords
Data mining
Exception
Support
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名数字属性的优化关联规则开采
被引量:2
- 6
-
-
作者
路松峰
胡和平
-
机构
华中理工大学计算机学院应用系
-
出处
《计算机工程与应用》
CSCD
北大核心
2000年第8期27-29,共3页
-
基金
国防预研基金!94J3.4.2.J9W05
-
文摘
关联规则揭示了关系表中属性之间潜在的联系,优化关联规则是发现特定属性间用户最感兴趣关系的一种有效途径。该文提出了一种基于数字属性的优化关税规则开采算法,该算法允许优化关联规则包含多维析取范式。
-
关键词
数据开采
优化
关联规则
数字属性
数据库
-
Keywords
data mining, optimized association rule, numeric attribute
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-