-
题名兴趣度——关联规则的又一个阈值
被引量:91
- 1
-
-
作者
周欣
沙朝锋
朱扬勇
施伯乐
-
机构
复旦大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第5期627-633,共7页
-
基金
国家自然科学基金和国家"八六三"高技术研究发展计划基金资助!(项目编号 863 -3 0 6-ZT0 2 -0 5 -1)
-
文摘
关联规则的采掘是数据采掘研究的一个重要方面 .分析现有的关联规则采掘算法中所存在的问题 :首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响 ,因而导致知识表达功能的不够完善 ;其次是有可能一条规则即使可信度和支持度都很高 ,仍没有实际意义 ,甚至是误导性的 .因此对关联规则的形式定义作了修改 ,将运用差异思想引入的兴趣度阈值运用到关联规则中来 ,并给出其形式定义 .在分析了兴趣度的实际意义以后 ,讨论了兴趣度与概念层次的结合 .
-
关键词
数据采掘
关联规则
兴趣度
概念层次
阈值
数据
-
Keywords
data mining, association rules, interest measure, concept hierarchy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种量化关联规则挖掘算法
被引量:10
- 2
-
-
作者
佟强
周园春
吴开超
阎保平
-
机构
中国科学院计算技术研究所
中国科学院计算机网络信息中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第10期34-35,69,共3页
-
基金
国家"863"计划基金资助项目(2002AA104240)
中国科学院"十五"信息化建设重大基金资助项目(INF105-SDB)
-
文摘
提出了一种新的挖掘量化关联规则的方法。该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间。实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可能遗漏的重要的规则。
-
关键词
数据挖掘
量化关联规则
频集
聚类
-
Keywords
data mining
quantitative association rule
Frequent set
Cluster
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名数量关联规则发现中的聚类方法研究
被引量:26
- 3
-
-
作者
苑森淼
程晓青
-
机构
吉林工业大学计算机科学与工程系
吉林工业大学应用数学系
-
出处
《计算机学报》
EI
CSCD
北大核心
2000年第8期866-871,共6页
-
基金
国家自然科学基金!( 69873 0 19)
-
文摘
应用聚类方法研究了数量关联规则提取过程中的连续属性离散化问题 .由于现存的方法倾向于将支持度较高的区域划分为多个区间 ,对高偏数据效果不理想 .针对这一问题 ,提出聚类算法 PKCCA.与传统快速聚类不同 ,PKCCA在迭代过程中动态调整中心个数 ,避免造成过小支持度问题 。
-
关键词
数据挖掘
数量关联规则
聚类方法
数据库
-
Keywords
data mining, quantitative association rules, cluster algorithm, sample
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种多概念层数值关联规则采掘方法
被引量:2
- 4
-
-
作者
朱绍文
王泉德
黄浩
彭清涛
胡宏银
陆玉昌
-
机构
华中师范大学电子与计算机研究所
清华大学计算机科学与技术系
-
出处
《计算机科学》
CSCD
北大核心
2001年第2期104-107,共4页
-
基金
清华大学智能技术与系统
国家重点实验室开放课题资助项目
-
文摘
目前,数据采掘已成为人工智能、数据库等领域的重要研究课题.数据采掘是从大量的数据中自动高效地提取未知的、可用的、可信的、可理解的知识的数据处理新技术[1].为了便于理解,数据采掘的结果可以用人们熟悉的概念来表示.某一领域中的概念按其内涵和外延往往形成一定的关系.在数据采掘中,主要有概念格和概念层次两种描述这种关系的方法,概念格主要应用在数据采掘的粗糙集方法中[2],概念层次主要应用在多概念层布尔关联规则采掘[3,4]和面向属性的归纳方法[5]中.
-
关键词
数据采掘
数值关联规则
概念层
数据库
-
Keywords
data mining,quantitative association rule ,conceptual hierarchy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名用模糊方法挖掘量化关联规则
被引量:8
- 5
-
-
作者
孙建勋
陈绵云
张曙红
-
机构
华中科技大学控制科学与工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第18期190-192,共3页
-
基金
部委预研基金项目
-
文摘
量化关联规则挖掘的一个关键问题是对连续数量值属性的划分,论文采用模糊划分来解决这个问题,实现了数据的平滑过渡,并在此基础上给出了模糊量化关联规则的形式化定义和挖掘算法。
-
关键词
数据挖掘
量化关联规则
模糊方法
-
Keywords
data mining,quantitative association rules,Fuzzy method
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名量化关联规则的隐私保持挖掘方法
被引量:4
- 6
-
-
作者
陈子阳
马朝虹
李宇佳
刘国华
-
机构
燕山大学计算机科学与工程系
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第11期74-76,98,共4页
-
文摘
根据数据库中量化属性值和分类属性值数量的不同,分别提出了基于布尔关联规则的量化关联规则隐私保持挖掘方法和基于部分变换机制的量化关联规则隐私保持挖掘方法。对于每一种方法都进行了隐私度和正确度分析,并通过实验证明了其正确性和可行性。
-
关键词
量化关联规则
隐私保持
数据挖掘
-
Keywords
quantitative association rule
Privacy-preserving
data mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名多值属性关联规则挖掘的Q-Apriori算法
被引量:9
- 7
-
-
作者
姜丽莉
孟凡荣
周勇
-
机构
中国矿业大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第9期81-83,共3页
-
基金
国家自然科学基金资助项目(50674086)
江苏省博士后科学基金资助项目(0701045B)
中国矿业大学科技基金资助项目(2007B017)
-
文摘
针对Apriori算法进行多值属性关联规则挖掘时效率低下的问题,提出量化Apriori算法。利用多值属性数据特点改变项集存储格式,采用类似矩阵的数据结构存储项集,提高遍历数据库时统计计数的速度,使用类似矩阵的加法运算改进连接操作,减少无效候选项集的产生。实验结果表明,相比Apriori算法,该算法执行效率有较大提高。
-
关键词
关联规则
多值属性
数据挖掘
量化Apriori算法
-
Keywords
association rules
multivalue attribute
data mining
quantitative Apriori(Q-Apriori) algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名元规则指导下的逐步求精多层空间关联规则挖掘算法
被引量:10
- 8
-
-
作者
袁红春
熊范纶
-
机构
上海水产大学计算机学院
中国科学院合肥智能机械研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第8期34-36,39,共4页
-
基金
国家自然科学基金资助项目 (69835010)
上海水产大学校长基金资助项目
-
文摘
提出了元规则指导下逐步求精的多层空间关联规则挖掘算法,该算法采用了自顶向下、逐步求精以及元规则等技术。文章最后以挖掘农产品市场的芝麻价格与铁路、国道和河流间的空间关联关系为例,介绍此算法的应用。
-
关键词
空间数据挖掘
空间关联规则
元规则
概念树
-
Keywords
Spatial data mining
Spatial association rule
Meta-rule
Concept hierarchy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名关系表中数量联系规则的挖掘技术
被引量:5
- 9
-
-
作者
杨阳
范志新
张天戈
-
机构
复旦大学计算机系
-
出处
《计算机工程》
CAS
CSCD
北大核心
1998年第4期29-32,共4页
-
基金
国家自然科学基金
-
文摘
文章介绍了含有数量属性与类型属性的关系表中联系规则的挖掘问题.采用将数量属性取值城区间划分办法,必要时合并相邻区间,引入部分完整性概念,用来量化因划分而造成的信息过失。最后给出挖掘数量联系规则的一种算法.
-
关键词
数据挖掘
数量联系规则
关系表
数据库
-
Keywords
data mining
quantitative association rules
Partial completeness
Partition
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名语言值关联规则挖掘算法
被引量:6
- 10
-
-
作者
邹晓峰
陆建江
宋自林
-
机构
解放军理工大学指挥自动化学院
-
出处
《系统仿真学报》
CAS
CSCD
2002年第9期1130-1132,共3页
-
基金
国家自然科学基金重点项目(编号 69931040)资助。
-
文摘
挖掘语言值关联规则是数量型属性关联规则中的一个重要研究内容。已有的语言值关联规则挖掘算法没有充分考虑隶属度的信息,为此改进了语言值关联规则的挖掘算法,此算法能充分考虑隶属度的信息,但算法的效率不高。为了提高挖掘算法的效率,通过引入可变阈值,并提出折衷的语言值关联规则挖掘算法,折衷的算法损失了少量的隶属度信息,但节省了挖掘所需的内存和时间。
-
关键词
语言值
关联规则
数据挖掘
数量型属性
模糊C-均值算法
数据库
-
Keywords
data mining
quantitative attributes
fuzzy c-means algorithm
linguistic valued association rules
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名挖掘支持度和兴趣度最优的数量关联规则
被引量:6
- 11
-
-
作者
吉根林
孙志挥
-
机构
东南大学计算机系
南京师范大学计算机系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第2期225-228,共4页
-
基金
国家自然科学基金 (79970 0 92 )资助
江苏省教育厅自然科学基金 (2 0 0 1SXXTSJB12 )的资助
-
文摘
讨论了数量关联规则提取过程中的连续属性离散化方法和规则的有趣性问题 ,给出了数量关联规则的客观兴趣度的度量函数 ,提出用模板匹配方法挖掘用户感兴趣的规则 ,以解决数量关联规则有趣性的主观评测 ,研究了一种挖掘支持度和兴趣度最优的形如 (A∈ [v1 ,v2 ]∧ C1 ) C2 (其中 A为连续属性 ,C1 、C2 为类别属性 )的数量关联规则方法 ,并将该方法应用于股市行情分析 ,实验结果表明是非常有效的 .
-
关键词
数据挖掘
知识发现
数量关联规则
规则有趣性
-
Keywords
data mining
knowledge discovery
quantitative association rule
interestingness of association rule
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于属性互信息熵的量化关联规则挖掘
被引量:12
- 12
-
-
作者
刘乐乐
田卫东
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第14期38-40,共3页
-
基金
安徽省自然科学基金资助项目(050420207)
-
文摘
在量化关联规则挖掘中存在量化属性及其取值区间的组合爆炸问题,影响算法效率。提出算法BMIQAR,通过考察量化属性间互信息熵,找到具有强信息关系的属性集,从中得到频繁项集以产生规则。实验表明,由于在属性层进行了剪枝,因此缩减了搜索空间,提高了算法的性能,且能得到绝大多数置信度较高的规则。
-
关键词
数据挖掘
量化关联规则
互信息熵
-
Keywords
data mining
quantitative association rules
mutual information entropy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据集划分及关联规则挖掘
被引量:2
- 13
-
-
作者
王泉德
王先甲
王先培
-
机构
武汉大学电子信息学院
武汉大学水利水电学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第21期18-19,共2页
-
文摘
介绍了一种根据数据集中项目的概念层次,利用变精度粗糙集模型对数据集进行划 分的方法,设计了相应的关联规则挖掘算法及并行算法,并通过测试分析了算法的挖掘效率 和影响挖掘效率的主要因素。
-
关键词
数据挖掘
关联规则
粗糙集
概念层次
-
Keywords
data mining
association rule
Rough set
conceptual hierarchy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名关联规则在肿瘤诊断中的应用
被引量:9
- 14
-
-
作者
陆建江
张文献
-
机构
解放军理工大学通信工程学院
解放军理工大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第12期8-9,47,共3页
-
基金
国家自然科学基金重点项目(69931040)
-
文摘
挖掘肿瘤诊断数据库中的关联规则,能为肿瘤诊断提供有用的信息。肿瘤诊断数据库中的属性常为数量型属性,因此如何将数量型属性离散化是挖掘关联规则的难点。竞争聚集算法综合了分层聚类与划分聚类的优点,它能够有效地体现数据的实际分布情况并得到优化的聚类个数,因此能将数量型属性离散化成若干个优化的区间。
-
关键词
数据挖掘
竞争聚集算法
数量型属性
关联规则
肿瘤诊断
-
Keywords
data mining
Competitive agglomeration (CA) algorithm
quantitative attributes
association rules
Tumor diagnoses
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名多值属性关联规则的理论基础
被引量:6
- 15
-
-
作者
高峰
谢剑英
-
机构
上海交通大学自动化所
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2000年第11期47-49,共3页
-
文摘
关联规则的研究主要集中在发现高效的算法,而该文基于形式概念分析讨论了多值属性关联规则发现的框架,指出最大频繁项目集由最大频繁闭合项目集唯一确定。
-
关键词
数据挖掘
多值属性关联规则
数据库
形式概念
-
Keywords
data mining
quantitative association rules
Formal concept analysiH
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于数据场的量化关联规则挖掘研究与实现
被引量:3
- 16
-
-
作者
孟海东
李丹丹
吴鹏飞
-
机构
内蒙古科技大学矿业工程学院
内蒙古科技大学信息工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第7期40-42,58,共4页
-
基金
内蒙古高等教育科学重点项目(NJZZ11140)
内蒙古自然科学基金项目(2012MS0611)
-
文摘
目前,对布尔型关联规则的挖掘研究已较成熟,而对量化关联规则的挖掘研究相对较少,并且采用的挖掘方法多是将量化属性进行离散化处理,进而转化为布尔型关联规则进行挖掘。但传统的对量化属性离散化处理的方法存在区间划分过硬的问题,因此提出一种基于数据场的量化关联规则挖掘方法。该方法避免了区间划分过硬问题,同时也充分考虑了数据集中数据的非完备性以及每个数据对数据挖掘任务所发挥的不同作用。实验证实了该方法的有效性。
-
关键词
数据挖掘
量化关联规则
数据场
聚类分析
-
Keywords
data mining
quantitative association rules
data field
Cluster analysis
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名量化关联规则挖掘及算法
被引量:4
- 17
-
-
作者
李乃乾
沈钧毅
-
机构
西安交通大学计算机软件研究所
-
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第12期2275-2277,共3页
-
基金
国家自然科学基金 (60 1 730 58)资助
-
文摘
提出了一种新的量化关联规则挖掘算法QAR及其增量式更新算法IUQAR .算法以模糊集理论为基础 ,利用模糊概念表示量化属性属性间的关联关系 ,克服了传统的离散分区方法的不足 ,使得规则的表示自然、简明 ,有利于专家理解 .同时 ,给出的算法IUQAR ,有效地解决了规则的维护问题 .
-
关键词
数据挖掘
量化关联规则
增量式更新算法
模糊集
模糊概念
-
Keywords
data mining
quantitative association rules
incremental updating
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名大型数据库中多层关联规则的挖掘算法
被引量:4
- 18
-
-
作者
高峰
谢剑英
-
机构
上海交通大学自动化系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2000年第10期75-76,142,共3页
-
文摘
将基于垂直数据分布的关联规则的发现从单层概念扩展到多层概念,提出了自顶向下的、用等价类生成频繁项目集的发现算法,无需复杂的Hash数据结构。该算法减少了项目的匹配计算,提高了挖掘的效率。
-
关键词
数据挖掘
关联规则
等价类
算法
大型数据库
-
Keywords
data mining
association rules
Equivalence class
Concept hierarchy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名量化关联规则的模糊方法开采
被引量:4
- 19
-
-
作者
胡和平
方正江
-
机构
华中理工大学计算机学院
-
出处
《计算机工程与科学》
CSCD
1999年第4期83-87,共5页
-
文摘
本文讨论一种用模糊集合理论处理量化属性的方法,从而提出量化关联规则的模糊开采方法,并对量化关联规则的开采查询语言作了说明。
-
关键词
数据开采
关联规则
量化属性
知识发现
数据库
-
Keywords
data mining,association rules,fuzzy method,quantitative attribute,mining query language.
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于lazy方法的数量型关联分类
被引量:1
- 20
-
-
作者
李学明
李宾飞
杨涛
付萌
-
机构
重庆大学计算机学院
中国科学技术大学软件学院
-
出处
《计算机应用》
CSCD
北大核心
2013年第8期2184-2187,共4页
-
基金
国家自然科学基金资助项目(61103114)
重庆市高等教育教学改革研究重点资助项目(112023)
+1 种基金
中央高校基本科研业务基金资助项目(CDJXS11181164)
"211工程"三期建设资助项目(S10218)
-
文摘
传统关联分类方法处理数量型数据时,"先离散,再学习"的步骤使新的测试样例可能无法找到合适的离散区间,形成离散盲目性问题。基于lazy的数量型关联分类作为一种新的关联分类法,它首先利用K-近邻分类思想为测试样例求得K-近邻作为新的训练数据集,然后对包含测试样例和K个近邻的数据集离散化,并在K-近邻组成的离散数据集上挖掘关联规则并构造分类器进行分类。最后,通过与传统CBA、CMAR、CPAR算法在7个常用UCI数量型数据集上进行的对比实验结果表明,基于lazy的数量型关联分类方法的平均分类准确率提高了0.66%~1.65%,证明了该方法的可行性。
-
关键词
数据挖掘
lazy方法
数量型关联分类
关联规则
K-近邻
-
Keywords
data mining
lazy method
quantitative associative classification
associative rule
K-Nearest Neighbors(KNN)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP18
[自动化与计算机技术—控制理论与控制工程]
-