-
题名基于粗糙集的数据概化算法
被引量:5
- 1
-
-
作者
翁宜慧
孙志挥
赵传申
-
机构
东南大学计算机系
福建农林大学计算机系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第4期169-170,172,共3页
-
文摘
应用粗糙集理论对大型数据库中的数据概化进行了研究,提出了对数据的动态概念层次划分算法,用以对相关数据集进行属性约简,并在此基础上挖掘概化特征,动态维护概念层次树。
-
关键词
粗糙集
数据概化算法
数据库
数据仓库
数据挖掘
概念层次
-
Keywords
data mining;rough sets;concept hierarchies;data generalization
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于粗糙集的多层次、逐步求精的发掘算法
被引量:17
- 2
-
-
作者
刘发升
杨炳儒
-
机构
北京科技大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
1999年第5期11-12,17,共3页
-
基金
国家自然科学基金
-
文摘
数据量的巨大和高维、用户交互与先验知识的利用等等是KDD(数据库中知识发现与数据发掘)面对的问题和难点,该文针对这些问题提出了一种基于概念普遍化和粗糙集的多层次、逐步求精的发掘算法CRCG。该算法利用概念普遍化和粗糙集对数据进行压缩和维数精简的特长,达到高效发掘感兴趣模式的目的。
-
关键词
数据发掘
数据库
粗糙集
概念普遍化
算法
-
Keywords
data mining, database, rough sets, concept generalization
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据集划分及关联规则挖掘
被引量:2
- 3
-
-
作者
王泉德
王先甲
王先培
-
机构
武汉大学电子信息学院
武汉大学水利水电学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第21期18-19,共2页
-
文摘
介绍了一种根据数据集中项目的概念层次,利用变精度粗糙集模型对数据集进行划 分的方法,设计了相应的关联规则挖掘算法及并行算法,并通过测试分析了算法的挖掘效率 和影响挖掘效率的主要因素。
-
关键词
数据挖掘
关联规则
粗糙集
概念层次
-
Keywords
data mining
Association rule
rough set
conceptual hierarchy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名云概念格的定义、性质与应用
被引量:3
- 4
-
-
作者
吴涛
秦昆
-
机构
湛江师范学院信息学院
武汉大学遥感信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第16期56-59,共4页
-
基金
国家"973"计划基金资助项目(2006CB701305)
中科院资源与环境信息系统国家重点实验开放基金资助项目(A0628)
湛江师范学院科研基金资助项目(QL0606)
-
文摘
为改善概念格对不确定性形式背景的处理,在分析现有概念格及其改进模型的基础上,将云模型引入概念格,提出一种新的格结构——云概念格,通过云形式背景实现了多值背景与单值背景、不确定性背景与精确背景的统一。同时证明了云概念格的若干性质,讨论了云概念格在数据挖掘中的应用,并结合实例给出基于云概念格的关联规则挖掘算法。
-
关键词
云模型
概念格
模糊概念格
粗糙集
数据挖掘
-
Keywords
cloud model
concept lattice
fuzzy concept lattice
rough set
data mining
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于扩展概念格模型的文本分类规则提取的研究
被引量:3
- 5
-
-
作者
周顽
周才学
-
机构
九江学院信息科学与技术学院.江西九江
-
出处
《计算机工程与科学》
CSCD
北大核心
2010年第8期98-100,103,共4页
-
文摘
文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。概念格是规则提取和数据分析的有效工具,然而概念格的构造效率始终是概念格应用的一大难题。本文研究了基于扩展概念格模型的文本分类规则提取,利用粗糙集和扩展概念格模型来进行分类规则提取。该方法利用概念树,极大地除去了冗余的概念,只需要建造很少的概念就能够提取出全部的分类规则,不仅效率较高,而且同时提取的分类规则与概念格相同。本文算法在MATLAB7.0的环境中运行的实验表明,查全率比KNN算法和SVM算法稍低,但是查准率比它们都高,因此该分类规则用于文本分类时效果与KNN和SVM相当。
-
关键词
文本分类
数据挖掘
粗糙集
概念格
分类规则
-
Keywords
document eategorization
data mining
rough set,concept lattice
categorization rule
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名模糊属性集的粗糙上下近似研究
被引量:2
- 6
-
-
作者
张文宇
张铭华
-
机构
西安邮电学院管理系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第22期66-68,93,共4页
-
基金
陕西省教育厅基金资助项目(编号:05JK092)
陕西省软科学基金资助项目(编号:2002KR39)
-
文摘
在知识发现和数据挖掘领域,粗集理论与模糊集合理论都是研究信息系统中知识不完备、不准确问题,两者都可利用观测数据表达知识,进行推理。论文针对传统粗集环境下知识表示模型用固定的属性及属性值来描述对象这一局限,提出利用模糊属性模型对知识表达系统进行信息描述,并给出了模糊属性集的粗糙上下近似模型。
-
关键词
数据挖掘
模糊粗糙集
原子概念
上下近似
-
Keywords
data mining,fuzzy rough set,atomic concepts,upper and lower approximation
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于粗糙集理论的数据发掘算法
被引量:1
- 7
-
-
作者
姚小群
陈统坚
姚锡凡
-
机构
华南理工大学机械工程学院
-
出处
《机床与液压》
北大核心
2003年第4期26-28,8,共4页
-
基金
国家自然科学基金资助项目 5 0 175 0 2 9
教育部留学回国人员科研启动基金资助项目
-
文摘
粗糙集理论是一种软计算方法 ,可以有效地分析和处理不完备信息。本文介绍了粗糙集理论的产生和发展、粗糙集理论概述、粗糙集理论的特点。研究了基于粗糙集的数据发掘算法CRCG ,该算法利用概念普遍化和粗糙集对数据进行压缩和维数精简的特长 。
-
关键词
粗糙集
知识约简
数据发掘
数据库
概念普遍化
-
Keywords
rough sets
Knowledge reduction
data mining
database
concept generalization
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于粗集的文本数据特征信息的挖掘方法
被引量:1
- 8
-
-
作者
易树鸿
张为群
-
机构
遵义师范学院计算机科学系
西南师范大学计算机与信息科学学院
-
出处
《计算机科学》
CSCD
北大核心
2002年第8期91-92,共2页
-
文摘
1.引言
随着Internet的飞速发展,人们的信息交流越来越多地依赖于网络,人们在网上发表自己的意见和见解、相互讨论各种问题、交流情感和思想.在网上传输的这些数据中,大量涉及到的是文本数据,网络应用的普及使得文本数据呈现出高速膨胀的态势,面对浩瀚的文本大海,人们迫切需要快速、准确地从需要的文本数据中了解其观点、思想或热点问题等等.例如,在远程教育中,教师可能面对的是成百上千个学生,教师希望快速地从学生的讨论和交谈中寻找学生集中关心的问题,以便及时回答和调整教学.又如,出于国家安全的考虑,需要对类似于BBS的公众论坛的文档进行鉴别,以便进行有效地监督和管理.以上问题所涉及的都需要高效、快捷地对文本数据进行特定的信息挖掘.
-
关键词
文本数据特征信息
信息挖掘
粗糙集理论
信息处理
-
Keywords
Text data,Characteristic information,mining method,rough sets,concept frame
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于粗集理论和神经网络的集成化数据挖掘方法研究
被引量:9
- 9
-
-
作者
陆光辉
肖人彬
-
机构
华中科技大学CAD中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2002年第5期552-557,共6页
-
基金
国家自然科学基金资助项目 (70 15 0 0 0 1)
华中科技大学研究生研究基金资助项目
-
文摘
为了从大型数据库中获取有用的知识 ,本文提出了一种基于粗集理论和神经网络的集成化数据挖掘方法 .论文以所提出的研究框架为基础 ,首先给出了一种改进的粗集属性约简的算法和消除冗余属性的方法 ,进而采用面向对象的概念泛化进一步对数据库进行属性约简 ,最后用相似权值法得到产生式规则 ,并将所得规则用决策树来表示 .通过一个完整的应用实例演示了本文方法 。
-
关键词
粗集理论
神经网络
集成化数据挖掘
数据库
-
Keywords
rough set
concept generalization
neural network
data mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-