-
题名基于不一致邻域的批增量式属性约简
被引量:4
- 1
-
-
作者
张扩
续欣莹
谢珺
韩晓霞
-
机构
太原理工大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2017年第6期1526-1531,共6页
-
基金
山西省自然科学基金项目(2014011018-2)
山西省回国留学人员科研基金项目(2013-033
2015-045)
-
文摘
经典粗糙集仅能处理离散性数据,而邻域粗糙集通过运用距离函数解决了此局限性。基于此,提出一种信息观下批增量式属性约简算法。分析批量增加样本后新样本集下条件熵的变化机制,给出条件熵的计算公式;通过公式得出新加入样本的不一致邻域引起条件熵的变化,当新增样本加入到原样本集后,只需找到新增样本集的不一致邻域,与新增样本集一起进行约简,对原约简集进行冗余剔除,得到最终约简。该算法避免了有重复的约简,大大减少了计算量。将该算法应用到UCI数据集以及某单位的科技人才流动绩效评价指标体系中进行实验,实验结果验证了该算法的有效性和高效性。
-
关键词
粗糙集
不一致邻域
批增量式属性约简
信息观
条件熵
-
Keywords
rough set
inconsistent neighborhcod
batch of incremental attribute reduction
information view
conditio
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于改进区分矩阵的决策表增量式属性约简
被引量:2
- 2
-
-
作者
刘高峰
牟廉明
张涛
-
机构
四川省高等学校数值仿真重点实验室
内江师范学院数学与信息科学学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第20期46-48,共3页
-
基金
四川省教育厅青年基金资助项目"基于粗集理论的增量式知识发现"(07ZB043)
-
文摘
针对属性在不断增加的决策表,为了快速准确地计算出属性约简,提出一种增量式属性约简算法。以正域为约简的标准,利用贪心算法思想,以属性区分能力为选择标准,逐渐构造近似的属性约简,从中删减掉不必要的属性,最终得到属性约简。经复杂度分析与实验数据测试,证明该算法的复杂度低并且约简结果准确。
-
关键词
粗糙集
改进区分矩阵
增量式属性约简
决策表
贪心算法
-
Keywords
rough set
improved discernibility matrix
incremental attributes reduction
decision table
greedy algorithm
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于区分矩阵的增量式属性约简
被引量:3
- 3
-
-
作者
刘高峰
牟廉明
-
机构
四川省高等学校数值仿真重点实验室
内江师范学院数学与信息科学学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第18期4293-4295,4298,共4页
-
基金
四川省教育厅青年基金项目(07ZB043)
-
文摘
定义了属性和属性集的区分矩阵以及区分矩阵的运算,表明了属性集的区分矩阵与论域按属性集的分类是1-1对应的,因此,区分矩阵代表了属性集的分类。以区分矩阵作为属性约简的标准,以属性对分类的贡献率作为贪心选择的次序,建立了一种针对无目标信息系统的属性约简以及增量式属性约简方法。该算法降低了处理增量式数据的复杂度,并且只涉及到矩阵的加法、非负矩阵转化为0-1矩阵、判断矩阵相等的运算,便于用计算机语言编程计算。
-
关键词
粗糙集
贪心算法
区分矩阵
增量式属性约简
信息系统
-
Keywords
rough sets
greedy algorithm
discernibility matrix
incremental attributes reductions
information system
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名区间值决策表的正域增量式属性约简算法
被引量:8
- 4
-
-
作者
鲍迪
张楠
童向荣
岳晓冬
-
机构
数据科学与智能技术山东省高校重点实验室(烟台大学)
烟台大学计算机与控制工程学院
上海大学计算机工程与科学学院
-
出处
《计算机应用》
CSCD
北大核心
2019年第8期2288-2296,共9页
-
基金
国家自然科学基金资助项目(61403329,61572418,61702439,61572419,61502410)
山东省自然科学基金资助项目(ZR2016FM42,ZR2018BA004)~~
-
文摘
实际应用中存在大量动态增加的区间型数据,若采用传统的非增量正域属性约简方法进行约简,则需要对更新后的区间值数据集的正域约简进行重新计算,导致属性约简的计算效率大大降低。针对上述问题,提出区间值决策表的正域增量属性约简方法。首先,给出区间值决策表正域约简的相关概念;然后,讨论并证明单增量和组增量的正域更新机制,提出区间值决策表的正域单增量和组增量属性约简算法;最后,通过8组UCI数据集进行实验。当8组数据集的数据量由60%增加至100%时,传统非增量属性约简算法在8组数据集中的约简耗时分别为36.59s、72.35s、69.83s、154.29s、80.66s、1498.11s、4124.14s和809.65s,单增量属性约简算法的约简耗时分别为19.05s、46.54s、26.98s、26.12s、34.02s、1270.87s、1598.78s和408.65s,组增量属性约简算法的约简耗时分别为6.39s、15.66s、3.44s、15.06s、8.02s、167.12s、180.88s和61.04s。实验结果表明,提出的区间值决策表的正域增量式属性约简算法具有高效性。
-
关键词
粗糙集
区间值决策表
相容关系
正域
增量式属性约简
-
Keywords
rough set
interval-valued decision table
tolerance relation
positive region
incremental attribute reduction
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于二进制区分矩阵的增量式属性约简算法
被引量:7
- 5
-
-
作者
丁棉卫
张腾飞
马福民
-
机构
南京邮电大学自动化学院
南京财经大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第1期201-206,共6页
-
基金
国家自然科学基金(61105082
61403184)
+2 种基金
江苏省"青蓝工程"基金(QL2016)
南京邮电大学"1311人才计划"项目(NY2013)
南京邮电大学科研项目(NY215149)
-
文摘
增量式属性约简算法是动态数据挖掘技术的重要研究内容。为降低区分矩阵的存储空间,结合二进制区分矩阵便于计算以及形象直观的优点,给出一种压缩二进制区分矩阵的方法。将二进制区分矩阵的存储空间从|C|+1列简化成3列。通过动态更新二进制区分矩阵实现增量式求核,并以核为出发点,提出一种的增量式属性约简算法。通过实例计算及仿真实验验证了该算法的有效性。
-
关键词
粗糙集
增量式属性约简
二进制区分矩阵
核属性
属性频率
-
Keywords
rough sets
incremental attribute reduction
binary discernibility matrix
core attribute
attribute frequency
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种处理部分标记数据的粗糙集属性约简算法
被引量:5
- 6
-
-
作者
张维
苗夺谦
高灿
李峰
-
机构
同济大学电子与信息工程学院计算机科学与技术系
上海电力学院计算机科学与技术学院
同济大学嵌入式系统与服务计算教育部重点实验室
深圳大学计算机与软件学院
香港理工大学应用科学与纺织学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第1期25-31,共7页
-
基金
国家自然科学基金项目(61273304)
2013年度高等学校博士学科点专项科研基金(20130072130004)资助
-
文摘
属性约简是粗糙集理论中重要的研究内容之一,是数据挖掘中知识获取的关键步骤。Pawlak粗糙集约简的对象一般是有标记的决策表或者是无标记的信息表。而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据。为此,结合半监督协同学习理论,提出了处理半监督数据的属性约简算法。该算法首先在有标记数据上构造两个差异性较大的约简来构造基分类器;然后在无标记数据上交互协同学习,扩大有标记数据集,获得质量更好的约简,构造性能更好的分类器,该过程迭代进行,从而实现利用无标记数据提高有标记数据的约简质量,最终获得质量较好的属性约简。UCI数据集上的实验分析表明,该算法是有效且可行的。
-
关键词
粗糙集
增量式属性约简
协同学习
部分标记数据
半监督学习
-
Keywords
Rough sets, Incremental attribute reduction, Co-training, Partially labeled data, Semi-supervised learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-