期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于条件信息熵的决策表约简 被引量:600
1
作者 王国胤 于洪 杨大春 《计算机学报》 EI CSCD 北大核心 2002年第7期759-766,共8页
Rough集理论是近年来发展起来的一种有效地处理不精确、不确定、含糊信息的数学理论方法 ,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了很大的成功 .研究者从不同的角度对这个理论进行研究 .本文将从信息论观点出发对... Rough集理论是近年来发展起来的一种有效地处理不精确、不确定、含糊信息的数学理论方法 ,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了很大的成功 .研究者从不同的角度对这个理论进行研究 .本文将从信息论观点出发对 Rough集理论的基本概念和主要运算进行分析讨论 ,通过与 Rough集理论的代数观点进行比较分析 ,得到这两种观点下的一些等价性质和不同的特性 ,并基于条件信息熵提出决策表的约简算法 . 展开更多
关键词 条件信息熵 决策表约简 近似集 等价性 知识约简 人工智能 ROUGH集理论
在线阅读 下载PDF
基于条件信息熵的自主式朴素贝叶斯分类算法 被引量:16
2
作者 邓维斌 黄蜀江 周玉敏 《计算机应用》 CSCD 北大核心 2007年第4期888-891,共4页
朴素贝叶斯是一种简单而高效的分类算法,但其条件独立性和属性重要性相等的假设并不符合客观实际,这在某种程度上影响了它的分类性能。如何去除这种先验假设,根据数据本身的特点实现知识自主学习是机器学习中的一个难题。根据RoughSet... 朴素贝叶斯是一种简单而高效的分类算法,但其条件独立性和属性重要性相等的假设并不符合客观实际,这在某种程度上影响了它的分类性能。如何去除这种先验假设,根据数据本身的特点实现知识自主学习是机器学习中的一个难题。根据RoughSet的相关理论,提出了基于条件信息熵的自主式朴素贝叶斯分类方法,该方法结合了选择朴素贝叶斯和加权朴素贝叶斯的优点。通过在UCI数据集上的仿真实验,验证了该方法的有效性。 展开更多
关键词 朴素贝叶斯 粗糙集 条件信息熵 自主式学习 分类
在线阅读 下载PDF
基于边界域的条件信息熵和属性约简 被引量:7
3
作者 黄国顺 文翰 《计算机应用》 CSCD 北大核心 2015年第10期2771-2776,共6页
为了建立边界域条件信息熵与属性约简之间的关系,证明了边界域和整个论域上的条件信息熵相等,得到信息熵约简的边界域条件信息熵表示。利用严凸函数和Jensen不等式,讨论了边界域条件信息熵的若干性质,给出保持边界域条件信息熵不变的充... 为了建立边界域条件信息熵与属性约简之间的关系,证明了边界域和整个论域上的条件信息熵相等,得到信息熵约简的边界域条件信息熵表示。利用严凸函数和Jensen不等式,讨论了边界域条件信息熵的若干性质,给出保持边界域条件信息熵不变的充要条件。为了得到正域约简的边界域条件信息熵表示,给出了保持正域不变的边界域条件信息熵充要条件,从而得到正域约简的边界域条件熵判定方法,它是一致决策表正域约简判定方法的推广形式。最后设计一个数值算例阐述如何应用边界域条件信息熵计算正域约简和信息熵约简。 展开更多
关键词 边界域 条件信息熵 正域 正域约简 信息熵约简
在线阅读 下载PDF
决策表中基于条件信息熵的近似约简 被引量:44
4
作者 杨明 《电子学报》 EI CAS CSCD 北大核心 2007年第11期2156-2160,共5页
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简... 属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Bench- mark上进行了分类器的性能测试. 展开更多
关键词 粗糙集 属性约简 条件信息熵 近似约简
在线阅读 下载PDF
基于条件信息熵的超高维分类数据特征筛选 被引量:4
5
作者 程国胜 孙超男 +1 位作者 宋凤丽 来鹏 《统计与决策》 CSSCI 北大核心 2018年第8期64-67,共4页
文章提出了一种基于条件信息熵的超高维自由模型下非参数特征筛选方法,在响应变量为两类别时,对多类别离散型协变量进行特征筛选。通过理论证明和蒙特卡罗数值模拟验证了该筛选方法具有确定筛选性质,对超高维分类变量的重要特征筛选具... 文章提出了一种基于条件信息熵的超高维自由模型下非参数特征筛选方法,在响应变量为两类别时,对多类别离散型协变量进行特征筛选。通过理论证明和蒙特卡罗数值模拟验证了该筛选方法具有确定筛选性质,对超高维分类变量的重要特征筛选具有显著的效果。 展开更多
关键词 超高维判别分析 特征筛选 确定筛选性质 条件信息熵
在线阅读 下载PDF
知识粗糙性和条件信息熵的关系 被引量:3
6
作者 陈凤娟 闫德勤 《计算机工程与应用》 CSCD 北大核心 2009年第21期160-162,共3页
目前,粗糙集理论存在着两种观点,它们分别是代数观和信息观。在代数观点中,知识粗糙性体现了知识的粒度;而在信息观中,定义了知识的信息熵和条件信息熵。已经有定理证明了信息熵与知识的粗糙性存在对应关系,它建立了代数观和信息观之间... 目前,粗糙集理论存在着两种观点,它们分别是代数观和信息观。在代数观点中,知识粗糙性体现了知识的粒度;而在信息观中,定义了知识的信息熵和条件信息熵。已经有定理证明了信息熵与知识的粗糙性存在对应关系,它建立了代数观和信息观之间的联系,但是这种关系却不是一一对应的。该文通过重新证明知识粗糙性和信息熵的对应关系定理,找到与知识粗糙性存在一一对应关系的是条件信息熵,并给出相关定理及其证明。 展开更多
关键词 知识粗糙性 信息熵 条件信息熵
在线阅读 下载PDF
基于条件信息熵的覆盖约简算法 被引量:3
7
作者 李永顺 贾瑞玉 《计算机工程》 CAS CSCD 北大核心 2010年第16期176-179,共4页
针对覆盖算法中识别精度与泛化能力存在的矛盾,在信息论观点的Rough集理论基础上,提出覆盖熵概念,以决策属性相对于分类器的条件信息熵为约束条件,在确保算法分类能力不降低的情况下,对一组覆盖中信息熵最大的覆盖进行约简,减少了分类... 针对覆盖算法中识别精度与泛化能力存在的矛盾,在信息论观点的Rough集理论基础上,提出覆盖熵概念,以决策属性相对于分类器的条件信息熵为约束条件,在确保算法分类能力不降低的情况下,对一组覆盖中信息熵最大的覆盖进行约简,减少了分类器的不确定因素。实验结果证明,该算法具有很好的识别精度与泛化能力,对模糊、不确定的数据也具有较好的处理能力。 展开更多
关键词 覆盖熵 覆盖约简 条件信息熵
在线阅读 下载PDF
代数约简的条件信息熵表示及其高效约简算法 被引量:1
8
作者 黄国顺 曾凡智 文翰 《计算机科学》 CSCD 北大核心 2014年第7期236-241,274,共7页
给出如何保持正区域不变的语义分析,提出一种修正条件信息熵计算公式,证明保持修正条件信息熵不变与保持正区域不变相互等价。在此基础上,给出代数约简概念的修正条件信息熵表示。给出反例说明修正条件信息熵不具有单调性,导致没法给出... 给出如何保持正区域不变的语义分析,提出一种修正条件信息熵计算公式,证明保持修正条件信息熵不变与保持正区域不变相互等价。在此基础上,给出代数约简概念的修正条件信息熵表示。给出反例说明修正条件信息熵不具有单调性,导致没法给出自底向上的启发式约简算法,证明了代数协调集中不可删除属性的不可逆性质,提出一种自顶向下直接删除属性的高效约简算法。它从所有条件属性集出发,逐步删除不必要的属性,只需遍历各属性一次,即可保证得到原始决策表的一个代数约简。数值算例和实验验证了该算法的正确性和高效性。 展开更多
关键词 条件信息熵 正区域 代数约简 算法
在线阅读 下载PDF
基于粗糙集条件信息熵辅助的最小二乘法 被引量:1
9
作者 邹凯 谭倩云 毛静 《统计与决策》 CSSCI 北大核心 2013年第22期12-14,共3页
指标属性权重的确定历来是多目标决策及评估的重点,关于权重确定方法的探讨一直是国内外研究热点之一。文章在最小二乘法的基础上,引入粗糙集条件信息熵,充分利用粗糙集无先验知识的优点,将最小二乘法确定的主观权重加以精确和优化,降... 指标属性权重的确定历来是多目标决策及评估的重点,关于权重确定方法的探讨一直是国内外研究热点之一。文章在最小二乘法的基础上,引入粗糙集条件信息熵,充分利用粗糙集无先验知识的优点,将最小二乘法确定的主观权重加以精确和优化,降低主观权重的模糊程度;同时通过调节系数,避免了因粗糙集条件信息熵本身系统集合样本少,出现权重大小差异性较大的情况。最后,通过具体的算法实例,来验证算法的有效性。 展开更多
关键词 最小二乘法 粗糙集 条件信息熵 调节系数
在线阅读 下载PDF
基于覆盖算法的条件信息熵表示及属性约简
10
作者 单雪红 吴涛 李国成 《计算机工程与应用》 CSCD 北大核心 2009年第31期115-117,124,共4页
利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算... 利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的算法。实验结果表明该约简算法能快速搜索到最优或次优约简。 展开更多
关键词 覆盖算法 ROUGH集理论 知识约简 条件信息熵
在线阅读 下载PDF
基于粗糙集条件信息熵的山岭隧道坍塌风险评价 被引量:32
11
作者 陈舞 张国华 +1 位作者 王浩 陈礼彪 《岩土力学》 EI CAS CSCD 北大核心 2019年第9期3549-3558,共10页
坍塌是山岭隧道施工过程中主要灾害之一。由于影响坍塌的因素众多,且各因素所占的权重差异较大,甚至有些因素是不必要或冗余的。目前常用的评价方法不但未对这些不必要或冗余的因素进行筛选,而且权重的确定过于依赖专家经验和主观赋值,... 坍塌是山岭隧道施工过程中主要灾害之一。由于影响坍塌的因素众多,且各因素所占的权重差异较大,甚至有些因素是不必要或冗余的。目前常用的评价方法不但未对这些不必要或冗余的因素进行筛选,而且权重的确定过于依赖专家经验和主观赋值,导致风险评价结果精度低、可靠性差。基于此,应用粗糙集理论在数据挖掘、指标筛选和重要性计算方面的优势,将山岭隧道坍塌风险评价构建为粗糙集的决策信息表。但工程试验发现,基于传统依赖度的属性约简及权重计算不能满足要求,存在计算权重为0或约简结果过多,无法取舍的问题。针对以上问题,提出了一种基于条件信息熵的计算方法,该方法将条件信息熵引入到属性重要度和权重的定义中,同时以最重要的条件属性为起点,逐步增添属性,实现属性约简。所建立的方法既能从大量影响因素中,提取出主要影响因素,剔除相对冗余或不重要的因素;同时又能计算得到各因素的客观权重。最后结合模糊综合评价法,建立了基于粗糙集条件信息熵的山岭隧道坍塌风险评价模型,并成功应用于秀村隧道中,表明该模型可靠、实用,为山岭隧道坍塌风险评价提供一条新的研究思路。 展开更多
关键词 山岭隧道 条件信息熵 属性约简 客观权重 坍塌风险评价
在线阅读 下载PDF
新的信息熵属性约简 被引量:6
12
作者 张清华 肖雨 《计算机科学与探索》 CSCD 2013年第4期359-367,共9页
在粗糙集不确定性度量公式中,模糊熵和模糊度是重要的度量方式。根据粗糙集不确定性度量中模糊熵和新的模糊度公式,提出了在决策信息系统中修正条件信息熵和相对模糊熵的概念,并分别用两种方式证明了熵在属性约简过程中的单调性。然后... 在粗糙集不确定性度量公式中,模糊熵和模糊度是重要的度量方式。根据粗糙集不确定性度量中模糊熵和新的模糊度公式,提出了在决策信息系统中修正条件信息熵和相对模糊熵的概念,并分别用两种方式证明了熵在属性约简过程中的单调性。然后利用向前添加属性算法进行属性约简,约简结果在RIDAS(roughset based intelligent data analysis system)平台上进行识别率测试,通过实验对比分析了两种新的信息熵与条件信息熵的约简结果,为基于信息熵的属性约简提供了参考。 展开更多
关键词 粗糙集 信息熵 条件信息熵 模糊熵 属性约简
在线阅读 下载PDF
不协调信息系统快速属性分布约简方法 被引量:15
13
作者 蒋云良 杨章显 刘勇 《自动化学报》 EI CSCD 北大核心 2012年第3期382-388,共7页
以条件信息熵为属性选择准则,设计了基于哈希(Hash)分类的启发式后向贪心算法,该算法以时间复杂度O(|A||U|)求解不协调信息系统的分布约简,其中|A|是条件属性个数,|U|是记录数,并通过实验验证该算法的高效率.
关键词 不协调信息系统 分布约简 条件信息熵 哈希
在线阅读 下载PDF
一种融合差别矩阵和条件熵的故障诊断方法 被引量:3
14
作者 张光轶 苏艳琴 程继红 《计算机工程与应用》 CSCD 北大核心 2011年第17期4-6,共3页
当约简对象过多时,粗糙集中基于差别矩阵的属性约简算法无法摆脱"知识爆炸"的问题。引入相对差别矩阵的概念,提出一种基于相对差别矩阵和条件信息熵的算法,比较分析了该算法与单纯应用差别矩阵算法和信息熵算法的优势,应用于... 当约简对象过多时,粗糙集中基于差别矩阵的属性约简算法无法摆脱"知识爆炸"的问题。引入相对差别矩阵的概念,提出一种基于相对差别矩阵和条件信息熵的算法,比较分析了该算法与单纯应用差别矩阵算法和信息熵算法的优势,应用于某型机载电台设备进行故障诊断,结果表明3种算法结果一致,并且是对单纯差别矩阵和信息熵算法的简化。 展开更多
关键词 粗糙集 相对差别矩阵 条件信息熵 故障诊断
在线阅读 下载PDF
粗糙集信息观中的绝对约简 被引量:4
15
作者 陈凤娟 孙静 《计算机工程与科学》 CSCD 北大核心 2010年第5期97-99,149,共4页
绝对约简是粗糙集理论研究的基本内容之一,而在粗糙集的信息观中,绝对约简的相关定理还存在着一些不足。本文分析了现有的一些关于划分与知识信息熵的关系定理以及绝对约简的充要条件定理,提出新的关于划分和条件信息熵的对应关系定理,... 绝对约简是粗糙集理论研究的基本内容之一,而在粗糙集的信息观中,绝对约简的相关定理还存在着一些不足。本文分析了现有的一些关于划分与知识信息熵的关系定理以及绝对约简的充要条件定理,提出新的关于划分和条件信息熵的对应关系定理,并给出其证明过程;依据该定理提出新的粗糙集信息观的绝对约简的充要条件,并给出相关证明。 展开更多
关键词 粗糙集 信息熵 条件信息熵 绝对约简
在线阅读 下载PDF
基于集对可拓耦合算法的尾矿库安全综合评价 被引量:10
16
作者 柯丽华 黄畅畅 +4 位作者 李全明 李振涛 叶义成 张光权 张莹 《中国安全生产科学技术》 CAS CSCD 北大核心 2020年第6期80-86,共7页
针对尾矿库安全综合评价中“定性定量评价尾矿库安全等级”和“客观描述尾矿库安全状态变化趋势”的要求,采用集对分析方法和可拓理论,利用可拓距计算原理,建立尾矿库集对可拓耦合安全评价模型和尾矿库集对势的计算方法。利用RSCIE权重... 针对尾矿库安全综合评价中“定性定量评价尾矿库安全等级”和“客观描述尾矿库安全状态变化趋势”的要求,采用集对分析方法和可拓理论,利用可拓距计算原理,建立尾矿库集对可拓耦合安全评价模型和尾矿库集对势的计算方法。利用RSCIE权重计算方法确定尾矿库评价指标的权重,将基于集对可拓耦合算法的尾矿库安全评价模型用于尾矿库各安全等级集对可拓联系度的分析中,并基于最大隶属度原则确定案例中的尾矿库为正常库,其集对可拓联系度为0.0406,安全状态的集对势为9.26。结果表明:该尾矿库的安全等级为正常库,且其安全状态发展趋势为弱同势,说明尾矿库的安全状况发展趋势为正常库的态势不强,且向不安全状态转变的可能非常大,应该加强该尾矿库的日常安全管理。这与实际情况相符合,有效验证了该评价模型的可行性和实用性。 展开更多
关键词 尾矿库 集对分析 可拓关联函数 粗糙集 条件信息熵
在线阅读 下载PDF
粗糙集理论在震害预测中的应用 被引量:15
17
作者 阎维明 乔亚玲 何浩祥 《自然灾害学报》 CSCD 北大核心 2006年第3期147-151,共5页
知识约简是粗糙集理论的核心问题。首次尝试将这一概念用于建筑物震害预测工作中,结合震害预测工作的实际,提出了一种基于属性重要性的近似相对约简算法,并通过实例验证了其可行性。所述研究具有理论和现实意义,对今后进行有关抗震防灾... 知识约简是粗糙集理论的核心问题。首次尝试将这一概念用于建筑物震害预测工作中,结合震害预测工作的实际,提出了一种基于属性重要性的近似相对约简算法,并通过实例验证了其可行性。所述研究具有理论和现实意义,对今后进行有关抗震防灾工作具有很好的应用价值,并为开展震害预测工作提供了新的研究思路和手段。 展开更多
关键词 条件信息熵 知识约简 震害预测
在线阅读 下载PDF
基于粗糙集的医疗数据挖掘研究与应用 被引量:11
18
作者 叶明全 伍长荣 胡学钢 《计算机工程与应用》 CSCD 北大核心 2010年第21期232-234,共3页
医疗数据挖掘能够对现有病历数据库中数据进行自动分析并且提供有价值的医学知识。针对临床病历数据库中存在大量重复样本和冗余属性,从而影响医疗诊断的精度和速度这一问题,建立了基于信息论的粗糙集理论模型和SQL语言之间的关系,提出... 医疗数据挖掘能够对现有病历数据库中数据进行自动分析并且提供有价值的医学知识。针对临床病历数据库中存在大量重复样本和冗余属性,从而影响医疗诊断的精度和速度这一问题,建立了基于信息论的粗糙集理论模型和SQL语言之间的关系,提出了基于SQL语言的条件信息熵属性约简算法,利用数据库查询语言实现了数据清洗、求核和属性约简等过程。实验结果表明该算法实现简单,运行效率高,为粗糙集理论更广泛地应用于具体的医疗数据挖掘提供了一种方法。 展开更多
关键词 粗糙集 属性约简 条件信息熵 结构化查询语言(SQL) 医疗数据挖掘
在线阅读 下载PDF
F-粗糙集视角的概念漂移与属性约简 被引量:9
19
作者 邓大勇 李亚楠 黄厚宽 《自动化学报》 EI CSCD 北大核心 2018年第10期1781-1789,共9页
概念漂移探测是数据流挖掘具有挑战意义的研究难点,属性约简是粗糙集理论的研究核心.从概念漂移的角度研究了粗糙集理论的属性约简,从粗糙集属性约简的角度研究了概念漂移,将概念漂移和属性约简进行分析比较,指出了它们之间的区别和联系... 概念漂移探测是数据流挖掘具有挑战意义的研究难点,属性约简是粗糙集理论的研究核心.从概念漂移的角度研究了粗糙集理论的属性约简,从粗糙集属性约简的角度研究了概念漂移,将概念漂移和属性约简进行分析比较,指出了它们之间的区别和联系.提出了基于属性依赖度和条件熵的概念漂移探测准则,并将两种常用的概念漂移探测准则与属性依赖度、条件熵探测准则进行了比较.属性依赖度和条件熵兼具分类准确率的可实验检验和联合概率分布可进行理论分析的优点,还可以进行属性约简(或特征选择).实验结果显示,属性依赖度、条件熵和分类准确率都能有效地探测概念漂移,但是,与分类准确率相比,属性依赖度和条件熵在探测概念漂移时可以增加可重用性,减少工作量.属性约简和概念漂移之间关系的研究为属性约简、概念漂移的研究提供了新方法,为粗糙集、粒计算进一步融入大数据时代潮流提供了新思路. 展开更多
关键词 F-粗糙集 数据流 概念漂移 属性约简 条件信息熵
在线阅读 下载PDF
贝叶斯网络参数学习中的连续变量离散化方法 被引量:10
20
作者 吴红 王维平 杨峰 《系统工程与电子技术》 EI CSCD 北大核心 2012年第10期2157-2162,共6页
首先从离散方案对推理功能的影响出发,提出将条件信息熵作为评判离散方案好坏的标准;其次从降低问题求解的复杂度出发,提出将贝叶斯网络划分为多个极小简单子网分别进行离散化;最后,依据离散化问题与路径规划问题的相似性,设计了一套利... 首先从离散方案对推理功能的影响出发,提出将条件信息熵作为评判离散方案好坏的标准;其次从降低问题求解的复杂度出发,提出将贝叶斯网络划分为多个极小简单子网分别进行离散化;最后,依据离散化问题与路径规划问题的相似性,设计了一套利用蚁群算法进行问题求解的方法。实验表明,采用所提方法进行贝叶斯网络连续变量离散化,能很好地将连续变量的取值空间进行分类,从而达到良好的推理效果。 展开更多
关键词 条件信息熵 贝叶斯网络 极小简单子网 连续变量 离散化 蚁群算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部