-
题名基于信息熵的特征子集选择启发式算法的研究
被引量:8
- 1
-
-
作者
钱国良
舒文豪
陈彬
权光日
-
机构
哈尔滨工业大学计算机科学与工程系
-
出处
《软件学报》
EI
CSCD
北大核心
1998年第12期911-916,共6页
-
基金
国家自然科学基金
国际合作项目彩色匹配基金
哈尔滨工业大学科技基金
-
文摘
特征子集选择问题是机器学习和模式识别中的一个重要问题.最优特征子集选择问题已被证明是NP难题.然而,目前的特征子集选择的启发式算法是基于正反例一致的,没有考虑到实际应用中的噪音数据影响,使得选择一个较好的特征子集非常困难.首先从统计学的角度分析了噪音对特征子集选择的影响,给出含有错误率的一致特征子集概念,然后利用信息熵和拉普拉斯错误估计函数构造了特征子集选择启发式算法EFS(entropybasedfeaturesubsetselection).将该算法应用于两个实际领域的学习问题,并与GFS(greedyfeaturesubsetselection)算法进行了比较.实验结果表明,EFS选择的特征子集更具有代表性。
-
关键词
特征子集选择
信息熵
启发式算法
NP问题
-
Keywords
Feature subset selection, machine learning, extension matrix, entropy, noise.
-
分类号
O22
[理学—运筹学与控制论]
-
-
题名基于信息熵的扩张矩阵的启发式算法
被引量:2
- 2
-
-
作者
钱国良
舒文豪
王亚东
-
机构
哈尔滨工业大学计算机科学与工程系
-
出处
《计算机学报》
EI
CSCD
北大核心
1998年第7期619-626,共8页
-
基金
国家自然科学基金
国际合作项目!彩色匹配
哈工大校科技基金
-
文摘
示例学习中传统的扩张矩阵理论和启发式算法是建立在正反例子集一致、没有噪音的基础上的.然而实际应用领域中的噪音数据,导致许多归纳能力很差的规则产生.本文提出从统计学的角度,对扩张矩阵理论的定义加以扩充,利用信息熵和拉普拉斯错误估计函数构造了扩张矩阵启发式算法ECA将该算法应用于几个实际领域的学习问题并与示例学习系统AES及AQ15等进行了比较.实验结果表明,ECA生成的规则简单,归纳能力强,较为有效地解换了实际应用中的噪音问题.
-
关键词
示例学习
扩张矩阵
信息熵
机器学习
启发式算法
-
Keywords
learning from examples, extension matrix, entropy, noise
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名归纳逻辑程序设计中的优化问题研究
被引量:1
- 3
-
-
作者
叶风
徐晓飞
权光日
陈彬
邱深山
-
机构
哈尔滨工业大学计算机科学与工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第5期560-566,共7页
-
基金
国家"八六三"高技术计划基金
-
文摘
归纳逻辑程序设计的核心问题是如何从背景知识中优选谓词构造满足约束的归纳假设.按Ocam准则,满足约束的最精简归纳假设为优,但迄今归纳逻辑程序设计中精简归纳假设构造的计算复杂性尚未解决.文中以扩张矩阵理论为工具证明了归纳假设构造中的一些主要最优化问题的计算复杂性是NP困难的,并给出了构造优假设的启发式算法,实验表明该算法产生的归纳假设在结构上具有明显的优越性.
-
关键词
归纳学习
归纳逻辑程序
程序设计
优化
-
Keywords
inductive learning,inductive logic programming,extension matrix,computational complexity
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于扩张矩阵的渐进式特征子集选择算法
被引量:3
- 4
-
-
作者
王兴起
孔繁胜
-
机构
浙江大学人工智能研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第25期108-110,178,共4页
-
文摘
特征子集选择问题一直是人工智能领域研究的重要内容,特别是近几年来,特征子集选择的算法研究已经成为机器学习和数据挖掘等领域的一个研究热点。该文在扩张矩阵的基础上提出了类扩张矩阵的概念,并将加权的期望信息和不一致错误率函数应用于特征子集的选择,实现了具有噪音处理功能的渐进式特征子集选择算法———IFSS_EM,实际领域的实验结果表明:IFSS_EM算法具有运行效率高、选择特征较具有代表性的优点,从而使其能够较好地应用于实际领域。
-
关键词
特征子集选择
扩张矩阵
噪音
渐进式学习
-
Keywords
Feature subset selection,extension matrix,noise,incremental learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名容忍噪音的最大复合问题启发式算法
- 5
-
-
作者
王兴起
孔繁胜
-
机构
浙江大学人工智能研究所
-
出处
《计算机科学》
CSCD
北大核心
2002年第8期79-81,共3页
-
基金
973项目基金
-
文摘
1.引言
从给定的数据集中发现有用的知识一直是示例学习和数据库知识发现等领域研究的重要内容[1,2].一般地说[3]:规则越简单,归纳概括能力就越强,分类精度越高.因此,近几年来,从给定示例中归纳简单而概括的规则,即最大复合问题的算法研究逐渐成为上述诸领域的一个热点.然而,现有的规则归纳算法多为建立在不含噪音的理想数据基础上的,而在实际的应用领域中不可避免地存在噪音数据[4,5],这样致使现有的算法一直得不到令人满意的结果,甚至很难应用于实际领域,从而给实际领域规则的获取带来了一定难度.噪音数据一般可以分为如下三种形式[6],即个别属性值错误型噪音、未知属性值型噪音和冗余属性值型噪音.规则归纳算法能否有效地解决上述三种情况的噪音、是其能否成功应用于实际领域的关键.
-
关键词
最大复合问题启发式算法
噪音
知识发现
数据库
数据集中
-
Keywords
inductive learning, Most general complex, extension matrix, noise
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名容忍噪音的扩张矩阵启发式算法研究
- 6
-
-
作者
王兴起
孔繁胜
-
机构
杭州电子科技大学计算机学院
浙江大学人工智能研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第20期25-28,55,共5页
-
基金
国家自然科学基金项目资助课题(编号:60303028)
浙江省"高校青年教师资助计划"基金资助
-
文摘
现有扩张矩阵算法多为建立在理想数据基础上的,而实际的应用领域中不可避免地存在噪音数据,这样致使其在实际的应用中很难得到令人满意的结果。文章对原有扩张矩阵理论进行扩充,提出扩张矩阵集的概念,并在此基础上给出了一个容忍噪音的扩张矩阵启发式算法(NCV)。实际领域的实验结果表明:NCV算法能够得到较为简单而精确的规则,并且较好地解决了实际领域中存在的噪音问题。
-
关键词
扩张矩阵
归纳学习
噪音
-
Keywords
extension matrix,inductive learning,noise
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-