-
题名基于排序互信息的无监督特征选择
被引量:2
- 1
-
-
作者
李纯果
张春琴
李海峰
-
机构
河北大学数学与信息科学学院
河北省机器学习与计算智能重点实验室
河北大学计算机教学部
-
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2020年第2期200-204,共5页
-
基金
国家自然科学基金资助项目(61573348)
河北省教育厅资助项目(ZC2016157)。
-
文摘
根据排序问题的单调先验知识,无监督学习问题中的观测属性之间也具备单调关系;否则该属性与排序无关,为冗余属性.基于排序互信息反应的两属性之间的单调关系,提出用每个属性与其他属性之间的平均互信息,来衡量每个属性与排序学习的相关程度,具有最高的平均互信息即为排序最相关的属性.
-
关键词
无监督排序
特征选择
排序互信息
-
Keywords
unsupervised ranking
feature selection
ranking mutual information
-
分类号
O235
[理学—运筹学与控制论]
-
-
题名面向单调特征选择的改进模糊排序互信息
- 2
-
-
作者
皮洪
罗川
李天瑞
陈红梅
-
机构
四川大学计算机学院
西南交通大学计算机与人工智能学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第1期108-115,共8页
-
基金
国家自然科学基金(62076171,61573292,61976182)。
-
文摘
缺失值、异常值等低质信息的大量存在使得实际应用中单调分类任务通常不满足一致性单调约束。然而,现有的面向单调分类的特征选择算法中用于评估特征相关性的互信息度量准则在处理不一致单调分类任务时不满足特征集合与度量准则之间的单调性限制关系。针对此问题,首先对经典的模糊排序信息熵进行了改进,使之满足单调性限制关系。进一步定义了模糊排序互信息(nFRMI)用于评估特征之间的单调一致性,并证明了该度量准则在一致性和不一致性单调分类任务中均满足单调性约束,此外结合最大相关最小冗余(mRMR)准则提出了两阶段的特征选择算法。算法第一阶段利用nFRMI计算每个特征的特征重要度,然后根据特征重要度得到特征排序;第二阶段采用Wrapper方法选出具有最优分类性能的特征子集。仿真实验从UCI挑选了四个单调分类数据集,并从分类精度指标对所提出的特征选择算法的有效性进行了验证。
-
关键词
特征选择
单调分类
不一致
模糊信息熵
排序互信息
-
Keywords
feature selection
monotonic classification
inconsistent
fuzzy information entropy
rank mutual information
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名区间值属性单调决策树算法的扩展
被引量:4
- 3
-
-
作者
王鑫
陈建凯
翟俊海
-
机构
河北大学数学与信息科学学院
河北省机器学习与计算智能重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2020年第3期557-563,共7页
-
基金
河北省科技计划重点研发基金(19210310D)
河北省自然科学基金(F2017201026)
河北省社会科学基金(HB18GL010,HB19JY042)。
-
文摘
区间值属性单调决策树算法是处理区间值属性单调分类问题的重要途径之一,但此算法构建决策树过程中没有考虑属性间的相关性,因此极可能继续分类没有意义或意义很小的冗余属性。针对以上不足,在区间值属性单调决策树算法的基础上,分析了区间值属性之间的冗余信息对构建单调决策树的影响,并提出了一种扩展算法,要求选取的扩展属性不仅与决策属性的排序互信息值最大,还与同一分支上已被选取的条件属性的排序互信息值最小。实验结果表明,考虑了区间值属性间的交互信息后,可避免同一条件属性的重复选择,与已有的算法相比,该扩展算法能构建出更优的单调决策树。
-
关键词
区间值属性
排序互信息
属性相关
单调决策树
-
Keywords
interval-valued attribute
rank mutual information
correlation of attributes
monotonic decision tree
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-