期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
联合对称不确定性ReliefF算法的PolSAR影像分类
1
作者 张继超 邹勇 +2 位作者 宋伟东 张永红 李建飞 《遥感信息》 CSCD 北大核心 2021年第4期20-27,共8页
针对在PolSAR影像分类中极易产生分类精度随着特征数增加不会持续增加,甚至还会降低的问题,提出一种基于对称不确定性ReliefF算法的分类方法。首先,在传统过滤式的ReliefF算法基础上引入对称不确定性评估函数,淘汰对分类贡献小的特征及... 针对在PolSAR影像分类中极易产生分类精度随着特征数增加不会持续增加,甚至还会降低的问题,提出一种基于对称不确定性ReliefF算法的分类方法。首先,在传统过滤式的ReliefF算法基础上引入对称不确定性评估函数,淘汰对分类贡献小的特征及属性;然后,利用封装式CART算法对剩余特征作进一步挑选,并根据得到的特征子集进行分类。将其与Wishart监督分类、未进行特征选择的分类和仅利用ReliefF算法进行特征属性选择的分类方法进行比较,以GF-3和Radarsat-2影像为例进行实验。结果表明,该方法各项指标均优于其他对比实验,并且大幅度节约时间成本。 展开更多
关键词 极化分解 对称不确定性 RELIEFF算法 特征选择 CART分类
在线阅读 下载PDF
基于对称不确定性和邻域粗糙集的肿瘤分类信息基因选择 被引量:5
2
作者 叶明全 高凌云 +2 位作者 伍长荣 黄道斌 胡学钢 《数据采集与处理》 CSCD 北大核心 2018年第3期426-435,共10页
基因表达谱中信息基因选择是有效建立肿瘤分类模型的关键问题。肿瘤基因表达谱具有高维小样本、噪声大且存在大量无关和冗余基因等特点。为了获得基因数量尽可能少而分类能力尽可能强的一组信息基因,提出一种基于对称不确定性和邻域粗... 基因表达谱中信息基因选择是有效建立肿瘤分类模型的关键问题。肿瘤基因表达谱具有高维小样本、噪声大且存在大量无关和冗余基因等特点。为了获得基因数量尽可能少而分类能力尽可能强的一组信息基因,提出一种基于对称不确定性和邻域粗糙集的肿瘤分类信息基因选择SUNRS方法。首先利用对称不确定性指标评估信息基因的重要度,以剔除大量无关和冗余基因,获取信息基因的候选子集;然后利用邻域粗糙集约简算法对信息基因候选子集进行寻优,获得信息基因的目标子集。实验结果表明,SUNRS方法能够用较少的信息基因获得更高的分类精度,从而既能改善算法的泛化性能,又能提高时间效率。 展开更多
关键词 基因表达谱 邻域粗糙集 对称不确定性 特征选择 肿瘤分类
在线阅读 下载PDF
基于对称不确定性和三路交互信息的特征子集选择算法 被引量:5
3
作者 顾翔元 郭继昌 +1 位作者 李重仪 肖利军 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2021年第2期214-220,共7页
由于在评价冗余特征时只考虑对称不确定性或最大信息系数等某一种度量标准,使得现有的一些特征子集选择算法存在性能不理想的问题.针对该问题,提出了一种基于对称不确定性和三路交互信息的特征子集选择算法.首先,计算特征与类标签的对... 由于在评价冗余特征时只考虑对称不确定性或最大信息系数等某一种度量标准,使得现有的一些特征子集选择算法存在性能不理想的问题.针对该问题,提出了一种基于对称不确定性和三路交互信息的特征子集选择算法.首先,计算特征与类标签的对称不确定性,按照其值大小对特征作降序排序处理,并消除不相关特征;然后,计算特征间的对称不确定性以及特征与类标签的三路交互信息,并与特征与类标签的对称不确定性一起,经过比较和排序等运算以消除冗余特征而得到选取的特征.在评价冗余特征上同时考虑对称不确定性和三路交互信息两种度量标准,并结合比较和排序等运算,可以减少将相关特征当作冗余特征而消除的情况,使得一些效果显著的相关特征得以保留.为验证所提算法的性能,采用J48、IB1和Naïve Bayes 3种分类器将其与另外4种特征子集选择算法在3个UCI数据集和9个ASU数据集上进行实验.实验结果表明,所提算法能够在选取特征数和用时均较少的情况下取得很好的特征选择效果. 展开更多
关键词 特征子集选择 三路交互信息 对称不确定性 特征选择 排序
在线阅读 下载PDF
面向多类不均衡网络流量的特征选择方法 被引量:9
4
作者 孙兴斌 孙彦赞 +1 位作者 郑小盈 芮赟 《计算机应用研究》 CSCD 北大核心 2017年第2期568-571,594,共5页
针对网络流量分类中的多类不均衡问题,提出一种基于相对不确定性和对称不确定性的Hybrid型特征选择方法。首先,利用相对不确定性为每个类选择候选特征集;然后,保留每个候选特征集中对称不确定性较高的特征并去除其他特征;最后,利用基于C... 针对网络流量分类中的多类不均衡问题,提出一种基于相对不确定性和对称不确定性的Hybrid型特征选择方法。首先,利用相对不确定性为每个类选择候选特征集;然后,保留每个候选特征集中对称不确定性较高的特征并去除其他特征;最后,利用基于C4.5决策树的wrapper型特征选择方法确定最优特征子集。在真实网络流量数据集上的实验结果表明,与传统方法相比,该方法具有较高的整体准确率、小类召回率和g-mean值,从而可以减轻多类不均衡问题带来的不良影响。 展开更多
关键词 网络流量 多类不均衡 特征选择 相对不确定性 对称不确定性
在线阅读 下载PDF
一种启发式的局部随机特征选择算法 被引量:5
5
作者 刘景华 林梦雷 +1 位作者 张佳 林耀进 《计算机工程与应用》 CSCD 北大核心 2016年第2期170-174,185,共6页
深入研究大间隔从样本间相似性、信息熵从特征间相关性进行特征选择的特点,提出一种有效地融合这两类方法的特征选择算法。采用Relief算法得到一个有效的特征排序,进而将其划分为若干区段。设置各区段的采样率,以对称不确定性作为启发... 深入研究大间隔从样本间相似性、信息熵从特征间相关性进行特征选择的特点,提出一种有效地融合这两类方法的特征选择算法。采用Relief算法得到一个有效的特征排序,进而将其划分为若干区段。设置各区段的采样率,以对称不确定性作为启发因子获得每个局部随机子空间的特征子集。将获得的所有特征子集作为最终的特征选择结果。实验结果表明该方法优于一些常用的特征选择算法。 展开更多
关键词 特征选择 大间隔 对称不确定性 局部随机子空间
在线阅读 下载PDF
一种基于分类互补性的特征选择算法 被引量:5
6
作者 李立斌 李宁 杨育彬 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第5期486-494,共9页
针对特征选择中Filter与Wrapper方法分别存在的问题,本文提出了一种新的基于分类互补性分析的特征选择算法.该方法将Filter方法与Wrapper方法结合起来.先根据ReliefF评估和对称不确定性评估去除不相关特征,再使用对称不确定性评估去除... 针对特征选择中Filter与Wrapper方法分别存在的问题,本文提出了一种新的基于分类互补性分析的特征选择算法.该方法将Filter方法与Wrapper方法结合起来.先根据ReliefF评估和对称不确定性评估去除不相关特征,再使用对称不确定性评估去除冗余特征,最后使用基于分类互补性分析的Wrapper特征选择算法选出最后的目标子集.实验表明该算法结合了Filter与Wrapper两者的优点,具备了高准确性,同时可以减少时间开销.文章最后在数字乳腺图像肿块的检测中应用了该算法,得到了良好的效果. 展开更多
关键词 特征选择 FILTER WRAPPER 相关性ReliefF 对称不确定性 分类互补性
在线阅读 下载PDF
面向类不平衡网络流量的特征选择算法 被引量:9
7
作者 唐宏 刘丹 +2 位作者 姚立霜 王云锋 裴作飞 《电子与信息学报》 EI CSCD 北大核心 2021年第4期923-930,共8页
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次... 针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除不相关特征及冗余特征;最后,利用基于相关性度量的特征评估函数以及序列搜索算法进一步降低特征维数,确定最优特征子集。实验表明,在保证算法整体分类精确率的前提下,算法能够有效提高小类别的分类性能。 展开更多
关键词 流量分类 特征选择 类不平衡 加权对称不确定性 近似马尔科夫毯
在线阅读 下载PDF
基于改进的C4.5算法的代码异味检测方法 被引量:4
8
作者 王帆 吴海涛 高建华 《计算机工程与设计》 北大核心 2021年第4期969-975,共7页
为检测软件结构中的代码异味,提出在属性选择过程中将ReliefF算法和互信息结合,筛选出相关度大而冗余度小的条件属性集。传统C4.5算法在构造决策树时,只考虑条件属性和目标属性的相关度,忽略条件属性间的相关度,基于这个问题提出在C4.5... 为检测软件结构中的代码异味,提出在属性选择过程中将ReliefF算法和互信息结合,筛选出相关度大而冗余度小的条件属性集。传统C4.5算法在构造决策树时,只考虑条件属性和目标属性的相关度,忽略条件属性间的相关度,基于这个问题提出在C4.5算法中加入对称不确定性(SU),利用SU计算条件属性间的相关度,更新信息增益率的计算,提高代码异味检测精确度。对比实验结果表明,该算法能够提高代码异味的检测精确度,有利延长软件生存周期。 展开更多
关键词 代码异味 C4.5算法 对称不确定性 RELIEFF算法 互信息
在线阅读 下载PDF
基于机器学习的混合式特征选择算法 被引量:7
9
作者 雷海锐 高秀峰 刘辉 《电子测量技术》 2018年第16期42-46,共5页
针对CFS算法中优先选择数量较多的特征属性的问题,引入了信息增益比和对称不确定性的改进CFS算法。同时,为了进一步降低特征维数,提高分类效率,提出一种基于filter-wrapper模型的混合式特征选择方法,先采用改进后的CFS算法过滤无关特征... 针对CFS算法中优先选择数量较多的特征属性的问题,引入了信息增益比和对称不确定性的改进CFS算法。同时,为了进一步降低特征维数,提高分类效率,提出一种基于filter-wrapper模型的混合式特征选择方法,先采用改进后的CFS算法过滤无关特征;再基于精简子集,采用封装式选择中的序列后向搜索算法,结合决策树选取最优子集。仿真实验表明,采用该方法选择的特征子集具有更好的分类能力,同时发现该方法在不同的分类模型中泛化能力也有着不同的表现。 展开更多
关键词 特征选择 信息增益比 对称不确定性 CFS 决策树
在线阅读 下载PDF
一种采用冗余性动态权重的特征选择算法 被引量:8
10
作者 肖利军 郭继昌 顾翔元 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第5期155-161,共7页
由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和三维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能... 由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和三维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和三路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。 展开更多
关键词 特征选择 冗余性 三路交互信息 对称不确定性 分类
在线阅读 下载PDF
基于交互信息的两阶段特征选择算法 被引量:1
11
作者 刘强 降爱莲 《计算机工程与设计》 北大核心 2023年第1期125-132,共8页
针对传统特征选择中只考虑了特征的相关性和冗余性而忽略了特征间交互作用的问题,提出一种基于交互信息的两阶段特征选择算法(SAMBFC)。通过对称不确定性和强近似马尔可夫毯原理进行无关特征和冗余特征的筛选;利用特征间交互增益和基于... 针对传统特征选择中只考虑了特征的相关性和冗余性而忽略了特征间交互作用的问题,提出一种基于交互信息的两阶段特征选择算法(SAMBFC)。通过对称不确定性和强近似马尔可夫毯原理进行无关特征和冗余特征的筛选;利用特征间交互增益和基于相关性特征选择算法构建一种特征间互补性评价方法,选取具有交互作用的冗余特征。在9个不同维度的标准数据集上与8种典型算法进行对比实验和分析,其结果表明,SAMBFC算法所选特征的分类性能以及综合表现明显优于其它算法。 展开更多
关键词 特征选择 两阶段 强近似马尔可夫毯 对称不确定性 相关性 冗余性 互补性
在线阅读 下载PDF
一种面向SNP选择的K-Center算法
12
作者 曹莉敏 周从华 《计算机应用与软件》 北大核心 2020年第9期227-234,共8页
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)数据是一种关于遗传病理学研究的重要数据,其高维少样本,存在大量噪声和冗余,并且SNP位点之间存在连锁不平衡性,因此需要对SNP数据进行降维。提出一种改进的K-Center算法——K-MSU... 单核苷酸多态性(Single Nucleotide Polymorphism,SNP)数据是一种关于遗传病理学研究的重要数据,其高维少样本,存在大量噪声和冗余,并且SNP位点之间存在连锁不平衡性,因此需要对SNP数据进行降维。提出一种改进的K-Center算法——K-MSU算法。使用K-Center进行数据降维,在K-Center算法的距离度量中引入对称不确定性,解决SNP数据之间的连锁不平衡性;针对K-Center算法的随机选择初始聚类中心的方法容易对聚类结果产生较大的影响,使用基于信息增益的密度方法去选择初始聚类中心。在医院提供的临床实验数据的实验结果表明,K-MSU算法在SNP选择中具有更高的分类准确率和较好的效果。 展开更多
关键词 单核苷酸多态 SNP选择 K-Center 特征选择 对称不确定性 信息增益
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部