期刊文献+
共找到3,330篇文章
< 1 2 167 >
每页显示 20 50 100
面向高光谱遥感图像的MMRI-Boruta特征选择算法
1
作者 张婧 孔霄 +2 位作者 曹峰 张超 李德玉 《郑州大学学报(理学版)》 北大核心 2026年第1期72-77,共6页
高光谱遥感图像特征选择旨在从高维光谱特征集中选择最优光谱特征子集,以消除冗余光谱特征来提高高光谱遥感图像分析的效率和精度。由此提出了一种混合型特征选择算法MMRI-Boruta,该算法首先对过滤式MRI特征选择算法进行改进,通过引入... 高光谱遥感图像特征选择旨在从高维光谱特征集中选择最优光谱特征子集,以消除冗余光谱特征来提高高光谱遥感图像分析的效率和精度。由此提出了一种混合型特征选择算法MMRI-Boruta,该算法首先对过滤式MRI特征选择算法进行改进,通过引入方差定义新的特征重要性评价指标,然后利用封装式的Boruta算法实现特征子集的进一步优化。所提算法结合了过滤式和封装式两种特征选择算法的优点,更易于获取最优特征子集。为了验证该算法的有效性,使用了两个经典的高光谱遥感图像数据集Indian Pines和Salinas对算法的性能进行了测试,实验结果表明该算法优于对比算法。 展开更多
关键词 高光谱遥感图像 特征选择 互信息 相关性
在线阅读 下载PDF
基于光谱特征选择和机器学习的沥青类型识别
2
作者 吕悦晶 钱进 +3 位作者 刘渭宁 汤文 王进波 薛永康 《江苏大学学报(自然科学版)》 北大核心 2026年第1期104-110,124,共8页
为提高识别速率,采用傅里叶变换红外光谱(FTIR)结合机器学习技术对多种老化状态下沥青的类型与等级进行分析.首先基于衰减全反射红外光谱(ATR-FTIR)对多种老化状态下的72个沥青样本进行光谱特征提取,分别采用连续投影算法(SPA)、主成分... 为提高识别速率,采用傅里叶变换红外光谱(FTIR)结合机器学习技术对多种老化状态下沥青的类型与等级进行分析.首先基于衰减全反射红外光谱(ATR-FTIR)对多种老化状态下的72个沥青样本进行光谱特征提取,分别采用连续投影算法(SPA)、主成分分析(PCA)、特征峰吸光度分析对沥青光谱样本进行特征提取,并简化光谱数据;其次将上述光谱数据作为输入数据,分别采用支持向量机(SVM)和线性判别分析(LDA)建立分类模型;最后采用交叉验证和混淆矩阵进行模型评价.结果表明:基于光谱特征选择(SPA、PCA、特征峰吸光度)与LDA的组合模型,对沥青老化状态进行分类识别,识别准确率达到100%,交叉验证准确率超过98%;光谱特征提取与LDA的组合模型显著提高了泛化能力与分类准确性,能够有效区分多种老化状态下的沥青种类及其服役状态. 展开更多
关键词 沥青分类 红外光谱 光谱特征选择 支持向量机 线性判别分析 机器学习
在线阅读 下载PDF
互信息与遗传算法融合的多维分类特征选择算法
3
作者 李二超 张宝新 +2 位作者 贾彬彬 包寅寅 杨宏强 《计算机工程与应用》 北大核心 2026年第5期162-177,共16页
多维分类(multi-dimensional classification,MDC)模型在处理高维特征时面临计算效率与泛化性能的挑战。特征选择通过筛选有效特征子集,可同时降低维度并提升分类器性能。已有的MDC研究主要集中于显式地建模类空间之间的依赖关系,而面向... 多维分类(multi-dimensional classification,MDC)模型在处理高维特征时面临计算效率与泛化性能的挑战。特征选择通过筛选有效特征子集,可同时降低维度并提升分类器性能。已有的MDC研究主要集中于显式地建模类空间之间的依赖关系,而面向MDC的特征选择方法仍需深入探索。针对MDC数据的特点,设计了一种互信息与遗传算法融合的多维分类特征选择算法MIGA(multi-dimensional classification feature selection algorithm based on fusion of mutual information and genetic algorithm)。该算法设计基于类空间综合相关性的种群初始化策略,以增加种群的多样性并加速收敛;提出自适应变异策略,依据特征综合得分动态调整变异概率以平衡全局探索与局部开发能力;融合MDC三项指标构建负加权和形式的适应度函数以适配GA优化框架。在10个MDC数据集上的实验结果表明:相较于特征映射降维方法(PCA、MDS)、监督式MDC降维方法SDeM(supervised dimensionality reduction for MDC)以及专用于MDC的过滤式特征选择算法MIFS(mutual information feature selection),MIGA所获特征子集显著提升了多维分类模型的泛化性能。 展开更多
关键词 机器学习 多维分类(MDC) 特征选择(FS) 遗传算法(GA) 互信息
在线阅读 下载PDF
自适应特征选择的BiLSTM-LSTM滚动轴承寿命预测研究
4
作者 聂磊 徐诗奕 +1 位作者 张吕凡 蔡文涛 《机械设计与制造》 北大核心 2026年第2期197-202,209,共7页
为了实现剩余寿命预测过程中的自主特征筛选,有效利用筛选出的最优特征集数据,提出了一种基于自适应特征选择法与BiLSTM-LSTM的预测模型。该方法先利用自适应特征选择法自主地对时、频域特征进行筛选;然后利用主成分分析法(PCA)构建趋... 为了实现剩余寿命预测过程中的自主特征筛选,有效利用筛选出的最优特征集数据,提出了一种基于自适应特征选择法与BiLSTM-LSTM的预测模型。该方法先利用自适应特征选择法自主地对时、频域特征进行筛选;然后利用主成分分析法(PCA)构建趋势性量化健康指标(HI),最后将HI输入BiLSTM-LSTM网络中,对滚动轴承的剩余寿命进行预测。利用IMS轴承公开数据集验证了提出的基于自适应特征选择法和BiLSTM-LSTM神经网络的预测模型在滚动轴承的退化趋势与剩余使用寿命预测上的有效性,并在PHM2012轴承公开数据集上进行了泛化性检验,进一步验证了方法的优越性。 展开更多
关键词 滚动轴承 自适应特征选择 双向长短期记忆神经网络 长短期记忆神经网络 寿命预测
在线阅读 下载PDF
基于邻域粒度条件熵的动态萤火虫特征选择算法 被引量:1
5
作者 吴国霞 邱雅茹 江峰 《计算机工程》 北大核心 2026年第1期144-153,共10页
针对传统的萤火虫算法(FA)在处理优化问题时存在的收敛速度慢、易陷入局部最优解等问题,提出一种动态的萤火虫算法,并将该算法与邻域粗糙集相关理论相结合开展特征选择的研究,从而实现对连续型数值的有效处理,并且有效提高特征选择的性... 针对传统的萤火虫算法(FA)在处理优化问题时存在的收敛速度慢、易陷入局部最优解等问题,提出一种动态的萤火虫算法,并将该算法与邻域粗糙集相关理论相结合开展特征选择的研究,从而实现对连续型数值的有效处理,并且有效提高特征选择的性能。首先,为了改进萤火虫算法的搜索策略,引入POX(Precedence Operation Crossover)变异策略并采用阈值设置控制萤火虫交叉变异的概率,便于陷入局部最优的个体及时跳出,提出一种动态的萤火虫算法;其次,为了能够同时考虑到知识完备性和知识粒度大小,将邻域粗糙集中的邻域知识粒度与条件熵有机结合,提出一种新的信息熵模——邻域粒度条件熵;最后,提出一种基于邻域粒度条件熵与动态萤火虫算法的特征选择算法FS_NGHFAPOX,该算法采用邻域粒度条件熵来构建适应度函数,进而更好地评价特征子集。在UCI和scikit-learn机器学习库中的内置数据库中部分数据集上进行实验验证,验证结果表明FS_NGHFAPOX算法分类性能最优且所选特征子集数量更少,平均准确率达到0.83,相较于其他特征选择算法最多提高了15%。 展开更多
关键词 特征选择 萤火虫算法 变异策略 适应度函数 邻域知识粒度 邻域粒度条件熵
在线阅读 下载PDF
基于特征选择和特征表示的垂直联邦知识迁移算法
6
作者 孙艳华 刘畅 +3 位作者 王子航 杨睿哲 李萌 王朱伟 《北京工业大学学报》 北大核心 2026年第2期138-147,共10页
为了突破现有的知识迁移融合方案大多以水平联邦学习算法为基础的局限性并且提高训练精度,充分挖掘医疗机构中海量患者数据价值,让不同资源状况的医院均能从中受益,该文提出一种垂直联邦知识转移框架,利用基于信息增益的特征选择模块和... 为了突破现有的知识迁移融合方案大多以水平联邦学习算法为基础的局限性并且提高训练精度,充分挖掘医疗机构中海量患者数据价值,让不同资源状况的医院均能从中受益,该文提出一种垂直联邦知识转移框架,利用基于信息增益的特征选择模块和基于幂迭代的知识蒸馏模块辅助完成垂直联邦知识转移,不仅能提高本地样本学习性能,使共享样本数量有限的医院受益,还能保证知识转移过程独立,让医疗资源稀缺的医院之间可以相互协作,有效提升医疗服务质量。仿真结果表明,与LOCAL法、FTL法、VFedTrans方法相比,该文提出的算法可以将疾病预测精度提升约10%。 展开更多
关键词 垂直联邦学习 特征表示 特征选择 知识蒸馏 知识迁移 信息增益
在线阅读 下载PDF
考虑特征选择的土石坝溃口峰值流量预测模型
7
作者 张美满 李晶 +5 位作者 张友明 杨旭 雷天宇 陈瀚 徐津 王玲玲 《水利水电科技进展》 北大核心 2026年第1期54-59,共6页
针对溃口特征维度高且特征间高度相关性导致预测模型性能下降的问题,提出了一种融合Lasso算法和XGBoost模型的土石坝溃口峰值流量预测模型。该模型采用斯皮尔曼相关系数法分析溃口特征间的相关性,使用Lasso算法进行进一步的特征选择,并... 针对溃口特征维度高且特征间高度相关性导致预测模型性能下降的问题,提出了一种融合Lasso算法和XGBoost模型的土石坝溃口峰值流量预测模型。该模型采用斯皮尔曼相关系数法分析溃口特征间的相关性,使用Lasso算法进行进一步的特征选择,并通过剔除冗余特征得到最优特征子集,再将该特征子集输入XGBoost模型进行溃口峰值流量预测。与支持向量回归和岭回归机器学习模型对比结果表明,该模型具有良好的非线性信息挖掘能力,可对高维特征进行有效降维,在减少模型复杂性的同时提高了模型预测精度。 展开更多
关键词 土石坝溃口 峰值流量预测 特征选择 多重共线性 Lasso算法 XGBoost模型
在线阅读 下载PDF
结合随机抽样和改进Relief-F的高效特征选择算法
8
作者 靳祥 王锋 魏巍 《小型微型计算机系统》 北大核心 2026年第1期34-41,共8页
特征选择是一种常用的数据预处理技术.为更深入分析复杂数据中隐藏的有用信息,本文提出了一种结合随机抽样和改进Relief-F的高效特征选择算法(SSFS).本文中,首先基于Relief-F算法拓展了一种新的计算特征权重的算法MDWA;并将该算法引入... 特征选择是一种常用的数据预处理技术.为更深入分析复杂数据中隐藏的有用信息,本文提出了一种结合随机抽样和改进Relief-F的高效特征选择算法(SSFS).本文中,首先基于Relief-F算法拓展了一种新的计算特征权重的算法MDWA;并将该算法引入到基于耦合学习的特征选择中,设计了一种有效的特征选择算法nFSCL;在此基础上结合随机抽样,并使用随机森林中基于Gini指数的特征重要性评分对所选择到的特征进一步作重要性评价,从而获取到最终的有效特征子集.为验证本文提出新算法的有效性,实验分析中使用了12组UCI数据集作了测试和比较,分别验证了本文拓展的特征权重求解算法MDWA以及高效特征选择算法SSFS的有效性和可行性,进一步表明本文提出的特征选择算法在不同数据集上均能找到有效的特征子集. 展开更多
关键词 特征选择 随机抽样 Relief-F 随机森林
在线阅读 下载PDF
LIBS结合最大相关最小冗余特征选择的镁合金快速分类识别
9
作者 陈明方 宫宇 +4 位作者 徐向君 冯磊 王鑫浩 邱选兵 李传亮 《光学精密工程》 北大核心 2026年第4期548-558,共11页
镁合金因其低密度、高比强度和优异的耐腐蚀性能,在航空航天、汽车及电子工业中得到广泛应用。激光诱导击穿光谱(LIBS)具有分析速度快、无需复杂样品制备等优势,因此在镁合金检测领域具有良好应用前景。由于LIBS光谱在不同次测量中存在... 镁合金因其低密度、高比强度和优异的耐腐蚀性能,在航空航天、汽车及电子工业中得到广泛应用。激光诱导击穿光谱(LIBS)具有分析速度快、无需复杂样品制备等优势,因此在镁合金检测领域具有良好应用前景。由于LIBS光谱在不同次测量中存在较大波动,同时不同类型镁合金的光谱相似度较高,数据中还包含冗余信息,直接分类往往效果有限。本文提出基于特征选择的镁合金快速分类方法,系统对比了最大相关最小冗余(mRMR)、随机森林(RF)和光谱指数三种特征选择方法,并结合支持向量机(Support Vector Machine,SVM)、反向传播神经网络(BPNN)和K近邻(KNN)三种分类模型,构建了多种镁合金分类模型。实验结果表明:mRMR-BPNN在仅使用180个特征的条件下,在首日和次日的数据测试中分别达到99.4%和92.5%的准确率,显著优于其他特征选择-分类器组合方法以及原始光谱直接分类方法。该方法在无需复杂前处理的条件下有效提升了模型的分类准确率与泛化能力,为镁铝合金材料的快速在线检测与质量控制提供了一种可靠分析手段,对推动LIBS技术在工业现场中的实际应用具有积极意义。 展开更多
关键词 激光诱导击穿光谱 镁合金 特征选择 机器学习
在线阅读 下载PDF
基于DTW M的时序邻域特征选择算法
10
作者 杨璇 王潇婉 +1 位作者 胡灵芝 吴迪 《计算机应用研究》 北大核心 2026年第1期170-177,共8页
现实生活中广泛存在的高维时序数据常常具有决策属性且时间长度不等的特点,使得现有的邻域粗糙集特征选择算法不再适用或分类性能下降。为了解决该问题,提出了一种基于DTW M度量的高维时序数据的特征选择方法。首先,引入马氏距离定义高... 现实生活中广泛存在的高维时序数据常常具有决策属性且时间长度不等的特点,使得现有的邻域粗糙集特征选择算法不再适用或分类性能下降。为了解决该问题,提出了一种基于DTW M度量的高维时序数据的特征选择方法。首先,引入马氏距离定义高维动态时间扭曲距离(DTW M)用于度量属性间的相似性;接着定义了时序决策信息系统,用于存放非等长高维时序数据;提出基于DTW M距离度量的时序邻域关系和时序邻域粗糙集模型;最后通过定义内、外重要度,给出了属性依赖度作为筛选和提出属性的重要指标,进而提出了基于DTW M度量的高维时序数据的特征选择方法。通过五个公开数据集上的实验结果表明,所提算法较其他算法在分类精度上平均提升了14.2%和21.7%,充分证明了其有效性和优越性。 展开更多
关键词 特征选择 高维时序数据 DTW M度量 马氏距离 邻域粗糙集
在线阅读 下载PDF
基于加权PageRank特征选择的软件缺陷预测集成分类方法
11
作者 王炜清 范洪旗 +1 位作者 严远亭 张以文 《计算机集成制造系统》 北大核心 2026年第3期1025-1048,共24页
基于机器学习方法的软件缺陷预测(SDP)是软件工程中的一项关键技术。随着软件规模的扩大,利用不同的软件度量指标从源代码中提取的度量元迅速增加,软件缺陷数据维数呈现出高维趋势,给训练高效的SDP模型带来了巨大挑战。鉴于此,提出了一... 基于机器学习方法的软件缺陷预测(SDP)是软件工程中的一项关键技术。随着软件规模的扩大,利用不同的软件度量指标从源代码中提取的度量元迅速增加,软件缺陷数据维数呈现出高维趋势,给训练高效的SDP模型带来了巨大挑战。鉴于此,提出了一种基于加权PageRank的双评估特征选择方法(DEFS)。DEFS同时考虑特征之间的组合效应和全局关系,将所有特征建模为完整的加权图。然后利用加权PageRank算法计算特征的重要性以实现优质特征的选择。最后为了融合多种特征选择算法的优势,将DEFS嵌入到集成框架中实现基于加权PageRank的双评估特征选择集成方法(E-DEFS),进一步提高预测性能。在6个软件缺陷数据库的30个数据集上的实验结果表明,DEFS和E-DEFS相较于经典的特征选择方法取得了更优的性能表现。 展开更多
关键词 软件缺陷预测 特征选择 集成学习 完全加权图 PAGERANK算法 机器学习
在线阅读 下载PDF
基于标记模糊化的层次特征选择
12
作者 龚匡丰 李国和 +1 位作者 郭凌云 林耀进 《南京大学学报(自然科学版)》 北大核心 2026年第1期151-162,共12页
分层分类任务通常面临高维特征空间、复杂的类别层次结构以及标记稀疏等多重挑战,其中,标记稀疏性导致监督信息不足,进而削弱特征选择的效果.针对该问题,提出一种新的层次特征选择方法——基于标记模糊化的层次特征选择方法(Hierarchica... 分层分类任务通常面临高维特征空间、复杂的类别层次结构以及标记稀疏等多重挑战,其中,标记稀疏性导致监督信息不足,进而削弱特征选择的效果.针对该问题,提出一种新的层次特征选择方法——基于标记模糊化的层次特征选择方法(Hierarchical Feature Selection Based on Label Fuzzification,HFSLF),其核心思想是通过增强稀疏标记的语义表达能力来改善监督信息.具体地,HFSLF首先利用兄弟关系构建类别间的模糊相似性,并利用该相似性将样本的原始标记转化为标记分布,这一转化过程有效扩展了监督信息的覆盖范围,增强了稀疏场景下的语义监督表达.进一步,所提算法以特征与标记分布之间的互信息为监督信号,引导特征权重逼近其对应的互信息值,从而增强模型对高相关性特征的选择偏好.在六个层次数据集上的实验证明了所提算法的有效性. 展开更多
关键词 特征选择 分层分类学习 标记模糊化 互信息
在线阅读 下载PDF
基于代价熵信息粒化的半监督特征选择方法
13
作者 乔丽娇 李佳蓉 +2 位作者 单婷婷 鞠恒荣 丁卫平 《南京邮电大学学报(自然科学版)》 北大核心 2026年第2期123-132,共10页
随着数据维度和规模的增长,传统特征选择方法面临计算效率低、分类性能差等问题。半监督特征选择虽能结合少量标记和大量未标记数据筛选低冗余、高相关性的特征,但现有方法难以兼顾局部与全局特征分析。为此,文中提出一种基于代价熵信... 随着数据维度和规模的增长,传统特征选择方法面临计算效率低、分类性能差等问题。半监督特征选择虽能结合少量标记和大量未标记数据筛选低冗余、高相关性的特征,但现有方法难以兼顾局部与全局特征分析。为此,文中提出一种基于代价熵信息粒化的半监督特征选择方法。该方法通过构建加权粒舱,将样本划分为核心粒舱和边界粒舱,并结合协方差主方向对各决策类进行半球粒化,为未标记样本分配伪标签。随后,引入代价熵评估特征重要性,并据此选择最优特征子集。实验结果表明,所提出的方法在多个数据集上优于现有方法,显著提升分类准确率,并降低计算复杂度。 展开更多
关键词 特征选择 加权粒舱 半球粒化 代价熵 半监督
在线阅读 下载PDF
基于互信息特征选择和递归特征消除的钢材疲劳强度预测
14
作者 姚磊 黎振 +2 位作者 武川 孟亚飞 王孟超 《机械强度》 北大核心 2026年第1期72-78,共7页
【目的】为了解决疲劳强度预测中由于数据量不足和高维数据而引起的挑战,提出一种互信息特征选择和递归特征消除(Mutual Information Feature Selection and Recursive Feature Elimination,MIFS-RFE)相结合的方法。【方法】首先,采用M... 【目的】为了解决疲劳强度预测中由于数据量不足和高维数据而引起的挑战,提出一种互信息特征选择和递归特征消除(Mutual Information Feature Selection and Recursive Feature Elimination,MIFS-RFE)相结合的方法。【方法】首先,采用MIFS识别对模型预测最关键的特征。其次,在RFE阶段重点处理剩余特征,通过系统迭代过程选择最具信息量的特征,确保最终特征子集能够准确地支持疲劳强度预测。最后,将经过特征选择和消除处理得到的最终特征子集输入到随机森林回归(Random Forest Regression,RFR)、K最近邻回归(K Nearest Neighbor Regression,KNN)、支持向量回归(Support Vector Regression,SVR)和多层感知机(Multi-Layer Perceptron,MLP)模型中,综合分析各模型的预测性能。【结果】经过优化后,特征数据从原始的25维降到了13维。在测试过程中,RFR、KNN、SVR和MLP的决定系数R^(2)分别为0.9777、0.9725、0.9613和0.9766。相较于全部特征的测试结果,所提方法使得模型的R^(2)最大提升了0.0208。最后基于模型的Shapley加法解释(Shapley Additive Explanation,SHAP)值分析最优特征的影响性,验证了MIFS-RFE方法的有效性,说明所提方法在维持相对高性能的同时成功降低了特征维度,为疲劳强度预测提供了更有效的优化方案。 展开更多
关键词 疲劳强度 互信息特征选择 递归特征消除 机器学习 最优特征子集
在线阅读 下载PDF
基于混合特征选择的BiGRU-Att烧结矿转鼓指数预测模型
15
作者 栗潇通 宋小龙 +1 位作者 范金鑫 吴朝霞 《东北大学学报(自然科学版)》 北大核心 2026年第1期107-114,共8页
由于烧结过程具有复杂且高维的过程变量及诸多不确定性因素,单一特征选择方法难以有效地选出最佳特征集,从而影响模型的预测准确性.为此,提出一种基于混合特征选择的BiGRU-Att烧结矿转鼓指数预测模型.首先,利用最大信息系数(MIC)从原始... 由于烧结过程具有复杂且高维的过程变量及诸多不确定性因素,单一特征选择方法难以有效地选出最佳特征集,从而影响模型的预测准确性.为此,提出一种基于混合特征选择的BiGRU-Att烧结矿转鼓指数预测模型.首先,利用最大信息系数(MIC)从原始特征集中筛选出候选特征.然后,运用基于同时扰动随机逼近的特征选择方法(SPSA-FS)对候选特征集进一步优选.最终,将最佳特征集作为基于注意力机制的双向门控循环单元模型(BiGRU-Att)的输入进行烧结矿转鼓指数预测.与多种模型和单一特征选择方法的比较分析结果表明,本文提出的混合特征选择方法能够选出最佳的特征集,所建模型具有较高的预测精度,为烧结过程提供了可靠的决策支持. 展开更多
关键词 烧结矿转鼓指数 混合特征选择方法 BiGRU 预测模型 注意力机制
在线阅读 下载PDF
数据驱动下基于时间序列云模型的特征选择聚类算法研究
16
作者 刘小红 张人龙 《统计与决策》 北大核心 2026年第5期41-47,共7页
由于时间序列数据具有多变量性和高维度性特征,增加了重要特征提取的难度,进而降低了高维数据聚类的精度与准确度。因此,针对多变量时间序列数据具有的非线性、高维冗余等特征,文章首先在传统特征选择算法、云模型、复杂时间序列等研究... 由于时间序列数据具有多变量性和高维度性特征,增加了重要特征提取的难度,进而降低了高维数据聚类的精度与准确度。因此,针对多变量时间序列数据具有的非线性、高维冗余等特征,文章首先在传统特征选择算法、云模型、复杂时间序列等研究的基础上,提出了有效的、可拓展的基于时间序列云模型的混合特征选择聚类算法;其次,针对提取出来的多维度时间序列数据特征,应用云模型时间相似度与多目标粒子群优化算法相结合的方法进行特征筛选与特征优化,以获取更多高质量的特征,从而有效提高混合算法的聚类精度;最后,基于高维数据集进行仿真实验,实验结果表明,该混合特征选择算法能有效解决多维度时间序列数据的复杂特征问题。 展开更多
关键词 时间序列 云模型 多目标粒子群优化 混合特征选择 聚类算法
在线阅读 下载PDF
基于潜在表示和图学习的无监督特征选择
17
作者 宿熙隆 谢锡炯 《计算机工程与设计》 北大核心 2026年第1期10-18,共9页
为解决多视图无监督特征选择在处理高维数据时面临噪声样本和特征干扰、数据样本互连信息利用不充分等问题,提出了一种基于潜在表示和图学习的鲁棒多视图无监督特征选择方法。通过构建融合多视图信息的低秩共识图以抑制噪声;通过核范数... 为解决多视图无监督特征选择在处理高维数据时面临噪声样本和特征干扰、数据样本互连信息利用不充分等问题,提出了一种基于潜在表示和图学习的鲁棒多视图无监督特征选择方法。通过构建融合多视图信息的低秩共识图以抑制噪声;通过核范数约束捕捉跨视图共性特征;将潜在表示学习嵌入特征选择框架,利用低秩图约束潜在空间的局部结构保持能力;并且设计联合优化模型以实现图学习、潜在表示与特征选择的多任务协同优化。实验结果表明,提出的方法在ACC和NMI上均优于实验对比方法。 展开更多
关键词 跨视图局部性 低秩 共识图 潜在表示学习 图学习 多视图 无监督特征选择
在线阅读 下载PDF
稳定性特征选择研究综述 被引量:1
18
作者 刘梓萱 杜建强 +4 位作者 罗计根 黄强 贺佳 李益雯 秦紫瑜 《计算机工程与应用》 北大核心 2025年第7期81-95,共15页
特征选择在高维数据预处理中扮演着重要角色,通过从原始特征集中挑选出最有利于模型性能提升的特征,可以有效地降低数据维数,提高模型的准确性和降低过拟合风险。稳定性是特征选择领域中一个不容忽视的关键研究内容,它指的是特征选择方... 特征选择在高维数据预处理中扮演着重要角色,通过从原始特征集中挑选出最有利于模型性能提升的特征,可以有效地降低数据维数,提高模型的准确性和降低过拟合风险。稳定性是特征选择领域中一个不容忽视的关键研究内容,它指的是特征选择方法对训练样本的微小扰动具有一定的鲁棒性。深入剖析了特征选择过程中产生不稳定性的多重成因;系统归纳并对比了多种提升稳定性的方法,详细阐述了各类方法的目标和评估标准及其独特优势和潜在缺陷;详尽介绍了评估特征选择稳定性的指标的性质,并对稳定性指标进行解析和细致分类;探讨了稳定性特征选择领域存在的问题及对未来的展望,以期为后续的研究和实践提供有价值的参考。 展开更多
关键词 特征选择 稳定性度量 集成特征选择 不稳定性
在线阅读 下载PDF
基于特征选择的食品掺杂物可视分析系统 被引量:1
19
作者 汤颖 盛祎琛 +1 位作者 潘晶 周伟华 《计算机辅助设计与图形学学报》 北大核心 2025年第2期229-242,共14页
食品安全抽检数据中蕴含的掺杂物信息在食品安全早期预警、风险预测等方面有着重要应用.为深入研究食品类别中的高权重掺杂物,首先根据对比学习思想设计了基于特征选择技术的食品掺杂物特征权重计算模型,并获取模型中的样本分类结果、... 食品安全抽检数据中蕴含的掺杂物信息在食品安全早期预警、风险预测等方面有着重要应用.为深入研究食品类别中的高权重掺杂物,首先根据对比学习思想设计了基于特征选择技术的食品掺杂物特征权重计算模型,并获取模型中的样本分类结果、特征信息以及分类模型中常见的评估指标,在上述特征模型计算的基础上,设计并实现了一个食品掺杂物可视分析系统.该系统不仅包含多个联动视图帮助用户更直观地理解食品掺杂物的特征,并支持用户通过迭代交互不断更新最优特征组合.最后,将该可视分析系统用于2010—2020年全国范围内24种食品类别的89202条不合格样本的掺杂物特征分析,实验结果证明该系统可以通过自动化的方式更加方便、直接地获取食品的掺杂物权重,增强掺杂物特征组合,为专业人员提供了对食品掺杂物更全面的见解. 展开更多
关键词 特征选择 食品抽检数据 掺杂物 可视分析 关联分析
在线阅读 下载PDF
KNN特征增强与互信息特征选择的两阶段多维分类方法 被引量:5
20
作者 李二超 张宝新 贾彬彬 《计算机工程与应用》 北大核心 2025年第15期167-177,共11页
现有多维分类的特征增强方法虽丰富了特征空间,但对特征内在质量缺乏有效评估,易引入冗余,影响分类性能。提出基于KNN特征增强与互信息特征选择的两阶段多维分类方法KMFM。第一阶段通过KNN特征增强扩展特征空间,第二阶段基于互信息评估... 现有多维分类的特征增强方法虽丰富了特征空间,但对特征内在质量缺乏有效评估,易引入冗余,影响分类性能。提出基于KNN特征增强与互信息特征选择的两阶段多维分类方法KMFM。第一阶段通过KNN特征增强扩展特征空间,第二阶段基于互信息评估并筛选相关性最强的特征子集,且通过计算类别空间组合熵考虑类别变量间的依赖关系。在10个基准数据集上的实验结果表明,KMFM在汉明分值、精确匹配和亚精确匹配指标上相比现有方法取得显著提升。在90种配置中,KMFM实现77.8%的最佳表现;与只采用特征增强的KRAM相比,性能提升显著;与只进行互信息特征选择MIFS相比,分类性能在9个指标上全面优越,充分说明了该算法的有效性和泛用性。 展开更多
关键词 多维分类 特征增强 特征选择 互信息 类依赖
在线阅读 下载PDF
上一页 1 2 167 下一页 到第
使用帮助 返回顶部