期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于特征间关系合成少数类样本的过采样算法 被引量:2
1
作者 雷明珠 王浩 +2 位作者 贾蓉 白琳 潘晓英 《计算机应用》 CSCD 北大核心 2024年第5期1428-1436,共9页
数据不平衡的现象在现实生活中非常普遍。为了提高整体分类精度,分类器有时会以错分少数类为代价。但在现实生活中,对少数类进行错误分类的后果非常严重。考虑到传统重采样算法容易忽略数据的空间分布和少数类样本特征之间的关系,提出... 数据不平衡的现象在现实生活中非常普遍。为了提高整体分类精度,分类器有时会以错分少数类为代价。但在现实生活中,对少数类进行错误分类的后果非常严重。考虑到传统重采样算法容易忽略数据的空间分布和少数类样本特征之间的关系,提出一种基于特征关系的采样算法(SABRF)生成新的样本集。SABRF通过帕累托多目标特征选择保留不平衡数据集的关键区分特征,同时通过极端梯度提升(XGBoost)回归模型捕获少数类样本关键特征之间的关系。此外,还提出一个新的样本选择策略衡量新生成样本的质量。使用6个公开的UCI数据集和1个真实的骨科术后血栓数据集进行实验,结果表明,SABRF在受试者工作特征曲线下面积(AUC)、F1分数(F1_score)和几何平均值(G_mean)上均有较好的表现;此外,对使用基于多指标评价的样本选择策略挑选出的新样本进行分类,不平衡数据的分类结果也最好,验证了样本选择策略的有效性。 展开更多
关键词 不平衡数据 过采样 特征选择 样本质量评估 极端梯度提升回归 帕累托前沿
在线阅读 下载PDF
基于偏最小二乘回归的鲁棒性特征选择与分类算法 被引量:9
2
作者 尚志刚 董永慧 +1 位作者 李蒙蒙 李志辉 《计算机应用》 CSCD 北大核心 2017年第3期871-875,共5页
提出一种基于偏最小二乘回归的鲁棒性特征选择与分类算法(RFSC-PLSR)用于解决特征选择中特征之间的冗余和多重共线性问题。首先,定义一个基于邻域估计的样本类一致性系数;然后,根据不同k近邻(k NN)操作筛选出局部类分布结构稳定的保守样... 提出一种基于偏最小二乘回归的鲁棒性特征选择与分类算法(RFSC-PLSR)用于解决特征选择中特征之间的冗余和多重共线性问题。首先,定义一个基于邻域估计的样本类一致性系数;然后,根据不同k近邻(k NN)操作筛选出局部类分布结构稳定的保守样本,用其建立偏最小二乘回归模型,进行鲁棒性特征选择;最后,在全局结构角度上,用类一致性系数和所有样本的优选特征子集建立偏最小二乘分类模型。从UCI数据库中选择了5个不同维度的数据集进行数值实验,实验结果表明,与支持向量机(SVM)、朴素贝叶斯(NB)、BP神经网络(BPNN)和Logistic回归(LR)四种典型的分类器相比,RFSC-PLSR在低维、中维、高维等不同情况下,分类准确率、鲁棒性和计算效率三种性能上均表现出较强的竞争力。 展开更多
关键词 偏最小二乘回归 K近邻 噪声样本 特征选择 鲁棒性
在线阅读 下载PDF
有限样本条件下重复抽样建模方法研究 被引量:2
3
作者 高艳平 王晶 《统计与决策》 CSSCI 北大核心 2019年第8期22-25,共4页
文章从数学及模拟仿真的角度证明特征样本重复抽样回归方法(FSR)的优越性。从数学角度证明了对于连续型变量,FSR中抽样方法可充分利用非原采样点的数据分布信息,从而提高估计精度;由FSR方法得到的统计量变异系数大小与抽样次数m成反比... 文章从数学及模拟仿真的角度证明特征样本重复抽样回归方法(FSR)的优越性。从数学角度证明了对于连续型变量,FSR中抽样方法可充分利用非原采样点的数据分布信息,从而提高估计精度;由FSR方法得到的统计量变异系数大小与抽样次数m成反比。通过对小样本参数估计的传统回归、Bayes Bootstrap和特征样本重复抽样方法的仿真模拟比较,验证了上述结论。 展开更多
关键词 有限样本 特征样本重复抽样回归 先验分布
在线阅读 下载PDF
基于自适应线性回归的头部姿态计算 被引量:3
4
作者 郭知智 周前祥 柳忠起 《计算机应用研究》 CSCD 北大核心 2016年第10期3181-3184,共4页
减少训练样本数量和不使用任何硬件参数是目前头部姿态计算领域的最大挑战。针对这些挑战,提出一种仅需要54个训练样本的头部姿态估计方法。其基本思想是将关键点间的归一化距离作为输入特征向量,并利用一阶范数最小化稀疏地挑选出一组... 减少训练样本数量和不使用任何硬件参数是目前头部姿态计算领域的最大挑战。针对这些挑战,提出一种仅需要54个训练样本的头部姿态估计方法。其基本思想是将关键点间的归一化距离作为输入特征向量,并利用一阶范数最小化稀疏地挑选出一组图片集,这些图片对应头部姿态的线性组合为测试图片的头部姿态。实验表明,该方法在不知道任何硬件参数的条件下,可以实现单方向上3°的头部姿态估计。此外,该方法也适用于不均匀光照条件和头部转动较大的情况,且计算精度高于其他相关方法。 展开更多
关键词 头部姿态 自适应线性回归 特征向量 一阶范数最小化 训练样本
在线阅读 下载PDF
一种新的网格曲面上的特征线提取方法 被引量:3
5
作者 葛闪 张丽艳 刘胜兰 《机械科学与技术》 CSCD 北大核心 2015年第8期1181-1185,共5页
提出一种新的三角网格模型的特征线提取方法。首先交互地选取几个初始特征点,利用追踪投影法确定初始特征线;对初始特征线进行均匀采样,找出采样点n环邻域内平均曲率最大的点作为新的特征点;利用这些新的特征点拟合B样条曲线;将B样条曲... 提出一种新的三角网格模型的特征线提取方法。首先交互地选取几个初始特征点,利用追踪投影法确定初始特征线;对初始特征线进行均匀采样,找出采样点n环邻域内平均曲率最大的点作为新的特征点;利用这些新的特征点拟合B样条曲线;将B样条曲线投影在三角网格曲面上。实验结果表明,利用该方法获得的特征线比较光滑而且逼近特征。 展开更多
关键词 特征线 提取 三角网格模型 平均曲率
在线阅读 下载PDF
基于关联规则与多元线性回归的云南省甘蔗产量预测模型 被引量:5
6
作者 刘振洋 赵家松 +1 位作者 胡仁傑 刘笠溶 《广东农业科学》 CAS 2022年第12期160-166,共7页
【目的】构建云南省甘蔗产量预测模型,对云南省甘蔗主产区甘蔗产量进行预测。【方法】选取云南省5个甘蔗主产区的甘蔗种植数据和地区气象数据作为研究对象,使用关联规则算法对研究区水库数、氮肥用量、磷肥用量、钾肥用量、复合肥用量... 【目的】构建云南省甘蔗产量预测模型,对云南省甘蔗主产区甘蔗产量进行预测。【方法】选取云南省5个甘蔗主产区的甘蔗种植数据和地区气象数据作为研究对象,使用关联规则算法对研究区水库数、氮肥用量、磷肥用量、钾肥用量、复合肥用量、地膜使用量、甘蔗种植面积、年均气温、年降水量9个影响因素进行分析,得出5个甘蔗产量的强关联因素作为样本特征,将样本特征代入多元线性回归算法,构建产量预测模型。【结果】根据测试集验证结果显示,使用多元线性回归算法构建甘蔗产量预测模型,普洱、临沧、红河、文山、德宏地区模型的准确率分别为81.1%、89.3%、67.8%、85.3%、73.7%;使用关联规则算法与多元线性回归算法构建甘蔗产量预测模型,普洱、临沧、红河、文山、德宏地区模型的准确率分别为95.4%、92.8%、97.9%、94%、91.4%,关联规则算法对模型准确率的提升分别为14.3%、3.5%、30.1%、8.7%、17.7%。【结论】关联规则算法可提升多元线性回归产量预测模型的准确率,该模型在云南省的5个甘蔗主产区均表现出较好的预测效果,为甘蔗产量预测提供了新的方法。 展开更多
关键词 甘蔗产量 关联规则 多元线性回归 预测模型 产量预测 样本特征筛选
在线阅读 下载PDF
基于随机蛙跳波段选择算法的土壤铅含量高光谱估测 被引量:5
7
作者 安柏耸 王雪梅 +1 位作者 黄晓宇 卡吾恰提·白山 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第10期3302-3309,共8页
高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。旨在寻求特征波段筛选的最佳算法,以实现土壤重金属铅含量的准确监测,为土壤污染防治提供参考。以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源,利用... 高光谱数据中存在的大量冗余信息对高光谱估测精度产生较大影响。旨在寻求特征波段筛选的最佳算法,以实现土壤重金属铅含量的准确监测,为土壤污染防治提供参考。以新疆渭干河-库车河三角洲绿洲土壤重金属铅含量与光谱数据为数据源,利用蒙特卡洛交叉验证(MCCV)算法确定92个有效土壤样品,通过相关分析选取倒数对数一阶微分变换处理的光谱数据,采用随机蛙跳(RF)算法,并结合竞争性自适应重加权(CARS)算法、迭代保留有效信息变量(IRIV)算法及连续投影算法(SPA),构建RF-CARS、RF-IRIV及RF-SPA三种算法对波段进行筛选。以倒数对数一阶微分变换处理下的特征波段反射率为自变量,土壤重金属铅含量为因变量,采用极端梯度提升(XGBoost)和地理加权回归(GWR)方法构建土壤重金属铅含量估测模型。结果表明:(1)光谱变换处理可有效增强光谱与土壤铅含量的敏感性,其中倒数对数一阶微分变换后的土壤光谱特征更为明显,相关系数可达到0.620(p<0.001)。(2)RF-CARS、RF-IRIV及RF-SPA算法分别从高光谱数据中筛选出6、9和7个特征波段,全部位于近红外光谱区域,3种算法具有较强的特征提取能力,极大减少光谱数据中的冗余信息。(3)基于RF-IRIV算法构建的土壤铅含量估测模型的精度和稳定性高于RF-CARS和RF-SPA算法构建的模型,说明RF-IRIV算法能更为准确的保留与土壤铅含量相关的波段。此外,GWR模型的性能优于XGBoost模型,构建的RF-IRIV-GWR模型具有较好的预测能力,可作为研究区土壤铅含量的最优估测模型,其验证集的决定系数(R^(2))为0.892,均方根误差(RMSE)为0.825 mg·kg^(-1),相对分析误差(RPD)为3.09。基于随机蛙跳(RF)与迭代保留有效信息变量(IRIV)算法,结合地理加权回归(GWR)建模方法在快速准确估测土壤铅含量方面具有一定优势,可进行土壤重金属污染的动态监测。 展开更多
关键词 特征波段 随机蛙跳算法 竞争性自适应重加权算法 迭代保留有效信息变量算法 连续投影算法 极端梯度提升 地理加权回归 土壤铅
在线阅读 下载PDF
RFOA优化EEMD阈值和SampEn的水电机组振动信号重构与特征提取 被引量:1
8
作者 董利江 朱霄珣 +6 位作者 刘伟 杨春旭 林翔 高晓霞 吕朝阳 胡乔良 苏海鹏 《水电能源科学》 北大核心 2023年第11期178-182,共5页
针对EEMD在水电机组振动信号降噪处理中的不足,提出一种基于改进果蝇算法(RFOA)优化EEMD噪声IMF分量阈值的降噪算法。通过EEMD算法将噪声信号分解,得到IMF分量,进而通过相关系数法确定噪声信号与有效信号,利用RFOA确定噪声信号IMF分量阈... 针对EEMD在水电机组振动信号降噪处理中的不足,提出一种基于改进果蝇算法(RFOA)优化EEMD噪声IMF分量阈值的降噪算法。通过EEMD算法将噪声信号分解,得到IMF分量,进而通过相关系数法确定噪声信号与有效信号,利用RFOA确定噪声信号IMF分量阈值;将求得的IMF分量的样本熵当作特征向量输入GRNN算法中,进行振动模式识别。研究结果表明,与小波阈值法、EEMD-GA方法相比,所提算法降噪时信噪比最高,降噪效果最佳。 展开更多
关键词 振动信号提取 集合经验模态分解 样本熵 特征提取 广义回归神经网络模型
在线阅读 下载PDF
特征融合的核相关滤波目标跟踪 被引量:5
9
作者 张晓玄 高美凤 《小型微型计算机系统》 CSCD 北大核心 2017年第10期2385-2389,共5页
针对复杂环境下采用单一图像特征跟踪精度和鲁棒性差的问题,基于密度采样框架提出了一种特征融合的核相关滤波目标跟踪算法.首先,对密度采样得到的各个样本提取多种特征,分别建立目标外观模型,并用核化的岭回归分类器分别对样本的外观... 针对复杂环境下采用单一图像特征跟踪精度和鲁棒性差的问题,基于密度采样框架提出了一种特征融合的核相关滤波目标跟踪算法.首先,对密度采样得到的各个样本提取多种特征,分别建立目标外观模型,并用核化的岭回归分类器分别对样本的外观模型进行训练;然后用训练获得的滤波模板对待检测帧的各个候选样本进行相似性度量;最后对相似性度量后的响应值线性融合,以获得对目标位置的估计.为了克服传统的模板更新引起的误跟踪,采用遮挡检测更新策略对目标进行跟踪.实验结果表明,本文提出的算法能够有效避免目标在遮挡、光照变化、背景干扰和相机移动等复杂环境下的影响,具有较高的跟踪精度和鲁棒性. 展开更多
关键词 目标跟踪 特征融合 相关滤波 密度采样 岭回归
在线阅读 下载PDF
基于样本特征核矩阵的稀疏双线性回归 被引量:2
10
作者 邵政毅 陈秀宏 《计算机科学》 CSCD 北大核心 2021年第10期185-190,共6页
在许多实际应用中出现了大量的冗余数据,这些数据可能是高维的,这时进行回归预测将会出现过拟合的现象,并且还会出现预测精度偏低等问题。另外,大多数回归方法都是基于向量的,忽略了矩阵数据原始位置之间的关系。为此,文中提出了一种基... 在许多实际应用中出现了大量的冗余数据,这些数据可能是高维的,这时进行回归预测将会出现过拟合的现象,并且还会出现预测精度偏低等问题。另外,大多数回归方法都是基于向量的,忽略了矩阵数据原始位置之间的关系。为此,文中提出了一种基于样本特征核矩阵的稀疏双线性回归(Kernel Matrix-based Sparse Bilinear Regression,KMSBR)方法。该方法直接将数据矩阵作为输入,其是通过左右回归系数矩阵而建立的,利用样本的特征核矩阵和L 2,1范数,能够同时实现对样本及样本特征的选择,且考虑了数据的原始位置,提高了算法的性能。在若干数据集上的实验结果表明,KMSBR能有效地选择相对重要的样本和特征,从而提高算法的运行效率,且其预测精度优于已有的几种回归模型。 展开更多
关键词 特征核矩阵 线性回归 样本与特征提取 稀疏性 左右回归矩阵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部