期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于间隔二肽组分和递归特征消除法的DNA结合蛋白的鉴定
1
作者 汤亚东 刘潇 +2 位作者 刘太岗 谢鹭 陈兰明 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2018年第4期453-459,共7页
DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature eliminati... DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature elimination,RFE)鉴定DBPs.首先获得待测蛋白质氨基酸序列的位置特异性得分矩阵(position specific scoring matrix,PSSM),在此基础上提取蛋白质的Gap DPC特征,通过RFE法选择最优特征,然后利用支持向量机(support vector machine,SVM)作为分类器,在蛋白质序列数据集PDB396和LB1068中进行夹克刀交叉验证(jackknife cross validation test).研究结果显示,基于PDB396和LB1068数据集,DBPs预测的准确率、Matthews相关系数、敏感性和特异性分别达到93.43%、0.86、89.04%和96.00%,以及86.33%、0.73、86.49%和86.18%,明显优于文献报道中的相关方法,为DBPs的鉴定提供了新的模型. 展开更多
关键词 DNA结合蛋白 间隔二肽组分 位置特异性得分矩阵 递归特征消除法 支持向量机分类器
在线阅读 下载PDF
联合多种衍生光谱特征的冬小麦叶绿素含量估算
2
作者 杨伟博 李映雪 +1 位作者 吴芳 邹晓晨 《农业工程学报》 北大核心 2025年第15期165-173,共9页
叶绿素含量是评估作物长势的重要指标,准确估算叶片叶绿素含量对指导田间管理具有重要意义。高光谱遥感是大面积无损探测叶片叶绿素含量的重要手段。与原始冠层光谱反射率相比,冠层衍生光谱通过对原始光谱反射率数学变换处理显著降低了... 叶绿素含量是评估作物长势的重要指标,准确估算叶片叶绿素含量对指导田间管理具有重要意义。高光谱遥感是大面积无损探测叶片叶绿素含量的重要手段。与原始冠层光谱反射率相比,冠层衍生光谱通过对原始光谱反射率数学变换处理显著降低了噪声的影响,提升了光谱特征对作物生理生化参量的敏感性。不同衍生光谱特征对生理生化参量的敏感性波段存在差异,与单一衍生光谱特征相比,充分利用并联合多种衍生光谱敏感性特征,有望进一步提升叶绿素含量探测精度。为此,该文提出了一种联合多种衍生光谱特征探测冬小麦叶绿素含量的方法。通过4a连续田间试验获取冬小麦4个关键生育期(拔节期、抽穗期、开花期和灌浆期)的冠层光谱反射率和叶片叶绿素含量,对原始光谱反射率进行一阶导数反射率变换、标准正态变量变换、去趋势校正和连续统去除变换形成4种衍生光谱特征,比较了原始光谱反射率与4种衍生光谱特征对叶片叶绿素含量敏感性差异。通过递归消除法与4种机器学习算法(随机森林回归、随机梯度提升回归、支持向量回归和核岭回归)结合,分别对单一光谱特征数据和多种光谱特征组合数据选取叶绿素含量敏感性光谱特征,分别构建基于单一光谱特征和联合多种衍生光谱特征的叶绿素含量探测模型。结果表明,逐波段衍生光谱特征与叶绿素含量决定系数大于原始光谱反射率,其中连续统去除变换特征在478~725 nm波段范围内决定系数(determination coefficient)R^(2)>0.6。在基于单一光谱特征数据估算模型中,以衍生光谱特征驱动机器学习估算叶绿素含量精度优于原始光谱反射率,其中以30个一阶导数反射率驱动随机梯度提升回归算法构建的模型精度最佳,在全部数据中估算精度(R^(2)=0.841,均方根误差root mean square error,RMSE=3.309μg/cm^(2))优于采用原始光谱反射率构建最佳模型估算精度(R^(2)=0.814和RMSE=3.602μg/cm^(2))。联合25个不同衍生光谱特征组合驱动随机梯度提升回归模型进一步提升了叶绿素含量估算精度,并降低了模型所需光谱特征数量,在全部数据中估算精度为R^(2)=0.847和RMSE=3.246μg/cm^(2)。研究结果提升了叶绿素含量估算精度,降低了模型的复杂性,为利用高光谱数据估算作物叶绿素含量提供参考。 展开更多
关键词 叶绿素 冬小麦 衍生光谱 机器学习 递归特征消除法
在线阅读 下载PDF
基于Landsat影像的半荒漠化草地地上生物量反演——以达茂旗为例
3
作者 王力琪 程博 +3 位作者 张晓平 李可冬 宋梦龙 颜涛 《测绘通报》 北大核心 2025年第7期52-57,共6页
准确监测半荒漠化草地地上生物量是草地生态状况评价和相应草地可持续管理的必要条件。达茂旗草地资源丰富,植被群落结构简单,属半荒漠化草地的典型性代表。为了提升半荒漠化草地资源信息的质量,本文以内蒙古达茂旗为研究区,基于Landsa... 准确监测半荒漠化草地地上生物量是草地生态状况评价和相应草地可持续管理的必要条件。达茂旗草地资源丰富,植被群落结构简单,属半荒漠化草地的典型性代表。为了提升半荒漠化草地资源信息的质量,本文以内蒙古达茂旗为研究区,基于Landsat遥感影像,借助地面实测样地数据,结合光谱、植被指数、气象数据和数字地形数据构建了23个原始特征,分别采用随机森林(RF)、支持向量机(SVM)、梯度提升回归树(GBRT)和决策树(CART)回归算法进行草地地上生物量反演,并使用特征重要性得分和递归特征消除(RFE)进行特征优化,最终完成达茂旗2021年半荒漠化草地AGB反演制图。结果表明,RF模型在半荒漠化草地AGB反演结果中精度最高,利用递归特征消除法筛选最优特征至12个,其中气象和地形特征对草地AGB反演贡献最大,最终的反演模型精度决定系数(R^(2))为0.83,均方根误差(RMSE)为20.31。本文对半荒漠化草地进行生物量的估算,为易受影响的草地生态系统管理和保护提供了科学依据,为生物量反演研究提供了有效的方法论。 展开更多
关键词 半荒漠化草地 草地地上生物量 Landsat影像 机器学习 递归特征消除法
在线阅读 下载PDF
基于MW-REF算法的心肺复苏影响因素分析 被引量:3
4
作者 张友坤 陈伟 +3 位作者 靳小静 孙洁 李瑞月 张瑛琪 《科学技术与工程》 北大核心 2023年第22期9543-9549,共7页
针对传统模型对心肺复苏结果预测准确率较低、模型可解释性较差,提出了一种基于多模型加权递归消除法(MW-REF)的心肺复苏结果预测模型,并在Shapley加法解释(Shapley additive explanation,SHAP)框架下分析影响心肺复苏结果的关键因素。... 针对传统模型对心肺复苏结果预测准确率较低、模型可解释性较差,提出了一种基于多模型加权递归消除法(MW-REF)的心肺复苏结果预测模型,并在Shapley加法解释(Shapley additive explanation,SHAP)框架下分析影响心肺复苏结果的关键因素。采用了随机森林、GBDT、XGBOOST作为基模型,将其特征重要性得分加权后使用递归消除法过滤特征并对3种及模型采用Voting进行模型融合,利用五折交叉验证下的准确率作为最终特征选择标准。最后对最终特征数据集下的融合模型进行可解释性分析。实验结果表明,与传统的递归特征消除算法对比,该模型提升了心肺复苏结果预测的准确率,模型预测结果具有可解释性,可为临床诊断提供辅助,提高诊断效率与心肺复苏成功率。 展开更多
关键词 多模型加权递归特征消除法 心肺复苏 模型融合 SHAP
在线阅读 下载PDF
基于机器学习的切丝后含水率预测及控制方法 被引量:6
5
作者 高立秀 陈得丽 +5 位作者 万兴淼 王星皓 朱知元 李永华 佘迪 孔维熙 《食品与机械》 北大核心 2021年第4期189-194,211,共7页
选取云烟(A)牌号制丝生产过程稳态数据样本,采用递归特征消除法分析模型的影响变量。基于车间温湿度SARIMAX预测模型,利用蒙特卡洛仿真、神经网络算法和XGBoost算法建立切丝后含水率控制模型,通过预测值与实际值对比的方法进行模型检验... 选取云烟(A)牌号制丝生产过程稳态数据样本,采用递归特征消除法分析模型的影响变量。基于车间温湿度SARIMAX预测模型,利用蒙特卡洛仿真、神经网络算法和XGBoost算法建立切丝后含水率控制模型,通过预测值与实际值对比的方法进行模型检验。结果表明,在工艺标准值±0.15%的误差范围内,切丝后含水率准确率由62.57%提升至86.49%;切丝后含水率的过程能力指数达标率由91.44%提升至97.30%。该方法实现了前后工序参数协同和精准控制,有效保证了制丝过程中切丝后含水率的稳定性。 展开更多
关键词 递归特征消除法 蒙特卡洛仿真 神经网络 XGBoost算 温湿度预测
在线阅读 下载PDF
基于SVR-RFE的作战方案评估指标选择方法 被引量:3
6
作者 丁晓剑 丁冉 《广西师范大学学报(自然科学版)》 CAS 北大核心 2015年第4期43-48,共6页
针对作战方案评价指标权值确定过程存在不确定和主观性的问题,本文提出了基于支持向量回归机的线性和非线性递归特征消除法(SVR-RFE)。该方法利用权值向量和函数值作为SVR-RFE的特征选择标准,采用支持向量回归机(SVR)对特征选择前后的... 针对作战方案评价指标权值确定过程存在不确定和主观性的问题,本文提出了基于支持向量回归机的线性和非线性递归特征消除法(SVR-RFE)。该方法利用权值向量和函数值作为SVR-RFE的特征选择标准,采用支持向量回归机(SVR)对特征选择前后的回归能力进行了分析比较。在某作战方案样本集上的仿真实验表明,线性和非线性SVR-RFE在作战方案数据集上的特征选择效果是一致的,在特征维度为50%左右时,SVR算法达到最优泛化性能。 展开更多
关键词 支持向量回归 递归特征消除法 评估指标
在线阅读 下载PDF
Sentinel-2A数据支持下的雷州半岛植被类型识别 被引量:4
7
作者 王刚 丁华祥 《测绘通报》 CSCD 北大核心 2022年第3期76-82,共7页
本文以雷州半岛为研究区,利用Sentinel-2A影像数据和真实植被样本数据,综合探讨了机器学习中随机森林与支持向量机的分类效果,并与传统的最大似然法进行比较。提取Sentinel-2A影像9个波段、7个植被指数、72个纹理特征,通过递归特征消除... 本文以雷州半岛为研究区,利用Sentinel-2A影像数据和真实植被样本数据,综合探讨了机器学习中随机森林与支持向量机的分类效果,并与传统的最大似然法进行比较。提取Sentinel-2A影像9个波段、7个植被指数、72个纹理特征,通过递归特征消除法挑选了10个特征组合,并将其应用于3种分类方法中,对其分类效果进行比较。结果表明:(1)有效使用多种特征变量是提高植被类型识别精度的关键,就不同特征对植被类型识别的重要性而言,光谱特征与纹理特征相当且大于植被指数,三者重要性相差不大;(2)随机森林分类效果最佳,不但能对特征进行有效选择,而且能保证植被类型提取精度,提高运行效率;(3)基于随机森林特征选择的递归特征消除法得到的特征组合不能对其他分类器性能进行优化,对随机森林模型本身的优化效果也有限。 展开更多
关键词 植被类型识别 机器学习 Sentinel-2A 特征选择 递归特征消除法
在线阅读 下载PDF
减压馏分黏度指数的近红外预测研究 被引量:4
8
作者 任小甜 褚小立 +1 位作者 田松柏 朱新宇 《石油炼制与化工》 CAS CSCD 北大核心 2019年第1期81-84,共4页
为了实现减压馏分油(VGO)黏度指数的快速预测,以70个VGO样品的近红外光谱及黏度指数数据为基础,利用随机森林回归算法建立了黏度指数的近红外预测模型。以随机森林算法中对各特征的重要性度量为依据,通过递归特征消除法对近红外光谱进... 为了实现减压馏分油(VGO)黏度指数的快速预测,以70个VGO样品的近红外光谱及黏度指数数据为基础,利用随机森林回归算法建立了黏度指数的近红外预测模型。以随机森林算法中对各特征的重要性度量为依据,通过递归特征消除法对近红外光谱进行波长变量选择。优选出10个波长变量作为模型的输入特征,利用10折交叉验证法确定模型的超参数(回归树数量n_t为150和节点分裂的特征数n_v为5),构建一个更加稳健的随机森林预测模型。对于7个预测集的样本,其黏度指数的预测标准偏差RMSEP为2.28,决定系数R^2为0.98,表明模型具有较高的准确度和泛化能力。 展开更多
关键词 减压馏分 黏度指数 预测 近红外光谱 递归特征消除法 随机森林算
在线阅读 下载PDF
基于Sentinel数据的临海市森林地上生物量估测 被引量:1
9
作者 曹依林 吴达胜 方陆明 《浙江林业科技》 2022年第5期40-49,共10页
为探究多源数据融合以及机器学习方法在森林地上生物量(Above-ground Biomass,AGB)的估测潜力,分析影响不同林分AGB的主要因素,以浙江省台州市临海市为研究区,提取Sentinel-2光学遥感影像的光谱信息、植被指数、纹理特征因子和Sentinel-... 为探究多源数据融合以及机器学习方法在森林地上生物量(Above-ground Biomass,AGB)的估测潜力,分析影响不同林分AGB的主要因素,以浙江省台州市临海市为研究区,提取Sentinel-2光学遥感影像的光谱信息、植被指数、纹理特征因子和Sentinel-1 SAR的后向散射系数,融合森林资源二类调查数据和数字高程模型数据,基于递归特征消除的特征选择方法筛选主要特征,基于随机森林(Random Forest,RF)、自适应提升(AdaBoost)法和类别提升(CatBoost)法三种方法建立不同林分AGB估测模型,以决定系数(R-squared,R^(2))、均方根误差(Root Mean Square Error,RMSE)来评估模型性能。结果表明,从特征组合来看,集成光学遥感、雷达遥感、地形因子及二类调查数据能够更全面地利用多源数据的信息,有效提高森林AGB的估测精度;递归特征消除法降低了模型的复杂度,消除了自变量之间的共线性,能在保持甚至提高模型估测精度的前提下,加快模型训练速度;从6种林分的AGB的估测结果来看,6种林分的AGB的主要影响因素与个数不尽相同,这也缘于不同树种有不同生物学和生态学特点,当然有3个因子是共同的,即年龄、郁闭度和海拔;3种算法中,CatBoost优于RF,RF优于AdaBoost,CatBoost方法的性能指标为:阔叶混交林R^(2)=0.78,RMSE=7.26 t·hm^(-2);针阔混交林R^(2)=0.72,RMSE=11.94 t·hm^(-2);针叶混交林R^(2)=0.60,RMSE=12.65 t·hm^(-2);其他硬阔林R^(2)=0.82,RMSE=9.22 t·hm^(-2);马尾松林R^(2)=0.74,RMSE=10.12 t·hm^(-2);杉木林R^(2)=0.75,RMSE=8.93 t·hm^(-2);基于RFE的CatBoost的方法模型总体平均估测精度(P)超过80%。以上结果表明,Sentinel光学影像与SAR融合可以为森林AGB估测提供更多有效的特征因子;递归特征消除法结合CatBoost方法用于区域尺度上森林AGB的估测,精度更高,且能有效降低模型复杂度,加快训练速度;不同林分的AGB的主要影响因素与个数不尽相同,但年龄、郁闭度、海拔3个因素是它们的共同影响因素。 展开更多
关键词 森林地上生物量 Sentinel-1 Sentinel-2 随机森林 自适应提升 类别提升 递归特征消除法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部