期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于随机下采样和SVR的蛋白质-ATP绑定位点预测 被引量:2
1
作者 余健浩 孙廷凯 《现代电子技术》 北大核心 2015年第4期19-24,共6页
将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题... 将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题本身的特点,在此提出一种基于随机下采样和支持向量回归的蛋白质-ATP绑定位点预测方法。首先,使用滑动窗口抽取蛋白质序列中每个残基的特征,得到一批不平衡的两类样本;其次,应用随机下采样策略,消除正负样本存在的显著不平衡;最后,使用支持向量回归建立预测模型,并选取合适的阈值进行蛋白质-ATP绑定位点的预测。在标准数据集上的实验结果以及与几种最新报道的预测方法的对比结果,验证了本文所述方法的有效性。 展开更多
关键词 蛋白质-ATP绑定位点 位置特异性得分矩阵 滑动窗口 支持向量回归模型 随机下采样
在线阅读 下载PDF
克隆代码有害性预测中分类不平衡问题的解决方法
2
作者 王欢 张丽萍 闫盛 《计算机应用》 CSCD 北大核心 2016年第12期3468-3475,共8页
针对克隆代码有害性预测中有害和无害数据分类不平衡的问题,提出一种基于随机下采样(RUS)的能够自动调整分类不平衡的K-Balance算法。首先对克隆代码提取静态特征和演化特征构建样本数据集;然后选取比例不同的分类不平衡新数据集;... 针对克隆代码有害性预测中有害和无害数据分类不平衡的问题,提出一种基于随机下采样(RUS)的能够自动调整分类不平衡的K-Balance算法。首先对克隆代码提取静态特征和演化特征构建样本数据集;然后选取比例不同的分类不平衡新数据集;接着对已选取的新数据集进行有害性预测;最后,通过观察分类器的不同表现自动选择一个最适合的分类不平衡比例值。在7款C语言开源软件共170个版本上对克隆有害性预测模型的性能进行评估,并和其他分类不平衡解决方法进行对比,实验结果表明所提方法对有害和无害克隆的分类预测效果(受试者工作特征曲线下方面积(AUC)值)提高了2.62个百分点~36.70个百分点,能有效地改善分类不平衡的预测问题。 展开更多
关键词 克隆代码 有害性 不平衡分类 随机下采样 参数搜索
在线阅读 下载PDF
基于代价敏感神经网络集成模型的类别不平衡问题研究 被引量:3
3
作者 张俊杰 曹丽 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第11期1573-1579,共7页
在解决类别不平衡问题的过程中,传统分类模型往往偏向对大类别样本的学习,影响模型分类效果。基于此,文章从数据采样、模型选择2方面入手,给出代价敏感神经网络集成(cost-sensitive neural network ensemble,CSNN_Ensemble)模型。首先... 在解决类别不平衡问题的过程中,传统分类模型往往偏向对大类别样本的学习,影响模型分类效果。基于此,文章从数据采样、模型选择2方面入手,给出代价敏感神经网络集成(cost-sensitive neural network ensemble,CSNN_Ensemble)模型。首先通过随机下采样,得到多组训练数据集;其次对每组训练数据集训练BP神经网络,并结合代价矩阵构造多个代价敏感神经网络;最后以代价敏感神经网络为基学习器构造并行集成模型,并以投票的方式进行最终决策。实验结果表明,该模型在F 1值、AUC值和期望总体代价3种性能方面表现优越,并具有一定的鲁棒性。 展开更多
关键词 类别不平衡 随机下采样 代价敏感神经网络(CSNN) 集成模型 Friedman检验
在线阅读 下载PDF
基于支持向量机集成的蛋白质与维生素绑定位点预测
4
作者 朱非易 《现代电子技术》 北大核心 2015年第9期90-95,共6页
在蛋白质与维生素绑定位点预测问题中,小类样本和大类样本之间存在显著的不平衡性,传统的机器学习方法将不再适用。针对此问题,在多重随机下采样的基础上结合支持向量机(SVM)集成来预测蛋白质与维生素的绑定位点,采用了一种改进的Ada Bo... 在蛋白质与维生素绑定位点预测问题中,小类样本和大类样本之间存在显著的不平衡性,传统的机器学习方法将不再适用。针对此问题,在多重随机下采样的基础上结合支持向量机(SVM)集成来预测蛋白质与维生素的绑定位点,采用了一种改进的Ada Boost集成方法,称为MAda Boost集成。通过实验比较了不同的集成策略,其中MAda Boost集成效果最优。实验结果表明,采用随机下采样结合SVM集成将有效提高蛋白质维生素绑定位点预测的精度。 展开更多
关键词 蛋白质-维生素相互作用 绑定位点预测 多重随机下采样 SVM集成 ADABOOST算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部