期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于惩罚的SVM和集成学习的非平衡数据分类算法研究 被引量:6
1
作者 刘进军 《计算机应用与软件》 CSCD 北大核心 2014年第1期186-190,共5页
利用各类算法对非平衡数据进行处理已成为数据挖掘领域研究的热问题。针对非平衡数据的特点,在研究支持向量机的相关理论及K-SVM算法基础上,提出基于惩罚机制的PFKSVM(K-SVMbased on penalty factor)算法,克服K-SVM在最优分类面附近易... 利用各类算法对非平衡数据进行处理已成为数据挖掘领域研究的热问题。针对非平衡数据的特点,在研究支持向量机的相关理论及K-SVM算法基础上,提出基于惩罚机制的PFKSVM(K-SVMbased on penalty factor)算法,克服K-SVM在最优分类面附近易发生错分的问题;并提出由重构采样层、基本训练层和综合判定层组成的集成学习模型。利用UCI公共数据集的实验验证了PFKSVM算法及集成模型在处理非平衡数据分类时的优势。 展开更多
关键词 数据挖掘 支持向量机(SVM) 平衡数据分类集成学习
在线阅读 下载PDF
一种新的过采样算法DB_SMOTE 被引量:12
2
作者 刘余霞 刘三民 +1 位作者 刘涛 王忠群 《计算机工程与应用》 CSCD 2014年第6期92-95,共4页
针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样... 针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样本。根据SMOTE(Synthetic Minority Over-sampling Technique)算法思想,在种子样本上实现少数类新样本合成。根据种子样本与少数类中心距离构造新样本分布函数。基于此采样算法并在多个数据集上进行分类实验,结果表明DB SMOTE算法是可行的。 展开更多
关键词 非平衡数据学习 过采样 数据分类
在线阅读 下载PDF
基于距离最大熵值的蛋白质结构域边界检测系统 被引量:1
3
作者 邹淑雪 刘桂霞 +1 位作者 时小虎 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2009年第6期1237-1240,共4页
首次将蛋白质结构域边界检测问题归结为非平衡数据学习问题,提出一种新的欠采样方法,即在支持向量机特征空间中对与正类样本具有距离最大熵值的负类样本进行采样.以经过筛选的蛋白质结构域数据库作为实验数据,支持向量机学习系统的平均... 首次将蛋白质结构域边界检测问题归结为非平衡数据学习问题,提出一种新的欠采样方法,即在支持向量机特征空间中对与正类样本具有距离最大熵值的负类样本进行采样.以经过筛选的蛋白质结构域数据库作为实验数据,支持向量机学习系统的平均预测准确率可达80%,同时具有较高的敏感性和特异性. 展开更多
关键词 蛋白质结构域边界 支持向量机 非平衡数据学习 基于距离的最大熵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部