期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
不平衡数据加权边界点集成欠采样方法
被引量:
2
1
作者
何云斌
冷欣
万静
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2021年第4期176-183,191,共9页
为了有效地解决不平衡数据中边界点直接被删除的问题,保持多数类数据的信息,提出一种基于聚类的加权边界点集成欠采样算法。首先该算法通过提取少数类数据集的数据点作为多数类数据集的初始聚类中心个数进行聚类;然后引入变异系数将边...
为了有效地解决不平衡数据中边界点直接被删除的问题,保持多数类数据的信息,提出一种基于聚类的加权边界点集成欠采样算法。首先该算法通过提取少数类数据集的数据点作为多数类数据集的初始聚类中心个数进行聚类;然后引入变异系数将边界点识别出来,对识别出的边界点进行加权,使得加权后的边界点可以加入到不平衡数据的处理中;再利用簇密度将多数类数据集分为高密度簇和低密度簇,把低密度簇删除;最后获得约简后的多数类样本集。再将约简后的多数类样本和少数类样本结合,形成平衡的数据集,利用Ada Boost对其进行训练,得到最终的分类模型。利用该方法可以实现对数据集的约简操作,提高执行效率。结果表明,所提方法可以有效地处理不平衡数据的问题,提高了不平衡数据加权边界点集成欠采样算法的执行效率和结果的精确性。
展开更多
关键词
采样
聚类
不平衡数据
加权边界点
在线阅读
下载PDF
职称材料
题名
不平衡数据加权边界点集成欠采样方法
被引量:
2
1
作者
何云斌
冷欣
万静
机构
哈尔滨理工大学计算机科学与技术学院
出处
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2021年第4期176-183,191,共9页
基金
国家自然科学基金(61872105)
黑龙江省教育厅科学技术研究项目(12531z004)。
文摘
为了有效地解决不平衡数据中边界点直接被删除的问题,保持多数类数据的信息,提出一种基于聚类的加权边界点集成欠采样算法。首先该算法通过提取少数类数据集的数据点作为多数类数据集的初始聚类中心个数进行聚类;然后引入变异系数将边界点识别出来,对识别出的边界点进行加权,使得加权后的边界点可以加入到不平衡数据的处理中;再利用簇密度将多数类数据集分为高密度簇和低密度簇,把低密度簇删除;最后获得约简后的多数类样本集。再将约简后的多数类样本和少数类样本结合,形成平衡的数据集,利用Ada Boost对其进行训练,得到最终的分类模型。利用该方法可以实现对数据集的约简操作,提高执行效率。结果表明,所提方法可以有效地处理不平衡数据的问题,提高了不平衡数据加权边界点集成欠采样算法的执行效率和结果的精确性。
关键词
采样
聚类
不平衡数据
加权边界点
Keywords
sampling
clustering
unbalanced data
weighted boundary point
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
不平衡数据加权边界点集成欠采样方法
何云斌
冷欣
万静
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部