期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ν-SVM的不平衡数据挖掘研究
被引量:
8
1
作者
郑恩辉
许宏
+1 位作者
李平
宋执环
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006年第10期1682-1687,共6页
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些...
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.
展开更多
关键词
不平衡数据
有偏分类器
支持向量机
在线阅读
下载PDF
职称材料
面向不均衡数据的融合谱聚类的自适应过采样法
被引量:
9
2
作者
刘金平
周嘉铭
+3 位作者
贺俊宾
唐朝晖
徐鹏飞
张国勇
《智能系统学报》
CSCD
北大核心
2020年第4期732-739,共8页
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导...
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,结果表明,所提方法能有效解决数据的不均衡问题,使得分类器对于少数类样本的分类精度得到提升。
展开更多
关键词
不自适应综合采样法
不均衡数据集
谱聚类
过采样
模式
分类
数据分布
有偏分类器
数据预处理
在线阅读
下载PDF
职称材料
题名
基于ν-SVM的不平衡数据挖掘研究
被引量:
8
1
作者
郑恩辉
许宏
李平
宋执环
机构
中国计量学院机电工程学院
浙江大学工业控制技术国家重点实验室
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006年第10期1682-1687,共6页
基金
国家"863"高科技研究发展计划资助项目(2002AA412010-12)
文摘
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.
关键词
不平衡数据
有偏分类器
支持向量机
Keywords
unbalanced data set
biased classifier
support vector machines
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
面向不均衡数据的融合谱聚类的自适应过采样法
被引量:
9
2
作者
刘金平
周嘉铭
贺俊宾
唐朝晖
徐鹏飞
张国勇
机构
湖南师范大学智能计算与语言信息处理湖南省重点实验室
湖南省计量检测研究院
中南大学自动化学院
出处
《智能系统学报》
CSCD
北大核心
2020年第4期732-739,共8页
基金
国家自然科学基金项目(61971188,61771492)
国家自然科学基金−广东联合基金重点项目(U1701261)
+1 种基金
湖南省自然科学基金项目(2018JJ3349)
湖南省研究生科研创新项目(CX20190415)。
文摘
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,结果表明,所提方法能有效解决数据的不均衡问题,使得分类器对于少数类样本的分类精度得到提升。
关键词
不自适应综合采样法
不均衡数据集
谱聚类
过采样
模式
分类
数据分布
有偏分类器
数据预处理
Keywords
adaptive synthetic sampling approach(ADASYN)
imbalanced data set
spectral clustering
oversampling
pattern classification
data distribution
biased classifier
data pre-processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于ν-SVM的不平衡数据挖掘研究
郑恩辉
许宏
李平
宋执环
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006
8
在线阅读
下载PDF
职称材料
2
面向不均衡数据的融合谱聚类的自适应过采样法
刘金平
周嘉铭
贺俊宾
唐朝晖
徐鹏飞
张国勇
《智能系统学报》
CSCD
北大核心
2020
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部