检索结果-维普期刊中文期刊服务平台

类别不均衡学习中的抽样策略研究被引量：8: 1; 作者刘树栋张可《计算机工程与应用》 CSCD 北大核心 2019年第21期1-17,共17页; 类别不均衡学习在信用评估、客户流失预测、医学诊断、短文本情感分析、标记学习、评分预测等众多领域有广泛的应用,是机器学习研究和应用的热点方向之一,近年来逐渐引起学术界和工业界的广泛关注。目前解决类别不均衡问题主要有三种方... 展开更多; 关键词不均衡学习集成学习欠抽样特征选择支持向量机合成少数类过抽样技术混合抽样; 在线阅读下载PDF 职称材料

基于不均衡数据集成学习的大型电力变压器状态评价方法被引量：26: 2; 作者韩笑王新迎 +2 位作者韩帅张玉天王继业《电网技术》 EI CSCD 北大核心 2021年第1期107-114,共8页; 大型电力变压器构造复杂,设备成本高,是电力系统的关键组成部分,其运行状态与电力系统的安全稳定密切相关,因此变压器状态评价已成为常态运维业务工作。然而目前状态评价工作严重依赖导则与专家经验,人力成本高,易受到主观影响;而已有... 展开更多; 关键词状态评价状态评估电力变压器不均衡学习集成学习机器学习人工智能; 在线阅读下载PDF 职称材料

价值样本选取的不均衡分类被引量：5: 3; 作者徐剑王馨月 +2 位作者才子昕沈启航景丽萍《计算机科学与探索》 CSCD 北大核心 2020年第3期401-409,共9页; 基于传统模型的实际分类问题,不均衡分类是一个常见的挑战问题。由于传统分类器较难学习少数类数据集内部的本质结构,导致更多地偏向于多数类,从而使少数类样本被误分为多数类样本。与此同时,样本集中的冗余数据和噪音数据也会对分类器... 展开更多; 关键词类的不均衡学习分类压缩激励网络代价敏感度学习; 在线阅读下载PDF 职称材料

摔倒检测中的样本失衡问题研究被引量：2: 4; 作者赵中堂陈继光马倩《计算机工程与应用》 CSCD 北大核心 2017年第23期142-146,共5页; 由于真实的摔倒数据难以获得,导致采集到的正常行为和摔倒行为样本比例严重失衡,从而基于此数据集训练的常规摔倒检测模型的漏警率和误警率都较高,不能满足实际的需求。针对该问题,提出一种基于样本加权极速学习机的摔倒检测方法,该方... 展开更多; 关键词摔倒检测行为识别普适计算迁移学习机器学习不均衡学习; 在线阅读下载PDF 职称材料

基于谱聚类和成对数据表示的多层感知机分类算法被引量：5: 5; 作者刘树栋魏嘉敏《计算机科学》 CSCD 北大核心 2019年第S11期194-198,共5页; 面向类别不均衡数据集的分类学习一直是数据挖掘和机器学习领域的研究热点。数据级、算法级和集成方法是目前解决类别不均衡学习的3种主流方法,其中欠抽样是类别不均衡学习一种常用的数据级解决方法,其缺点在于容易丢失多数类中部分有... 展开更多; 关键词多层感知机分类欠抽样谱聚类不均衡学习; 在线阅读下载PDF 职称材料

题名类别不均衡学习中的抽样策略研究被引量：8: 1; 作者刘树栋张可; 机构中南财经政法大学人工智能法商应用研究中心中南财经政法大学信息与安全工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2019年第21期1-17,共17页; 基金国家自然科学基金（No.61602518,No.71872180）中南财经政法大学中央高校基本科研业务费专项资金（No.2722019JCG074,No.2722019JCT035）; 文摘类别不均衡学习在信用评估、客户流失预测、医学诊断、短文本情感分析、标记学习、评分预测等众多领域有广泛的应用,是机器学习研究和应用的热点方向之一,近年来逐渐引起学术界和工业界的广泛关注。目前解决类别不均衡问题主要有三种方法:数据级解决方法、算法级解决方法和集成解决方法。侧重于对近年来类别不均衡学习中的抽样策略研究进展进行综述,介绍类别不均衡学习的基本框架,对类别不均衡学习中三种主要的抽样策略(过抽样、欠抽样和混合抽样)相关研究进展进行前沿概括、比较和分析,对类别不均衡学习的抽样策略中有待研究的难点、热点及发展趋势进行展望。; 关键词不均衡学习集成学习欠抽样特征选择支持向量机合成少数类过抽样技术混合抽样; Keywords class-imbalanced learning ensemble learning undersampling feature selection support vector machine synthetic minority oversampling technique hybrid sampling; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于不均衡数据集成学习的大型电力变压器状态评价方法被引量：26: 2; 作者韩笑王新迎韩帅张玉天王继业; 机构中国电力科学研究院有限公司; 出处《电网技术》 EI CSCD 北大核心 2021年第1期107-114,共8页; 基金国家自然科学基金项目(61703379):基于随机映射神经网络的电力大数据预测方法研究。; 文摘大型电力变压器构造复杂,设备成本高,是电力系统的关键组成部分,其运行状态与电力系统的安全稳定密切相关,因此变压器状态评价已成为常态运维业务工作。然而目前状态评价工作严重依赖导则与专家经验,人力成本高,易受到主观影响;而已有模型往往直接应用标准算法,在实际生产环境中表现不佳。针对目前大型电力变压器状态评价在数据质量、样本分布、应用需求与模型表现等方面存在的问题,提出了一种新的评价模型。首先,剔除了无效样本并设计了一种交叉权重方法来标记有效样本;之后,按照数据完整程度区分状态量并对其进行特征提取和高维映射,再拆分数据集得到多个完备训练数据集;然后,应用SMOTEBORDERLINE算法来合成正样本,得到多个完备均衡训练数据集;最后,并行化训练多个代价敏感修正的支持向量机(support vector machine,SVM)组件学习器,并通过权重投票法形成集成学习器。所提出的模型考虑了不均衡数据集与代价敏感所带来的影响,利用集成学习提高了模型的泛化能力,经过实际生产环境验证表现良好,与传统方法相比,显著降低了非正常状态样本的误判率与漏判率。; 关键词状态评价状态评估电力变压器不均衡学习集成学习机器学习人工智能; Keywords status evaluation condition assessment power transformer imbalanced learning ensemble learning machine learning artificial intelligence; 分类号 TM85 [电气工程—高电压与绝缘技术]; 在线阅读下载PDF 职称材料

题名价值样本选取的不均衡分类被引量：5: 3; 作者徐剑王馨月才子昕沈启航景丽萍; 机构北京交通大学计算机与信息技术学院; 出处《计算机科学与探索》 CSCD 北大核心 2020年第3期401-409,共9页; 基金中央高校基本科研业务费专项资金 No.2019YJS040~~; 文摘基于传统模型的实际分类问题,不均衡分类是一个常见的挑战问题。由于传统分类器较难学习少数类数据集内部的本质结构,导致更多地偏向于多数类,从而使少数类样本被误分为多数类样本。与此同时,样本集中的冗余数据和噪音数据也会对分类器造成困扰。为有效处理上述问题,提出一种新的不均衡分类框架SSIC,该框架充分考虑数据统计特性,自适应从大小类中选取有价值样本,并结合代价敏感学习构建不均衡数据分类器。首先,SSIC通过组合部分多数类实例和所有少数类实例来构造几个平衡的数据子集。在每个子集上,SSIC充分利用数据的特征来提取可区分的高级特征并自适应地选择重要样本,从而可以去除冗余噪声数据。其次,SSIC通过在每个样本上自动分配适当的权重来引入一种代价敏感的支持向量机(SVM),以便将少数类视为与多数类相等。; 关键词类的不均衡学习分类压缩激励网络代价敏感度学习; Keywords class imbalance learning classification squeeze-and-excitation networks cost-sensitive learning; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名摔倒检测中的样本失衡问题研究被引量：2: 4; 作者赵中堂陈继光马倩; 机构郑州航空工业管理学院计算机学院航空经济发展河南省协同创新中心郑州航空工业管理学院管理工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2017年第23期142-146,共5页; 基金国家自然科学基金(No.U1504609) 河南省教育厅重点科研教育计划项目(No.15A520003); 文摘由于真实的摔倒数据难以获得,导致采集到的正常行为和摔倒行为样本比例严重失衡,从而基于此数据集训练的常规摔倒检测模型的漏警率和误警率都较高,不能满足实际的需求。针对该问题,提出一种基于样本加权极速学习机的摔倒检测方法,该方法综合考虑不同种类行为样本之间的比例关系,分别赋予其一定的权值,能较好地解决样本失衡问题。基于真实行为数据的实验结果表明,和传统非加权的行为识别方法相比较,基于样本加权极速学习机的摔倒检测方法能够将识别模型的性能提高10%左右。; 关键词摔倒检测行为识别普适计算迁移学习机器学习不均衡学习; Keywords fall detection activity recognition pervasive computing transfer learning machine learning imbalance learning; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于谱聚类和成对数据表示的多层感知机分类算法被引量：5: 5; 作者刘树栋魏嘉敏; 机构中南财经政法大学信息与安全工程学院; 出处《计算机科学》 CSCD 北大核心 2019年第S11期194-198,共5页; 基金国家自然科学基金项目(61602518,71872180) 中南财经政法大学中央高校基本科研业务费专项资金(2722019JCG074,2722019JCT035)资助; 文摘面向类别不均衡数据集的分类学习一直是数据挖掘和机器学习领域的研究热点。数据级、算法级和集成方法是目前解决类别不均衡学习的3种主流方法,其中欠抽样是类别不均衡学习一种常用的数据级解决方法,其缺点在于容易丢失多数类中部分有用信息。文中将谱聚类引入到成对数据表示的多数类欠抽样过程中,首先利用谱聚类方法,对多数类样本进行聚类,根据聚类簇大小和簇内样本点与少数类样本点的平均距离,在每个聚类簇内抽取不同个数有代表性的样本,并将簇内样本点之间及所有少数类样本点两两成对表示,从而有效降低了所有样本成对数据表示中两两组合而导致的数据暴涨问题,同时避免了随机抽样而可能导致的有效信息丢失问题。最后在9组UCI数据集上验证了所提算法的有效性。; 关键词多层感知机分类欠抽样谱聚类不均衡学习; Keywords Multilayer perceptron Classification Under-sampling Spectral clustering Imbalanced learning; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	类别不均衡学习中的抽样策略研究	刘树栋张可	《计算机工程与应用》 CSCD 北大核心	2019	8	在线阅读下载PDF 职称材料
2	基于不均衡数据集成学习的大型电力变压器状态评价方法	韩笑王新迎韩帅张玉天王继业	《电网技术》 EI CSCD 北大核心	2021	26	在线阅读下载PDF 职称材料
3	价值样本选取的不均衡分类	徐剑王馨月才子昕沈启航景丽萍	《计算机科学与探索》 CSCD 北大核心	2020	5	在线阅读下载PDF 职称材料
4	摔倒检测中的样本失衡问题研究	赵中堂陈继光马倩	《计算机工程与应用》 CSCD 北大核心	2017	2	在线阅读下载PDF 职称材料
5	基于谱聚类和成对数据表示的多层感知机分类算法	刘树栋魏嘉敏	《计算机科学》 CSCD 北大核心	2019	5	在线阅读下载PDF 职称材料