期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
构造性覆盖算法的SMOTE过采样方法 被引量:11
1
作者 严远亭 朱原玮 +2 位作者 吴增宝 张以文 张燕平 《计算机科学与探索》 CSCD 北大核心 2020年第6期975-984,共10页
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数... 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。 展开更多
关键词 不平衡数据 过采样技术 合成少数类过采样技术(SMOTE) 构造性覆盖算法(cca)
在线阅读 下载PDF
基于覆盖的构造性学习算法SLA及在股票预测中的应用 被引量:18
2
作者 张燕平 张铃 +3 位作者 吴涛 徐锋 张 王伦文 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期979-984,共6页
覆盖算法是神经网络学习算法中的一个十分有效的方法 ,它克服了基于搜索机制的学习方法和规划学习方法计算复杂性高 ,难以用于处理海量数据的不足 ,为神经网络提供一个构造性的学习方法 但该方法是建立在所有训练样本都是精确的假设上... 覆盖算法是神经网络学习算法中的一个十分有效的方法 ,它克服了基于搜索机制的学习方法和规划学习方法计算复杂性高 ,难以用于处理海量数据的不足 ,为神经网络提供一个构造性的学习方法 但该方法是建立在所有训练样本都是精确的假设上的 ,未考虑到所讨论的数据具有不精确的情况 ,若直接将该方法应用于数据不精确情况 ,所得到效果不理想 主要讨论数据具有不精确情况下的时间序列的预测问题 为此将原有的覆盖算法进行改进 ,引入“覆盖强度”和“拒识样本”的概念 ,并结合这些新概念给出相应的覆盖学习算法 (简称SLA) ,最后将SLA算法 ,应用于金融股市的预测 ,具体应用到以上 (海 )证 (券 )综合指数构成的时间序列的预测 ,取得了较好的结果 。 展开更多
关键词 覆盖算法 构造性学习算法(SLA) 股市预测 时间序列
在线阅读 下载PDF
构造性覆盖方法的增量学习算法 被引量:3
3
作者 张燕平 杜玲 赵姝 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第5期699-704,共6页
构造性机器学习方法——覆盖算法学习速度快、复杂度低、可解释性强,能有效地解决有导师学习问题,并取得了很好的效果,但构造神经元的权值即取新覆盖中心时通常人为地给定一个准则,并未遵循样本的分布特征求得最优解.由此采用佳点集理... 构造性机器学习方法——覆盖算法学习速度快、复杂度低、可解释性强,能有效地解决有导师学习问题,并取得了很好的效果,但构造神经元的权值即取新覆盖中心时通常人为地给定一个准则,并未遵循样本的分布特征求得最优解.由此采用佳点集理论求取覆盖中心,以改进覆盖算法.针对大规模或动态数据集的分类问题,将构造性覆盖方法与增量学习的思想相结合,提出了构造性覆盖方法的增量学习算法.该算法利用改进的覆盖算法作为基础学习器,通过连续地对新增样本进行测试而反复不断地提炼已有模型,体现了对样本的"渐近式"学习.对标准数据集的实验结果表明,这种增量学习算法是有效的. 展开更多
关键词 构造性机器学习方法 覆盖算法 佳点集 增量学习
在线阅读 下载PDF
基于Lasso和构造性覆盖算法的不均衡数据分类方法 被引量:4
4
作者 蒋溢 伍书平 +1 位作者 胡昆 龙林波 《计算机应用》 CSCD 北大核心 2023年第4期1086-1093,共8页
针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化... 针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化模型输入;然后,通过构造性覆盖算法(CCA)建立神经网络生成符合样本整体分布的覆盖;最后,进一步提出单样本覆盖策略、样本多样性策略和样本密度峰值策略,通过以上策略混合采样以平衡数据。选用了KEEL数据库中的13个不均衡数据集和2个脱敏电信客户数据集,分别在逻辑回归(LR)和支持向量机(SVM)分类算法上对该方法进行验证。在LR分类算法上,与SMOTE-Enn(Synthetic Minority Oversampling TEchnique Edited nearest neighbor)相比,所提方法的平均几何平均值(G-MEAN)提升了2.32%;在SVM分类算法上,与Borderline-SMOTE(Borderline Synthetic Minority Oversampling Technique Edited)相比,所提方法的平均G-MEAN提升了2.44%。实验结果表明,所提方法能解决类别偏斜分布影响分类的问题,且对于稀有类的识别能力优于经典平衡数据方法。 展开更多
关键词 Lasso 构造性覆盖算法 不均衡数据分类 客户流失预测 混合采样
在线阅读 下载PDF
基于构造性覆盖算法的离群数据挖掘研究
5
作者 张旻 张铃 《计算机科学》 CSCD 北大核心 2005年第4期27-30,共4页
本文提出一种通过构造覆盖领域进行离群点(outlier)挖掘的新方法。由于覆盖领域构造的特殊性,使得覆盖算法非常适合离群点的挖掘。在分析覆盖模型的基础上,给出了覆盖模型的离群点的定义和算法步骤。这样将复杂的离群点挖掘问题变成十... 本文提出一种通过构造覆盖领域进行离群点(outlier)挖掘的新方法。由于覆盖领域构造的特殊性,使得覆盖算法非常适合离群点的挖掘。在分析覆盖模型的基础上,给出了覆盖模型的离群点的定义和算法步骤。这样将复杂的离群点挖掘问题变成十分简单的覆盖领域样本分析问题,而且算法十分直观,并能很好地解释离群点的含义,同时适合对高维及海量数据的处理。本文给出实验例子,结果表明该方法是有效可行的。 展开更多
关键词 覆盖算法 离群数据挖掘 构造性 覆盖模型 离群点 算法步骤 分析问题 海量数据 特殊性
在线阅读 下载PDF
基于Tri-training算法的构造性学习方法 被引量:3
6
作者 吴涛 李萍 王允强 《计算机工程》 CAS CSCD 2012年第6期13-15,共3页
构造性机器学习(CML)算法在训练分类器时需要大量有标记样本,而获取这些有标记样本十分困难。为此,提出一种基于Tri-training算法的构造性学习方法。根据已标记的样本,采用不同策略构造3个差异较大的初始覆盖分类网络,用于对未标记数据... 构造性机器学习(CML)算法在训练分类器时需要大量有标记样本,而获取这些有标记样本十分困难。为此,提出一种基于Tri-training算法的构造性学习方法。根据已标记的样本,采用不同策略构造3个差异较大的初始覆盖分类网络,用于对未标记数据进行标记,再将已标记数据加入到训练样本中,调整各分类网络参数,反复进行上述过程,直至获得稳定的分类器。实验结果证明,与CML算法和基于NB分类器的半监督学习算法相比,该方法的分类准确率更高。 展开更多
关键词 半监督学习 构造性机器学习 Tri-training算法 覆盖 分类网络
在线阅读 下载PDF
机器学习中的核覆盖算法 被引量:33
7
作者 吴涛 张铃 张燕平 《计算机学报》 EI CSCD 北大核心 2005年第8期1295-1301,共7页
基于统计学习理论的支持向量机(SVM)方法在样本空间或特征空间构造最优分类超平面解决了分类器的构造问题,但其本质是二分类的,且核函数中的参数难以确定,计算复杂性高.构造性学习算法根据训练样本构造性地设计分类网络,运行效率高,便... 基于统计学习理论的支持向量机(SVM)方法在样本空间或特征空间构造最优分类超平面解决了分类器的构造问题,但其本质是二分类的,且核函数中的参数难以确定,计算复杂性高.构造性学习算法根据训练样本构造性地设计分类网络,运行效率高,便于处理多分类问题,但存在所得的分界面零乱、测试计算量大的缺点.该文将SVM中的核函数法与构造性学习的覆盖算法相融合,给出一种新的核覆盖算法.新算法克服了以上两种模型的缺点,具有运算速度快、精度高、鲁棒性强的优点.其次,文中给出风险误差上界与覆盖个数的关系.最后给出实验模拟,模拟结果证明了新方法的优越性. 展开更多
关键词 覆盖算法 融合 机器学习 支持向量机 构造性算法
在线阅读 下载PDF
基于Rough集和构造性学习神经网络的经济预警模型 被引量:3
8
作者 朱勇 吴涛 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第7期836-839,843,共5页
在深入分析人工神经网络(ANN)与粗集(Rough set)理论方法的基础上,将Rough集、构造性神经网络与宏观经济预警研究相结合,尝试建立起基于Rough集-覆盖算法的构造性神经网络宏观经济预警方法体系;结合安徽省经济数据,对该模型预警实证分... 在深入分析人工神经网络(ANN)与粗集(Rough set)理论方法的基础上,将Rough集、构造性神经网络与宏观经济预警研究相结合,尝试建立起基于Rough集-覆盖算法的构造性神经网络宏观经济预警方法体系;结合安徽省经济数据,对该模型预警实证分析。理论和实践证明,基于Rough集-覆盖算法的构造性神经网络预警模型是有效的、可行的,且具有较高的精度,从而为动态经济预警提供一条新的途经。 展开更多
关键词 经济预警 构造性学习 覆盖算法 粗糙集
在线阅读 下载PDF
协同半监督的构造性学习方法 被引量:1
9
作者 李萍 吴涛 《计算机工程与应用》 CSCD 北大核心 2015年第3期129-132,207,共5页
利用构造性学习(CML)算法训练分类器需要大量已标记样本,然而获取大量已标记的样本较为困难。为此,提出了一种协同半监督的构造性学习算法。将已标记样本等分为三个训练集,分别使用构造性学习算法训练三个单分类器,以共同投票的方式对... 利用构造性学习(CML)算法训练分类器需要大量已标记样本,然而获取大量已标记的样本较为困难。为此,提出了一种协同半监督的构造性学习算法。将已标记样本等分为三个训练集,分别使用构造性学习算法训练三个单分类器,以共同投票的方式对未标记样本进行标记,从而依次扩充三个单分类器训练集直到不能再扩充为止。将三个训练集合并训练出最终的分类器。选取UCI数据集进行实验,结果表明,与CML算法、Tri-CML算法、NB算法及Tri-NB相比,该方法的分类更为有效。 展开更多
关键词 半监督学习 构造性机器学习 co-training算法 tri-training算法 覆盖算法
在线阅读 下载PDF
基于概率的覆盖算法的模型及仿真研究
10
作者 周瑛 谢阳群 张铃 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第17期4609-4612,4617,共5页
提出的基于概率的覆盖算法——PBCA是一种新的分类算法,它利用学习所得到的样本的概率分布信息,通过投票的方式来决定覆盖边界中样本的类别。从网络结构上看,它是一种混合型的神经网络,由下面三层的前馈网络和上层的反馈网络组成。通过... 提出的基于概率的覆盖算法——PBCA是一种新的分类算法,它利用学习所得到的样本的概率分布信息,通过投票的方式来决定覆盖边界中样本的类别。从网络结构上看,它是一种混合型的神经网络,由下面三层的前馈网络和上层的反馈网络组成。通过在覆盖中加入一定数量的异类样本和使用概率的方法来扩大覆盖半径,减少拒识的样本数,提高识别率。计算机仿真实验表明,这种方法有效地提高了学习的精度。 展开更多
关键词 构造性学习算法 神经网络 覆盖算法 概率
在线阅读 下载PDF
CCA三支决策模型的边界域样本处理 被引量:3
11
作者 张燕平 邹慧锦 +1 位作者 邢航 赵姝 《计算机科学与探索》 CSCD 2014年第5期593-600,共8页
构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边... 构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边界域样本处理提出了两种决策方案:一种为处理全部的边界域样本,给出了距中心最近原则、距边界最近原则、万有引力原则3种方法;另一种为处理部分的边界域样本,即只对满足一定条件的边界域样本作进一步的划分,这样使不满足条件的边界域样本仍保留在边界域,提高了边界域样本处理的正确率。用十字交叉法在5组数据集上对这两种决策方案进行了对比,实验结果表明,处理部分边界域样本时正确率更高,效果更好。 展开更多
关键词 构造性覆盖算法(cca) 边界域样本处理 三支决策 CONSTRUCTIVE COVERING ALGORITHM (cca)
在线阅读 下载PDF
基于CCA的代价敏感三支决策模型 被引量:11
12
作者 张燕平 邹慧锦 赵姝 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第2期447-452,共6页
随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价... 随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价敏感引入到基于构造性覆盖算法的三支决策模型.该模型根据误分类之间的大小关系来减少正、负覆盖的个数,从而调整三个域,即正域、负域和边界域的大小.引入代价敏感的目的是尽可能的减少划分损失.实验对比了本文的模型分类结果和基于决策粗糙集的三支决策模型,结果表明,本文的模型分类结果稳定,并且能够通过改变三个域的大小,把分类损失最小化. 展开更多
关键词 代价敏感 三支决策 构造性覆盖算法 决策粗糙集模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部