期刊文献+
共找到146篇文章
< 1 2 8 >
每页显示 20 50 100
数据非平衡性对试验分析结果的影响 被引量:5
1
作者 胡希远 《西北农林科技大学学报(自然科学版)》 CSCD 北大核心 2004年第1期103-107,112,共6页
 利用蒙特卡罗(MonteCarlo)模拟考察了随机区组设计、裂区设计和条区设计因数据缺失形成的数据非平衡性对试验分析结果的影响。结果表明,数据非平衡性可导致方差组分估计的精准度降低、固定效应误差的偏低估计以及固定效应测验一类统...  利用蒙特卡罗(MonteCarlo)模拟考察了随机区组设计、裂区设计和条区设计因数据缺失形成的数据非平衡性对试验分析结果的影响。结果表明,数据非平衡性可导致方差组分估计的精准度降低、固定效应误差的偏低估计以及固定效应测验一类统计错误率的增大。缺失数据越多,这一现象表现越明显。数据缺失对随机区组设计分析精准度的影响小,而对裂区和条区设计分析精准度的影响大。 展开更多
关键词 数据非平衡 试验分析 影响因素 方差组分估计 固定效应测验
在线阅读 下载PDF
面向非平衡数据集的深度极限学习机模型
2
作者 张喻喻 李凤莲 +3 位作者 王伟丽 贾文辉 黄丽霞 陈桂军 《重庆理工大学学报(自然科学)》 北大核心 2025年第6期108-116,共9页
针对非平衡数据集对分类器性能造成的不利影响,提出一种基于Universum和改进哈里斯鹰算法优化的自适应深度极限学习机模型。在数据预处理阶段引入Universum样本,帮助更好地学习不同类别的样本;提出改进的哈里斯鹰算法,通过定义位置更新... 针对非平衡数据集对分类器性能造成的不利影响,提出一种基于Universum和改进哈里斯鹰算法优化的自适应深度极限学习机模型。在数据预处理阶段引入Universum样本,帮助更好地学习不同类别的样本;提出改进的哈里斯鹰算法,通过定义位置更新公式提升搜索能力,优化最小化问题公式以增强算法稳定性,生成更准确的特定类别成本调节极限学习机权重参数。基于多层感知机理论,构建自适应深度模型确定最佳隐藏层参数,进一步提高分类性能。基于公共数据集的实验结果表明,提出的自适应深度极限学习机模型可显著提高少数类样本的分类准确率。对脑卒中筛查数据进行的分类预测结果表明,该模型应用于临床数据可提供辅助诊断建议。 展开更多
关键词 平衡数据 极限学习机 哈里斯鹰算法 Universum
在线阅读 下载PDF
基于层次模型的非平衡风速预报订正
3
作者 曹阳 翟俊海 韩玲 《河北大学学报(自然科学版)》 北大核心 2025年第3期317-326,共10页
针对风速预报订正中的数据非平衡问题,提出了一种基于分类/回归层次结构的订正模型.该模型的核心思想是采用分治策略,逐步解决风速数据中的非平衡问题.在分类层中,使用了重加权策略来初步解决数据中的非平衡问题.在回归层中,提出了一种... 针对风速预报订正中的数据非平衡问题,提出了一种基于分类/回归层次结构的订正模型.该模型的核心思想是采用分治策略,逐步解决风速数据中的非平衡问题.在分类层中,使用了重加权策略来初步解决数据中的非平衡问题.在回归层中,提出了一种分组扩展的训练策略,有效纠正了受非平衡影响而被错误分类的样本,从而进一步解决数据非平衡问题.此外,还基于贪心策略设计了一种概率加权方法,目的是对有把握的样本输出更加准确的预测.该模型在山东沿海14个地区的风速数据集上进行了验证,并与相关方法进行了比较.订正后的风速预报整体和极端风速事件的平均绝对误差分别降低了34.4%和69.0%,表明该模型在提高极端风速事件预测能力的同时,也保持了对稳定事件的预测性能. 展开更多
关键词 风速预报订正 层次模型 数据非平衡 极端风速预测
在线阅读 下载PDF
基于非平衡MD&A文本数据的财务欺诈识别 被引量:1
4
作者 程双双 谷晓燕 王兴芬 《管理现代化》 北大核心 2024年第1期121-127,共7页
财务欺诈不仅会导致会计信息失真,还会危害经济的健康发展。因此,找到一种高效的智能化欺诈识别方法具有重要的现实意义。本文基于2020—2022年美国上市公司提交到EDGAR数据库的年度报告,聚焦于报告中管理层讨论与分析部分的文本信息(Ma... 财务欺诈不仅会导致会计信息失真,还会危害经济的健康发展。因此,找到一种高效的智能化欺诈识别方法具有重要的现实意义。本文基于2020—2022年美国上市公司提交到EDGAR数据库的年度报告,聚焦于报告中管理层讨论与分析部分的文本信息(Management Discussion and Analysis,MD&A)并对其进行分析。考虑到现有数据中欺诈和非欺诈样本数据极度不平衡的特点,本文在分层注意力网络的基础上设计了一个更高效的财务欺诈识别模型,最终使得欺诈识别模型的F1分数和F2分数分别提高了4.1%和3.7%,所提出的算法框架能够有效提高非平衡MD&A文本数据集的分类正确率。研究结果为财务欺诈识别系统性能的提高以及其他领域长文本分类任务的预测提供了新的解决思路,并进一步验证了使用MD&A文本数据进行财务欺诈识别的有效性,为使用非平衡数据进行欺诈识别提供了直接的实证支持。 展开更多
关键词 财务欺诈识别 管理层讨论与分析 分层注意力网络 平衡文本数据
在线阅读 下载PDF
基于对抗数据增强的非平衡节点分类算法
5
作者 程凤伟 王文剑 +1 位作者 史颖 张珍珍 《南京大学学报(自然科学版)》 CSCD 北大核心 2024年第5期785-792,共8页
图神经网络(Graph Neural Networks,GNNs)在节点分类任务中取得了显著的成功,然而,目前的GNNs模型倾向于处理具有大量标记数据的多数类,较少关注标记较少的少数类,传统方法常通过过采样来解决这一问题,但可能会导致过拟合.近期的一些研... 图神经网络(Graph Neural Networks,GNNs)在节点分类任务中取得了显著的成功,然而,目前的GNNs模型倾向于处理具有大量标记数据的多数类,较少关注标记较少的少数类,传统方法常通过过采样来解决这一问题,但可能会导致过拟合.近期的一些研究提出了从标记节点合成少数类附加节点的方法,但对于生成的节点是否真正代表相应的少数类,没有明确保证,实际上,不正确的合成节点可能导致算法的泛化能力不足.为了解决这一问题,提出一种基于对抗训练的简单自监督数据增强方法 GraphA2,通过在少数类周围的平滑空间中对梯度最远的地方施加扰动来增强数据,同时采用对比学习来保证增强后的一致性.使用这种方法,不仅增强了数据的多样性,还确保了模型在整个空间中的平滑性和连贯性,能增强其泛化能力.实验表明,提出的方法在各种类别不平衡的数据集上的性能均优于目前最先进的基准模型. 展开更多
关键词 图神经网络 节点分类 平衡数据 过采样 对抗数据增强
在线阅读 下载PDF
基于方差迁移的非平衡数据过采样方法
6
作者 郑一凡 王卯宁 《计算机科学》 CSCD 北大核心 2024年第S01期645-650,共6页
重采样是解决非平衡数据分类问题的重要方法。但在数据集很小的情况下,欠采样会丢失数据集的重要信息,因此过采样是非平衡数据分类问题的研究重点。现有的过采样方法虽然部分解决了类间不平衡问题,但是本质上并未给少数类引入额外的信息... 重采样是解决非平衡数据分类问题的重要方法。但在数据集很小的情况下,欠采样会丢失数据集的重要信息,因此过采样是非平衡数据分类问题的研究重点。现有的过采样方法虽然部分解决了类间不平衡问题,但是本质上并未给少数类引入额外的信息,且仍然存在着过拟合的风险。针对这些问题,提出了一种基于多数类方差迁移的少数类合成方法(Variance Transfer Oversampling,VTO),从足够多样化的多数类中提取样本偏移向量,综合少数类和多数类的特征权重矩阵以调整,最终将经过置信条件筛选的偏移向量叠加至少数类样本中心,从而在少数类样本生成中引入多数类方差,进而丰富少数类特征空间。为了验证所提算法的有效性,使用决策树为分类模型在6个KEEL数据集上训练,对比SMOTEENN等其他过采样方法,以F-score和PR-AUC值为评价指标进行了实验。结果显示,该算法在处理非平衡数据分类问题时具有更大优势。 展开更多
关键词 平衡数据 分类 过采样 方差迁移 协方差
在线阅读 下载PDF
一种基于核SMOTE的非平衡数据集分类方法 被引量:49
7
作者 曾志强 吴群 +1 位作者 廖备水 高济 《电子学报》 EI CAS CSCD 北大核心 2009年第11期2489-2495,共7页
本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空... 本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果. 展开更多
关键词 平衡数据 支持向量机 输入空间 特征空间 原像
在线阅读 下载PDF
基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法 被引量:18
8
作者 翟云 王树鹏 +2 位作者 马楠 杨炳儒 张德政 《电子学报》 EI CAS CSCD 北大核心 2014年第7期1311-1319,共9页
非平衡数据集分类问题是机器学习领域的重大挑战性难题.针对该难题,传统的少数类样本合成技术(Synthetic Minority Over-Sampling Technique,SMOTE)已成为一种有力手段并得到广泛采用.但在新样本生成过程中,SMOTE利用所有少数类样本合... 非平衡数据集分类问题是机器学习领域的重大挑战性难题.针对该难题,传统的少数类样本合成技术(Synthetic Minority Over-Sampling Technique,SMOTE)已成为一种有力手段并得到广泛采用.但在新样本生成过程中,SMOTE利用所有少数类样本合成新样本,由此产生过拟合瓶颈.为更好地解决该问题,提出了一种基于单边选择链和样本分布密度的非平衡数据挖掘新方法(One-Sided Link&Distribution Density-SMOTE,OSLDD-SMOTE).OSLDDSMOTE通过单边选择链遴选出处于分类边界的少数类样本,根据这些样本的动态分布密度生成新样本.进而分析了样本合成度对节点数目和对少数类精度的影响;基于G-mean、F-measure和AUC三个指标综合比较了OSLDD-SMOTE与其他同类方法的分类性能.实验结果表明,OSLDD-SMOTE有效提高了少数类样本的分类准确率. 展开更多
关键词 平衡数据分类 单边选择链 分布密度 重采样
在线阅读 下载PDF
非平衡数据集分类方法探讨 被引量:9
9
作者 职为梅 郭华平 +1 位作者 范明 叶阳东 《计算机科学》 CSCD 北大核心 2012年第B06期304-308,共5页
由于数据集中类分布极不平衡,很多分类算法在非平衡数据集上失效,而非平衡数据集中占少数的类在现实生活中通常具有显著意义,因此如何提高非平衡数据集中少数类的分类性能成为近年来研究的热点。详细讨论了非平衡数据集分类问题的本质... 由于数据集中类分布极不平衡,很多分类算法在非平衡数据集上失效,而非平衡数据集中占少数的类在现实生活中通常具有显著意义,因此如何提高非平衡数据集中少数类的分类性能成为近年来研究的热点。详细讨论了非平衡数据集分类问题的本质、影响非平衡数据集分类的因素、非平衡数据集分类通常采用的方法、常用的评估标准以及该问题中存在的问题与挑战。 展开更多
关键词 平衡数据 分类 抽样技术 代价敏感学习
在线阅读 下载PDF
处理非平衡数据的粒度SVM学习算法 被引量:15
10
作者 郭虎升 亓慧 王文剑 《计算机工程》 CAS CSCD 北大核心 2010年第2期181-183,共3页
针对支持向量机对于非平衡数据不能进行有效分类的问题,提出一种粒度支持向量机学习算法。根据粒度计算思想对多数类样本进行粒划分并从中获取信息粒,以使数据趋于平衡。通过这些信息粒来寻找局部支持向量,并在这些局部支持向量和少数... 针对支持向量机对于非平衡数据不能进行有效分类的问题,提出一种粒度支持向量机学习算法。根据粒度计算思想对多数类样本进行粒划分并从中获取信息粒,以使数据趋于平衡。通过这些信息粒来寻找局部支持向量,并在这些局部支持向量和少数类样本上进行有效学习,使SVM在非平衡数据集上获得令人满意的泛化能力。 展开更多
关键词 粒度支持向量机 平衡数据 信息粒 局部支持向量
在线阅读 下载PDF
基于改进SMOTE的非平衡数据集分类研究 被引量:19
11
作者 王超学 潘正茂 +2 位作者 董丽丽 马春森 张星 《计算机工程与应用》 CSCD 2013年第2期184-187,245,共5页
针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少... 针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。 展开更多
关键词 平衡数据 分类 支持度 轮盘赌选择 合成少数过采样技术(SMOTE)
在线阅读 下载PDF
非平衡数据集分类问题研究进展 被引量:16
12
作者 高嘉伟 梁吉业 《计算机科学》 CSCD 北大核心 2008年第4期10-13,共4页
非平衡数据集广泛存在于现实世界中,其分类问题已经成为目前数据挖掘领域中的一个研究热点。文章综述了非平衡数据集分类问题的评价方法及其常用分类算法,分析了目前存在的主要困难,并指出需进一步解决的几个问题。
关键词 平衡数据 分类 算法
在线阅读 下载PDF
针对非平衡数据分类的新型模糊SVM模型 被引量:19
13
作者 蔡艳艳 宋晓东 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2015年第5期120-124,160,共6页
提出了一种新的模糊支持向量机模型——非平衡数据分类的支持向量机模型,通过改进惩罚函数,降低模型对于含有噪声点的非平衡样本数据的敏感性,并采用网格搜索算法来确定各个支持向量机模型中参数的优化取值.研究结果表明,非平衡数据分... 提出了一种新的模糊支持向量机模型——非平衡数据分类的支持向量机模型,通过改进惩罚函数,降低模型对于含有噪声点的非平衡样本数据的敏感性,并采用网格搜索算法来确定各个支持向量机模型中参数的优化取值.研究结果表明,非平衡数据分类的支持向量机模型对非平衡样本数据进行分类的效果优于其他方法,不仅总体判别精度较高,也提高了少数类样本的判别精度,取得了较好的改进效果. 展开更多
关键词 支持向量机 分类 平衡数据 噪声 惩罚函数
在线阅读 下载PDF
一种面向非平衡数据集分类问题的组合选择方法 被引量:7
14
作者 职为梅 郭华平 +1 位作者 张银峰 范明 《小型微型计算机系统》 CSCD 北大核心 2014年第4期770-775,共6页
由于类分布的不平衡性,很多传统的分类方法在非平衡数据集上的分类效果不好.与传统的方法不同,论文从组合选择的角度考虑不平衡类学习问题,提出了一种基于实例的组合选择方法 CBES,提升组合分类器在不平衡数据集上的分类性能.CBES考察... 由于类分布的不平衡性,很多传统的分类方法在非平衡数据集上的分类效果不好.与传统的方法不同,论文从组合选择的角度考虑不平衡类学习问题,提出了一种基于实例的组合选择方法 CBES,提升组合分类器在不平衡数据集上的分类性能.CBES考察类标号未知的样本的k近邻,并以此为选择集,从分类器库中选择一个最优或次优的子组合分类器来预测未知样本的类标号.由于考虑了待分类样本的局部特征,更关注稀有类,因此CBES能够更好地对非平衡数据集进行分类.实验结果表明,本文的方法能够显著地降低模型的复杂度,有效地提高了非平衡数据集上的分类性能. 展开更多
关键词 平衡数据 组合分类器 组合选择 K近邻 基分类器
在线阅读 下载PDF
旅游上市公司董事会治理对经营绩效的影响——基于非平衡面板数据的分析 被引量:16
15
作者 王迪 张红 +1 位作者 张春晖 李红辉 《旅游学刊》 CSSCI 2014年第11期36-44,共9页
董事会作为公司治理的核心,是影响企业绩效的重要因素,对旅游上市公司的可持续发展具有重要意义。制订科学、完善的监管制度并严格执行,是上市公司防止"一股独大"与"内部人控制"等现象产生的重要途径。因此,建立科... 董事会作为公司治理的核心,是影响企业绩效的重要因素,对旅游上市公司的可持续发展具有重要意义。制订科学、完善的监管制度并严格执行,是上市公司防止"一股独大"与"内部人控制"等现象产生的重要途径。因此,建立科学合理的董事会成为现代公司治理的必然要求。文章选取2004—2012年间16家旅游上市公司为研究样本,以董事会规模、董事会会议频率、前三名董事薪酬、独立董事比例、执行董事比例和董事长与总经理两职合一为董事会治理变量,运用主成分分析法计算我国旅游上市公司经营绩效指数,利用非平衡面板数据建立计量经济学模型,采用混合最小二乘法对我国旅游上市公司董事会治理与经营绩效的相关性进行实证研究。研究发现,我国旅游上市公司董事会规模与经营绩效之间存在显著的倒U形曲线关系,执行董事比例对企业业绩有显著的促进作用,前三名董事薪酬、独立董事比例和董事长与总经理两职合一对经营绩效有消极影响,而董事会会议频率对经营绩效无显著影响。 展开更多
关键词 旅游上市公司 董事会治理 经营绩效 平衡面板数据
在线阅读 下载PDF
非平衡数据训练方法概述 被引量:10
16
作者 张琦 吴斌 王柏 《计算机科学》 CSCD 北大核心 2005年第10期181-186,共6页
现实世界中数据分类的应用通常会遇到数据非平衡的问题,即数据中的一类样本在数量上远多于另一类,例如欺诈检测和文本分类问题等。其中少数类的样本通常具有巨大的影响力和价值,是我们主要关心的对象,称为正类,另一类则称为负类。正类... 现实世界中数据分类的应用通常会遇到数据非平衡的问题,即数据中的一类样本在数量上远多于另一类,例如欺诈检测和文本分类问题等。其中少数类的样本通常具有巨大的影响力和价值,是我们主要关心的对象,称为正类,另一类则称为负类。正类样本与负类样本可能数量上相差极大,这给训练非平衡数据提出了挑战。传统机器训练算法可能会产生偏向多数类的结果,因而对于正类来说,预测的性能可能会很差。本文分析了导致非平衡数据分类性能差的多方面原因,并针对这些原因列出了多种解决方法。 展开更多
关键词 平衡数据 小析取项 元学习 训练方法 数据挖掘 评估度量
在线阅读 下载PDF
结合样本局部密度的非平衡数据集成分类算法 被引量:11
17
作者 杨浩 陈红梅 《计算机科学与探索》 CSCD 北大核心 2020年第2期274-284,共11页
传统的过采样方法是解决非平衡数据分类问题的有效方法之一。基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MO... 传统的过采样方法是解决非平衡数据分类问题的有效方法之一。基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD。在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE。LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类器集成。在KEEL公开的20个非平衡数据集上,将提出的LADBMOTE算法与当前流行的7个处理非平衡数据的算法对比,实验结果表明LADBMOTE在不同的分类器上的分类性能更好,鲁棒性更强。 展开更多
关键词 平衡数据 近邻计算策略 集成学习 过采样
在线阅读 下载PDF
基于新型集成分类器的非平衡数据分类关键问题研究 被引量:8
18
作者 翟云 杨炳儒 +1 位作者 曲武 隋海峰 《系统工程与电子技术》 EI CSCD 北大核心 2011年第1期196-201,共6页
针对非平衡数据分类问题,提出了一种基于差异采样率的重采样算法(differentiated sampling rate algorithm,DSRA),基于DSRA设计了一种新的集成分类器(SVM-Ripper ensemble classifier,SREC)。SREC采用独特的分类器选择策略、分类器集成... 针对非平衡数据分类问题,提出了一种基于差异采样率的重采样算法(differentiated sampling rate algorithm,DSRA),基于DSRA设计了一种新的集成分类器(SVM-Ripper ensemble classifier,SREC)。SREC采用独特的分类器选择策略、分类器集成策略、分类决策方案,可获得较高的分类精度。同时,利用SREC对影响非平衡数据分类的关键问题进行了研究。结果表明,非平衡数据分类问题本质上是由正负样本类间非平衡、类内非平衡、样本规模以及样本非平衡度等诸多因素引起的,只有综合考虑这些因素才能更好地解决非平衡数据分类问题。 展开更多
关键词 数据挖掘 平衡数据分类 集成分类器 关键问题
在线阅读 下载PDF
城镇化与工业化对能源强度影响的实证研究——基于截面相关和异质性回归系数的非平衡面板数据模型 被引量:18
19
作者 王珂英 张鸿武 《中国人口·资源与环境》 CSSCI CSCD 北大核心 2016年第6期122-129,共8页
城镇化、工业化对中国能源强度的影响如何?如何在快速推进城镇化、工业化进程的同时确保节能减排目标的实现?论文以能源强度指标代替传统的能源消费指标来反映能源综合利用效率,并应用考虑截面相关性和异质性回归系数的非平衡面板数据模... 城镇化、工业化对中国能源强度的影响如何?如何在快速推进城镇化、工业化进程的同时确保节能减排目标的实现?论文以能源强度指标代替传统的能源消费指标来反映能源综合利用效率,并应用考虑截面相关性和异质性回归系数的非平衡面板数据模型,使用共同相关效应组均值(CCEMG)估计方法对中国1978-2014年城镇化、工业化与能源强度之间的关系进行分析。研究结果表明:人均实际GDP增长1%,能源强度将会降低0.412%,工业化水平增长1%,能源强度将会上升0.630%,而由于生产消费等经济活动的增加、高度集中化以及规模经济的综合作用,使得城镇化对能源强度的影响并不确定。联系研究结论,本文提出政策建议:我国应加快产业结构升级,转变经济增长方式;构建绿色制造体系,推进"五化"协同发展;推进绿色、循环、低碳发展的新型城镇化建设,提高城镇化质量,提升我国整体的能源效率,确保节能减排目标的实现,推动经济全面、协调、可持续发展。 展开更多
关键词 能源强度 城镇化 工业化 平衡面板数据
在线阅读 下载PDF
Logistic回归的非平衡数据问题及其解决方法 被引量:5
20
作者 李刚 李纯青 张莉 《统计与决策》 CSSCI 北大核心 2013年第20期8-10,共3页
文章使用典型仿真数据引出Logistic回归的非平衡数据问题;基于重构训练集思想,提出在不改变Logistic基本求解算法下的"小类配平"和"大类配平"解决方法,实验验证这两种解决方法的有效性,论述这两类方法的优缺点;理... 文章使用典型仿真数据引出Logistic回归的非平衡数据问题;基于重构训练集思想,提出在不改变Logistic基本求解算法下的"小类配平"和"大类配平"解决方法,实验验证这两种解决方法的有效性,论述这两类方法的优缺点;理论分析Logistic回归的非平衡数据问题存在的原因及"小类配平"和"大类配平"法的合理性。 展开更多
关键词 LOGISTIC回归 平衡数据 极大似然法 训练集重构
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部