期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
不平衡数据分类问题的FL逻辑回归算法 被引量:5
1
作者 陈钟毓 尹居良 《统计与决策》 CSSCI 北大核心 2023年第5期33-37,共5页
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈... 针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。 展开更多
关键词 FL逻辑回归算法 焦点损失函数 代价敏感学习 不平衡数据 随机森林
在线阅读 下载PDF
城镇燃气管道腐蚀失效逻辑回归预测模型的构建与应用 被引量:1
2
作者 王明达 张榜 +2 位作者 吴志生 李云飞 蔡文龙 《腐蚀与防护》 CAS CSCD 北大核心 2024年第11期85-93,127,共10页
为打破城镇燃气管道失效传统预测模型在信息采集和计算上的空间限制,利用云环境搭建了管道失效预测模型。首先对人机环管模型进行梳理,运用鱼骨图对影响城镇燃气管道失效的因素进行定性分析,并利用聚类分析方法得到管道失效的主要因素;... 为打破城镇燃气管道失效传统预测模型在信息采集和计算上的空间限制,利用云环境搭建了管道失效预测模型。首先对人机环管模型进行梳理,运用鱼骨图对影响城镇燃气管道失效的因素进行定性分析,并利用聚类分析方法得到管道失效的主要因素;然后收集城镇燃气事故数据和管道设计指标,结合广义灰色关联分析法提取影响城镇燃气管道失效的关键因素;最后在云环境中建立基于逻辑回归算法的管道失效预测模型,并通过实际案例验证模型的可行性。结果表明:基于逻辑回归算法的燃气管道失效预测模型准确率达到了89%,证明本模型适用于城镇燃气管道的失效预测。 展开更多
关键词 安全工程技术科学 城镇燃气管道 失效风险预测 逻辑回归算法
在线阅读 下载PDF
基于SMOTE算法和逻辑回归模型算法的江苏短时强降水潜势预报 被引量:10
3
作者 王坤 蒋宁 +4 位作者 李敏 李静 张树民 陈铁 彭小燕 《科学技术与工程》 北大核心 2020年第28期11447-11454,共8页
短时强降水是导致城市内涝和山洪、滑坡等灾害的重要原因,其突发性强,局地性明显,预报难度大,是强对流天气业务预报的重点和难点之一。本研究利用2011—2018年江苏省国家气象观测的逐小时降水资料对江苏省短时强降水时空分布特征进行分... 短时强降水是导致城市内涝和山洪、滑坡等灾害的重要原因,其突发性强,局地性明显,预报难度大,是强对流天气业务预报的重点和难点之一。本研究利用2011—2018年江苏省国家气象观测的逐小时降水资料对江苏省短时强降水时空分布特征进行分析,江苏短时强降水频次分布为典型的南多北少,主要降水出现在早晨04:00—10:00和午后15:00—19:00,前半夜出现降水的概率则较低。基于ERA5再分析资料,选取了对于短时强降水有较强判断能力的气象要素,合成少数类过取样(SMOTE)算法和逻辑回归(LR)方法,构建短时强降水的预报模型,利用2019年的,欧洲中期天气预报中心(ECMWF)预报产品基于该模型进行短时强降水的确定性预报和概率预报,并使用同期实况数据进行系统性检验和天气过程检验。结果表明该模型总体性能较好,对短时强降水出现与否有较好的判别能力和预报指示意义。未来24 h以内的6 h时效预报,TS(threat score)评分在0.23以上,未来60 h以内的6 h时效预报TS评分均在0.2以上,但也存在着一定程度的空报和漏报。基于SMOTE+LR短时强降水预报模型对短时强降水的潜势预报具有较好的指示作用,对气象防灾减灾具有重要意义。 展开更多
关键词 SMOTE算法 逻辑回归模型算法 机器学习 短时强降水预报
在线阅读 下载PDF
融合电力数据的纵向联邦学习企业排污预测模型
4
作者 王心妍 杜嘉程 +3 位作者 钟李红 徐旺旺 刘伯宇 佘维 《计算机应用》 北大核心 2025年第2期518-525,共8页
针对企业排污难以监测和控制的问题,在考虑数据安全共享和隐私保护的前提下,提出一种融合电力数据的纵向联邦学习企业排污预测(VFL-EEP)模型。首先,在纵向联邦学习(VFL)框架下改进逻辑回归模型,从而在不泄露电力和环保企业排污监测数据... 针对企业排污难以监测和控制的问题,在考虑数据安全共享和隐私保护的前提下,提出一种融合电力数据的纵向联邦学习企业排污预测(VFL-EEP)模型。首先,在纵向联邦学习(VFL)框架下改进逻辑回归模型,从而在不泄露电力和环保企业排污监测数据的前提下,允许将数据的使用和模型的训练相分离;随后,改进逻辑回归算法使该算法能结合Paillier加密技术以保证模型的参数传递安全,从而有效解决VFL中参与方之间通信不安全的问题;最后,在仿真数据上实验,所提模型的排污预测结果与集中式逻辑回归模型的排污预测结果比较表明:所提模型在隐私安全的前提下融合电力数据,准确率、召回率、精确率和F1值分别提升了8.92%、7.62%、3.95%和11.86%,有效实现了隐私保护和模型性能的均衡。 展开更多
关键词 纵向联邦学习 逻辑回归算法 隐私集合求交 Paillier同态加密 数据共享
在线阅读 下载PDF
基于迁移学习算法的深部爆破振动速度预测 被引量:4
5
作者 张西良 焦灏恺 李二宝 《中国安全科学学报》 CAS CSCD 北大核心 2023年第6期64-72,共9页
为了更好地预测深部矿山爆破振动速度,针对深部爆破振动速度预测中存在的样本量小、数据分布同浅部爆破不同的问题,将浅部地下矿山爆破数据中有用的知识迁移至深部矿山爆破振动速度预测模型中,提出一种逻辑回归迁移学习算法(LR-TrAdaboo... 为了更好地预测深部矿山爆破振动速度,针对深部爆破振动速度预测中存在的样本量小、数据分布同浅部爆破不同的问题,将浅部地下矿山爆破数据中有用的知识迁移至深部矿山爆破振动速度预测模型中,提出一种逻辑回归迁移学习算法(LR-TrAdaboost),提升模型的样本容量及预测准确率;以某铜矿深部爆破振动速度预测为研究对象,结合该铜矿27条深部爆破数据以及梅山矿等5个地下金属矿204条浅部爆破数据,利用支持向量回归机(SVR)、回归迁移学习算法(TrAdaboost-R 2)以及LR-TrAdaboost算法分别进行预测和对比。结果表明:3种算法的模型分数分别为0.24、0.38、0.81,均方根误差(RMSE)分别为0.152、0.107、0.06,LR-TrAdaboost算法预测误差相比SVR、TrAdaboost-R^(2)分别降低了60.5%、43.9%;同时,LR-TrAdaboost在迭代次数为50时已经收敛,而TrAdaboost-R^(2)在迭代次数100次后才收敛,收敛速度前者是后者的2倍;LR-TrAdaboost算法的预测性能更好。 展开更多
关键词 深部爆破振动速度 逻辑回归迁移学习算法(LR-TrAdaboost) 预测误差 支持向量回归机(SVR) 机器学习
在线阅读 下载PDF
多变量数据分析模型在无症状颈动脉狭窄检测中的应用
6
作者 陈曦 《科学技术与工程》 北大核心 2013年第27期8100-8105,共6页
无症状颈动脉狭窄是引起中风的主要原因。而无症状颈动脉狭窄的危险因素包括高血压、心脏病发病率、吸烟、糖尿病、久坐不动等。为了明确无症状颈动脉狭窄的重要影响因素,利用多变量数据分析技术研究探讨了无症状颈动脉狭窄检测中可能... 无症状颈动脉狭窄是引起中风的主要原因。而无症状颈动脉狭窄的危险因素包括高血压、心脏病发病率、吸烟、糖尿病、久坐不动等。为了明确无症状颈动脉狭窄的重要影响因素,利用多变量数据分析技术研究探讨了无症状颈动脉狭窄检测中可能存在的规则和关系。通过采用遗传算法、逻辑回归算法及卡方检验,对372位病人的临床特征进行了检测分析。实验结果表明,高血压、冠状动脉疾病是诱发无症状颈动脉狭窄最主要的两个因素,相比逻辑回归、卡方检测,遗传算法产生的简单规则更适用于医生的日常诊断。 展开更多
关键词 无症状颈动脉狭窄 多变量数据分析 数据挖掘 遗传算法 逻辑回归算法 卡方检验
在线阅读 下载PDF
基于空间相量模型的三相电压暂降扰动特征提取与分类 被引量:13
7
作者 辛峰 尤向阳 +1 位作者 葛笑寒 马宁 《电力系统保护与控制》 EI CSCD 北大核心 2022年第8期58-65,共8页
对暂降扰动进行精准类型识别是电能质量评估和治理的前提。现有暂降特征提取多是对单一扰动数据进行识别分类,采用数学变换法进行特征提取时数据维数高且计算量大。针对这些问题,提出了一种基于三相电压空间相量模型的多级暂降扰动可视... 对暂降扰动进行精准类型识别是电能质量评估和治理的前提。现有暂降特征提取多是对单一扰动数据进行识别分类,采用数学变换法进行特征提取时数据维数高且计算量大。针对这些问题,提出了一种基于三相电压空间相量模型的多级暂降扰动可视化特征提取及分类方法。首先,将三相电压时域波形数据转换为空间相量模型;其次,使用K-mean算法,将电压降落扰动聚类成平面内可视化的圆或椭圆;最后,利用逻辑回归算法对每一个聚类的圆或椭圆进行特征提取与分类。应用所提方法分别进行了单一扰动和多级扰动识别的仿真实验,结果表明,所提方法能有效识别A、C_(a)、C_(b)、C_(c)、D_(a)、D_(b)和D_(c)等七类电压暂降扰动。该方法降低了数据维度,减少了模型计算量,避免了对动态过渡过程的检测,降低了错误识别的风险,为多级电压暂降扰动的识别与分类提供了一种有效的辅助手段。 展开更多
关键词 空间相量模型 K-mean聚类 逻辑回归算法 电压暂降
在线阅读 下载PDF
电费回收风险预测的大数据方法应用 被引量:21
8
作者 赵雅迪 吴钊 +2 位作者 李庆兵 陈小峰 王宝亭 《电信科学》 2019年第2期125-133,共9页
基于电力客户的历史数据,采用客户的基本属性、用电行为、缴费行为、客户信用、行业前景信息等多个维度确定模型所需指标体系。通过指标的相关系数矩阵及信息值(information value,IV)筛选出最终进入模型的指标变量,同时采用最优分组的... 基于电力客户的历史数据,采用客户的基本属性、用电行为、缴费行为、客户信用、行业前景信息等多个维度确定模型所需指标体系。通过指标的相关系数矩阵及信息值(information value,IV)筛选出最终进入模型的指标变量,同时采用最优分组的方法对变量进行分组,并进行证据权重转化(weight of evidence,WOE)。基于处理后的数据,运用逻辑回归算法构建用电客户电费风险预测模型,并依据得到的模型结果量化输出变量标准评分卡表,从而将客户划分为高风险、中风险和低风险用户,为不同的用户采取差异化的营销措施提供依据。 展开更多
关键词 电费回收 逻辑回归算法 指标体系
在线阅读 下载PDF
基于k-DT-LR融合模型的农村商业医疗保险潜在客户识别分析
9
作者 周可心 袁永生 林春进 《湖北农业科学》 2022年第24期144-148,共5页
为促进农村商业医疗保险的发展,提出了一种基于k-近邻算法、决策树算法和逻辑回归算法的kDT-LR融合模型,动态地为集成中的每个学习器分配有效能力,并根据CGSS2017家户调查数据,构建农村商业医疗保险潜在客户识别模型。结果表明,k-DT-LR... 为促进农村商业医疗保险的发展,提出了一种基于k-近邻算法、决策树算法和逻辑回归算法的kDT-LR融合模型,动态地为集成中的每个学习器分配有效能力,并根据CGSS2017家户调查数据,构建农村商业医疗保险潜在客户识别模型。结果表明,k-DT-LR融合模型算法的分类准确率达到90.024%,召回率达到91.402%,能够精确地识别出农村商业医疗保险潜在客户。 展开更多
关键词 农村商业医疗保险 K近邻算法 决策树算法 逻辑回归算法 集成学习 潜在客户识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部