期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于SMOTE算法的腹膜透析患者合并重度贫血的预测模型构建
1
作者 燕雯雯 储杨敏 +1 位作者 束永兵 罗寅亮 《皖南医学院学报》 2025年第1期29-32,37,共5页
目的:探讨腹膜透析患者合并重度贫血的危险因素,并基于少数类样本合成过抽样技术(SMOTE)算法构建腹膜透析患者合并重度贫血的预测模型。方法:选取2020年1月~2022年10月六安市中医院诊治的212例腹膜透析患者作为研究对象。采用多因素Logi... 目的:探讨腹膜透析患者合并重度贫血的危险因素,并基于少数类样本合成过抽样技术(SMOTE)算法构建腹膜透析患者合并重度贫血的预测模型。方法:选取2020年1月~2022年10月六安市中医院诊治的212例腹膜透析患者作为研究对象。采用多因素Logistic回归分析筛选腹膜透析患者合并重度贫血的危险因素,应用SMOTE算法构建腹膜透析患者合并重度贫血的预测模型,并对其预测效能进行分析。结果:212例腹膜透析患者中有72例患者发生重度贫血,重度贫血的发生率为33.96%(72/212)。Logistic回归分析结果显示,血清铁降低、营养不良、未使用补血药物及C-反应蛋白(C-reactive protein,CRP)水平升高等是腹膜透析患者合并重度贫血的危险因素,铁蛋白升高、转铁蛋白升高是腹膜透析患者合并重度贫血的保护因素(P<0.05)。基于SMOTE算法的预警模型Logit(P)=1.266血钙+1.702血清铁+1.578营养不良+1.815未使用补血药物-0.115铁蛋白-2.687转铁蛋白+0.511CRP+12.199,H-L检验结果(决定系数R 2=0.187,P=0.924)提示基于SMOTE算法的预警模型拟合度良好。Logistic回归模型的ROC曲线下面积(AUC)为0.902(95%CI:0.860~0.945),基于SMOTE算法的预测模型的AUC为0.936(95%CI:0.911~0.962),基于SMOTE算法的预测模型的ROC曲线下面积高于Logistic回归模型(P<0.05)。结论:血清铁降低、营养不良、未使用补血药物及CRP等是腹膜透析患者合并重度贫血的危险因素,铁蛋白升高、转铁蛋白升高是腹膜透析患者合并重度贫血的保护因素,基于SMOTE算法的预警模型对腹膜透析患者合并重度贫血预测的准确性较高。 展开更多
关键词 腹膜透析 重度贫血 危险因素 少数类样本合成过抽样技术
在线阅读 下载PDF
基于SMOTE-IKPCA-SeNet深度迁移学习的小批量生产质量预测研究 被引量:1
2
作者 杨剑锋 崔少红 +1 位作者 段家琦 王宁 《工业工程》 2024年第2期98-106,157,共10页
随着智能制造技术的发展和客户个性化需求的增加,多品种小批量生产方式逐渐成为制造业的主流。面向大批量生产、以统计过程控制为核心的质量管理方式并不适用于小批量生产。针对复杂生产过程存在参数多、非线性和交互作用的问题,提出利... 随着智能制造技术的发展和客户个性化需求的增加,多品种小批量生产方式逐渐成为制造业的主流。面向大批量生产、以统计过程控制为核心的质量管理方式并不适用于小批量生产。针对复杂生产过程存在参数多、非线性和交互作用的问题,提出利用深度迁移学习的方式将历史生产数据作为源域迁移至小样本目标产品数据进行质量预测。首先,通过合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)和改进的核主成分分析(improved kernel principal component analysis,IKPCA)算法筛选源域和目标域的可迁移特征,这不仅兼顾了特征重要性和可迁移性,还减少了“负迁移”,提高了模型泛化能力;然后,采用结合通道注意力机制的卷积神经网络SeNet构建基于深度迁移学习的质量预测模型。仿真结果表明,随着目标域样本的增加,所提方法的预测准确性明显优于广泛采用的支持向量机建模方法。同时,所提可迁移特征筛选方法显著提高了深度迁移学习的质量预测效果,为复杂的小批量生产过程质量保证提供了新方法。 展开更多
关键词 小批量生产质量预测 深度迁移学习 smote IKPCA SeNet
在线阅读 下载PDF
小样本下基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断
3
作者 葛平淑 王朝阳 +3 位作者 王阳 张涛 薛红涛 夏晨迪 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第8期1-9,共9页
轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据... 轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据集,生成与真实样本分布相似的故障样本,并使用主成分分析(PCA)优化其时域和频域的特征。然后,通过引入非线性收敛因子和Levy飞行策略改进传统的灰狼优化算法(GWO),使用改进的灰狼优化算法(IGWO)优化随机森林(RF)模型的参数。最后,基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断模型实现故障状态的识别,并在轮毂电机试验台架上进行了实验验证。结果表明,所提出的轮毂电机轴承故障诊断方法在7种转速工况下平均准确率均超过96%,具有高精度和稳定性。与遗传算法(GA)、粒子群优化算法(PSO)、GWO优化RF相比,提出的IGWO-RF模型在3种小样本训练集下的诊断准确率均超过90%,且准确率均明显高于其他3个对比算法,能够有效实现小样本条件下的轮毂电机轴承故障诊断。 展开更多
关键词 轮毂电机 轴承 合成少数类过采样技术(smote) 改进灰狼优化算法(IGWO) 随机森林(RF) 故障诊断
在线阅读 下载PDF
基于SMOTE-UVE-SVM的小麦种子纯度高光谱图像检测 被引量:1
4
作者 朱潘雨 黄敏 赵鑫 《激光技术》 CAS CSCD 北大核心 2024年第2期281-287,共7页
为了解决基于高光谱成像技术的小麦种子纯度检测过程中样本不均衡及波段信息冗余导致纯度检测模型性能下降的问题,提出了一种融合合成少数类过采样技术(SMOTE)、非信息变量剔除(UVE)和支持向量机(SVM)的种子纯度高光谱检测模型。该模型... 为了解决基于高光谱成像技术的小麦种子纯度检测过程中样本不均衡及波段信息冗余导致纯度检测模型性能下降的问题,提出了一种融合合成少数类过采样技术(SMOTE)、非信息变量剔除(UVE)和支持向量机(SVM)的种子纯度高光谱检测模型。该模型利用SMOTE算法对小麦种子少数类(杂质)样本进行扩充,改善样本的不均衡性;同时利用UVE对高维的高光谱特征进行选择,并构建SVM模型作为分类器,以进一步提高分类的性能。结果表明,5类小麦种子的平均准确率、精确率和负样本检出率分别达到95.98%、94.94%和89.32%,较传统方法分别提高了3.89%、7.18%和12.42%。所提出的方法在基于高光谱成像技术的小麦种子纯度检测中具有较好的应用前景。 展开更多
关键词 光谱学 高光谱成像技术 合成少数类过采样技术 非信息变量剔除 种子纯度
在线阅读 下载PDF
基于SMOTE算法的船舶结构可靠性优化设计 被引量:17
5
作者 龙周 陈松坤 王德禹 《上海交通大学学报》 EI CAS CSCD 北大核心 2019年第1期26-34,共9页
针对常规船舶结构可靠性优化设计由高度非线性带来的计算效率低、收敛困难的问题,提出了基于SMOTE(Synthetic Minority Oversampling Technique)算法的船舶结构可靠性优化设计方法.利用SMOTE算法建立了改进的BP (Back Propagation)神经... 针对常规船舶结构可靠性优化设计由高度非线性带来的计算效率低、收敛困难的问题,提出了基于SMOTE(Synthetic Minority Oversampling Technique)算法的船舶结构可靠性优化设计方法.利用SMOTE算法建立了改进的BP (Back Propagation)神经网络模型,以较少的样本点完成了极限状态函数的高度近似,克服了以往代理模型不能同时满足精度和效率要求的缺点,并通过数学算例验证了使用SMOTE算法建立BP神经网络模型的可行性和有效性.将改进的BP神经网络模型和模拟退火法嵌入单循环优化策略,并将其用于船舶舱段的可靠性优化设计,验证了所提出的可靠性优化设计方法的求解效率和精度,为大型工程结构的可靠性优化设计提供了思路. 展开更多
关键词 可靠性优化设计 极限状态函数 单循环优化策略 smote算法
在线阅读 下载PDF
基于SMOTE算法和动态代理模型的船舶结构可靠性优化 被引量:12
6
作者 刘婧 王德禹 《中国舰船研究》 CSCD 北大核心 2020年第5期114-123,共10页
[目的]针对传统船舶结构可靠性优化设计中难以同时保证全局近似精度与计算效率的问题,提出一种基于少数类合成的过采样算法(SMOTE)和动态代理模型的可靠性优化策略。[方法]首先,通过最优拉丁超立方试验设计,在设计空间中选择初始样本点... [目的]针对传统船舶结构可靠性优化设计中难以同时保证全局近似精度与计算效率的问题,提出一种基于少数类合成的过采样算法(SMOTE)和动态代理模型的可靠性优化策略。[方法]首先,通过最优拉丁超立方试验设计,在设计空间中选择初始样本点,构造BP神经网络模型;然后,利用全局优化算法−模拟退火法(ASA)和可靠性优化设计的单循环法(SLA),找到当前全局最优解;最后,通过SMOTE算法增加最优解周围的样本点,更新代理模型以提高其在全局最优解附近的精度,直至优化迭代收敛。[结果]结果显示,SMOTE算法可以合成位于失效面附近的样本点,从而使BP神经网络模型更高效地拟合极限状态函数;SLA法将可靠性优化问题解耦成确定性优化问题,在保持计算精度的同时提高了计算效率。[结论]优化结果表明,采用所提方法在获得分析模型全局最优解的同时还能有效减少计算成本。 展开更多
关键词 船舶结构 可靠性优化 动态代理模型 少数类合成的过采样算法 BP神经网络模型 单循环法
在线阅读 下载PDF
基于SMOTE算法的声门型喉癌患者术后下呼吸道感染预警模型构建 被引量:11
7
作者 马灵草 董婷 +3 位作者 戴晗青 岳红 陈海芳 臧艳姿 《护理学杂志》 CSCD 北大核心 2021年第8期1-4,共4页
目的构建基于SMOTE算法的声门型喉癌患者术后下呼吸道感染预警模型,为临床预防患者术后下呼吸道感染提供参考。方法收集596例接受肿瘤根治手术的声门型喉癌患者临床资料,利用单因素比较和Logistic回归分析筛选术后下呼吸道感染的影响因... 目的构建基于SMOTE算法的声门型喉癌患者术后下呼吸道感染预警模型,为临床预防患者术后下呼吸道感染提供参考。方法收集596例接受肿瘤根治手术的声门型喉癌患者临床资料,利用单因素比较和Logistic回归分析筛选术后下呼吸道感染的影响因素,采用SMOTE算法对影响因素的原始数据集进行重建,得到基于SMOTE算法的声门型喉癌患者术后下呼吸道感染预警模型。结果术后共38例(6.38%)患者发生下呼吸道感染。Logistic回归分析可得,年龄、BMI值、吸烟史、糖尿病、肺部疾病、手术类型、术后吸痰、术中出血量、术后拔管时间和使用人工鼻是声门型喉癌患者术后下呼吸道感染的影响因素(均P<0.01)。原始预测模型和基于SMOTE算法的预警模型比较,真阳性率差异无统计学意义,阳性预测值、F值、ROC曲线下面积差异有统计学意义(P<0.05,P<0.01)。结论基于SMOTE算法构建的预警模型优于原始预测模型,能准确预警喉癌患者术后下呼吸道感染,可基于预测结果采取针对性措施预防喉癌患者术后下呼吸道感染。 展开更多
关键词 smote算法 声门型喉癌 术后 下呼吸道感染 预警模型 吸痰 人工鼻 出血量
在线阅读 下载PDF
面向不平衡图像数据的对抗自编码器过采样算法
8
作者 职为梅 常智 +1 位作者 卢俊华 耿正乾 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第11期4208-4218,共11页
许多适用于低维数据的传统不平衡学习算法在图像数据上的效果并不理想。基于生成对抗网络(GAN)的过采样算法虽然可以生成高质量图像,但在类不平衡情况下容易产生模式崩溃问题。基于自编码器(AE)的过采样算法容易训练,但生成的图像质量... 许多适用于低维数据的传统不平衡学习算法在图像数据上的效果并不理想。基于生成对抗网络(GAN)的过采样算法虽然可以生成高质量图像,但在类不平衡情况下容易产生模式崩溃问题。基于自编码器(AE)的过采样算法容易训练,但生成的图像质量较低。为进一步提高过采样算法在不平衡图像中生成样本的质量和训练的稳定性,该文基于生成对抗网络和自编码器的思想提出一种融合自编码器和生成对抗网络的过采样算法(BAEGAN)。首先在自编码器中引入一个条件嵌入层,使用预训练的条件自编码器初始化GAN以稳定模型训练;然后改进判别器的输出结构,引入一种融合焦点损失和梯度惩罚的损失函数以减轻类不平衡的影响;最后从潜在向量的分布映射中使用合成少数类过采样技术(SMOTE)来生成高质量的图像。在4个图像数据集上的实验结果表明该算法在生成图像质量和过采样后的分类性能上优于具有辅助分类器的条件生成对抗网络(ACGAN)、平衡生成对抗网络(BAGAN)等过采样算法,能有效解决图像数据中的类不平衡问题。 展开更多
关键词 不平衡图像数据 过采样 生成对抗网络 对抗自编码器 合成少数类过采样技术
在线阅读 下载PDF
基于自适应GA-RF的用户流失预测研究
9
作者 赵峰 徐丹华 《信息通信技术》 2024年第1期58-63,72,共7页
针对电信用户流失问题,文章提出一种自适应遗传算法优化随机森林的预测模型。首先对Kaggle平台提供的电信数据进行数据清洗、特征提取及无量纲化处理,然后运用SMOTE过采样以解决数据不平衡问题,对决策树、随机森林等模型预测的召回率、F... 针对电信用户流失问题,文章提出一种自适应遗传算法优化随机森林的预测模型。首先对Kaggle平台提供的电信数据进行数据清洗、特征提取及无量纲化处理,然后运用SMOTE过采样以解决数据不平衡问题,对决策树、随机森林等模型预测的召回率、F1和AUC值进行对比。最后提出一种自适应遗传算法优化随机森林的电信用户流失预测模型。结果表明,自适应遗传算法优化的随机森林模型的预测性能优于单一分类模型。 展开更多
关键词 用户流失 自适应 遗传算法 随机森林 smote
在线阅读 下载PDF
考虑不同天气类型样本的光伏功率日内预测模型 被引量:2
10
作者 付雪姣 吕可欣 +4 位作者 吴林林 刘辉 张扬帆 李奕霖 叶林 《分布式能源》 2024年第2期39-47,共9页
太阳能具有清洁、安全、可再生的优点,光伏发电可减轻资源消耗,助力可持续发展,然而光伏功率易受天气影响,针对不同天气类型下光伏功率的预测也是一个研究难点。该研究着手于在不同天气类型下应用人工少数类过采样法(synthetic minority... 太阳能具有清洁、安全、可再生的优点,光伏发电可减轻资源消耗,助力可持续发展,然而光伏功率易受天气影响,针对不同天气类型下光伏功率的预测也是一个研究难点。该研究着手于在不同天气类型下应用人工少数类过采样法(synthetic minority over-sampling technique,SMOTE)和机器学习进行光伏功率预测。首先,通过皮尔逊相关系数法选择出对光伏功率影响最大的气象因子;然后,根据重要程度较大的气象因子计算日照时数,通过给日照时数设定阈值进行划分,将天气分类为晴天、多云或阴天、覆雪,再通过SMOTE技术对各种天气类型下的样本进行扩充;最后,通过多种机器学习算法分别针对不同天气场景以及数据扩充前后构建光伏功率预测模型。通过案例分析可知,所提算法能对不同天气类型进行划分,并为不同天气类型下光伏功率预测存在的样本不平衡问题提供了一种解决方案,提升了不同天气场景下光伏功率的预测精度。 展开更多
关键词 光伏发电 功率预测 机器学习 人工少数类过采样法(smote) 天气类型
在线阅读 下载PDF
基于卷积神经网络的液化预测模型及可解释性分析 被引量:2
11
作者 龙潇 孙锐 郑桐 《岩土力学》 EI CAS CSCD 北大核心 2024年第9期2741-2753,共13页
常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上... 常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上覆应力、门槛加速度、循环剪应力比、剪切波速、震级与地表峰值加速度11个液化特征建立卷积神经网络(convolutional neural network,简称CNN)模型。引入边界合成少数过采样技术消除不平衡数据集的影响。将CNN模型与随机森林模型、逻辑回归模型、支持向量机模型、极致梯度提升模型和规范方法进行对比,并结合沙普利加性解释(SHapley Additive exPlanations,简称SHAP)分析输入特征对预测结果的影响趋势。结果表明,CNN模型准确率达92.58%,各项指标均优于其他4种机器学习模型和规范方法。对SHAP结果分析可知,修正标贯击数小于15的土层液化概率较高,循环剪应力比CSR小于0.25的土层更不易液化。各因素的影响规律均符合现有认知,预测模型合理可靠。 展开更多
关键词 机器学习 液化预测 卷积神经网络 边界合成少数过采样技术 沙普利加性解释(SHAP)
在线阅读 下载PDF
一种带式输送机故障诊断方法 被引量:15
12
作者 张喆 陶云春 +1 位作者 梁睿 迟鹏 《工矿自动化》 北大核心 2020年第4期81-84,108,共5页
针对传统浅层神经网络用于带式输送机故障诊断时存在故障状态样本数据不足、准确率不高等问题,提出了一种基于合成少数类过采样技术(SMOTE)和深度置信网络(DBN)的带式输送机故障诊断方法.该方法利用SMOTE生成带式输送机故障状态样本数据... 针对传统浅层神经网络用于带式输送机故障诊断时存在故障状态样本数据不足、准确率不高等问题,提出了一种基于合成少数类过采样技术(SMOTE)和深度置信网络(DBN)的带式输送机故障诊断方法.该方法利用SMOTE生成带式输送机故障状态样本数据,克服样本数据分布不平衡现象;将样本数据输入DBN,利用无监督逐层训练方式提取数据中的故障特征,并通过有监督微调来优化故障诊断能力,实现带式输送机故障精确诊断.仿真结果表明,该方法提高了带式输送机故障诊断准确率. 展开更多
关键词 带式输送机 故障诊断 合成少数类过采样技术 深度置信网络
在线阅读 下载PDF
考虑不平衡数据的民航不安全事件分析 被引量:4
13
作者 倪晓梅 王华伟 +1 位作者 洪骥宇 严晓婧 《航空计算技术》 2017年第5期37-40,45,共5页
民航事故的产生具有随机性,导致民航不安全事件的数据也具有较大的波动性,如何从波动的安全数据中提取出反映民航安全变化的本质安全特征,直接决定安全分析的准确度。引入不平衡数据的概念,利用SMOTE和随机向下抽样的方法平衡民航数据,... 民航事故的产生具有随机性,导致民航不安全事件的数据也具有较大的波动性,如何从波动的安全数据中提取出反映民航安全变化的本质安全特征,直接决定安全分析的准确度。引入不平衡数据的概念,利用SMOTE和随机向下抽样的方法平衡民航数据,通过主成分分析方法提取引起航空器空中运行、起飞着陆、地面运行等六个方面不安全事件的主要因素。针对不安全事件的特点提出改进措施,从而达到提高民航安全水平的目的。 展开更多
关键词 民航安全 不安全事件 smote 主成分分析
在线阅读 下载PDF
基于CNN与BiGRU融合神经网络的入侵检测模型 被引量:21
14
作者 张安琳 张启坤 +3 位作者 黄道颖 刘江豪 李建春 陈孝文 《郑州大学学报(工学版)》 CAS 北大核心 2022年第3期37-43,共7页
针对深度学习入侵检测中出现的数据类不平衡及特征学习不全面等问题,提出了一种基于卷积神经网络(CNN)与双向门控循环单元(BiGRU)融合的神经网络入侵检测模型。通过SMOTE-Tomek算法完成对数据集的平衡处理,使用基于平均不纯度减少的特... 针对深度学习入侵检测中出现的数据类不平衡及特征学习不全面等问题,提出了一种基于卷积神经网络(CNN)与双向门控循环单元(BiGRU)融合的神经网络入侵检测模型。通过SMOTE-Tomek算法完成对数据集的平衡处理,使用基于平均不纯度减少的特征重要性算法实现特征选择,将CNN和BiGRU模型进行特征融合并引入注意力机制进行特征提取,从而提高模型的总体检测性能。使用入侵检测数据集CSE-CIC-IDS2018进行多分类实验,并与经典单一深度学习模型进行对比。实验结果表明:在数据集平衡方面,经SMOTE-Tomek算法处理,DoS attacks-Slow HTTP Test识别准确率从0提升至34.66%,SQL Injection识别准确率从0提升至100%,DDoS attack-LOIC-UDP、Brute Force-Web和Brute Force-XSS分别提升了5.22百分点、6.55百分点和35.71百分点,证明了平衡后的数据集较未经过处理的数据集在少数类的识别精度上提升明显。在模型的总体检测性能方面,在多分类实验对比中,所提模型总的分类精确率、召回率以及F1值均高于其他几种单一神经网络模型。其中各攻击流量类别的总评精确率比LSTM模型提升了2.10百分点;总评召回率比LSTM模型提升了1.50百分点;总评F1值比GRU模型提升了1.97百分点,从而证明了该模型具有更好的检测效果。 展开更多
关键词 入侵检测 卷积神经网络 双向门控循环单元 smote算法 Tomek Links算法
在线阅读 下载PDF
基于GAN数据重构的电信用户流失预测方法 被引量:3
15
作者 阿克弘 胡晓东 《电信科学》 2023年第3期135-142,共8页
用户是运营商利益的核心。随着携号转网政策的出台,运营商之间的竞争越发激烈。为了提前精准有效地预测用户流失倾向,提出了一种基于生成对抗网络(generative adversarial network,GAN)数据重构的电信用户流失预测方法。首先,利用有效... 用户是运营商利益的核心。随着携号转网政策的出台,运营商之间的竞争越发激烈。为了提前精准有效地预测用户流失倾向,提出了一种基于生成对抗网络(generative adversarial network,GAN)数据重构的电信用户流失预测方法。首先,利用有效的数据预处理方法电信用户流失数据中的脏数据;其次,利用GAN重构电信用户流失数据,解决电信用户流失数据不平衡问题;最后,利用极度梯度提升树(extremegradient boosting,XGBoost)算法分别训练基于GAN重构的电信用户流失预测模型和基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)采样的电信用户流失预测模型,对比两种模型的预测精度。实验结果表明,GAN重构后的电信用户流失预测模型预测精度比未重构的预测模型的准确率提升了6.75%,查准率提升了25.91%,召回率提升了30.91%,F1值提升了28.73%。该方法能够有效提升电信用户流失预测的准确度。 展开更多
关键词 XGBoost算法 生成对抗网络 用户流失 数据重构 smote
在线阅读 下载PDF
基于卷积神经网络的庞氏骗局合约检测方法
16
作者 袁政 葛斌 任萍 《佳木斯大学学报(自然科学版)》 CAS 2022年第5期9-11,86,共4页
现有庞氏骗局合约检测方法主要结合账户特征和代码特征进行检测,对无账户特征的初步部署智能合约检测精度较低,为此提出一种基于改进卷积神经网络的庞氏骗局合约检测方法。首先,选取初步部署合约的唯一特征操作码作为数据源,改进合成少... 现有庞氏骗局合约检测方法主要结合账户特征和代码特征进行检测,对无账户特征的初步部署智能合约检测精度较低,为此提出一种基于改进卷积神经网络的庞氏骗局合约检测方法。首先,选取初步部署合约的唯一特征操作码作为数据源,改进合成少数类过采样技术生成人工样本,解决数据集样本类分布不均衡问题。然后,创新性引入卷积神经网络用于庞氏骗局智能合约检测,为提升检测精度,改进卷积神经网络,使用不同卷积核进行双路卷积,充分提取数据特征,在融合层进行特征融合。实验结果表明,该方法对初步部署合约具有较高检测精度。 展开更多
关键词 以太坊 智能合约 庞氏骗局 卷积神经网络 合成少数类过采样技术
在线阅读 下载PDF
An ensemble learning classifier to discover arsenene catalysts with implanted heteroatoms for hydrogen evolution reaction
17
作者 An Chen Junfei Cai +3 位作者 Zhilong Wang Yanqiang Han Simin Ye Jinjin Li 《Journal of Energy Chemistry》 SCIE EI CAS CSCD 2023年第3期268-276,I0008,共10页
Accurate regulation of two-dimensional materials has become an effective strategy to develop a wide range of catalytic applications.The introduction of heterogeneous components has a significant impact on the performa... Accurate regulation of two-dimensional materials has become an effective strategy to develop a wide range of catalytic applications.The introduction of heterogeneous components has a significant impact on the performance of materials,which makes it difficult to discover and understand the structure-property relationships at the atomic level.Here,we developed a novel and efficient ensemble learning classifier with synthetic minority oversampling technique(SMOTE) to discover all possible arsenene catalysts with implanted heteroatoms for hydrogen evolution reaction(HER).A total of 850 doped arsenenes were collected as a database and 140 modified arsenene materials with different doping atoms and doping sites were identified as promising candidate catalysts for HER,with a machine learning prediction accuracy of 81%.Based on the results of machine learning,we proposed 13 low-cost and easily synthesized two-dimensional Fe-doped arsenene catalytic materials that are expected to contribute to high-efficient HER.The proposed ensemble method achieved high prediction accuracy,but millions of times faster to predict Gibbs free energies and only required a small amount of data.This study indicates that the presented ensemble learning classifier is capable of screening high-efficient catalysts,and can be further extended to predict other two-dimensional catalysts with delicate regulation. 展开更多
关键词 Ensemble learning Implanted heteroatoms Hydrogen evolution reaction synthetic minority oversampling technique
在线阅读 下载PDF
面向非均衡数据的二进制排队搜索特征选择机制
18
作者 郭嘉 《微电子学与计算机》 2021年第8期45-52,共8页
非均衡数据(分类不均匀分布)和冗余特征的出现极大增加了数据准确分类的难度.以最优化学习算法的预测准确率为目标,结合合成少数过采样技术SMOTE,设计了一种针对非均衡数据的二进制排队搜索方法的包装式特征选择算法BQSA,利用PROMISE知... 非均衡数据(分类不均匀分布)和冗余特征的出现极大增加了数据准确分类的难度.以最优化学习算法的预测准确率为目标,结合合成少数过采样技术SMOTE,设计了一种针对非均衡数据的二进制排队搜索方法的包装式特征选择算法BQSA,利用PROMISE知识库中十四种软件故障预测数据集进行实验分析.测试了数据集过采样比例的影响,证实合成少数过采样对高度非均衡数据的分类预测具有正面影响,并得到了最佳过采样率;比较了BQSA与同类算法的性能,证实结合合成少数过采样技术的BQSA算法拥有更优的预测准确性,在分类敏感度、专一性以及曲线下面积AUC等指标上表现更佳. 展开更多
关键词 特征选择 非均衡数据 排队搜索算法 合成少数过采样 学习算法
在线阅读 下载PDF
基于改进堆叠泛化算法的电信套餐预测
19
作者 包志强 胡啸天 +2 位作者 赵研 赵媛媛 黄琼丹 《西安邮电大学学报》 2019年第2期98-104,共7页
提出一种改进堆叠泛化(stacking)算法的电信套餐预测方法。该方法将多种套餐进行两层分类,第一层粗分为高低价值两种套餐,第二层在粗分基础上对高价值或低价值套餐进行细分,在每一层数据预处理阶段使用合成少数类过采样算法(synthetic m... 提出一种改进堆叠泛化(stacking)算法的电信套餐预测方法。该方法将多种套餐进行两层分类,第一层粗分为高低价值两种套餐,第二层在粗分基础上对高价值或低价值套餐进行细分,在每一层数据预处理阶段使用合成少数类过采样算法(synthetic minority oversampling technique,SMOTE)得到平衡数据集。采用改进堆叠泛化算法,对每一类取所有0层分类器的最大最小后验概率,并融合重要的消费信息作为1层训练集,由1层分类器预测套餐的种类。选取某公司6种电信套餐进行预测,实验结果表明,改进后的套餐预测模型可应用于多种不平衡套餐的预测。 展开更多
关键词 电信套餐 堆叠泛化算法 合成少数类过采样算法 后验概率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部