期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于边界过采样的图节点不平衡分类算法 被引量:1
1
作者 武天昊 董明刚 谭若琦 《计算机工程与应用》 CSCD 北大核心 2024年第13期92-101,共10页
在现实世界中,金融欺诈检测和疾病诊断是典型的图不平衡问题,基于过采样的图神经网络是解决此类问题的常用方法之一。然而,该方法难以保证生成边界样本的多样性,易导致分类性能下降。提出一种基于边界过采样的图节点不平衡分类算法(ImBS... 在现实世界中,金融欺诈检测和疾病诊断是典型的图不平衡问题,基于过采样的图神经网络是解决此类问题的常用方法之一。然而,该方法难以保证生成边界样本的多样性,易导致分类性能下降。提出一种基于边界过采样的图节点不平衡分类算法(ImBS)来提升生成样本的多样性。ImBS通过双层图神经分类网络选择出每个类别中高置信度样本作为采样锚点,提高锚点的代表性。为了使生成样本分布更加合理,利用上一步得到的混淆矩阵,计算少数类误判的分布比例。并基于该分布比例,自适应计算不同类间生成的样本数量。在此基础上,提出基于锚点的混合过采样方法。通过混合异类锚点特征的方式过采样边界节点,达到增加样本多样性和扩展少数类决策边界的目的。此外,为了防止产生有害连接,引入个性化PageRank方法,为过采样样本生成邻域分布。在三个真实的数据集(Cora、CiteSeer和Cora-Ful)上的实验表明,该方法与9个代表性的方法对比具有明显优势。 展开更多
关键词 图神经网络 不平衡节点分类 边界过采样
在线阅读 下载PDF
结合Transformer的双向GRU入侵检测研究
2
作者 李道全 刘旭寅 +1 位作者 刘嘉宇 陈思慧 《计算机工程与应用》 北大核心 2025年第10期299-307,共9页
在网络入侵检测系统中,以往的系统在特征提取时容易受到噪声特征的干扰,面对不平衡数据时对少数类样本边界区分不明显,同时检测模型容易错过重要时间点的信息。这些问题影响了模型的训练效果,降低了模型的检测性能。为应对这些挑战,提... 在网络入侵检测系统中,以往的系统在特征提取时容易受到噪声特征的干扰,面对不平衡数据时对少数类样本边界区分不明显,同时检测模型容易错过重要时间点的信息。这些问题影响了模型的训练效果,降低了模型的检测性能。为应对这些挑战,提出了一种结合鸽群优化算法和边界合成少数过采样技术的Transformer-双向门控循环单元(bidirectional gated recurrent unit,BiGRU)混合模型。通过鸽群优化算法自动进行特征选择,以提升模型处理复杂数据集的能力,并降低噪声特征的干扰。采用边界合成少数过采样技术对数据进行平衡处理,特别是针对少数类样本,提高其在平衡数据集中的代表性和质量。构建了一个集成Transformer和BiGRU的深度学习模型来进行入侵检测,利用Transformer捕捉全局依赖关系的特征提取能力,同时借助BiGRU的时间序列建模能力来更好地理解序列数据的双向上下文关系。在NSL-KDD数据集上的实验结果表明,该模型展现出了良好的检测性能,准确率达到83.64%,F1分数为78.41%,均超过了对比的传统机器学习模型和深度学习模型。 展开更多
关键词 鸽群优化算法 边界过采样 多头注意力 双向循环门控单元 入侵检测
在线阅读 下载PDF
基于CD-BSMOTE的D-S证据融合变压器故障诊断 被引量:1
3
作者 鲁玲 高诚 +3 位作者 熊威 龚康 马辉 张鑫 《水电能源科学》 北大核心 2024年第5期192-196,共5页
针对变压器油中溶解气体数据集不均衡特性对故障诊断结果的影响,提出一种基于清除临界点改进的边界合成少数类过采样算法均衡数据集和Pearson冲突距离改进D-S证据融合的变压器故障诊断模型。首先,对少数类样本进行均衡化处理,根据K-mean... 针对变压器油中溶解气体数据集不均衡特性对故障诊断结果的影响,提出一种基于清除临界点改进的边界合成少数类过采样算法均衡数据集和Pearson冲突距离改进D-S证据融合的变压器故障诊断模型。首先,对少数类样本进行均衡化处理,根据K-means聚类结果清除处于临界位置的样本;其次,搭建梯度提升树、随机森林、BP神经网络的故障诊断模型,实现变压器故障初步诊断;接着引入Pearson冲突距离改进D-S证据融合模型,实现诊断结果的融合决策;最后,经实际算例分析,诊断精确率达到92.65%。结果表明,所建模型能有效解决数据不平衡对诊断结果的影响,提高故障诊断精度。 展开更多
关键词 故障诊断 油中溶解气体分析 边界合成少数类过采样 Pearson冲突距离 D-S证据融合
在线阅读 下载PDF
基于卷积神经网络的液化预测模型及可解释性分析 被引量:2
4
作者 龙潇 孙锐 郑桐 《岩土力学》 EI CAS CSCD 北大核心 2024年第9期2741-2753,共13页
常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上... 常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上覆应力、门槛加速度、循环剪应力比、剪切波速、震级与地表峰值加速度11个液化特征建立卷积神经网络(convolutional neural network,简称CNN)模型。引入边界合成少数过采样技术消除不平衡数据集的影响。将CNN模型与随机森林模型、逻辑回归模型、支持向量机模型、极致梯度提升模型和规范方法进行对比,并结合沙普利加性解释(SHapley Additive exPlanations,简称SHAP)分析输入特征对预测结果的影响趋势。结果表明,CNN模型准确率达92.58%,各项指标均优于其他4种机器学习模型和规范方法。对SHAP结果分析可知,修正标贯击数小于15的土层液化概率较高,循环剪应力比CSR小于0.25的土层更不易液化。各因素的影响规律均符合现有认知,预测模型合理可靠。 展开更多
关键词 机器学习 液化预测 卷积神经网络 边界合成少数过采样技术 沙普利加性解释(SHAP)
在线阅读 下载PDF
基于BSMOTE-SVM算法的溢流风险评价 被引量:3
5
作者 张禾 池紫欣 《控制工程》 CSCD 北大核心 2023年第12期2173-2178,共6页
现今钻井作业中各平台仍然依靠人工坐岗进行溢流预警,溢流风险判断具有主观性导致准确率十分有限。针对目前溢流风险识别能力弱和准确率低的问题,首先,采用了边界样本过采样方法避免了由于溢流发生频率极低导致可获取的样本数量不足的缺... 现今钻井作业中各平台仍然依靠人工坐岗进行溢流预警,溢流风险判断具有主观性导致准确率十分有限。针对目前溢流风险识别能力弱和准确率低的问题,首先,采用了边界样本过采样方法避免了由于溢流发生频率极低导致可获取的样本数量不足的缺陷;其次,引入支持向量机对改善后的样本构造分类器,建立了溢流风险评价模型,并采用已经完钻的油井数据作为测试集进行模型验证。实验结果表明,所提方法将溢流识别准确率提高到了90%,相对于原始不均衡样本训练的分类器准确率,提高了36.67%。同时,此研究成果提高了钻井作业中的溢流识别能力,为安全钻井提供了有力支撑。 展开更多
关键词 不均衡数据集 支持向量机 边界合成少数类过采样技术 溢流风险评价
在线阅读 下载PDF
基于数据生成算法的睡眠分期方法 被引量:1
6
作者 刘静博 王蓓 顾吉峰 《计算机工程与设计》 北大核心 2022年第2期406-412,共7页
针对睡眠分期中样本不平衡问题,提出以最短路径为指标选取最优数据进行数据生成的思想,增加少数类样本的数量。基于Border-SMOTE算法,提出改进的iBorder-SMOTE睡眠数据生成算法。用密度峰值聚类算法确定待生成数据的簇类别区域,采用中... 针对睡眠分期中样本不平衡问题,提出以最短路径为指标选取最优数据进行数据生成的思想,增加少数类样本的数量。基于Border-SMOTE算法,提出改进的iBorder-SMOTE睡眠数据生成算法。用密度峰值聚类算法确定待生成数据的簇类别区域,采用中心最短路径选取最优数据点进行数据生成,使用异变扰动方法对生成数据进行修正,保证数据的全局分布。在数据集Sleep-EDF上进行验证,其结果表明,改进后的算法有效提高了少数类样本的识别精度。 展开更多
关键词 睡眠分期 数据生成 边界合成少数类过采样技术 多簇中心最短路径 异变扰动
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部