-
题名列控车载设备故障样本生成质量评估方法
- 1
-
-
作者
王金兰
蔡伯根
申彦春
刘江
-
机构
广州铁路职业技术学院
北京交通大学自动化与智能学院
-
出处
《中国铁路》
北大核心
2025年第5期139-145,共7页
-
基金
广东省普通高校重点领域专项项目(2021ZDZX1110)。
-
文摘
列控车载设备故障预测是提升运维智能化水平的重要方向。为解决故障建模样本不平衡条件下生成故障样本的质量评估与保障问题,基于条件生成对抗网络实现故障建模样本生成,从样本比例和样本分布2个维度对生成故障样本进行质量评估。在样本比例维度,设定不同样本调和比生成并构建合成故障样本集开展模型训练,结合模型性能指标评估生成故障样本的质量;在样本分布维度,引入最大均值差异和结构相似性指数2项指标,对待评估生成故障样本与真实故障样本做分布相似度评估。采用CTCS2-200H型列控车载设备真实故障数据进行验证,结果表明:在不同的故障样本生成方法下,所提出方法均能有效量化评估所生成故障样本的特性,设定合适的样本调和比可以缓解故障样本数据不平衡问题,有助于构建列控车载设备故障预测模型,并有效提升故障预测性能。
-
关键词
列控车载设备
故障样本
故障预测
生成对抗网络
样本质量评估
智能运维
-
Keywords
train control onboard equipment
faulty sample
fault prediction
generative adversarial network
sample quality assessment
intelligent O&M
-
分类号
U284
[交通运输工程—交通信息工程及控制]
-
-
题名基于特征间关系合成少数类样本的过采样算法
被引量:2
- 2
-
-
作者
雷明珠
王浩
贾蓉
白琳
潘晓英
-
机构
西安邮电大学计算机学院
陕西省网络数据分析与智能处理重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2024年第5期1428-1436,共9页
-
基金
陕西省重点研发计划项目(2023-YBSF-476)。
-
文摘
数据不平衡的现象在现实生活中非常普遍。为了提高整体分类精度,分类器有时会以错分少数类为代价。但在现实生活中,对少数类进行错误分类的后果非常严重。考虑到传统重采样算法容易忽略数据的空间分布和少数类样本特征之间的关系,提出一种基于特征关系的采样算法(SABRF)生成新的样本集。SABRF通过帕累托多目标特征选择保留不平衡数据集的关键区分特征,同时通过极端梯度提升(XGBoost)回归模型捕获少数类样本关键特征之间的关系。此外,还提出一个新的样本选择策略衡量新生成样本的质量。使用6个公开的UCI数据集和1个真实的骨科术后血栓数据集进行实验,结果表明,SABRF在受试者工作特征曲线下面积(AUC)、F1分数(F1_score)和几何平均值(G_mean)上均有较好的表现;此外,对使用基于多指标评价的样本选择策略挑选出的新样本进行分类,不平衡数据的分类结果也最好,验证了样本选择策略的有效性。
-
关键词
不平衡数据
过采样
特征选择
样本质量评估
极端梯度提升回归
帕累托前沿
-
Keywords
imbalanced data
oversampling
feature selection
sample quality evaluation
eXtreme Gradient Boosting(XGBoost)regression
Pareto frontier
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-