为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性...为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性和名义型变量的信息熵,基于数据的密度来衡量观测点的异常程度。分别使用基于信用卡申请数据集的仿真案例和基于德国信用卡数据集的实例,对比MLOF控制图和现有混合型数据控制图在异常点检测上的表现。仿真案例共模拟了30种监测场景。结果表明,在57%的场景中,MLOF控制图的综合表现都是最好的。而实例也验证了MLOF控制图更适用于数据量大、聚类情况复杂的混合型数据监测过程中。展开更多
为有效识别桥梁健康监测数据的异常,减少误预警、漏预警现象,保障桥梁监测数据的质量和有效性,针对大跨度斜拉桥长期监测数据的缺失、离群和漂移3类异常数据,提出基于时间序列压缩分割的监测数据异常识别算法。该算法将原始监测数据时...为有效识别桥梁健康监测数据的异常,减少误预警、漏预警现象,保障桥梁监测数据的质量和有效性,针对大跨度斜拉桥长期监测数据的缺失、离群和漂移3类异常数据,提出基于时间序列压缩分割的监测数据异常识别算法。该算法将原始监测数据时间序列通过基于序列重要点(Series Importance Point, SIP)的时间序列线性分段(Piecewise Linear Represent, PLR)算法(PLR_SIP)得到数条时间子序列;然后采用欧氏距离进行时间子序列的相似性分析,并基于改进的局部离群因子(Local Outlier Factor, LOF)算法计算每条时间子序列的局部离群因子;最后将其与设定的阈值相比较,从而识别出监测数据的异常。为验证该算法的准确性与工程实用性,对某公路大跨度斜拉桥健康监测数据进行异常识别。结果表明:采用PLR_SIP算法对原始时间序列压缩分割得到的时间子序列能够准确地反映原序列的变化趋势和范围;改进的LOF算法突破了传统LOF算法仅能识别离群值这类无持续时间异常的局限性,能够排除噪声的干扰,实现对离群、缺失和漂移3种异常的识别。该算法无需定义训练集,直接以原始监测数据作为算法的输入,同时能够自适应调整阈值参数,具有良好的可扩展性、实时性、准确性和高效性,适用于处理实时、大量的桥梁健康监测数据。展开更多
文摘为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性和名义型变量的信息熵,基于数据的密度来衡量观测点的异常程度。分别使用基于信用卡申请数据集的仿真案例和基于德国信用卡数据集的实例,对比MLOF控制图和现有混合型数据控制图在异常点检测上的表现。仿真案例共模拟了30种监测场景。结果表明,在57%的场景中,MLOF控制图的综合表现都是最好的。而实例也验证了MLOF控制图更适用于数据量大、聚类情况复杂的混合型数据监测过程中。
文摘为有效识别桥梁健康监测数据的异常,减少误预警、漏预警现象,保障桥梁监测数据的质量和有效性,针对大跨度斜拉桥长期监测数据的缺失、离群和漂移3类异常数据,提出基于时间序列压缩分割的监测数据异常识别算法。该算法将原始监测数据时间序列通过基于序列重要点(Series Importance Point, SIP)的时间序列线性分段(Piecewise Linear Represent, PLR)算法(PLR_SIP)得到数条时间子序列;然后采用欧氏距离进行时间子序列的相似性分析,并基于改进的局部离群因子(Local Outlier Factor, LOF)算法计算每条时间子序列的局部离群因子;最后将其与设定的阈值相比较,从而识别出监测数据的异常。为验证该算法的准确性与工程实用性,对某公路大跨度斜拉桥健康监测数据进行异常识别。结果表明:采用PLR_SIP算法对原始时间序列压缩分割得到的时间子序列能够准确地反映原序列的变化趋势和范围;改进的LOF算法突破了传统LOF算法仅能识别离群值这类无持续时间异常的局限性,能够排除噪声的干扰,实现对离群、缺失和漂移3种异常的识别。该算法无需定义训练集,直接以原始监测数据作为算法的输入,同时能够自适应调整阈值参数,具有良好的可扩展性、实时性、准确性和高效性,适用于处理实时、大量的桥梁健康监测数据。