期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
高维空间聚类下多信道光纤网络大数据异常检测
1
作者 李晟 李嘉泽楷 任昊 《激光杂志》 北大核心 2025年第3期169-174,共6页
光纤网络的数据质量会影响用户通信质量,当其中包含异常数据时,将会使得通信效率和通信质量大幅下降。为此,提出高维空间聚类下多信道光纤网络大数据异常检测算法。根据历史数据特征密度指标,获得异常数据特征;利用高维高斯混合聚类算... 光纤网络的数据质量会影响用户通信质量,当其中包含异常数据时,将会使得通信效率和通信质量大幅下降。为此,提出高维空间聚类下多信道光纤网络大数据异常检测算法。根据历史数据特征密度指标,获得异常数据特征;利用高维高斯混合聚类算法将数据特征从低维空间映射到高维空间中,为了降低计算难度,利用核映射将高维内积计算转换为低维数据核计算;最后利用HGMM算法得到不同时刻下的检测时间序列,融合后输出最终检测结果。实验结果表明,所提方法可取得高达98%的反馈率,且检测到的异常数据类型与实际结果完全一致,可保证光纤网络免受异常数据影响。 展开更多
关键词 高维空间聚类 数据异常检测 聚类权值 协方差矩阵 条件概率
在线阅读 下载PDF
基于二维卷积神经网络的结构加速度数据异常检测研究
2
作者 麻胜兰 钟建坤 +1 位作者 刘昱昊 郑翔 《建筑科学与工程学报》 北大核心 2025年第1期112-120,共9页
为提高结构加速度数据异常检测的效率和准确率,提出基于二维卷积神经网络(2D-CNN)的结构加速度数据异常检测方法。通过二维桁架数值模型验证了所提方法的有效性,并研究了2D-CNN卷积层数和加速度噪声水平对数据异常检测效果的影响。结果... 为提高结构加速度数据异常检测的效率和准确率,提出基于二维卷积神经网络(2D-CNN)的结构加速度数据异常检测方法。通过二维桁架数值模型验证了所提方法的有效性,并研究了2D-CNN卷积层数和加速度噪声水平对数据异常检测效果的影响。结果表明:提出的结构加速度数据异常检测方法能快速准确区分加速度数据异常类型,异常检测的准确率可达97%以上;对于包含信息复杂、数据规模大的样本,采用4层以上的2D-CNN有助于提高加速度数据异常检测的准确率,采用5层卷积层的2D-CNN对数据异常辨识精度可达98%;当加速度信噪比大于1时,数据异常检测准确率均在90%以上,当加速度信噪比为10时,准确率在97%以上,所提方法具有良好的容噪性和鲁棒性;采用2D-CNN的数据异常检测方法可为传感器网络的有效运行提供技术支持。 展开更多
关键词 结构健康监测 二维卷积神经网络 桁架结构 深度学习 加速度 数据异常检测
在线阅读 下载PDF
基于生成对抗Transformer的电力负荷数据异常检测 被引量:13
3
作者 陆旦宏 范文尧 +3 位作者 杨婷 倪敏珏 李思琦 朱晓 《电力工程技术》 北大核心 2024年第1期157-164,共8页
电力负荷异常数据将给电力系统规划、负荷预测以及用能分析等带来较大的负面影响,因此亟须对负荷数据异常进行检测与识别。首先,针对电力负荷数据异常分类、原因及其特征开展分析。其次,改进传统Transformer编码器结构,采用多头注意力... 电力负荷异常数据将给电力系统规划、负荷预测以及用能分析等带来较大的负面影响,因此亟须对负荷数据异常进行检测与识别。首先,针对电力负荷数据异常分类、原因及其特征开展分析。其次,改进传统Transformer编码器结构,采用多头注意力层代替掩码多头注意力层,同时移除前馈网络,以提高模型对负荷时序序列的全局注意力。基于生成对抗网络(generative adversarial networks,GAN)生成器与判别器的博弈结构,提出一种改进的GAN-Transformer模型,以更好地捕捉趋势性特征并加速模型收敛。然后,引入多阶段映射与训练方法,综合焦点分数打分机制,通过分阶段负荷序列重构帮助模型更好地提取负荷数据异常特征。最后,算例分析结果表明,GAN-Transformer模型在负荷数据异常检测精确率、召回率、F_(1)值以及训练时间方面均具有更优的性能,验证了所提方法的有效性和优越性。文中研究工作为基于深度学习进一步实现电力负荷数据异常分类与数据修复提供了有益参考。 展开更多
关键词 电力负荷数据 数据异常检测 生成对抗网络(GAN)-Transformer 多阶段训练与映射 焦点分数 序列重构
在线阅读 下载PDF
基于云框架直方图的无线传感网络数据异常检测方法 被引量:15
4
作者 田洪生 仝军 吴翠红 《传感技术学报》 CAS CSCD 北大核心 2022年第7期990-995,共6页
以提高无线传感网络环境安全性为目的,提出一种基于云框架直方图的数据异常检测方法。在高斯函数分类云模型中,划分不同数据的属性中心值,完成数据高维分类。然后针对可能存在异常数据的传感网络环境,在构建云框架直方图后计算数据间相... 以提高无线传感网络环境安全性为目的,提出一种基于云框架直方图的数据异常检测方法。在高斯函数分类云模型中,划分不同数据的属性中心值,完成数据高维分类。然后针对可能存在异常数据的传感网络环境,在构建云框架直方图后计算数据间相似度。通过比较低的数据间相似度阈值完成数据异常粗检测,再在不同维度空间内,利用超矩形方法对比粗检测后数据是否处于同一数段,实现数据异常细检测。仿真结果表明:所提方法的归一化训练结果基本符合归一化处理的理论变化趋势,在数据量最大的情况下,其检测耗时仅用41 s、检测误差仅为1.2%,且在中心机房的能耗中占比较小。相比于传统方法来说,所提方法的检测耗时更少、误差更小、检测能耗更低。 展开更多
关键词 无线传感网络 数据异常检测 云框架直方图 直方图向量 信息熵 相似度
在线阅读 下载PDF
基于条件随机场模型的数据异常检测算法 被引量:3
5
作者 王文珂 文雅玫 蔡喆 《计算机工程与科学》 CSCD 北大核心 2015年第9期1756-1760,共5页
企业数据中心作为辅助决策的重要工具,保证其数据的及时性、准确性和科学性是最基本的要求和最核心的原则。对于数据异常的情况,若仅依靠人为的经验在海量数据中进行判断是很困难的,也是不科学且低效的。针对企业购销存数据的准确性问题... 企业数据中心作为辅助决策的重要工具,保证其数据的及时性、准确性和科学性是最基本的要求和最核心的原则。对于数据异常的情况,若仅依靠人为的经验在海量数据中进行判断是很困难的,也是不科学且低效的。针对企业购销存数据的准确性问题,研究了基于机器学习的数据异常检测算法。由于购销存数据是由一组相对固定的数据项组成,可以看作是一个结构化数据序列,因此选择了解决结构化序列预测问题最为有效的条件随机场模型CRFs。通过对大量历史数据进行学习,分析出数据的自身规律以及关联关系,使计算机具备自动检测异常的能力。实验结果表明了该算法的有效性。 展开更多
关键词 数据中心 机器学习 数据异常检测 条件随机场模型
在线阅读 下载PDF
生成对抗网络在数据异常检测中的研究 被引量:10
6
作者 庄跃生 林珊玲 +2 位作者 林志贤 张永爱 郭太良 《计算机工程与应用》 CSCD 北大核心 2022年第4期143-149,共7页
针对许多检测模型受到数据不平衡和异常数据的复杂性等因素影响问题,提出一种以生成对抗网络(generative adversarial network,GAN)为基础的数据异常检测方法。该方法利用InfoGAN网络训练生成正常数据和异常数据,构造一个推理神经网络... 针对许多检测模型受到数据不平衡和异常数据的复杂性等因素影响问题,提出一种以生成对抗网络(generative adversarial network,GAN)为基础的数据异常检测方法。该方法利用InfoGAN网络训练生成正常数据和异常数据,构造一个推理神经网络作为生成数据与原始数据的标签生成器,之后利用第二个GAN网络对推理网络精调,保证生成的样本和其标签对应;最后将生成样本与标签输入随机森林分类,通过Hyperband算法寻找随机森林最优超参,对推理网络进一步优化。在四个真实数据集上与五种传统机器学习模型进行实验对比,实验结果表明,该模型无需收集更多异常样本,达到数据平衡就可以有效进行数据异常检测。在Mnist数据集中,该模型的AUC值相比于K近邻(K-nearest neighbor,KNN)方法提高0.14,并且综合性能优于传统机器学习模型。 展开更多
关键词 数据异常检测 InfoGAN 随机森林 Hyperband
在线阅读 下载PDF
深度自编码器在数据异常检测中的应用研究 被引量:7
7
作者 张常华 周雄图 +3 位作者 张永爱 姚剑敏 郭太良 严群 《计算机工程与应用》 CSCD 北大核心 2020年第17期93-99,共7页
针对自编码器网络(AE)需要正常数据进行训练的局限性,结合主成分分析方法,将AE的每次重建输出与输入数据进行求差,隔离出异常数据部分,即将输入数据分为正常与异常部分,正常部分由AE重建输出,异常部分由近端法进行优化输出,最后采用交... 针对自编码器网络(AE)需要正常数据进行训练的局限性,结合主成分分析方法,将AE的每次重建输出与输入数据进行求差,隔离出异常数据部分,即将输入数据分为正常与异常部分,正常部分由AE重建输出,异常部分由近端法进行优化输出,最后采用交替方向乘子法训练整个模型并达到预定训练次数再输出结果,实现了一种基于深度自编码网络(DAE)模型的无监督数据异常检测方法。在7个真实数据集与8种机器学习模型和AE模型进行了对比实验,结果表明,DAE模型无需输入正常数据就可以有效进行模型训练,且可以防止模型的过拟合,其综合表现高于传统机器学习模型和AE模型,AUC值在4个数据集中达到最优。在mnist数据集中,DAE模型的AUC值相比于孤立森林(IF)方法提高了10.93%。 展开更多
关键词 数据异常检测 自编码网络 深度自编码网络 曲线下面积(AUC)
在线阅读 下载PDF
基于多证据融合决策的间歇过程测量数据异常检测方法 被引量:2
8
作者 刘伟旻 王建林 +2 位作者 邱科鹏 于涛 赵利强 《化工学报》 EI CAS CSCD 北大核心 2017年第8期3183-3189,共7页
间歇过程测量数据的高维、非线性、非高斯分布特征直接影响过程测量数据异常检测的准确性,为了融合多源数据异常检测信息,提升间歇过程测量数据异常检测精度,提出了一种基于多证据融合决策的间歇过程测量数据异常检测方法,该方法通过引... 间歇过程测量数据的高维、非线性、非高斯分布特征直接影响过程测量数据异常检测的准确性,为了融合多源数据异常检测信息,提升间歇过程测量数据异常检测精度,提出了一种基于多证据融合决策的间歇过程测量数据异常检测方法,该方法通过引入证据理论(Dempster-Shafer,D-S),采用主焦元判别伪证据和重新计算证据权重改进冲突证据处理方法,减小了冲突证据对多证据融合决策结果的影响,提高了间歇过程测量数据异常检测的准确率。构建了基于多证据融合的测量数据异常检测模型并将其应用到间歇过程测量数据异常检测决策判决中。实验结果表明,该方法能够融合多证据信息,有效地处理冲突证据,实现了间歇过程测量数据异常检测,降低了误检和漏检率。 展开更多
关键词 间歇过程 D-S证据理论 冲突证据 多证据决策 测量数据异常检测
在线阅读 下载PDF
加权LOF结合上下文判断的云环境中服务运行数据异常检测方法 被引量:14
9
作者 仇开 姜瑛 《计算机工程与科学》 CSCD 北大核心 2020年第6期951-958,共8页
云环境中服务运行数据是服务运行状态的反映,如果服务运行数据出现异常将会影响相关软件的运行和用户的使用。传统的软件异常检测方法通常忽略软件运行数据各维度属性提供的信息量及软件运行时的上下文环境,从而影响异常检测的准确率。... 云环境中服务运行数据是服务运行状态的反映,如果服务运行数据出现异常将会影响相关软件的运行和用户的使用。传统的软件异常检测方法通常忽略软件运行数据各维度属性提供的信息量及软件运行时的上下文环境,从而影响异常检测的准确率。因此,提出一种加权LOF结合上下文判断的云环境中服务运行数据异常检测方法,首先使用信息熵法给服务运行数据的各维度属性赋权,使用改进的加权LOF算法对服务运行数据进行初次异常判断;然后综合考虑服务运行时的上下文信息,对服务运行数据进行二次异常判断后得到相应结果。实验表明,此方法能够有效检测出云环境中的服务运行数据异常。 展开更多
关键词 云环境 服务运行数据异常检测 加权LOF 上下文信息
在线阅读 下载PDF
基于DHSC的多模态间歇过程测量数据异常检测方法 被引量:6
10
作者 刘伟旻 王建林 +2 位作者 邱科鹏 熊欢 韩锐 《化工学报》 EI CAS CSCD 北大核心 2017年第11期4201-4207,共7页
多模态间歇过程测量数据异常直接影响数据驱动的多元统计分析过程建模的准确性,导致间歇过程的监控性能降低。针对多模态间歇过程测量数据异常问题,提出了一种基于动态超球结构变化(DHSC)的多模态间歇过程测量数据异常检测方法。该方法... 多模态间歇过程测量数据异常直接影响数据驱动的多元统计分析过程建模的准确性,导致间歇过程的监控性能降低。针对多模态间歇过程测量数据异常问题,提出了一种基于动态超球结构变化(DHSC)的多模态间歇过程测量数据异常检测方法。该方法通过引入时序约束的模糊C均值聚类(SCFCM),利用隶属度变化划分多模态间歇过程的模态;针对不同模态,采用支持向量数据描述(SVDD)建立基于训练数据的静态超球体和基于待检数据的动态超球体,选择重要的支持向量作为球体结构,进而通过识别超球体发生结构变化实现过程测量数据异常检测。青霉素发酵过程仿真实验表明,所提出的方法能够实现多模态间歇过程的模态划分,减少了模态切换对过程测量数据异常检测精度的影响,并能够根据超球体结构变化检测过程测量数据异常,具有较高的检测精度,降低了误检率。 展开更多
关键词 间歇过程 支持向量数据描述 多模态 测量数据异常检测
在线阅读 下载PDF
基于生成对抗网络的离心泵时序数据异常检测 被引量:1
11
作者 李思汉 黄倩 +2 位作者 付强 张鑫宇 李云鹏 《机电工程》 CAS 北大核心 2023年第12期1957-1964,共8页
针对离心泵数据采集的过程中存在异常数据的问题,对产生异常数据的原因、生成对抗网络的优化以及异常数据检测的方法等问题进行了研究,提出了一种基于生成对抗网络的离心泵时序数据异常检测方法(该方法可以优化生成对抗网络,解决梯度消... 针对离心泵数据采集的过程中存在异常数据的问题,对产生异常数据的原因、生成对抗网络的优化以及异常数据检测的方法等问题进行了研究,提出了一种基于生成对抗网络的离心泵时序数据异常检测方法(该方法可以优化生成对抗网络,解决梯度消失问题)。首先,使用长短期记忆神经网络(LSTM),建立了生成对抗网络(GAN)框架中的基础模型,增强了捕获数据分布的时间相关性;并采用Wasserstein距离方法,解决了梯度消失的问题;然后,搭建了离心泵异常数据检测试验台,对离心泵运行时的数据进行了采集,分析了造成异常数据的原因;最后,基于正常数据训练数据,生成了对抗网络的生成器和判别器,并利用重构损失与判别损失构建了检测阈值,对异常数据进行了检测。研究结果表明:GAN在离心泵数据异常检测中的表现皆优于孤立森林、自编码器(AE)、K-Means等算法;基于生成对抗网络的离心泵异常数据检测精确率可达到89.5%,能够有效检测出异常数据,可达到优化数据库和提高旋转机械故障诊断精度的目的。该研究结果可以为离心泵的异常数据检测提供参考。 展开更多
关键词 离心泵时序数据 生成对抗网络 数据异常检测 无监督学习 长短期记忆网络 Wasserstein距离方法
在线阅读 下载PDF
基于DBSCAN的智能机舱多源数据异常检测方法 被引量:7
12
作者 陈砚桥 孙彤 张侨禹 《舰船科学技术》 北大核心 2021年第17期156-160,共5页
针对舰船智能机舱多源数据处理,建立基于DBSCAN聚类算法的多源数据异常检测方法,包含聚类参数的自动获取及校正,并可根据试验数据进行机器学习和更新。介绍该检测方法的程序框架、子程序的程序流程,并基于机舱中典型的滑油系统进行数据... 针对舰船智能机舱多源数据处理,建立基于DBSCAN聚类算法的多源数据异常检测方法,包含聚类参数的自动获取及校正,并可根据试验数据进行机器学习和更新。介绍该检测方法的程序框架、子程序的程序流程,并基于机舱中典型的滑油系统进行数据检测测试。经过测试,该检测方法可有效对测试数据进行分析,自动得出并修正聚类参数,且对正常信号相差15%以上的异常数据的检测结果识别度达到100%。本文提出的异常数据检测方法可行有效,可以作为智能机舱数据处理系统的方案之一。 展开更多
关键词 智能机舱 多源数据处理 DBSCAN聚类算法 异常数据检测
在线阅读 下载PDF
基于影响因子分解法的大坝监测数据异常检测算法 被引量:9
13
作者 李松轩 丁勇 李登华 《人民长江》 北大核心 2023年第4期234-240,共7页
如何快速检测出大坝安全监测系统内的异常数据(例如粗差和告警值)对于大坝安全运行具有极其重要的意义,但传统方法容易漏检较小数值异常而对后续建模产生不利影响。提出了一种基于影响因子分解的异常值检测方法,通过快速小波变换及离散... 如何快速检测出大坝安全监测系统内的异常数据(例如粗差和告警值)对于大坝安全运行具有极其重要的意义,但传统方法容易漏检较小数值异常而对后续建模产生不利影响。提出了一种基于影响因子分解的异常值检测方法,通过快速小波变换及离散傅里叶变换提取监测序列中的显著趋势与周期,剥离环境因子的影响,构建余项序列,并结合小概率事件思想准确判定余项序列中保留的异常值,从而精确检测出监测序列中较小数值异常。实例验证结果表明:此方法具有较好的实用性与稳定性,各类监测序列中异常检测准确率均达98%以上,查准率与查全率均值分别为93%与92%,与传统检测方法相比,检测精确程度及泛化能力明显提升。 展开更多
关键词 大坝安全监测 异常数据模拟 异常数据检测 影响因子分解法
在线阅读 下载PDF
基于差分序列方差与CPS融合的数字变电站数据异常检测方法 被引量:20
14
作者 李远松 高博 +3 位作者 须琳 丁津津 汤汉松 单荣荣 《电网与清洁能源》 北大核心 2021年第2期30-41,共12页
针对传统基于简单阈值的异常检测方法已无法适用于数字变电站过程层网络中可能出现的设备物理故障和恶意入侵导致的数据异常的问题,提出了一种基于差分序列方差(difference sequence variance,VDS)与信息物理系统(cyberphysical system,... 针对传统基于简单阈值的异常检测方法已无法适用于数字变电站过程层网络中可能出现的设备物理故障和恶意入侵导致的数据异常的问题,提出了一种基于差分序列方差(difference sequence variance,VDS)与信息物理系统(cyberphysical system,CPS)融合的数字变电站数据异常检测方法。首先,在分析CPS中面向通用对象的变电站事件(generic object oriented substation event,GOOSE)和制造报文规范(manufacturing message specification,MMS)数据的行为特征基础上,研究了IEC 61850协议规范的度量方法,提出了网络和系统管理方案;其次,基于VDS的异常检测方法和流程,结合数字变电站过程层报文特点,提出了变电站流量异常隶属函数以及基于CPS融合的参数确定方法;最后通过仿真验证了所提方法不仅能有效识别信息设备物理故障和恶意入侵导致的数据异常,对于拒绝服务攻击也能实现准确检测,相比于传统方法具有更高的准确性与可靠性。 展开更多
关键词 数字变电站 差分序列方差 信息物理系统(CPS) 异常数据检测
在线阅读 下载PDF
无线传感网络数据异常状态检测算法 被引量:1
15
作者 王晨 刘鑫 《传感技术学报》 北大核心 2025年第6期1133-1137,共5页
当前的无线传感网络异常状态检测均是基于节点本身状态产生的阈值形成判断,有一定的检测滞后性。为提高传感网络的稳定性和可靠性,提出一种新的无线传感网络状态数据异常检测算法。通过逆向云发生器和正向云发生器对传感器节点状态采集... 当前的无线传感网络异常状态检测均是基于节点本身状态产生的阈值形成判断,有一定的检测滞后性。为提高传感网络的稳定性和可靠性,提出一种新的无线传感网络状态数据异常检测算法。通过逆向云发生器和正向云发生器对传感器节点状态采集的通信状态数据进行预处理和转换,完成缺失传感数据的填充。根据填充后状态数据确定短期特征,获取通信状态数据特征,构建异常传感节点数据特征模型,确定目标节点周围存在的邻居节点状态,根据实际检测情况更新、完善数据目标特征,输出传感器节点状态通信异常状态数据,从而实现异常数据检测。仿真结果表明,所提算法的异常数据检测时间始终低于0.5 s,三次迭代中的平均绝对误差在0.2以下,具有良好的检测效果。 展开更多
关键词 无线传感网络 数据异常状态检测 云模式 逆向云发生器 正向云发生器
在线阅读 下载PDF
基于GATv2-TCN联合优化的WSN数据流异常检测算法
16
作者 苏宇杭 马俊 +3 位作者 樊津瑜 陈博行 周家城 尹博然 《计算机工程与科学》 北大核心 2025年第5期843-850,共8页
在传感器网络中,通过对数据流进行异常检测能够及时发现故障并报警,以确保系统安全可靠运行。然而WSN数据流异常检测仍面临2大难题:1)不同时间序列间复杂的相关性有待深入挖掘;2)在正常/异常样本分布极度不平衡的数据集中异常样本不易... 在传感器网络中,通过对数据流进行异常检测能够及时发现故障并报警,以确保系统安全可靠运行。然而WSN数据流异常检测仍面临2大难题:1)不同时间序列间复杂的相关性有待深入挖掘;2)在正常/异常样本分布极度不平衡的数据集中异常样本不易检出。提出一种基于GATv2-TCN的异常检测算法。采用GATv2和TCN来建模特征和时间维度的复杂关系,并优化预测和重构模块。采用4个数据集对所提算法进行性能验证与分析。实验结果表明,所提算法获得了较高的F 1和AUC,特别是在不平衡的数据集中各项指标均高于基线模型,具有较好的WSN数据流异常检测效果。 展开更多
关键词 无线传感器网络 数据异常检测 GATv2 TCN
在线阅读 下载PDF
基于孤立森林的传感器网络非线性异常数据点检测方法
17
作者 韦霞 熊志文 傅彦铭 《传感技术学报》 北大核心 2025年第8期1499-1504,共6页
检测传感器网络中的非线性异常数据点对于保证数据质量、提高数据安全性具有重要作用。为此,提出基于孤立森林的传感器网络非线性异常数据点检测方法。首先,联合小波变换、傅里叶变换和奇异谱分析法,分离出传感器网络非线性数据中的趋势... 检测传感器网络中的非线性异常数据点对于保证数据质量、提高数据安全性具有重要作用。为此,提出基于孤立森林的传感器网络非线性异常数据点检测方法。首先,联合小波变换、傅里叶变换和奇异谱分析法,分离出传感器网络非线性数据中的趋势项,更好地聚焦于局部数据点检测;然后,通过自动编码器重构的方式,突出数据的本质特征;最后,引入分裂准则和相对质量的概念优化孤立森林算法,根据孤立树节点的分值分析对应数据点存在异常的可能性,从而检测出非线性数据中的异常点。仿真结果表明,所提方法的AUC值始终保持在0.945以上,均方根误差低于0.073,虽然内存占用率存在微小波动,但在数值上始终处于0.25以下。 展开更多
关键词 信息与通信工程 异常数据检测 孤立森林 传感器网络 小波变换 自动编码器
在线阅读 下载PDF
基于WGAN-XGBoost的ADS-B异常数据检测模型
18
作者 李怀谦 陈雨昊 +1 位作者 付宇翔 沈嘉意 《中国安全科学学报》 北大核心 2025年第8期188-195,共8页
为保障航空运行安全、提升空域管理效率并增强系统对欺骗与干扰的防御能力,提出一种融合Wasserstein生成对抗网络(WGAN)和极限梯度提升(XGBoost)算法的异常数据检测模型。首先,通过WGAN学习预处理后ADS-B数据的内在分布特征,生成异常数... 为保障航空运行安全、提升空域管理效率并增强系统对欺骗与干扰的防御能力,提出一种融合Wasserstein生成对抗网络(WGAN)和极限梯度提升(XGBoost)算法的异常数据检测模型。首先,通过WGAN学习预处理后ADS-B数据的内在分布特征,生成异常数据,将其与原始数据融合作为训练数据集;其次,基于XGBoost算法训练混合数据集,构建异常分类检测器;最后,通过试验与朴素贝叶斯、逻辑回归、感知机等基准模型开展性能对比。结果表明:与其他机器学习异常数据检测器相比,XGBoost异常数据检测器在准确率、精确率、召回率、F_(1)分数等6项指标上均表现更优,其中准确率和精确率均超过0.999;模型检测243792条数据的总耗时为2.0702 s,平均每条数据检测耗时0.0085 ms,在检测性能与时间成本间实现最优平衡,且经真实异常事件验证,具备良好的实用性与适用性。 展开更多
关键词 Wasserstein生成对抗网络(WGAN) 极限梯度提升(XGBoost) 广播式自动相关监视(ADS-B) 异常数据检测 朴素贝叶斯
在线阅读 下载PDF
考虑载客状态的改进孤立森林浮动车异常数据检测算法 被引量:8
19
作者 任其亮 徐韬 +1 位作者 刘媛 程龙春 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第1期124-131,共8页
为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S... 为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S)、三阶求和平均差分(DTA)的二维度空间SDTA特征向量;提出差额累计更新和动态区分辨识的改进孤立森林IIForest算法,通过设置停止阈值参数,避免当出现新样本异常值分数大于停止阈值时,仅更新样本不更新孤立森林模型的问题,设计每个二叉树区分辨识度参数,区分辨识度位于停止区间时停止二叉树生长,提高算法收敛性能,以ROC(Receiver Operating Characteristic)曲线下面积AUC(Area Under ROC Cure)、F1-score为指标对模型精度进行对比分析,并以重庆市中心城区学府大道开展实例验证。结果表明:本文S-DTA-IIForest组合算法AUC、F1-score分别为86.63%、0.89,AUC较传统孤立森林IForest(Isolation Forest)提高32.4%,运行效率提高1.29%,具有收敛速度更快、精度更高的优势,载客条件下模型AUC、F1-score较未载客分别提高7.7%、10.8%,组合算法对载客数据有更高的检测精度,且未载客状态数据异常率较载客状态增加71.4%,未载客数据异常率更高。 展开更多
关键词 智能交通 异常数据检测 改进孤立森林 浮动车数据 S-DTA算法
在线阅读 下载PDF
基于先验聚类的机电设备环境参数异常检测算法
20
作者 邢鹏 李新娥 《现代电子技术》 北大核心 2025年第6期78-84,共7页
传统的聚类异常数据检测算法在处理高维度、大数据量且异常值分布杂乱的机电设备环境参数时,存在聚类效果差和检测效率低的问题。为此,在原有异常检测算法的基础上提出一种基于先验聚类的机电设备环境参数异常检测算法。该算法改用历史... 传统的聚类异常数据检测算法在处理高维度、大数据量且异常值分布杂乱的机电设备环境参数时,存在聚类效果差和检测效率低的问题。为此,在原有异常检测算法的基础上提出一种基于先验聚类的机电设备环境参数异常检测算法。该算法改用历史数据构建先验聚类,确保聚类构建不会受太多异常环境参数所影响;在选取聚类中心时引入密集度的概念,以确保聚类中心的可靠性,并在选取聚类中心过程中去除已选聚类中心周围的数据点,防止选取的聚类中心集中在某一区域,以此提升聚类效果。进行异常检测时,依次将待检测数据放入先验聚类中进行匹配,一旦测试数据无法匹配任何一个已知聚类,则将其标记为异常数据。实验结果表明:所提算法在机电设备环境参数的异常检测方面具有检测率高、误报率低的特点,在2000例数据异常检测中,其检测准确率达到了97.5%,优于DBSCAN算法的97%以及基础K-means算法的86%;同时,误检率低至0.0106,优于DBSCAN算法的0.0239和基础K-means算法的0.0228。改进后的模型较基础K-means算法和DBSCAN算法在机电设备环境参数异常检测中检测效果更佳,在机电设备环境异常数据检测上具有良好的性能。 展开更多
关键词 机电设备 环境参数 异常数据检测 先验聚类 K-means算法 密集度 聚类匹配
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部