为有效解决多维时间序列(multivariate time series, MTS)无监督异常检测模型中自编码器模块容易拟合异常样本、正常MTS样本对应的隐空间特征可能被重构为异常MTS的问题,设计一种具有三重生成对抗的MTS异常检测模型。以LSTM自编码器为...为有效解决多维时间序列(multivariate time series, MTS)无监督异常检测模型中自编码器模块容易拟合异常样本、正常MTS样本对应的隐空间特征可能被重构为异常MTS的问题,设计一种具有三重生成对抗的MTS异常检测模型。以LSTM自编码器为生成器,基于重构误差生成伪标签,由判别器区分经伪标签过滤后的重构MTS和原始MTS;采用两次对抗训练将LSTM自编码器的隐空间约束为均匀分布,减少LSTM自编码器隐空间特征重构出异常MTS的可能性。多个公开MTS数据集上的实验结果表明,T-GAN能在带有污染数据的训练集上更好学习正常MTS分布,取得较高的异常检测效果。展开更多
针对部分场景下标签较少、样本不均衡的时序数据,为了更好的捕捉序列之间的逐步依赖关系,本文一方面使用具有因果关系属性的时域卷积网络构建生成对抗网络,另一方面使用长短期记忆网络构建嵌入网络和复现网络,以实现模型同时处理短期依...针对部分场景下标签较少、样本不均衡的时序数据,为了更好的捕捉序列之间的逐步依赖关系,本文一方面使用具有因果关系属性的时域卷积网络构建生成对抗网络,另一方面使用长短期记忆网络构建嵌入网络和复现网络,以实现模型同时处理短期依存项和长期依存项,从而提出一种基于时域卷积网络和长短期记忆网络的时间序列生成对抗网络(A Time-series Generative Adversarial Network based on Temporal convolutional network and Long-short term memory network, TL-TimeGAN)。采用覆盖性、有用性和相似度检验的综合分析方法作为合成数据质量的评价指标,进一步全面地评价合成数据的覆盖性、预测程度和相似性。最终,基于以太坊欺诈检测数据集,使用Tabnet网络对扩增数据进行异常检测并获得局部特征重要性以及全局特征重要性,以增强扩增数据应用于实际工作的实践指导价值。展开更多
多元时间序列(Multivariate Time Series,MTS)广泛应用于医学、经济、多媒体等领域。针对其相似模式匹配问题,该文提出一种基于2维奇异值分解(Two-Dimensional Singular Value Decomposition,2DSVD)的匹配方法。2DSVD是经典奇异值分解...多元时间序列(Multivariate Time Series,MTS)广泛应用于医学、经济、多媒体等领域。针对其相似模式匹配问题,该文提出一种基于2维奇异值分解(Two-Dimensional Singular Value Decomposition,2DSVD)的匹配方法。2DSVD是经典奇异值分解的扩展,能准确地描述MTS的本质特征。首先对MTS进行2DSVD分解;然后将MTS按行、列组成的协方差矩阵的主特征向量结合原MTS矩阵组成其模式表示矩阵,并借助Euclid范数来度量两个特征模式矩阵之间的相似程度,进而进行多元时间序列的模式匹配。最后通过与直接欧氏距离法、主成分分析、趋势距离、基于点分布特征4种相似匹配方法对3种不同数据规模的数据集进行对比实验,验证了所提方法刻画多种数据规模的多元时间序列特征的有效性和高效性。展开更多
文摘为有效解决多维时间序列(multivariate time series, MTS)无监督异常检测模型中自编码器模块容易拟合异常样本、正常MTS样本对应的隐空间特征可能被重构为异常MTS的问题,设计一种具有三重生成对抗的MTS异常检测模型。以LSTM自编码器为生成器,基于重构误差生成伪标签,由判别器区分经伪标签过滤后的重构MTS和原始MTS;采用两次对抗训练将LSTM自编码器的隐空间约束为均匀分布,减少LSTM自编码器隐空间特征重构出异常MTS的可能性。多个公开MTS数据集上的实验结果表明,T-GAN能在带有污染数据的训练集上更好学习正常MTS分布,取得较高的异常检测效果。
文摘针对部分场景下标签较少、样本不均衡的时序数据,为了更好的捕捉序列之间的逐步依赖关系,本文一方面使用具有因果关系属性的时域卷积网络构建生成对抗网络,另一方面使用长短期记忆网络构建嵌入网络和复现网络,以实现模型同时处理短期依存项和长期依存项,从而提出一种基于时域卷积网络和长短期记忆网络的时间序列生成对抗网络(A Time-series Generative Adversarial Network based on Temporal convolutional network and Long-short term memory network, TL-TimeGAN)。采用覆盖性、有用性和相似度检验的综合分析方法作为合成数据质量的评价指标,进一步全面地评价合成数据的覆盖性、预测程度和相似性。最终,基于以太坊欺诈检测数据集,使用Tabnet网络对扩增数据进行异常检测并获得局部特征重要性以及全局特征重要性,以增强扩增数据应用于实际工作的实践指导价值。
文摘多元时间序列(Multivariate Time Series,MTS)广泛应用于医学、经济、多媒体等领域。针对其相似模式匹配问题,该文提出一种基于2维奇异值分解(Two-Dimensional Singular Value Decomposition,2DSVD)的匹配方法。2DSVD是经典奇异值分解的扩展,能准确地描述MTS的本质特征。首先对MTS进行2DSVD分解;然后将MTS按行、列组成的协方差矩阵的主特征向量结合原MTS矩阵组成其模式表示矩阵,并借助Euclid范数来度量两个特征模式矩阵之间的相似程度,进而进行多元时间序列的模式匹配。最后通过与直接欧氏距离法、主成分分析、趋势距离、基于点分布特征4种相似匹配方法对3种不同数据规模的数据集进行对比实验,验证了所提方法刻画多种数据规模的多元时间序列特征的有效性和高效性。