已有盾构掘进地层识别机器学习模型高度依赖准确的地层信息作为模型标签输入,使其在复杂地层适用性较差。通过引入线性插值模型克服传统动态时间规整(dynamic time warping,简称DTW)的离散化问题,提出了基于连续动态时间规整(continuous...已有盾构掘进地层识别机器学习模型高度依赖准确的地层信息作为模型标签输入,使其在复杂地层适用性较差。通过引入线性插值模型克服传统动态时间规整(dynamic time warping,简称DTW)的离散化问题,提出了基于连续动态时间规整(continuous dynamic time warping,简称CDTW)的凝聚型层次聚类模型(CDTW-Agglomerative),构建了能够动态识别地层的在线学习机制。基于厦门地铁3号线盾构掘进数据集验证了所提模型的准确性和可靠性,并通过厦门地铁6号线盾构掘进数据集对模型泛化性进行测试。结果表明,CDTW-Agglomerative在两个不同地质条件数据集下的预测准确率分别约为85%和73%,具有良好的泛化性。CDTW-Agglomerative性能优于基于DTW、软动态时间规整(soft dynamic time warping,简称Soft DTW)的凝聚型层次聚类模型和CDTW-K-means、CDTW-K-medoids、CDTW-Spectral等聚类模型。所提模型无需地层信息作为标签输入,即可有效识别盾构刀盘处地层信息,为盾构掘进参数智能决策提供参考。展开更多
对于时间序列聚类任务而言,一个有效的距离度量至关重要.为了提高时间序列聚类的性能,考虑借助度量学习方法,从数据中学习一种适用于时序聚类的距离度量.然而,现有的度量学习未注意到时序的特性,且时间序列数据存在成对约束等辅助信息...对于时间序列聚类任务而言,一个有效的距离度量至关重要.为了提高时间序列聚类的性能,考虑借助度量学习方法,从数据中学习一种适用于时序聚类的距离度量.然而,现有的度量学习未注意到时序的特性,且时间序列数据存在成对约束等辅助信息不易获取的问题.提出一种辅助信息自动生成的时间序列距离度量学习(distance metric learning based on side information autogeneration for time series,简称SIADML)方法.该方法利用动态时间弯曲(dynamic time warping,简称DTW)距离在捕捉时序特性上的优势,自动生成成对约束信息,使习得的度量尽可能地保持时序之间固有的近邻关系.在一系列时间序列标准数据集上的实验结果表明,采用该方法得到的度量能够有效改善时间序列聚类的性能.展开更多
已有城市轨道交通车站分类多基于定性分析,不能满足精细化设计和运营的需要。本文提出一种基于聚类站点公共特征的站点精细分类方法。首先,将来源于AFC(Automatic Fare Collection)的进站客流量数据处理为时间序列数据,并基于K-Means++...已有城市轨道交通车站分类多基于定性分析,不能满足精细化设计和运营的需要。本文提出一种基于聚类站点公共特征的站点精细分类方法。首先,将来源于AFC(Automatic Fare Collection)的进站客流量数据处理为时间序列数据,并基于K-Means++算法对各个站点的客流量进行聚类;其次,建立客流量聚类结果与土地利用特征多维参数的拟合方程,计算获得居住密集型、工作就业型以及区域中心型等5种大类站点的客流量公共特征。在此基础上,充分考虑属于同一大类站点不同站点的细分特性,使用5类客流量公共特征比重组合精细描述具体站点类型。实例结果表明,使用本文提出的精细分类方法计算得到的每个站的客流量拟合值与真实客流值间的平均绝对百分比误差控制在14%以内,说明该分类方法具有可行性。展开更多
针对传统多变量时间序列预测方法未考虑变量间依赖关系从而影响预测效果的问题,提出了一种基于异常序列剔除的多变量时间序列预测算法.该算法旨在利用多维支持向量回归机(Multi-dimensional support vector regression,M-SVR)内在的结...针对传统多变量时间序列预测方法未考虑变量间依赖关系从而影响预测效果的问题,提出了一种基于异常序列剔除的多变量时间序列预测算法.该算法旨在利用多维支持向量回归机(Multi-dimensional support vector regression,M-SVR)内在的结构化输出特性,对选取到具有相似性的多个变量序列进行联合预测.首先,对已知序列进行基于模糊熵的层次聚类,实现对相似序列的初步划分;其次,求出类中所有序列的主曲线,根据序列到主曲线的距离计算各个序列的异常因子,从而进一步剔除聚类结果中的异常序列;最后,将选取到的相似变量序列作为输入,利用M-SVR进行预测.通过理论分析,证明本文算法在理论上存在信息损失上界与可靠度下界,从而说明本文算法的合理性与可行性.采用混沌时间序列数据与多个实际数据集进行对比实验,结果表明,与现有多个代表性方法相比,本文算法可有效挖掘多变量时间序列的内在结构信息,预测精度更高,数值稳定性更好.展开更多
船舶航迹的时序特性在船舶航迹异常检测中至关重要,为了提取船舶航迹的时序特性,提出了一种基于编码降维及DTW(dynamic time warping)算法改进的船舶航迹聚类算法。为了避免二维时间序列DTW度量容易失去属性之间相关性的问题,该算法提...船舶航迹的时序特性在船舶航迹异常检测中至关重要,为了提取船舶航迹的时序特性,提出了一种基于编码降维及DTW(dynamic time warping)算法改进的船舶航迹聚类算法。为了避免二维时间序列DTW度量容易失去属性之间相关性的问题,该算法提出一种编码降维方法将船舶二维时间序列转化为一维时间序列;为了满足计算效率要求,该算法首先从最小粒度压缩角度对DTW算法进行了改进,然后又从度量搜索角度对DTW算法实现进一步的改进。实验结果表明编码降维后的时间序列有效保留了属性之间的相关性;改进后的DTW算法有效提高了计算效率;同时该航迹聚类算法有效提取出船舶航迹的时序特性。展开更多
文摘已有盾构掘进地层识别机器学习模型高度依赖准确的地层信息作为模型标签输入,使其在复杂地层适用性较差。通过引入线性插值模型克服传统动态时间规整(dynamic time warping,简称DTW)的离散化问题,提出了基于连续动态时间规整(continuous dynamic time warping,简称CDTW)的凝聚型层次聚类模型(CDTW-Agglomerative),构建了能够动态识别地层的在线学习机制。基于厦门地铁3号线盾构掘进数据集验证了所提模型的准确性和可靠性,并通过厦门地铁6号线盾构掘进数据集对模型泛化性进行测试。结果表明,CDTW-Agglomerative在两个不同地质条件数据集下的预测准确率分别约为85%和73%,具有良好的泛化性。CDTW-Agglomerative性能优于基于DTW、软动态时间规整(soft dynamic time warping,简称Soft DTW)的凝聚型层次聚类模型和CDTW-K-means、CDTW-K-medoids、CDTW-Spectral等聚类模型。所提模型无需地层信息作为标签输入,即可有效识别盾构刀盘处地层信息,为盾构掘进参数智能决策提供参考。
文摘对于时间序列聚类任务而言,一个有效的距离度量至关重要.为了提高时间序列聚类的性能,考虑借助度量学习方法,从数据中学习一种适用于时序聚类的距离度量.然而,现有的度量学习未注意到时序的特性,且时间序列数据存在成对约束等辅助信息不易获取的问题.提出一种辅助信息自动生成的时间序列距离度量学习(distance metric learning based on side information autogeneration for time series,简称SIADML)方法.该方法利用动态时间弯曲(dynamic time warping,简称DTW)距离在捕捉时序特性上的优势,自动生成成对约束信息,使习得的度量尽可能地保持时序之间固有的近邻关系.在一系列时间序列标准数据集上的实验结果表明,采用该方法得到的度量能够有效改善时间序列聚类的性能.
文摘已有城市轨道交通车站分类多基于定性分析,不能满足精细化设计和运营的需要。本文提出一种基于聚类站点公共特征的站点精细分类方法。首先,将来源于AFC(Automatic Fare Collection)的进站客流量数据处理为时间序列数据,并基于K-Means++算法对各个站点的客流量进行聚类;其次,建立客流量聚类结果与土地利用特征多维参数的拟合方程,计算获得居住密集型、工作就业型以及区域中心型等5种大类站点的客流量公共特征。在此基础上,充分考虑属于同一大类站点不同站点的细分特性,使用5类客流量公共特征比重组合精细描述具体站点类型。实例结果表明,使用本文提出的精细分类方法计算得到的每个站的客流量拟合值与真实客流值间的平均绝对百分比误差控制在14%以内,说明该分类方法具有可行性。
文摘针对传统多变量时间序列预测方法未考虑变量间依赖关系从而影响预测效果的问题,提出了一种基于异常序列剔除的多变量时间序列预测算法.该算法旨在利用多维支持向量回归机(Multi-dimensional support vector regression,M-SVR)内在的结构化输出特性,对选取到具有相似性的多个变量序列进行联合预测.首先,对已知序列进行基于模糊熵的层次聚类,实现对相似序列的初步划分;其次,求出类中所有序列的主曲线,根据序列到主曲线的距离计算各个序列的异常因子,从而进一步剔除聚类结果中的异常序列;最后,将选取到的相似变量序列作为输入,利用M-SVR进行预测.通过理论分析,证明本文算法在理论上存在信息损失上界与可靠度下界,从而说明本文算法的合理性与可行性.采用混沌时间序列数据与多个实际数据集进行对比实验,结果表明,与现有多个代表性方法相比,本文算法可有效挖掘多变量时间序列的内在结构信息,预测精度更高,数值稳定性更好.
文摘船舶航迹的时序特性在船舶航迹异常检测中至关重要,为了提取船舶航迹的时序特性,提出了一种基于编码降维及DTW(dynamic time warping)算法改进的船舶航迹聚类算法。为了避免二维时间序列DTW度量容易失去属性之间相关性的问题,该算法提出一种编码降维方法将船舶二维时间序列转化为一维时间序列;为了满足计算效率要求,该算法首先从最小粒度压缩角度对DTW算法进行了改进,然后又从度量搜索角度对DTW算法实现进一步的改进。实验结果表明编码降维后的时间序列有效保留了属性之间的相关性;改进后的DTW算法有效提高了计算效率;同时该航迹聚类算法有效提取出船舶航迹的时序特性。