-
题名不确定时间序列Top-k窗口聚合查询方法
- 1
-
-
作者
张航
熊浩然
何震瀛
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机工程》
北大核心
2025年第7期161-170,共10页
-
基金
国家重点研发计划(2021YFB3300502)。
-
文摘
近年来,如何分析挖掘不确定时间序列数据逐渐受到业界关注。Top-k查询作为数据库领域研究的热点问题,旨在从大规模数据中检索出最符合用户查询条件的前k项结果。然而,尽管Top-k查询在其他领域已被广泛应用,针对不确定时间序列的Top-k查询研究仍然较少。这种查询可以有效帮助用户从不确定时间序列提取重要信息。提出一种新的Top-k查询问题——不确定时间序列Top-k窗口聚合查询,并针对该问题给出高效的查询方法。这个查询可以作为一个基础工具,辅助用户探索和分析不确定时间序列数据。现有能够支持这个查询的方法均存在查询效率较低或所需存储空间过高的问题。针对该问题,提出一种基于子窗口拼接策略的两级Top-k查询方法,并提出高效计算阈值上界方法解决基于子窗口拼接策略引入的阈值计算复杂难题。该方法能够以较少的预计算存储空间,高效支持不确定时间序列Top-k窗口聚合查询。为了验证所提方法的有效性,在真实和人造数据集上进行实验。实验结果表明,所提方法与基于TA的Top-k查询方法相比,明显降低了预计算列表的存储空间;与基于遍历的FSEC-S方法相比,所提方法以及使用计算阈值上界优化方法的平均查询效率分别提升了7.27倍和20.04倍。
-
关键词
不确定时间序列
TOP-K查询
窗口
聚合查询
有序列表
阈值
-
Keywords
uncertain time series
Top-k query
window
aggregation query
sorted list
threshold
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名不确定时间序列的降维及相似性匹配
被引量:2
- 2
-
-
作者
王伟
刘国华
徐斌
-
机构
东华大学信息科学与技术学院
东华大学计算机科学与技术学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2015年第4期418-428,共11页
-
基金
国家自然科学基金Grant No.61070032~~
-
文摘
不确定时间序列的每个时间点上对应一个可能取值的集合,无法给出其确定值,这种不确定性给时间序列降维处理和相似性匹配带来巨大挑战,现有的时间序列降维方法和相似性匹配算法已经无法适用。针对此问题,提出了描述统计模型,将不确定时间序列归约为3条确定时间序列,通过离散傅里叶变换(discrete Fourier transform,DFT)、离散余弦变换(discrete cosine transform,DCT)、离散小波变换(discrete wavelet transform,DWT)对模型下不确定时间序列降维;根据模型特点,提出了以观察值区间和区间集中趋势为核心的相似性匹配算法。经过实验验证,描述统计模型下DCT和DWT有良好的降维效果,提出的相似匹配算法与现有算法相比提高了匹配准确率。
-
关键词
不确定时间序列
降维
相似性匹配
离散傅里叶变换(DFT)
离散余弦变换(DCT)
离散小波变换(DWT)
-
Keywords
uncertain time series
dimensionality reduction
similarity match
discrete Fourier transform (DFT)
dis-crete cosine transform (DCT)
discrete wavelet transform (DWT)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名不确定时间序列的规约方法
- 3
-
-
作者
吴红花
刘国华
-
机构
东华大学计算机科学与技术学院
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第21期33-35,共3页
-
基金
国家自然科学基金资助项目(61070032)
-
文摘
为提高不确定时间序列的查询效率,在对不确定时间序列数据集进行建模的基础上,提出由不确定时间序列向确定时间序列的3种规约方法,分别为概率最大法、混合规约法和均值法,并给出具体的规约过程。实验结果表明,上述3种规约方法能减少时间序列的不确定性,为其相似性匹配、搜索和查询操作提供依据。
-
关键词
不确定时间序列
查询复杂度
概率最大法
均值法
规约方法
-
Keywords
uncertainty time series
query complexity
probability maximum method
mean value method
specification method
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于PSO的不确定时间序列模体发现算法
- 4
-
-
作者
王菊
刘付显
靳春杰
-
机构
空军工程大学防空反导学院
中国人民解放军
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2018年第7期1639-1645,共7页
-
基金
国家自然科学基金(71771216)资助课题
-
文摘
针对不确定时间序列(uncertain time series,UTS)的模体发现(motif discovery,MD)问题,提出了基于粒子群(particle swarm optimization,PSO)的UTS MD算法。该算法根据UTS的特点,设计了基于PSO的UTS MD的研究框架,并通过对时间序列片段的起始时刻和持续时间进行编码和修正,实现了在该框架下对UTS的MD。在实验中,针对所提出的算法,验证了其可行性,比较了其与MK、MOEN算法在运行时间、占用内存和收敛性方面的性能,并分析了其MD准确率,结果表明所提方法占用较少内存与运行时间,可以发现不同长度的模体,且具有收敛性和较高的准确率。
-
关键词
不确定时间序列
粒子群
模体发现
-
Keywords
uncertain time series (UTS)
particle swarm optimization (PSO)
motif discovery (MD)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名面向不确定时间序列的分类方法
被引量:5
- 5
-
-
作者
王佳林
王斌
杨晓春
-
机构
东北大学信息科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S3期31-39,共9页
-
基金
国家自然科学基金项目(60973018
60973020)
+2 种基金
中央高校基本科研业务费专项资金项目(N090504004
N100704001
N090104001)
-
文摘
时间序列的分类问题在生物、经济金融分析、语音处理等方面有着广泛的应用.在传统的确定性的时间序列上这项技术已得到了深入的研究,并取得了很好的效果;但在新兴的不确定时间序列上解决方案还很少.不确定模型更能真实地反映现实世界;因此,研究不确定时间序列的分类问题有很大的实际意义.DTW距离是确定性的时间序列上的重要的度量方式,但其不能直接应用于不确定时间序列之上.提出了基于期望距离的不确定时间序列下的DTW距离.给出了期望距离的一种简单计算方法,从而简化了不确定时间序列的建模,降低了模型的存储代价.利用期望距离公式的特点,将确定性的时间序列DTW的距离下界函数LB_Keogh进行扩展,得到了不确定时间序列的下界函数ULB_Keogh.实验结果显示:提出的DTW算法对于不确定时间序列的分类有着很高的正确率;ULB_Keogh下界函数有着很好的剪枝效果.
-
关键词
不确定时间序列
分类
DTW
下界函数
-
Keywords
uncertain time series
classification
DTW
lower bound function
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于Hadoop的不确定异常时间序列检测
被引量:3
- 6
-
-
作者
李斌
张建平
刘学军
-
机构
南京工业大学计算机科学与技术学院
-
出处
《传感技术学报》
CAS
CSCD
北大核心
2015年第7期1066-1072,共7页
-
基金
国家公益性科研专项项目(201310162
201210022)
连云港科技支撑计划项目(SH1110)
-
文摘
无线传感器网络中,传感器的采集与无线网络的传输等均可能带来时间序列的不确定性,而大数据时代的到来使得传统不确定异常时间序列检测研究面临时间效率低下的问题,为此提出基于Hadoop的不确定异常时间序列检测算法。首先对不确定时间序列进行压缩变换,使不确定数据量大大减少,然后利用Map Reduce架构调用基于期望距离的不确定时间序列下的DTW算法,实现算法的并行化处理,降低算法时间复杂度。同时针对Hadoop集群任务级调度分配方法在运行中负载分配不均现象,提出Hadoop集群优化方法,明显缩减集群总任务时间,使得节点资源的利用更为合理。Hadoop平台下实验结果验证显示,该方法既提高了检测速度,又保证了检测准确率。
-
关键词
无线传感器网络
不确定异常时间序列
Hadoop集群优化
压缩
动态时间弯曲
期望距离
-
Keywords
wireless sensor network
uncertain abnormal time series
Hadoop optimization
compress
dynamic timewarping
expected distance
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于时间窗口选择和SVR的船舶交通事故率预测
被引量:4
- 7
-
-
作者
孙墨林
郑中义
-
机构
大连海事大学航海学院
-
出处
《中国航海》
CSCD
北大核心
2019年第1期47-51,共5页
-
基金
国家自然科学基金(51509031)
-
文摘
为提高对船舶交通事故率的预测精度,建立基于时间窗口选择和支持向量回归的船舶交通事故率预测模型,该预测模型考虑船舶交通事故的发生具有随机不确定性,以及海事规则生效等导致的船舶交通事故率的变动趋势。在构造船舶交通事故率不确定时间序列的基础上,采用滑动窗口技术对置信区间比较集中的不确定时间序列点进行聚类并分段,选择最接近当前时间的区段作为统计时间窗口,并利用支持向量回归模型对船舶交通事故率进行预测。以英国籍船舶交通事故数据为例,对预测模型进行实例分析。通过与指数平滑法和自回归移动平均模型预测结果的对比验证预测模型的有效性,为船舶交通安全管理者的决策提供指导。
-
关键词
船舶交通事故率
时间窗口
不确定时间序列
支持向量回归
-
Keywords
vessel traffic accident rate
time window
random time sequence
support vector regression
-
分类号
U698.6
[交通运输工程—港口、海岸及近海工程]
-
-
题名混合多机器学习的ICU病人生死预测框架
被引量:1
- 8
-
-
作者
张远健
徐健锋
涂敏
黄学坚
刘清
-
机构
南昌大学软件学院
江西警察学院
南昌大学信息工程学院
-
出处
《计算机科学与探索》
CSCD
2014年第11期1381-1390,共10页
-
基金
国家自然科学基金~~
-
文摘
ICU病人生死预测一直都是医学界的研究热点和难点。数据挖掘的机器学习方法近年来在该领域取得了一定的进展,但依然有很大的发展空间。针对ICU时序数据的高维度和不确定间隔采样特性,提出了不确定间隔采样转化为确定间隔的空采样的思想和相应的处理策略;在此基础上将传统的时间序列聚类与机器学习方法相结合,提出了一个两阶段的混合多机器学习算法框架,使得数据集的高维和不确定性得到了约简,从而可以采用经典的机器学习方法挖掘病人生死知识。在一个公开数据集上的两组实验结果表明,基于该算法框架的ICU病人死亡预测方法对于少数样本的分类效果优于传统方法,弹性时间间隔下的预测效果更好,最优时间间隔的选取可以通过实验效果来验证。
-
关键词
ICU
不确定时间序列
预测
机器学习
混合框架
-
Keywords
ICU
uncertain time series
prediction
machine learning
hybrid framework
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-