在长期时间序列预测(long-term time series forecasting,LTSF)领域,采用编码器-解码器架构的深度学习模型展现出了卓越的性能。目前,虽然编码器从输入的历史序列中能够提取深层次的时间变化特征,捕获时间序列内部的周期性、趋势性以及...在长期时间序列预测(long-term time series forecasting,LTSF)领域,采用编码器-解码器架构的深度学习模型展现出了卓越的性能。目前,虽然编码器从输入的历史序列中能够提取深层次的时间变化特征,捕获时间序列内部的周期性、趋势性以及局部信息相关性,但是解码器多依赖于编码器输出的全局特征,对编码器提取的局部特征利用不充分,限制了模型的预测性能。为充分挖掘和利用局部特征,提出了一种多局部增强线性解码器(multiple local augmented linear decoders,MLAD),通过引入局部特征增强机制(local feature augmented mechanism,LFAM),在编码器生成的特征序列上进行滑动,并将提取的局部特征与原始历史序列融合,从而生成多个局部增强序列,然后通过计算所有的局部增强序列对应预测序列的平均值来确定预测结果。在7个公开数据集上进行实验,结果表明MLAD达到或超过了现有主流模型性能,证明了其在LTSF任务中的有效性。展开更多
经过对大量维吾尔文网站的调查与分析,该文从多语种混合网页中针对维吾尔文网页识别进行了研究,这对维吾尔语信息处理工作起着关键作用。首先该文探讨了维吾尔文不规范网页的字符编码转换规则及原理,以此对不规范维吾尔文字符进行了相...经过对大量维吾尔文网站的调查与分析,该文从多语种混合网页中针对维吾尔文网页识别进行了研究,这对维吾尔语信息处理工作起着关键作用。首先该文探讨了维吾尔文不规范网页的字符编码转换规则及原理,以此对不规范维吾尔文字符进行了相应的处理,之后介绍了基于修改的N-Gram方法和基于维吾尔语常用词特征向量的两种方法,其中后者融合了维吾尔文常用候选词语料库及向量空间模型(Vector Space Model)。使用三种不同类型的维吾尔文网页文本作为本研究的数据集,在此基础上验证了该文提出的网页识别方法,以及采用不同的方法进行了网页识别的实验。实验结果表明,基于N-Gram的方法对正文较长的新闻或论坛网页的识别性能最佳,反而基于常用词特征向量的方法对短文本的网页识别性能优越N-Gram。所提方法对维吾尔文网页识别的整体性能达到90%以上,并验证了这两种方法的有效性。展开更多
文摘在长期时间序列预测(long-term time series forecasting,LTSF)领域,采用编码器-解码器架构的深度学习模型展现出了卓越的性能。目前,虽然编码器从输入的历史序列中能够提取深层次的时间变化特征,捕获时间序列内部的周期性、趋势性以及局部信息相关性,但是解码器多依赖于编码器输出的全局特征,对编码器提取的局部特征利用不充分,限制了模型的预测性能。为充分挖掘和利用局部特征,提出了一种多局部增强线性解码器(multiple local augmented linear decoders,MLAD),通过引入局部特征增强机制(local feature augmented mechanism,LFAM),在编码器生成的特征序列上进行滑动,并将提取的局部特征与原始历史序列融合,从而生成多个局部增强序列,然后通过计算所有的局部增强序列对应预测序列的平均值来确定预测结果。在7个公开数据集上进行实验,结果表明MLAD达到或超过了现有主流模型性能,证明了其在LTSF任务中的有效性。
文摘经过对大量维吾尔文网站的调查与分析,该文从多语种混合网页中针对维吾尔文网页识别进行了研究,这对维吾尔语信息处理工作起着关键作用。首先该文探讨了维吾尔文不规范网页的字符编码转换规则及原理,以此对不规范维吾尔文字符进行了相应的处理,之后介绍了基于修改的N-Gram方法和基于维吾尔语常用词特征向量的两种方法,其中后者融合了维吾尔文常用候选词语料库及向量空间模型(Vector Space Model)。使用三种不同类型的维吾尔文网页文本作为本研究的数据集,在此基础上验证了该文提出的网页识别方法,以及采用不同的方法进行了网页识别的实验。实验结果表明,基于N-Gram的方法对正文较长的新闻或论坛网页的识别性能最佳,反而基于常用词特征向量的方法对短文本的网页识别性能优越N-Gram。所提方法对维吾尔文网页识别的整体性能达到90%以上,并验证了这两种方法的有效性。