期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
在线分割时间序列数据 被引量:27
1
作者 李爱国 覃征 《软件学报》 EI CSCD 北大核心 2004年第11期1671-1679,共9页
时间序列分割是时间序列数据挖掘研究的重要任务之一.它主要有两个应用:检测生成时间序列的系统何时发生变化;创建时间序列的高级数据表示,从而对时间序列进行索引、聚类和分类.在实时时间序列数据挖掘应用中,需要在线时间序列分割算法... 时间序列分割是时间序列数据挖掘研究的重要任务之一.它主要有两个应用:检测生成时间序列的系统何时发生变化;创建时间序列的高级数据表示,从而对时间序列进行索引、聚类和分类.在实时时间序列数据挖掘应用中,需要在线时间序列分割算法,以便实时发现和预测时态模式.在对时间序列分割问题进行形式化描述的基础上,提出了一种评估时间序列的分割结果以及分割算法性能的评价指标,并提出了一种在线分割时间序列数据的递推算法(on-line segmentation,简称OLS).OLS的一个显著特点是不依赖有关时间序列的先验知识.实验结果说明,OLS算法能够有效地在线检测出数据挖掘应用中感兴趣的关键变化点,而且过拟合程度低. 展开更多
关键词 数据挖掘 知识获取 时间序列 分割
在线阅读 下载PDF
滑动窗口二次自回归模型预测非线性时间序列 被引量:12
2
作者 李爱国 覃征 《计算机学报》 EI CSCD 北大核心 2004年第7期1004-1008,共5页
提出一种新颖的非线性时间序列预测模型 ,即滑动窗口二次自回归 (MWDAR)模型 .MWDAR模型使用部分的历史数据及其二次项构造自回归模型 .模型参数用线性最小二乘法估计 .应用模型进行预测时 ,预先选定窗口大小以及模型一次项和二次项的阶... 提出一种新颖的非线性时间序列预测模型 ,即滑动窗口二次自回归 (MWDAR)模型 .MWDAR模型使用部分的历史数据及其二次项构造自回归模型 .模型参数用线性最小二乘法估计 .应用模型进行预测时 ,预先选定窗口大小以及模型一次项和二次项的阶次 .在每个当前时刻 ,先根据窗口内的数据估计模型参数 ,然后根据输入向量及模型参数做出预测 .这种预测方法不仅适合小数据集的时间序列预测 ,而且对大数据集具有极高的计算效率 .该文分别用H啨non混沌时间序列数据和真实的股票交易数据作了MWDAR方法与局域线性化方法的 1步和多步预测对比 ,结果显示MWDAR方法无论在预测精度上 ,还是在计算效率上都优于局域线性化方法 . 展开更多
关键词 非线性系统 混沌时间序列 预测 预报
在线阅读 下载PDF
基于SGNN的报税欺诈检测 被引量:3
3
作者 王世卫 李爱国 +1 位作者 郭媛媛 李士宁 《西安科技大学学报》 CAS 北大核心 2004年第4期470-473,477,共5页
税收申报欺诈检测是税务机关税收征管和稽查中面临的一个重要问题。提出一种基于自生成神经网络(SGNN)的税收申报欺诈检测方法。首先用采样来的企业经营和财务数据训练好一个SGNN网络,然后用这个SGNN网络判断一个企业的报税额是否真实... 税收申报欺诈检测是税务机关税收征管和稽查中面临的一个重要问题。提出一种基于自生成神经网络(SGNN)的税收申报欺诈检测方法。首先用采样来的企业经营和财务数据训练好一个SGNN网络,然后用这个SGNN网络判断一个企业的报税额是否真实。实验结果说明所提方法是一种有效的方法:在31个测试样本中,检测精度达93.55%,比基于C5.0的方法高了近10个百分点,而训练时间只需0.1875s。 展开更多
关键词 报税欺诈检测 神经网络 自生成神经网络 税收
在线阅读 下载PDF
基于SVM的报税欺诈检测 被引量:4
4
作者 王世卫 李爱国 《计算机工程》 EI CAS CSCD 北大核心 2006年第9期201-202,208,共3页
税收申报欺诈检测是税务机关税收征管和稽查中面临的一个重要问题。该文提出了一种基于SVM的税收申报欺诈检测方法。首先用采样来的企业经营和财务数据训练好一个SVM识别系统,然后用这个SVM识别系统判断一个企业的报税额是否真实。实验... 税收申报欺诈检测是税务机关税收征管和稽查中面临的一个重要问题。该文提出了一种基于SVM的税收申报欺诈检测方法。首先用采样来的企业经营和财务数据训练好一个SVM识别系统,然后用这个SVM识别系统判断一个企业的报税额是否真实。实验结果说明该方法是一种有效的方法,在31个测试样本中,检测精度达87.10%,比基于See 5.0的方法高3.23%,而训练时间只需1.708s。 展开更多
关键词 模式识别 SVM 欺诈检测
在线阅读 下载PDF
检测时间序列数据中的例外模式 被引量:1
5
作者 王世卫 李爱国 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期18-21,共4页
提出一种从时间序列数据中辨识例外模式的系统化方法,包括4个步骤1)将时间序列数据分割为一系列子序列;2)将这些子序列映射到某个特征空间;3)在此特征空间中,用聚类算法将分割得到的子序列聚类为不同的模式;4)定义例外支持的概念,并计... 提出一种从时间序列数据中辨识例外模式的系统化方法,包括4个步骤1)将时间序列数据分割为一系列子序列;2)将这些子序列映射到某个特征空间;3)在此特征空间中,用聚类算法将分割得到的子序列聚类为不同的模式;4)定义例外支持的概念,并计算每个模式的例外支持,如果某个模式的例外支持小于1,则该模式是一个例外模式。实验表明该方法能够有效地监测出时间序列中的例外模式。 展开更多
关键词 知识获取 时间序列 数据挖掘 例外
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部