期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于多分类器的数据流中的概念漂移挖掘 被引量:28
1
作者 孙岳 毛国君 +1 位作者 刘旭 刘椿年 《自动化学报》 EI CSCD 北大核心 2008年第1期93-97,共5页
数据流中概念漂移的检测是当前数据挖掘领域的重要研究分支,近年来得到了广泛的关注.本文提出了一种称为M_ID4的数据流挖掘算法.它是在大容量数据流挖掘中,通过尽量少的训练样本来实现概念漂移检测的快速方法.利用多分类器综合技术,M-ID... 数据流中概念漂移的检测是当前数据挖掘领域的重要研究分支,近年来得到了广泛的关注.本文提出了一种称为M_ID4的数据流挖掘算法.它是在大容量数据流挖掘中,通过尽量少的训练样本来实现概念漂移检测的快速方法.利用多分类器综合技术,M-ID4实现了数据流中概念漂移的增量式检测和挖掘.实验结果表明,MID4算法在处理数据流的概念漂移上表现出比已有同类算法更高的精确度和适应性. 展开更多
关键词 数据挖掘 数据流 概念漂移
在线阅读 下载PDF
数据流中频繁闭项集的近似挖掘算法 被引量:14
2
作者 刘旭 毛国君 +1 位作者 孙岳 刘椿年 《电子学报》 EI CAS CSCD 北大核心 2007年第5期900-905,共6页
在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘... 在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘频繁闭项集,其中一个典型的工作就是Moment算法.本文提出了一种数据流中频繁闭项集的近似挖掘算法A-Moment.它采用衰减窗口机制、近似计数估计方法和分布式更新信息策略来解决Moment算法中过度依赖于窗口和执行效率低等问题.实验表明,该算法在保证挖掘精度的前提下,可以比Moment获得更好的效率. 展开更多
关键词 数据挖掘 数据流 频繁闭项集
在线阅读 下载PDF
时态约束下的数据挖掘问题及算法 被引量:5
3
作者 毛国君 刘椿年 《电子学报》 EI CAS CSCD 北大核心 2003年第11期1690-1694,共5页
对于一个大型数据库而言 ,为了提高挖掘效率 ,必须考虑减少数据库的扫描次数 ,同时使内存需求量保持在一个适当的水平上 .把时态约束应用到事务数据库的挖掘中 ,可以获得更好的效率 .本文首先利用时态区间代数操作实现原始数据库的过滤... 对于一个大型数据库而言 ,为了提高挖掘效率 ,必须考虑减少数据库的扫描次数 ,同时使内存需求量保持在一个适当的水平上 .把时态约束应用到事务数据库的挖掘中 ,可以获得更好的效率 .本文首先利用时态区间代数操作实现原始数据库的过滤和挖掘时态区间的合并 ;然后在定义项目序列集操作的基础上 ,提出一个称为TISS DM的发现频繁项目序列集的高效算法 ;最后讨论了这个算法的效率 . 展开更多
关键词 数据挖掘 关联规则 时态区间 频繁项目序列
在线阅读 下载PDF
数据流中概念漂移检测的集成分类器设计
4
作者 孙岳 毛国君 刘旭 《计算机应用研究》 CSCD 北大核心 2008年第1期164-167,共4页
提出了一种称为ICEA(incremental classification ensemble algorithm)的数据流挖掘算法。它利用集成分类器综合技术,实现了数据流中概念漂移的增量式检测和挖掘。实验结果表明,ICEA在处理数据流的快速概念漂移上表现出很高的精确度和... 提出了一种称为ICEA(incremental classification ensemble algorithm)的数据流挖掘算法。它利用集成分类器综合技术,实现了数据流中概念漂移的增量式检测和挖掘。实验结果表明,ICEA在处理数据流的快速概念漂移上表现出很高的精确度和较好的时间效率。 展开更多
关键词 数据挖掘 数据流 概念漂移
在线阅读 下载PDF
数据挖掘技术在DNA序列分割中的应用
5
作者 邱洪君 毛国君 罗春雨 《计算机应用研究》 CSCD 北大核心 2006年第6期23-25,共3页
DNA序列分割作为DNA序列分析中的一部分正受到越来越多人的关注,引入数据挖掘技术是提高DNA序列分割有效性的一个重要途径。全面综述了目前数据挖掘技术在DNA序列分割中的应用,最后指出了尚待解决的问题。
关键词 数据挖掘 序列分割 DNA序列
在线阅读 下载PDF
基于项目序列集亚操作和数据分割的最大频繁项目序列挖掘方法(英文)
6
作者 毛国君 刘椿年 《自动化学报》 EI CSCD 北大核心 2004年第5期772-777,共6页
发现频繁项目序列集是关联规则挖掘中的一个重要步骤.该文提出两个发现最大频繁项目序列的算法Dfis和Dfisp.Dfis算法基于项目序列集操作理论,只有一次数据库扫描.Dfisp是Dfis的改进算法,它引入数据分割技术以提高内存使用率因而增强对... 发现频繁项目序列集是关联规则挖掘中的一个重要步骤.该文提出两个发现最大频繁项目序列的算法Dfis和Dfisp.Dfis算法基于项目序列集操作理论,只有一次数据库扫描.Dfisp是Dfis的改进算法,它引入数据分割技术以提高内存使用率因而增强对大型数据库的处理能力,是一个两次数据库扫描算法.实验表明了它们的性能能和优势. 展开更多
关键词 数据挖掘 关联规则 项目序列 亚操作
在线阅读 下载PDF
分段扫描生成频繁项目序列集的挖掘算法
7
作者 毛国君 刘椿年 《计算机工程与应用》 CSCD 北大核心 2004年第7期19-21,202,共4页
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据... 关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。 展开更多
关键词 数据挖掘 关联规则 项目序列(集) 数据分段扫描
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部