期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
离群数据之间模式相似性的分布式挖掘
1
作者 唐锐 《计算机工程与应用》 CSCD 北大核心 2007年第9期174-175,230,共3页
提出了分布式系统中各站点离群数据之间模式相似性挖掘算法,该算法首先利用基于距离的离群数据挖掘算法挖掘各自站点的离群数据,然后计算离群数据的知识集,最后依据各站点知识集的分布情况来判断离群数据之间的类别相似性和行为相似性。
关键词 离群数据挖掘 分布式挖掘 离群数据的模式相似性
在线阅读 下载PDF
基于模式相似性测度的电能质量数据压缩方法 被引量:13
2
作者 黄南天 徐殿国 +1 位作者 刘晓胜 林琳 《电工技术学报》 EI CSCD 北大核心 2011年第10期39-46,61,共9页
针对电能质量信号中单次电能质量事件内各个周期信号相同的特点,设计一种基于模式相似性测度的电能质量信号压缩方法。首先,建立6种典型电能质量信号的数学模型,生成仿真信号进行实验,选择适合电能质量信号畸变检测的相似性测度。在判... 针对电能质量信号中单次电能质量事件内各个周期信号相同的特点,设计一种基于模式相似性测度的电能质量信号压缩方法。首先,建立6种典型电能质量信号的数学模型,生成仿真信号进行实验,选择适合电能质量信号畸变检测的相似性测度。在判定新电能质量事件发生后,记录发生畸变的相邻两个周期的电能质量信号,并使用其中第2个周期的信号代替该次电能质量事件中的其他周期波形,从而达到压缩信号的目的。新方法可以对电能质量信号进行非降采样率的全时数据压缩。与小波等压缩方法比较,新方法的压缩与重构过程计算简单、对硬件要求低,同时避免了压缩过程中高频信号成分特征的丢失。仿真实验表明,新方法失真度低、计算时间短、压缩比高,能够满足电能质量数据压缩与分析的需要。 展开更多
关键词 电能质量 数据压缩 模式相似性测度
在线阅读 下载PDF
基于分形理论的股票时序数据离群模式挖掘研究 被引量:4
3
作者 孙金花 冯英浚 胡健 《运筹与管理》 CSCD 2008年第5期135-140,共6页
针对股票时间序列的特点,从离群点对股票时序数据有序性的影响角度出发,在界定分形离群点含义的基础上,利用分形理论将离群模式挖掘理解为一个优化分割问题。采用推广G-P(Grassberger-Procaccia)算法计算股票时间序列数据集的多重分形... 针对股票时间序列的特点,从离群点对股票时序数据有序性的影响角度出发,在界定分形离群点含义的基础上,利用分形理论将离群模式挖掘理解为一个优化分割问题。采用推广G-P(Grassberger-Procaccia)算法计算股票时间序列数据集的多重分形广义维数,并利用贪婪算法的思想设计了FT-Greedy算法来求解基于分形理论的时间序列离群模式挖掘优化问题的解集。实验证明,该方法能有效地解决股票时间序列离群模式挖掘问题。 展开更多
关键词 数据挖掘 离群模式挖掘 分型理论 股票时序数据
在线阅读 下载PDF
基于形状的时间序列相似性度量及模式发现算法 被引量:3
4
作者 曾凡仔 岳建海 裘正定 《信号处理》 CSCD 2004年第6期548-551,共4页
针对目前时间序列模式发现中使用的时间序列相似性度量易受尺度(scale)和平移的影响,不适应基于形状的时间序列模式发现,本文提出了一种重标和平移不变的时间序列相似性度量:Sh 度量,给出度量的性质及其证明。同时提出了基于Sh度量的时... 针对目前时间序列模式发现中使用的时间序列相似性度量易受尺度(scale)和平移的影响,不适应基于形状的时间序列模式发现,本文提出了一种重标和平移不变的时间序列相似性度量:Sh 度量,给出度量的性质及其证明。同时提出了基于Sh度量的时间序列形状模式发现算法,并对算法的有限次迭代终止性和时间复杂性进行了证明。论文最后通过对人工数据和太阳黑子数据的实验证明了本文提出的Sh度量及基于形状的时间序列模式发现算法的有效性。 展开更多
关键词 模式发现 相似性度量 时间序列模式 发现算法 时间复杂性 平移不变 数据 实验证明 迭代 形状
在线阅读 下载PDF
基于时空切分和词向量相似性的轨迹伴随模式挖掘 被引量:10
5
作者 李欣 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第5期17-25,共9页
设计了一种基于时空Hausdorff距离切分、词向量相似性的轨迹大数据挖掘方法,以准确高效地分析数据中的伴随规律,真实反映人群和车辆的流动行为。基于时序特征的一对三Hausdorff距离算法可以排除反向轨迹、挖掘伴随关系;利用时间滑动窗... 设计了一种基于时空Hausdorff距离切分、词向量相似性的轨迹大数据挖掘方法,以准确高效地分析数据中的伴随规律,真实反映人群和车辆的流动行为。基于时序特征的一对三Hausdorff距离算法可以排除反向轨迹、挖掘伴随关系;利用时间滑动窗口切分得到的轨迹段集合可为相似性度量建立数据基础。而基于词向量的轨迹相似性度量方法,建立了轨迹和词句的类比关系,体现了轨迹的空间、时间和方向异质性,能较为准确地度量伴随轨迹在结构上的相似程度,为发现同类目标或检测频繁路径等提供参考依据。 展开更多
关键词 轨迹数据 伴随模式 HAUSDORFF距离 词向量 轨迹相似性
在线阅读 下载PDF
高维类别属性数据流离群点快速检测算法 被引量:21
6
作者 周晓云 孙志挥 +1 位作者 张柏礼 杨宜东 《软件学报》 EI CSCD 北大核心 2007年第4期933-942,共10页
提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categoric... 提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性. 展开更多
关键词 数据 离群点检测 频繁模式 高维 概念转移
在线阅读 下载PDF
快速挖掘数据流中离群点 被引量:5
7
作者 唐向红 李国徽 杨观赐 《小型微型计算机系统》 CSCD 北大核心 2011年第1期9-16,共8页
离群点检测是数据挖掘领域的一个重要分支,当前数据流的离群点检测研究越来越受到关注.为了快速准确地检测出数据流中离群点,提出一种在线数据流离群点检测算法ODDS(outlier detection in online data stream s).它利用数据与频繁模式... 离群点检测是数据挖掘领域的一个重要分支,当前数据流的离群点检测研究越来越受到关注.为了快速准确地检测出数据流中离群点,提出一种在线数据流离群点检测算法ODDS(outlier detection in online data stream s).它利用数据与频繁模式的相异程度来度量数据的离群程度,通过构建ODDS-Tree树,能动态地更新数据流中候选离群点的离群信息.实验结果验证了该算法与其他同类算法相比具有较高的效率与优良的可扩展性能. 展开更多
关键词 数据 离群点检测 频繁模式 离群因子
在线阅读 下载PDF
基于频繁模式的离群点挖掘在入侵检测中的应用 被引量:11
8
作者 王茜 唐锐 《计算机应用研究》 CSCD 北大核心 2013年第4期1208-1211,共4页
针对网络安全数据高维度的特征,对传统离群点检测不能有效发现的网络数据中入侵行为细节进行检测。提出一种基于频繁模式的算法,通过检测数据项的频繁模式和关联规则,剥离数据流中或安全日志数据中的噪声和异常点,计算安全数据的加权频... 针对网络安全数据高维度的特征,对传统离群点检测不能有效发现的网络数据中入侵行为细节进行检测。提出一种基于频繁模式的算法,通过检测数据项的频繁模式和关联规则,剥离数据流中或安全日志数据中的噪声和异常点,计算安全数据的加权频繁离群因子,精确定位离群点,最后从中自动筛选出异常属性。实验证明,该方法在较好的空间复杂性与时间复杂性下,能有效地发现在高维安全数据中异常的属性。 展开更多
关键词 频繁模式 离群 入侵检测 高维数据
在线阅读 下载PDF
基于时空模式的轨迹数据聚类算法 被引量:18
9
作者 石陆魁 张延茹 张欣 《计算机应用》 CSCD 北大核心 2017年第3期854-859,895,共7页
针对轨迹聚类算法在相似性度量中多以空间特征为度量标准,缺少对时间特征的度量,提出了一种基于时空模式的轨迹数据聚类算法。该算法以划分再聚类框架为基础,首先利用曲线边缘检测方法提取轨迹特征点;然后根据轨迹特征点对轨迹进行子轨... 针对轨迹聚类算法在相似性度量中多以空间特征为度量标准,缺少对时间特征的度量,提出了一种基于时空模式的轨迹数据聚类算法。该算法以划分再聚类框架为基础,首先利用曲线边缘检测方法提取轨迹特征点;然后根据轨迹特征点对轨迹进行子轨迹段划分;最后根据子轨迹段间时空相似性,采用基于密度的聚类算法进行聚类。实验结果表明,使用所提算法提取的轨迹特征点在保证特征点具有较好简约性的前提下较为准确地描述了轨迹结构,同时基于时空特征的相似性度量因同时兼顾了轨迹的空间与时间特征,得到了更好的聚类结果。 展开更多
关键词 时空模式 轨迹数据 曲线边缘检测 相似性度量 密度聚类
在线阅读 下载PDF
模式识别在多视角下数据拼接中的应用 被引量:2
10
作者 马骊溟 姜虹 王小椿 《西安交通大学学报》 EI CAS CSCD 北大核心 2005年第3期270-273,共4页
针对传统三点定位法在数据配准中使用的局限性,提出了将模式识别中的相似性理论应用在多视角下数据拼接中的新方法.首先,在数据重叠区域内用梯度法搜索曲率极值点,然后在已经获得的曲率极值点中,根据模式识别中的灰度相似性原则确定特征... 针对传统三点定位法在数据配准中使用的局限性,提出了将模式识别中的相似性理论应用在多视角下数据拼接中的新方法.首先,在数据重叠区域内用梯度法搜索曲率极值点,然后在已经获得的曲率极值点中,根据模式识别中的灰度相似性原则确定特征点,最后根据对应的特征点进行配准.将该算法应用在水轮机叶片毛坯的测量数据配准中,结果表明,它可实现空间曲面的多视角测量及后序多片数据的拼接,具有速度快、精度高、可操作性强等特点,而且算法不受零件材质和形状的限制,通用性较强. 展开更多
关键词 测量数据 多视角配准 模式识别 相似性
在线阅读 下载PDF
一种多尺度的时间序列相似模式匹配算法 被引量:3
11
作者 郑诚 蔡庆生 《小型微型计算机系统》 CSCD 北大核心 2003年第3期546-549,共4页
提出一种多尺度的时间序列相似模式匹配算法 .该算法用离散小波变换对时间序列进行多分辨分析 ,在多尺度上提取序列的形状特征 ,然后在不同的尺度上找出相似的序列和子序列模式 .该算法可以匹配不同长度的序列 。
关键词 时间序列 相似模式匹配算法 数据 数据挖掘 知识发现 相似性 离散小波变换
在线阅读 下载PDF
遥感图像检索中的相似性度量方法比较 被引量:2
12
作者 包倩 郭平 《计算机科学》 CSCD 北大核心 2004年第B07期62-65,共4页
相似性度量是用来研究多源数据之间的相似程度的,是对空间数据进行模式识别的基础。本文通过单波段遥感图像的检索实验对应用于直方图匹配的8种相似性度量方法进行了比较。实验中发现两种方法在对直方图向量的匹配中表现出色,它们分别... 相似性度量是用来研究多源数据之间的相似程度的,是对空间数据进行模式识别的基础。本文通过单波段遥感图像的检索实验对应用于直方图匹配的8种相似性度量方法进行了比较。实验中发现两种方法在对直方图向量的匹配中表现出色,它们分别是X^2统计距离度量和相似夹角余弦度量。文章最后讨论了各种度量方法的适用性及优缺点。 展开更多
关键词 遥感图像检索 相似性度量 特征提取 直方图匹配 模式识别 空间数据
在线阅读 下载PDF
基于矩形代数和公共模式方法的相似图像检索
13
作者 刘大有 董婥 王生生 《深圳大学学报(理工版)》 EI CAS 北大核心 2012年第2期100-106,共7页
指出了图像检索中公共模式方法(common pattern method,CPM)所建立的type-i公共子图无法精确描述区域间的空间拓扑关系.研究采用矩形代数表示CPM中区域间的空间拓扑关系,得到了拓扑表达更精确的相似性图像检索算法(SRRA).该算法将对象... 指出了图像检索中公共模式方法(common pattern method,CPM)所建立的type-i公共子图无法精确描述区域间的空间拓扑关系.研究采用矩形代数表示CPM中区域间的空间拓扑关系,得到了拓扑表达更精确的相似性图像检索算法(SRRA).该算法将对象抽象为最小边界矩形,采用矩形代数描述对象间的二维空间关系,构建基于矩形代数的相似图,并从中寻找最大相似对象集合.实验结果表明,SRRA不仅在效率上优于基于CPM的算法,且检索效果更符合用户要求. 展开更多
关键词 数据挖掘 基于内容的图像检索 空间关系 相似性图像检索 矩形代数 语义检索 最小边界矩形 模式识别
在线阅读 下载PDF
一种基于p权值的离群数据挖掘算法 被引量:6
14
作者 娄圣金 张继福 刘爱琴 《小型微型计算机系统》 CSCD 北大核心 2014年第1期55-59,共5页
传统的基于距离的离群数据挖掘方法计算量大,挖掘效率和精度较低.本文利用大多数据集的聚类性特征,采用p权值和剪枝技术,给出一种基于距离的离群数据挖掘算法.该算法首先采用基于三角不等式的剪枝技术,寻找出离群候选集,仅候选集驻内存... 传统的基于距离的离群数据挖掘方法计算量大,挖掘效率和精度较低.本文利用大多数据集的聚类性特征,采用p权值和剪枝技术,给出一种基于距离的离群数据挖掘算法.该算法首先采用基于三角不等式的剪枝技术,寻找出离群候选集,仅候选集驻内存;然后对候选集中的每个数据点,分两种情况:若近邻达不到k值,赋予一个相对较大权值,若达到k值,运用p权值方法,计算该数据对象与其k最近邻的距离和,和越大,则离群的可能性越大;将离群候选集中的每个数据点按权值大小排序,并确定是否为离群数据,从而较好地克服了离群检测中的掩盖和淹没现象;最后采用UCI数据,实验验证了该算法的有效性. 展开更多
关键词 剪枝 离群数据挖掘 p权值 相似性搜索 三角不等式
在线阅读 下载PDF
基于无监督学习的电力用户异常用电模式检测 被引量:153
15
作者 庄池杰 张斌 +2 位作者 胡军 李秋硕 曾嵘 《中国电机工程学报》 EI CSCD 北大核心 2016年第2期379-387,共9页
检测异常用电模式的主要目的在于降低非技术性损失(non-technical losses,NTL),降低电力公司的运营成本。该文提出了基于无监督学习的异常用电模式检测模型,适用于电力用户数据集缺乏训练样本的情况。该模型包括特征提取、主成分分析、... 检测异常用电模式的主要目的在于降低非技术性损失(non-technical losses,NTL),降低电力公司的运营成本。该文提出了基于无监督学习的异常用电模式检测模型,适用于电力用户数据集缺乏训练样本的情况。该模型包括特征提取、主成分分析、网格处理、计算局部离群因子等模块。首先提取多个表征用户用电模式的特征量,通过主成分分析将每个用户映射到二维平面,实现数据可视化并便于计算局部离群因子。网格处理技术筛选出低密度区域的数据点,显著提升了算法效率。该模型输出所有用户用电行为的异常度及疑似概率排序,研究结果表明利用该排序,只需要检测异常度排序靠前的少数用户即可查出大部分异常用户。 展开更多
关键词 用电模式 电力大数据 异常检测 无监督学习 局部离群因子 反窃电技术
在线阅读 下载PDF
时间序列数据挖掘综述 被引量:77
16
作者 贾澎涛 何华灿 +1 位作者 刘丽 孙涛 《计算机应用研究》 CSCD 北大核心 2007年第11期15-18,29,共5页
在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预测了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预测、分类、聚类、分割、可视化等方面,为研究者... 在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预测了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预测、分类、聚类、分割、可视化等方面,为研究者了解最新的时间序列数据挖掘研究动态、新技术及发展趋势提供了参考。 展开更多
关键词 时间序列 数据挖掘 相似性搜索 模式发现
在线阅读 下载PDF
DNA序列数据挖掘技术 被引量:37
17
作者 朱扬勇 熊赟 《软件学报》 EI CSCD 北大核心 2007年第11期2766-2781,共16页
DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA... DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA序列数据分析,已得到了广泛关注和快速发展,并取得了许多研究成果.综述了DNA序列数据挖掘领域的研究状况和进展,提出了3个研究阶段:基于统计的挖掘方法应用阶段、一般化挖掘方法应用阶段和专门的DNA序列数据挖掘方法设计阶段.阐述了DNA序列数据挖掘的基础是序列相似性,评述了DNA序列数据挖掘领域所采用的关键技术,包括DNA序列模式、关联、聚类、分类和异常挖掘等,分析讨论了其相应的生物应用背景和意义.最后给出DNA序列数据挖掘进一步研究的热点问题,包括DNA序列数据新的存储和索引机制的设计、根据生物领域知识的数据挖掘新模型和算法的设计等. 展开更多
关键词 DNA序列 数据挖掘 生物信息学 序列模式 序列相似性
在线阅读 下载PDF
多变量时间序列模式挖掘的研究 被引量:11
18
作者 张军 吴绍春 王炜 《计算机工程与设计》 CSCD 北大核心 2006年第18期3364-3366,3384,共4页
多变量时间序列数据集合在许多领域中存在,由于其观测变量之间的相互关联性,往往需要进行综合分析。使用基于时间序列相似性的多变量时间序列模式挖掘方法,从历史数据中寻找出相似的多变量时间序列。将多变量的数据集分段平均为连续矩阵... 多变量时间序列数据集合在许多领域中存在,由于其观测变量之间的相互关联性,往往需要进行综合分析。使用基于时间序列相似性的多变量时间序列模式挖掘方法,从历史数据中寻找出相似的多变量时间序列。将多变量的数据集分段平均为连续矩阵,并采用基于主成分分析和奇异值分解的方法来对矩阵进行相似性比较,最后通过相邻片断的合并以组成更高层次的时序片断,以提高模式的匹配的范围。并在地震前兆数据进行了实现。 展开更多
关键词 数据挖掘 多变量时间序列 相似性 数据预处理 频繁序列模式
在线阅读 下载PDF
数据挖掘在水文时间序列中的应用研究与进展 被引量:6
19
作者 欧阳如琳 任立良 +1 位作者 周成虎 程维明 《水电能源科学》 北大核心 2009年第3期11-14,161,共5页
引入时间序列的数据挖掘理论与技术,在总结国内外数据挖掘在水文时间序列研究进展的基础上,进一步探讨了水文时间序列数据挖掘技术及应用,并展望了水文时间序列数据挖掘在分类聚类、相似性搜索、模式发现和趋势周期分析的研究方向,力求... 引入时间序列的数据挖掘理论与技术,在总结国内外数据挖掘在水文时间序列研究进展的基础上,进一步探讨了水文时间序列数据挖掘技术及应用,并展望了水文时间序列数据挖掘在分类聚类、相似性搜索、模式发现和趋势周期分析的研究方向,力求从理论框架上完善水文时间序列的数据挖掘研究。 展开更多
关键词 数据挖掘 时间序列 水文时间序列 模式 相似性 周期分析
在线阅读 下载PDF
基于时序离群检测的新的分段方法 被引量:3
20
作者 薛安荣 何伟华 《计算机工程与设计》 CSCD 北大核心 2007年第20期4875-4877,共3页
在对时序数据进行离群检测之前,一般先将原时序数据划分为若干个子序列,以便降低计算复杂度。现有的子序列划分方法一般是依据应用要求进行,而在某些情况下应用要求无法转换为有效的子序列划分方法。因此,提出从时序数据自身特点出发,... 在对时序数据进行离群检测之前,一般先将原时序数据划分为若干个子序列,以便降低计算复杂度。现有的子序列划分方法一般是依据应用要求进行,而在某些情况下应用要求无法转换为有效的子序列划分方法。因此,提出从时序数据自身特点出发,得到突变系数和重要点,依据重要点和突变系数的新的划分方法,并以微软的股票数据进行测试。实验结果表明,分段方法不依赖于应用要求,具有简单、直观的特点,与相关算法相比,具有更高的检测精度。 展开更多
关键词 时序数据 突变系数 重要点 分段 离群模式
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部