期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
基于频繁轨迹序列模式挖掘的路径推荐方法 被引量:3
1
作者 段宗涛 任国亮 +3 位作者 康军 黄山 杜锦光 王倩倩 《太原理工大学学报》 CAS 北大核心 2022年第2期240-247,共8页
出行路径推荐是智能交通领域的重要研究内容之一。传统路径推荐方法往往基于路径最短或通行时间最短等单一因素进行路径推荐,而忽略了城市人群出行模式对路径推荐过程的影响。针对上述问题,提出了一种基于频繁轨迹序列模式的路径推荐方... 出行路径推荐是智能交通领域的重要研究内容之一。传统路径推荐方法往往基于路径最短或通行时间最短等单一因素进行路径推荐,而忽略了城市人群出行模式对路径推荐过程的影响。针对上述问题,提出了一种基于频繁轨迹序列模式的路径推荐方法,在数据预处理阶段基于历史轨迹数据库挖掘城市不同时段的频繁序列模式,并以此构建频繁路径序列模式库。在路径推荐阶段,对于给定起止点后确定的一组候选路径集合,利用所提出的长短模式权重评估模型对其进行量化评估并进行排序。然后,取出其评估值为Top-n的路径为用户进行推荐。通过4组模拟场景对推荐结果进行分析,结果表明该推荐方法具备合理性,同时将推荐结果和传统的最短路径和测试集比较分析,证明其推荐的路径更优,与传统的路径推荐算法相比其运行速度也更快。 展开更多
关键词 智能交通 时空轨迹数据 最短路径 频繁轨迹序列模式挖掘 路径推荐
在线阅读 下载PDF
冠心病合并慢性心衰序列模式联合轨迹群组的个性化治疗模式研究
2
作者 董晓婧 孟冰霞 +4 位作者 杨弘 闫晶晶 和紫铉 田晶 张岩波 《中国卫生统计》 北大核心 2025年第3期418-423,428,共7页
目的探讨序列模式联合轨迹群组对冠心病合并慢性心衰临床个性化治疗的意义。方法纳入2014年1月—2021年10月山西医科大学第一医院及山西省心血管医院确诊为冠心病合并慢性心衰,符合纳入排除标准并且知情同意的309例患者共计1098份记录... 目的探讨序列模式联合轨迹群组对冠心病合并慢性心衰临床个性化治疗的意义。方法纳入2014年1月—2021年10月山西医科大学第一医院及山西省心血管医院确诊为冠心病合并慢性心衰,符合纳入排除标准并且知情同意的309例患者共计1098份记录。使用心脏的结构与功能指标训练基于群组的多轨迹模型,基于轨迹群进一步训练SPADE算法,探索与死亡相关的轨迹指标变化模式。在此基础上,筛选与之对应的逆转结局的生存规则,同时合并药物使用筛选与生存相关的药物治疗模式。结果轨迹模型最终确定为由射血分数、左房前后径、左室舒张末期内径、右室前后径训练的轨迹3群组1阶模型。SPADE算法挖掘结果显示:3个轨迹群组死亡相关的轨迹序列模式各异,并且每个轨迹群组中均筛选出逆转结局的生存序列规则,同时存在着与生存序列规则相关的药物使用模式。结论预后规则数据集展示了预后相关的轨迹指标变化及相对应的药物治疗模式,在不同轨迹群组中存在特异性,侧面验证了轨迹群组的必要性。在特征分组基础上,使用SPADE算法有助于实行个性化治疗序列模式探索。 展开更多
关键词 慢性心力衰竭 冠心病 群组轨迹模型 序列模式挖掘
在线阅读 下载PDF
基于频繁序列挖掘的出租车轨迹特性分析
3
作者 龙雪琴 王晗 王瑞璇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期24-33,共10页
为进一步厘清不同出租车路径选择行为的差异性,采用频繁序列挖掘方法提取了同一个OD对间的频繁路径,构建路径选择集,分别从静态和动态两个角度分析路径集的相似特性。以西安市出租车的轨迹数据为研究对象,通过栅格划分与路网匹配,获得... 为进一步厘清不同出租车路径选择行为的差异性,采用频繁序列挖掘方法提取了同一个OD对间的频繁路径,构建路径选择集,分别从静态和动态两个角度分析路径集的相似特性。以西安市出租车的轨迹数据为研究对象,通过栅格划分与路网匹配,获得了不同OD对之间的路径集合。重新定义了频繁路径,采用PrefixSpan演变算法,在得到频繁子序列的基础上引入动态阈值和频繁度指标挖掘频繁路径,提取了最短路径和其他路径,完成了3类有效路径集的构建,并分析了路径集的一般属性。其后,将路径上二维时间序列(轨迹)间的相似度表示为动态相似度,将一维有向序列(路段)间的相似度表示为静态相似度,基于改进的最长公共子序列和动态时间规整算法对3类路径进行了相似性分析。结果表明:频繁路径与最短路径的相似度较高,意味着大多数出租车仍然选择具有最低出行时间的路段,但不一定会选择最短路径;时间和距离仍是出行者选择路径时主要考虑的因素,但出行者并不完全追求时间最短或距离最短;试验得到的动态相似度计算结果显著高于静态相似度计算结果,说明路径上的二维时序相似度高于一维形状相似度;两种方法下频繁路径和最短路径的相似度均最高,最短路径和其他路径的相似度均最低,比较结果的一致性说明可以用动态轨迹的相似度来大致度量静态路径的相似度。文中的频繁路径挖掘算法具有一定的可靠性,可为城市交通管理者进行路径推荐、道路规划等提供支持。 展开更多
关键词 交通运输工程 轨迹数据 频繁序列挖掘 路径选择集 相似特性分析
在线阅读 下载PDF
差分隐私下的一种频繁序列模式挖掘方法 被引量:7
4
作者 卢国庆 张啸剑 +2 位作者 丁丽萍 李彦峰 廖鑫 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2789-2801,共13页
频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私... 频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私保护的目的.由于序列数据内在序列性和高维度的特点,给差分隐私应用于频繁序列模式挖掘带来了挑战.对此提出了一种基于交互式差分隐私保护框架的频繁序列模式挖掘算法Diff-FSPM(differential-privacy frequent sequential pattern mining).该算法利用指数机制获取最优序列长度,并采用一种维规约策略获得原始序列数据集的规约表示,有效降低序列维度的影响;应用前缀树压缩频繁序列模式,利用拉普拉斯机制产生的噪音扰动频繁模式的真实支持度计数,同时采用闭频繁序列模式和Markov假设,有效分配隐私预算,并利用一致性约束后置处理,增强输出模式的可用性.理论角度证明算法满足ε-差分隐私,实验结果验证算法具有较好的可用性. 展开更多
关键词 频繁序列模式 数据挖掘 差分隐私 隐私保护 前缀树
在线阅读 下载PDF
基于FP-Tree模型的频繁轨迹模式挖掘方法 被引量:8
5
作者 牛新征 牛嘉郡 +1 位作者 苏大壮 佘堃 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第1期86-90,134,共6页
通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列... 通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列且具备时空属性的改进型FP-tree,使用动态数组存储模式挖掘过程中得到的候选集,根据用户的输入针对性输出相应时间和频率范围的频繁轨迹。最后通过与GSP算法、Prefixspan算法的对比测试表明,该算法具有更短执行时间和更优性能。 展开更多
关键词 FP-TREE 频繁轨迹模式 模式挖掘 时空属性
在线阅读 下载PDF
一种基于逻辑的频繁序列模式挖掘算法 被引量:9
6
作者 刘端阳 冯建 李晓粉 《计算机科学》 CSCD 北大核心 2015年第5期260-264,共5页
传统的类Apriori频繁序列模式挖掘算法都是基于支持度框架理论,需要预先设定支持度阈值,而这通常需要较深的领域知识或大量的实践,因此目前仍没有一种很好的设定方法。同时,序列模式的挖掘结果往往数量很大且不易理解,可用性较低。针对... 传统的类Apriori频繁序列模式挖掘算法都是基于支持度框架理论,需要预先设定支持度阈值,而这通常需要较深的领域知识或大量的实践,因此目前仍没有一种很好的设定方法。同时,序列模式的挖掘结果往往数量很大且不易理解,可用性较低。针对上述问题,提出了一种基于逻辑的频繁序列模式挖掘算法即LFSPM算法,并首次在频繁序列模式挖掘算法中引入了逻辑的思想,通过逻辑规则过滤,大大优化了结果集。实验证明,该算法较好地解决了支持度设置问题及挖掘结果可理解性不高的问题。 展开更多
关键词 频繁序列模式 数据挖掘 逻辑 支持度阈值
在线阅读 下载PDF
位置不确定移动时空轨迹频繁模式挖掘 被引量:3
7
作者 王亮 胡琨元 +1 位作者 库涛 吴俊伟 《小型微型计算机系统》 CSCD 北大核心 2014年第12期2659-2663,共5页
针对不确定移动轨迹ε-邻域的空间分布特征,提出一种基于网格分割面积的不确定轨迹近邻网格概率匹配方法,将原始不确定移动轨迹数据转换为以网格单元表示的概率序列数据,通过对经典序列模式挖掘算法Prefix Span的相关改进,设计并实现了... 针对不确定移动轨迹ε-邻域的空间分布特征,提出一种基于网格分割面积的不确定轨迹近邻网格概率匹配方法,将原始不确定移动轨迹数据转换为以网格单元表示的概率序列数据,通过对经典序列模式挖掘算法Prefix Span的相关改进,设计并实现了适应于严格时间间隔约束条件下的移动概率序列模式挖掘算法UTFP-Prefix Span.合成数据的测试实验仿真结果表明,本文所提出的方法较基于距离的概率转换方法在挖掘结果、可扩展性等方面具有更好的性能. 展开更多
关键词 数据挖掘 频繁模式 不确定数据 移动轨迹
在线阅读 下载PDF
一种时间序列频繁模式挖掘算法及其在WSAN行为预测中的应用 被引量:5
8
作者 万里 廖建新 朱晓民 《电子与信息学报》 EI CSCD 北大核心 2010年第3期682-686,共5页
该文提出FPM(Frequent Pattern Mining)算法充分考虑频繁模式在时间序列中出现次数和分布。基于这些不同分布的频繁模式扩展MAMC(Mixed memory Aggregation Markov Chain)模型提出FMAMC(Frequent pattern based Mixed memory Aggregatio... 该文提出FPM(Frequent Pattern Mining)算法充分考虑频繁模式在时间序列中出现次数和分布。基于这些不同分布的频繁模式扩展MAMC(Mixed memory Aggregation Markov Chain)模型提出FMAMC(Frequent pattern based Mixed memory Aggregation Markov Chain)模型。将FPM和FMAMC应用到实际的智能楼宇项目中,证明和现有算法相比FPM算法具有较好的时间性能,FMAMC模型能够比MAMC模型更准确的预测WSAN节点行为。 展开更多
关键词 数据挖掘 时间序列 频繁模式挖掘 无线传感器自组织网络节点行为预测 智能楼宇
在线阅读 下载PDF
面向移动时空轨迹数据的频繁闭合模式挖掘 被引量:5
9
作者 王亮 汪梅 +1 位作者 郭鑫颖 秦学斌 《西安科技大学学报》 CAS 北大核心 2016年第4期573-576,598,共5页
移动泛在感知设备的广泛普及为移动轨迹数据的大规模采集、存储与分析开拓了广阔的空间。通过对用户的移动轨迹数据进行分析挖掘,发现其中所蕴含的有价值的行为模式与特征,对于基于位置的服务(Location-based Service,LBS),城市交通管理... 移动泛在感知设备的广泛普及为移动轨迹数据的大规模采集、存储与分析开拓了广阔的空间。通过对用户的移动轨迹数据进行分析挖掘,发现其中所蕴含的有价值的行为模式与特征,对于基于位置的服务(Location-based Service,LBS),城市交通管理,精准广告营销等领域均具有重要的价值。文中针对移动轨迹频繁模式规模过大、信息冗余问题定义了频繁闭合移动轨迹模式,以经典闭合序列模式挖掘算法为基础提出了适应于移动轨迹数据的频繁闭合模式Close Traj算法,分别通过对仿真数据与真实数据的实验测试,结果显示文中所提出的Close Traj算法对于频繁闭合移动轨迹模式挖掘问题具有较强的适用性,同时在运行效率方面具有显著优势。 展开更多
关键词 移动轨迹 数据挖掘 频繁闭合模式
在线阅读 下载PDF
时空轨迹序列模式挖掘方法综述 被引量:5
10
作者 康军 黄山 +1 位作者 段宗涛 李宜修 《计算机应用》 CSCD 北大核心 2021年第8期2379-2385,共7页
在全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据,这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照,蕴含了丰富的信息,这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应... 在全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据,这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照,蕴含了丰富的信息,这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值,而时空轨迹数据在这些领域的应用通常需要通过对时空轨迹数据进行序列模式挖掘才能得以实现。时空轨迹序列模式挖掘旨在从时空轨迹数据集中找出频繁出现的序列模式,例如:位置模式(频繁轨迹、热点区域)、活动周期模式、语义行为模式,从而挖掘时空数据中隐藏的信息。总结近年来时空轨迹序列模式挖掘的研究进展,先介绍时空轨迹序列的数据特点及应用,再描述时空轨迹模式的挖掘过程:从基于时空轨迹序列来挖掘位置模式、周期模式、语义模式这三个方面来介绍该领域的研究情况,最后阐述现有时空轨迹序列模式挖掘方法存在的问题,并展望时空轨迹序列模式挖掘方法未来的发展趋势。 展开更多
关键词 时空轨迹数据 轨迹序列模式挖掘 位置模式 周期模式 语义模式
在线阅读 下载PDF
基于多维频繁序列挖掘的攻击轨迹识别方法 被引量:3
11
作者 李洪成 吴晓平 俞艺涵 《海军工程大学学报》 CAS 北大核心 2018年第1期40-45,共6页
针对传统攻击轨迹识别方法处理时序数据效率较低且无法全面反映告警各维属性变化规律的不足,首先基于前缀-投影思想,设计了不产生候选集的频繁告警属性序列挖掘算法;然后,利用时间窗分割全局攻击类型序列和全局攻击目标序列,挖掘出网络... 针对传统攻击轨迹识别方法处理时序数据效率较低且无法全面反映告警各维属性变化规律的不足,首先基于前缀-投影思想,设计了不产生候选集的频繁告警属性序列挖掘算法;然后,利用时间窗分割全局攻击类型序列和全局攻击目标序列,挖掘出网络中频繁攻击行为序列和频繁攻击目标序列,并利用目的IP分割全局攻击类型序列,挖掘出针对单个主机的组合攻击模式,进而全面识别网络和主机上的攻击轨迹;最后,在典型分布式拒绝服务攻击场景LLDoS1.0inside的流量数据集中验证了以上方法的有效性。 展开更多
关键词 入侵检测 攻击轨迹识别 频繁序列挖掘 多维关联 序列分割
在线阅读 下载PDF
基于最大频繁序列模式挖掘的App-DDoS攻击的异常检测 被引量:7
12
作者 李锦玲 汪斌强 《电子与信息学报》 EI CSCD 北大核心 2013年第7期1739-1745,共7页
为了动态、准确、高效地描述用户的访问行为,实现对不同应用层分布式拒绝服务(Application-layerDistributed Denial of Service,App-DDoS)攻击行为的透明检测,该文提出基于最大频繁序列模式挖掘的ADA_MFSP(App-DDoS Detection Algorith... 为了动态、准确、高效地描述用户的访问行为,实现对不同应用层分布式拒绝服务(Application-layerDistributed Denial of Service,App-DDoS)攻击行为的透明检测,该文提出基于最大频繁序列模式挖掘的ADA_MFSP(App-DDoS Detection Algorithm based on Maximal Frequent Sequential Pattern mining)检测模型。该模型在对正常Web访问序列数据库(Web Access Sequence Database,WASD)及待检测WASD进行最大频繁序列模式挖掘的基础上,引入序列比对平均异常度,联合浏览时间平均异常度、请求循环平均异常度等有效检测属性,最终实现攻击行为的异常检测。实验证明:ADA_MFSP模型不仅能有效检测各类App-DDoS攻击,且有良好的检测灵敏度。 展开更多
关键词 应用层分布式拒绝服务攻击 检测模型 频繁序列模式挖掘 异常度
在线阅读 下载PDF
基于包含索引的频繁闭序列模式挖掘的新算法 被引量:1
13
作者 李晋宏 杨炳儒 +1 位作者 宋威 侯伟 《系统工程与电子技术》 EI CSCD 北大核心 2009年第10期2485-2488,共4页
频繁闭序列模式惟一确定全体频繁序列模式,且规模小得多。传统的闭序列模式挖掘算法对每个频繁项目都进行扩展,往往会产生大量的非闭合序列。为解决这一问题,提出了一种新的基于包含索引的频繁闭序列模式挖掘算法,其主要思想是只对闭项... 频繁闭序列模式惟一确定全体频繁序列模式,且规模小得多。传统的闭序列模式挖掘算法对每个频繁项目都进行扩展,往往会产生大量的非闭合序列。为解决这一问题,提出了一种新的基于包含索引的频繁闭序列模式挖掘算法,其主要思想是只对闭项集进行扩展,大大减少了非闭合序列的产生。首先,论证了闭序列模式只能由闭项集组成;其次,说明了如何利用包含索引来快速发现闭项集;最后,给出了一种深度优先的挖掘频繁闭序列模式的新算法。实验结果表明,该算法具有较高的效率。 展开更多
关键词 数据挖掘 频繁闭项集 频繁序列模式 包含索引
在线阅读 下载PDF
基于偏序压缩技术的频繁序列模式数据挖掘 被引量:1
14
作者 程舒通 徐从富 但红卫 《计算机工程与应用》 CSCD 北大核心 2008年第3期192-194,共3页
基于频繁序列模式的压缩技术旨在提高数据挖掘结果的可用性和可理解性,从庞大的序列模式中发现有用的知识。分析了现有频繁模式压缩算法的不足,提出了在模式聚类函数的基础上生成一个压缩的偏序(Partial Order)的算法,实验结果显示该算... 基于频繁序列模式的压缩技术旨在提高数据挖掘结果的可用性和可理解性,从庞大的序列模式中发现有用的知识。分析了现有频繁模式压缩算法的不足,提出了在模式聚类函数的基础上生成一个压缩的偏序(Partial Order)的算法,实验结果显示该算法可以对频繁序列模式进行高效,高质量的压缩,可以得到数量更少、信息量更大的模式,从而提高发现的频繁访问序列的兴趣性。 展开更多
关键词 数据挖掘 频繁序列模式 偏序 压缩
在线阅读 下载PDF
挖掘语义轨迹频繁模式及拼车应用研究 被引量:5
15
作者 刘春 周燕 李鑫 《计算机工程与应用》 CSCD 北大核心 2019年第15期96-103,共8页
现有各种轨迹分析主要利用聚类方法从多用户轨迹中挖掘公共停留点、计算用户相似度以发现热点、提取近似人群的公共属性,对同一用户计算相似度也无商业价值,因此很少对单用户轨迹分析展开研究。提出了基于地点语义的个体用户轨迹频繁模... 现有各种轨迹分析主要利用聚类方法从多用户轨迹中挖掘公共停留点、计算用户相似度以发现热点、提取近似人群的公共属性,对同一用户计算相似度也无商业价值,因此很少对单用户轨迹分析展开研究。提出了基于地点语义的个体用户轨迹频繁模式挖掘方法。先逆地理编码求得语义轨迹并进行预处理从而求取Top-k候选频繁地点项集,进而采用时空序列求交集和分治归并方法,将长项集的频繁迭代计算转化为分层集合正则运算,从而求出频繁序列超集和子集。这种语义轨迹频繁模式挖掘能主动识别和发掘潜在的拼车需求,为共享拼车、HOV车道出行等基于位置的智能推荐提供更高的精准度。仿真拼车实验结果证明了该方法的适用性和高效性。 展开更多
关键词 语义轨迹 频繁模式 数据挖掘 拼车
在线阅读 下载PDF
基于改进FP-Tree的Web频繁序列模式挖掘技术 被引量:1
16
作者 谭小球 徐妙君 张建科 《浙江海洋学院学报(自然科学版)》 CAS 2005年第3期284-288,共5页
WebLog挖掘的基本思想是将数据挖掘技术应用于Web服务器的日志文件,且客户对服务器的访问模式是一种序列模式。本文在基于一种简化站点结构的基础上,构造并改进FP-Tree,该结构有较好的伸缩性,在其上实施频繁序列模式挖掘,具有较理想的... WebLog挖掘的基本思想是将数据挖掘技术应用于Web服务器的日志文件,且客户对服务器的访问模式是一种序列模式。本文在基于一种简化站点结构的基础上,构造并改进FP-Tree,该结构有较好的伸缩性,在其上实施频繁序列模式挖掘,具有较理想的效率。 展开更多
关键词 数据挖掘 WebLog挖掘 FP-TREE 频繁序列模式
在线阅读 下载PDF
近似到达时间约束下的语义轨迹频繁模式挖掘 被引量:6
17
作者 吴瑕 唐祖锴 +2 位作者 祝园园 彭煜玮 彭智勇 《软件学报》 EI CSCD 北大核心 2018年第10期3184-3204,共21页
随着GPS定位技术的不断发展与智能移动设备的普及,轨迹数据的获取变得越来越容易,同时,轨迹数据相关应用的需求也逐渐增多.在轨迹数据上加入语义信息,可以得到体积较小、质量较高、能够更好地反映用户行为的语义轨迹,在其上实现旅游线... 随着GPS定位技术的不断发展与智能移动设备的普及,轨迹数据的获取变得越来越容易,同时,轨迹数据相关应用的需求也逐渐增多.在轨迹数据上加入语义信息,可以得到体积较小、质量较高、能够更好地反映用户行为的语义轨迹,在其上实现旅游线路推荐、路线预测、用户生活模式挖掘、朋友推荐等应用,可以更好地满足用户需求.挖掘语义轨迹的频繁模式是实现这些应用的技术基础,而在很多情况下,用户对语义轨迹频繁模式常存在到达时间方面的需求,比如按特定时间游玩热门景点的同时需要按时到达车站候车.现有的语义轨迹模式挖掘方法大多没有考虑到达时间的约束,挖掘出的频繁模式缺少到达时间信息;少数方法考虑了精确的到达时间,但因为约束太强会导致无法挖掘到频繁的模式.因此,首次对近似到达时间约束下的语义轨迹频繁模式(approximatearrival-time constrained frequent pattern,简称AAFP)挖掘方法进行了研究,并给出了其形式化定义;通过时间轴划分提出了挖掘AAFP的基线算法,并通过建立索引AAP-tree提出了改进后的高效、灵活的AAFP挖掘算法;之后提出了信息熵增量公式,并给出了时间轴划分及AAP-tree的高效维护方法;最后在真实数据集上进行实验,验证了方法的有效性及高效性. 展开更多
关键词 轨迹数据 语义轨迹 近似到达时间 轨迹频繁模式 频繁模式挖掘
在线阅读 下载PDF
基于不确定数据的可能频繁闭序列模式挖掘 被引量:7
18
作者 李立波 白树仁 +1 位作者 陈磊 张威 《计算机应用研究》 CSCD 北大核心 2016年第4期983-988,共6页
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCS... 对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。 展开更多
关键词 不确定数据 可能频繁序列模式 概率频繁 不确定数据挖掘 序列模式 序列模式增长
在线阅读 下载PDF
本地化差分隐私下的频繁序列模式挖掘算法PrivSPM 被引量:5
19
作者 黄硕 李艳辉 曹建秋 《计算机应用》 CSCD 北大核心 2023年第7期2057-2064,共8页
序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP... 序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。 展开更多
关键词 本地化差分隐私 隐私保护 频繁序列模式挖掘 指数机制 数据挖掘
在线阅读 下载PDF
带通配符和One-Off条件的序列模式挖掘 被引量:23
20
作者 吴信东 谢飞 +2 位作者 黄咏明 胡学钢 高隽 《软件学报》 EI CSCD 北大核心 2013年第8期1804-1815,共12页
很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,... 很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA序列上的实验结果表明,One-Off Mining比相关的序列模式挖掘算法具有更好的时间性能和完备性. 展开更多
关键词 数据挖掘 序列模式挖掘 频繁模式 通配符 One-Off条件
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部