期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
面向时间有序事务数据的聚簇频繁模式挖掘
1
作者 王少鹏 牛超煜 《软件学报》 北大核心 2025年第5期2342-2361,共20页
首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可... 首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可以利用定义的参数minCF,有效减少挖掘结果的搜索空间,另一方面可以参考(n–1)项集的判别结果加速聚簇频繁n项集的判别过程,算法还使用了ICFPM-list结构来减少候选n项集的构建开销.基于两个真实世界数据集的仿真实验证明了ICFPM算法的有效性,与Naive算法相比,ICFPM算法在时间和空间效率方面得到了大幅度的提高,是解决聚簇频繁模式挖掘的有效方法. 展开更多
关键词 时间有序事务数据 聚簇 频繁模式 数据挖掘 向下闭包
在线阅读 下载PDF
一种有效的差分隐私事务数据发布策略 被引量:13
2
作者 欧阳佳 印鉴 +1 位作者 刘少鹏 刘玉葆 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2195-2205,共11页
近年来,隐私保护事务数据发布得到了研究者的广泛关注.事务数据的稀疏性导致个体隐私保护与数据效用性之间很难达到平衡.目前已有的方法大多是基于分组的匿名模型,但该类模型依赖于攻击者背景知识,且发布的数据无法满足事务数据分析任... 近年来,隐私保护事务数据发布得到了研究者的广泛关注.事务数据的稀疏性导致个体隐私保护与数据效用性之间很难达到平衡.目前已有的方法大多是基于分组的匿名模型,但该类模型依赖于攻击者背景知识,且发布的数据无法满足事务数据分析任务的需要.针对事务数据隐私保护发布的数据安全性与效用性不足,基于差分隐私与压缩感知理论,提出一种有效的面向应用的事务数据发布策略(transaction data publish strategy,TDPS).首先构建事务数据库的完整Trie项集树,然后基于压缩感知技术对项集树添加满足差分隐私约束的噪音得到含噪Trie项集树,最后在含噪树上进行频繁项集挖掘任务.实验结果表明,TDPS不仅能很好地保护隐私,而且能有效保持数据效用性,满足事务数据分析任务对数据质量的要求. 展开更多
关键词 隐私保护 差分隐私 事务数据 TRIE树 压缩感知
在线阅读 下载PDF
一种分布式事务数据的差分隐私发布策略 被引量:7
3
作者 欧阳佳 印鉴 刘少鹏 《软件学报》 EI CSCD 北大核心 2015年第6期1457-1472,共16页
目前隐私保护的事务数据发布研究多是基于集中式结构.针对分布式结构下事务数据发布问题,为保护数据隐私,同时最大化数据效用,提出一种满足差分隐私约束的发布策略.首先,将结果效用性优化与差分隐私约束相结合,构建分布式非线性规划模型... 目前隐私保护的事务数据发布研究多是基于集中式结构.针对分布式结构下事务数据发布问题,为保护数据隐私,同时最大化数据效用,提出一种满足差分隐私约束的发布策略.首先,将结果效用性优化与差分隐私约束相结合,构建分布式非线性规划模型.然后,基于全局与局部数据设计两种解决方案安全求解该分布式模型.理论分析与实验结果均表明,所提出的发布策略是安全的且满足差分隐私要求,具有很好的实用性. 展开更多
关键词 隐私保护 差分隐私 分布式结构 事务数据发布 优化
在线阅读 下载PDF
Shared-nothing并行事务数据库系统中规则的挖掘与更新算法 被引量:3
4
作者 朱玉全 陈耿 +1 位作者 宋余庆 孙志挥 《小型微型计算机系统》 CSCD 北大核心 2003年第8期1499-1502,共4页
关联规则是数据挖掘中的一个重要研究内容 .本文提出了 Shared- nothing并行事务数据库系统 (简称SNPDBS)中一种快速的关联规则挖掘算法 SNPMAR,并考虑当最小支持度发生变化后 SNPDBS中关联规则的高效更新问题 ,提出了一种有效的关联规... 关联规则是数据挖掘中的一个重要研究内容 .本文提出了 Shared- nothing并行事务数据库系统 (简称SNPDBS)中一种快速的关联规则挖掘算法 SNPMAR,并考虑当最小支持度发生变化后 SNPDBS中关联规则的高效更新问题 ,提出了一种有效的关联规则更新算法 SNPIUA. 展开更多
关键词 数据挖掘 关联规则 shared—nothing 并行事务数据库系统 增量式更新
在线阅读 下载PDF
点击流中事务数据模型的设计与实现 被引量:3
5
作者 辛燕 鞠时光 +1 位作者 蔡涛 阎星娥 《计算机科学》 CSCD 北大核心 2003年第7期73-76,共4页
In this paper, we first briefly introduce the concepts of clickstream data and data warehouse, analyze twoexisting clickstream star schema click star schema and session star schema in webhouse, then induce a new mod-e... In this paper, we first briefly introduce the concepts of clickstream data and data warehouse, analyze twoexisting clickstream star schema click star schema and session star schema in webhouse, then induce a new mod-el transaction star model based on them, and expressed the method of bringing out the model. Comparing withthe two schemas mentioned above, its most apparent speciality is that it includes a series of meaningful page-view se-quence rather than a single click. Thus, on the one hand it improves the query performance of data, on the other handit is in favor of executing more deepen analysis data mining, and simplifies the process of data pretreatment. Atlast ,the paper verifies its' feasibility and validity using association rules based on the model. 展开更多
关键词 数据仓库 数据模型 数据挖掘 数据 事务数据模型 设计 点击流数据
在线阅读 下载PDF
大型事务数据库中的一种快速的规则挖掘算法 被引量:4
6
作者 朱玉全 孙志挥 《计算机科学》 CSCD 北大核心 2002年第10期59-60,69,共3页
1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘... 1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘算法一般都分为两个阶段:①频繁项目集的发现;②规则的产生。算法的计算工作量主要集中在第一阶段上,因此,如何快速确定频繁项目集是算法效率的关键,在这方面已有许多工作与成果。但总的来讲,许多研究都是在Apriori算法或其派生算法的基础上进行的。这些算法或多或少存在如下两个问题:①算法必须耗费大量的时间处理规模巨大的候选项目集; 展开更多
关键词 大型事务数据 规则挖掘算法 数据挖掘 知识发现
在线阅读 下载PDF
基于事务数据库的关联规则采掘算法研究 被引量:5
7
作者 向阳 张巍 《山东科技大学学报(自然科学版)》 CAS 2001年第2期55-59,共5页
采掘关联规则是知识发现领域的一个重要问题 ,文中对采掘关联规则问题进行了简单的回顾 ,分析了传统的关联规则Apriori算法的优缺点 ,设计了一种基于事务数据库的快速采掘算法TB -MA。实例证明 ,与Apriori算法相比 ,TB -MA算法削减了数... 采掘关联规则是知识发现领域的一个重要问题 ,文中对采掘关联规则问题进行了简单的回顾 ,分析了传统的关联规则Apriori算法的优缺点 ,设计了一种基于事务数据库的快速采掘算法TB -MA。实例证明 ,与Apriori算法相比 ,TB -MA算法削减了数据库遍历次数 ,提高了采掘效率 。 展开更多
关键词 关联规则 频繁集 可辨识向量 可辨识矩阵 事务数据 数据采掘 知识发现 TB-MA算法
在线阅读 下载PDF
面向关系-事务数据的数据匿名方法 被引量:4
8
作者 龚奇源 杨明 罗军舟 《软件学报》 EI CSCD 北大核心 2016年第11期2828-2842,共15页
在发布同时包含关系和事务属性的数据(简称为关系-事务数据)时,由于关系数据和事务数据均有可能受到链接攻击,需要同时匿名这两部分的数据.现有的数据匿名技术在匿名化关系-事务数据时会造成严重的数据缺损,无法保障数据可用性.针对此问... 在发布同时包含关系和事务属性的数据(简称为关系-事务数据)时,由于关系数据和事务数据均有可能受到链接攻击,需要同时匿名这两部分的数据.现有的数据匿名技术在匿名化关系-事务数据时会造成严重的数据缺损,无法保障数据可用性.针对此问题,提出了(k,l)-多样化模型,通过等价类上的l-多样化约束和事务数据上的k-匿名约束来保证用户隐私不被泄露.在此基础上,设计并实现了APA和PAA两种满足该模型的匿名算法,以不同的顺序对关系-事务数据进行匿名,并提出了相应的数据缺损评估方法.实际公开数据集上的实验结果表明,与现有的数据匿名技术相比,APA和PAA能够在保护用户隐私的前提下,以更低的数据缺损和更高的效率完成对关系-事务数据的匿名. 展开更多
关键词 数据匿名 隐私泄露 K-匿名 l-多样化 关系-事务数据
在线阅读 下载PDF
面向频繁项集挖掘的本地差分隐私事务数据收集方法 被引量:10
9
作者 欧阳佳 印鉴 +4 位作者 肖政宏 赵慧民 刘少鹏 梁鹏 肖茵茵 《软件学报》 EI CSCD 北大核心 2021年第11期3541-3562,共22页
事务数据常见于各种应用场景中,如购物记录、页面浏览历史等.为了提供更好的服务,服务提供商收集用户数据并进行分析,但收集事务数据会泄露用户的隐私信息.为了解决上述问题,基于压缩的本地差分隐私模型,提出一种事务数据收集方法.首先... 事务数据常见于各种应用场景中,如购物记录、页面浏览历史等.为了提供更好的服务,服务提供商收集用户数据并进行分析,但收集事务数据会泄露用户的隐私信息.为了解决上述问题,基于压缩的本地差分隐私模型,提出一种事务数据收集方法.首先,定义了一种新的候选项集分值函数;其次,基于该函数,将候选项集的样本空间划分为多个子空间;然后,随机选择其中一个子空间,基于该子空间随机生成事务数据并发送给不可信的数据收集者;最后,考虑到隐私参数的设置问题,基于最大后验置信度攻击模型设计启发式隐私参数设置策略.理论分析表明,该方法能够同时保护事务数据的长度与内容,满足压缩的本地差分隐私要求.实验结果表明,与目前最优的工作相比,所收集的数据具有更高的效用性,隐私参数设置更具有语义性. 展开更多
关键词 隐私保护 数据收集 事务数据 本地差分隐私 隐私参数
在线阅读 下载PDF
面向事务型数据隐私保护的p-剖分l-多样化算法 被引量:1
10
作者 吴英杰 王一蕾 +1 位作者 廖尚斌 王晓东 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第5期551-558,共8页
目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算... 目前关于隐私保护数据发布的研究大多是面向低维的关系型数据,其相关模型及算法无法直接用于解决稀疏的高维事务型数据发布中可能存在的隐私泄露问题.本文以剖分技术为基础,设计出一个面向隐私保护事务型数据发布的p-剖分l-多样化匿名算法.算法通过计算事务型数据中属性间的均方列联系数将高维属性集剖分成互不相交的p个属性子集,而后对事务型数据进行记录划分,使记录划分后的事务型数据关于p个属性子集满足l-多样化的要求.实验对匿名前后事务型数据的关联规则挖掘结果进行比较分析.理论分析和实验结果表明,本文的算法可安全地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高. 展开更多
关键词 隐私保护 事务数据 p-剖分 l-多样化 关联规则挖掘
在线阅读 下载PDF
数据挖掘中事务性数据库的压缩及其应用 被引量:5
11
作者 朱建平 张润楚 《统计研究》 CSSCI 北大核心 2004年第1期38-44,共7页
The author combines statistical thoughts with coarse aggregate theory,statistically describes affair data bank system, forwards the method of compressing affair data bank,and further conducts data mining regarding con... The author combines statistical thoughts with coarse aggregate theory,statistically describes affair data bank system, forwards the method of compressing affair data bank,and further conducts data mining regarding consumption information of mobile telecommunication subscriber by using the method. 展开更多
关键词 数据挖掘 事务数据 ROUGH集 列联关系 数据压缩 中国移动手机用户 缴费情况数据
在线阅读 下载PDF
基于多代理的数据库并行事务处理模型 被引量:5
12
作者 赵一江 邵定宏 《计算机工程与设计》 CSCD 北大核心 2011年第1期206-209,共4页
为了优化一般数据库管理系统的事务处理能力,提出了一种数据库事务并行处理算法。基于多代理技术,建立了一种数据库并行事务处理模型,该模型可以自动识别数据库事务的类别并分配相应的事务代理。通过多代理工具Jade实现了该模型中如事... 为了优化一般数据库管理系统的事务处理能力,提出了一种数据库事务并行处理算法。基于多代理技术,建立了一种数据库并行事务处理模型,该模型可以自动识别数据库事务的类别并分配相应的事务代理。通过多代理工具Jade实现了该模型中如事务类型的判别、事务代理的分配、代理的事务处理、结果的返回等基本功能。仿真实验结果表明,对比于传统的单任务事务处理方式,该模型是一种提高数据库事务处理能力的有效方案。 展开更多
关键词 多代理 并行事务 数据事务 事务优化 多代理软件
在线阅读 下载PDF
传感器网络中协作实时数据库事务的提交控制 被引量:4
13
作者 胡侃 刘云生 《计算机学报》 EI CSCD 北大核心 2007年第6期916-923,共8页
传统的事务模型由于其严格的ACID特性无法适应传感器网络中协作事务的实时性要求.因此着重研究传感器网络中协作实时数据库事务的提交机制.首先,分析传感器网络中实时数据库应用的协作特性,放松事务的严格ACID要求,运用控制区域的概念... 传统的事务模型由于其严格的ACID特性无法适应传感器网络中协作事务的实时性要求.因此着重研究传感器网络中协作实时数据库事务的提交机制.首先,分析传感器网络中实时数据库应用的协作特性,放松事务的严格ACID要求,运用控制区域的概念提出一种基于事务的行为语义控制区域的事务模型.然后,给出该模型的提交、回滚、可见规则及能保证数据库一致性和协作事务实时性的三阶段提交协议,并通过补偿事务保证外化信息准确性.性能测试表明,该模型及提交机制提高了采集数据的外化率和协作实时事务的成功率. 展开更多
关键词 实时数据事务 事务模型 协作事务提交 数据 无线传感器网络
在线阅读 下载PDF
一种多数据库事务模型 被引量:6
14
作者 肖卫军 卢正鼎 +1 位作者 李兵 李瑞轩 《小型微型计算机系统》 CSCD 北大核心 2003年第12期2224-2227,共4页
分析了多数据库系统中事务的特征 ,给出了多数据事务和事务经历的形式化描述 .在此基础上 ,提出了多数据库事务正确性标准MDB 可串行化 ,最后给出了基于MSG图的多数据库串行化定理 .
关键词 数据库形式化模型 MDB-可串行化 MSG图 数据库串行化定理 数据事务模型 异构数据
在线阅读 下载PDF
面向数据库的持久化事务内存 被引量:2
15
作者 Hillel Avni 王鹏 《计算机研究与发展》 EI CSCD 北大核心 2018年第2期305-318,共14页
硬件事务内存(hardware transactional memory,HTM)和可字节寻址的非易失性内存(nonvolatile memory,NVM)已经可以在新的计算机设备中使用.使用HTM确保一致性和隔离性,使用NVM确保持久性,组合使用两者可以实现满足原子性、一致性、隔离... 硬件事务内存(hardware transactional memory,HTM)和可字节寻址的非易失性内存(nonvolatile memory,NVM)已经可以在新的计算机设备中使用.使用HTM确保一致性和隔离性,使用NVM确保持久性,组合使用两者可以实现满足原子性、一致性、隔离性和持久性(atomicity,consistency,isolation and durability,ACID)特性的事务.ACID事务在数据库中非常有价值,但由于数据库事务通常较大,其面临的挑战是HTM固有的容量限制和争用水平.首先提出了一种通过HTM进行ACID事务处理的软硬件解决方案——持久化HTM(persistent HTM,PHTM).使用2种方法来消除PHTM的局限性:1)持久化混合事务内存(persistent hybrid TM,PHyTM),允许PHTM事务与支持任意大小的纯软件事务(software transactional memory,STM)并发执行;2)分离事务执行(split transaction execution,STE)算法,该算法为关系数据库事务量身定制,解决了大多数事务超过PHTM的容量限制的问题.简而言之,讨论了利用NVM将HTM扩展到ACID数据库事务的问题. 展开更多
关键词 硬件事务内存 非易失性内存 数据事务 多核 共享内存 ACID特性 一致性
在线阅读 下载PDF
基于DWF、数据事务和PRO*C的可视化系统的研究与实现
16
作者 马宝 刘渊 冷文浩 《船海工程》 北大核心 2008年第1期135-138,共4页
在船舶数据可视化系统中,引入新技术Autodesk DWF开发3D船舶图形,应用JNI技术对图形进行集成,利用PRO*C技术以及Hibernate、视图等技术来对数据进行处理,同时利用数据事务对系统的安全进行保护。
关键词 AUTODESK DWF 数据事务 可视化 JAVA本地接口 PRO*C
在线阅读 下载PDF
基于数据库事务的不变式推导
17
作者 曾虹驰 彭鑫 赵文耘 《计算机科学》 CSCD 北大核心 2017年第11期91-97,共7页
作为数据处理和并发控制的基本单位,数据库事务被广泛应用于软件系统的业务逻辑中。通过收集运行时数据库事务中的数据,推导这些数据之间满足的不变式,建立相应的数据契约关系,是软件维护过程中对系统的内部状态进行监控的重要方法之一... 作为数据处理和并发控制的基本单位,数据库事务被广泛应用于软件系统的业务逻辑中。通过收集运行时数据库事务中的数据,推导这些数据之间满足的不变式,建立相应的数据契约关系,是软件维护过程中对系统的内部状态进行监控的重要方法之一。目前,在不变式推导领域,主要的方法和工具都是基于代码进行分析的,缺少与基于数据分析相关的研究和成果。为了解决这一问题,首先提出了基于数据的推导代数等式形式的不变式的算法,然后设计并实现了基于数据库事务的不变式推导的原型工具,最后通过相关实验分析和验证了原型工具的有效性。实验结果表明,原型工具有良好的推导准确率和运行性能,能够弥补现有工具和方法在基于数据的分析领域的不足。 展开更多
关键词 数据事务 不变式推导 代数等式
在线阅读 下载PDF
Web使用模式研究中的数据挖掘 被引量:55
18
作者 张娥 冯秋红 +1 位作者 宣慧玉 田增瑞 《计算机应用研究》 CSCD 北大核心 2001年第3期80-83,共4页
Web使用模式挖掘是利用Web使用数据的高级手段,是对Web使用数据的深层次分析,从而挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的知识,以帮助管理决策。综述了Web使用模式的数据挖掘研究技术的内容、现状和研究的方向。
关键词 数据挖掘 事务数据 WEB 用户访问模式 INTERNET
在线阅读 下载PDF
基于数据库约简的关联规则挖掘算法 被引量:9
19
作者 刘培奇 李增智 +2 位作者 王云岚 朱海萍 赵银亮 《西安交通大学学报》 EI CAS CSCD 北大核心 2003年第8期836-839,共4页
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简... 通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法AprioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.AprioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中. 展开更多
关键词 数据库约简 关联规则 频繁项集 事务数据
在线阅读 下载PDF
一种基于时间衰减模型的数据流闭合模式挖掘方法 被引量:16
20
作者 韩萌 王志海 原继东 《计算机学报》 EI CSCD 北大核心 2015年第7期1473-1483,共11页
数据流是随着时间顺序快速变化的和连续的,对其进行频繁模式挖掘时会出现概念漂移现象.在一些数据流应用中,通常认为最新的数据具有最大的价值.数据流挖掘会产生大量无用的模式,为了减少无用模式且保证无损压缩,需要挖掘闭合模式.因此,... 数据流是随着时间顺序快速变化的和连续的,对其进行频繁模式挖掘时会出现概念漂移现象.在一些数据流应用中,通常认为最新的数据具有最大的价值.数据流挖掘会产生大量无用的模式,为了减少无用模式且保证无损压缩,需要挖掘闭合模式.因此,提出了一种基于时间衰减模型和闭合算子的数据流闭合模式挖掘方式TDMCS(Time-Decay-Model-based Closed frequent pattern mining on data Stream).该算法采用时间衰减模型来区分滑动窗口内的历史和新近事务权重,使用闭合算子提高闭合模式挖掘的效率,设计使用最小支持度-最大误差率-衰减因子的三层架构避免概念漂移,设计一种均值衰减因子平衡算法的高查全率和高查准率.实验分析表明该算法适用于挖掘高密度、长模式的数据流;且具有较高的效率,在不同大小的滑动窗口条件下性能表现是稳态的,同时也优于其他同类算法. 展开更多
关键词 事务数据 数据流挖掘 频繁模式挖掘 闭合模式挖掘 时间衰减模型 概念漂移
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部