期刊文献+
共找到173篇文章
< 1 2 9 >
每页显示 20 50 100
熔盐堆钍铀、铀钚燃料循环核数据不确定度分析 被引量:1
1
作者 胡继峰 王小鹤 +3 位作者 伍建辉 蔡翔舟 韩建龙 陈金根 《原子能科学技术》 EI CAS CSCD 北大核心 2018年第7期1206-1213,共8页
反应堆物理设计不确定度是第4代核能系统的QMU(quantification of margins and uncertainties)有效性认证所必须的参数之一,核数据不确定度是其重要来源。基于自主开发的耦合程序BUND(burnup uncertainty of nuclear data),将SCALE程序T... 反应堆物理设计不确定度是第4代核能系统的QMU(quantification of margins and uncertainties)有效性认证所必须的参数之一,核数据不确定度是其重要来源。基于自主开发的耦合程序BUND(burnup uncertainty of nuclear data),将SCALE程序TRITON和TSUNAMI-3D模块耦合,完成了熔盐堆钍铀燃料循环、铀钚燃料循环核数据引起的有效增殖因数keff不确定度分析,并与ENDF/B-Ⅶ.1协方差数据库计算结果进行了对比。结果显示:初始时刻,两种燃料循环模式下,核数据导致的keff不确定度分别为0.490%和0.582%。随燃耗的增加,核数据引起的keff不确定度增加。寿期末,两种燃料循环模式下,对keff不确定度影响显著增加的反应道分别为239Pu(nubar)、(n,f)、(n,γ)、105 Rh(n,γ)、135 Xe(n,γ)和234 U(n,γ)、143 Nd(n,γ)、131,135 Xe(n,γ)等。 展开更多
关键词 数据不确定 钍铀燃料循环 铀钚燃料循环 熔盐堆
在线阅读 下载PDF
数据不确定条件下安全仪表系统SIL等级验证方法研究 被引量:11
2
作者 付建民 李成美 +3 位作者 东静波 熊涛 张洪杰 李宏浩 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第3期129-135,共7页
为减小数据缺失或数据不确定对安全完整性等级(SIL)验证结果的影响,引入基于有限差分法的参数重要度评估方法,分别对低要求操作模式及高要求操作模式下的多个典型冗余结构进行参数重要度计算,对SIL验证所需参数进行重要度排序,并通过Mon... 为减小数据缺失或数据不确定对安全完整性等级(SIL)验证结果的影响,引入基于有限差分法的参数重要度评估方法,分别对低要求操作模式及高要求操作模式下的多个典型冗余结构进行参数重要度计算,对SIL验证所需参数进行重要度排序,并通过Monte-Carlo方法对重要参数进行仿真,建立数据不确定条件下的SIL验证评估方法,并以某分液系统为例进行SIL验证。结果表明:该数据不确定性条件下的SIL验证方法能够结合工程实际完成安全仪表系统的SIL等级评估,并能有效减小数据缺乏等不确定性因素对SIL验证结果的影响。 展开更多
关键词 数据不确定 安全完整性等级 MONTE-CARLO模拟 安全仪表系统 敏感性分析
在线阅读 下载PDF
基于数据不确定性的变压器故障诊断研究
3
作者 杨杰明 沈胜楠 +2 位作者 董玉坤 曲朝阳 刘志颖 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2017年第3期57-60,共4页
针对采集的变压器油中溶解气体数据的波动性和不确定性,通过引入蒙特卡洛算法进行数据处理.根据油中溶解气体试验,将处理后的变压器油中溶解气体数据进行两两比值.分别根据变压器运行规程、DGA知识以及模糊c均值聚类法对气体含量和比值... 针对采集的变压器油中溶解气体数据的波动性和不确定性,通过引入蒙特卡洛算法进行数据处理.根据油中溶解气体试验,将处理后的变压器油中溶解气体数据进行两两比值.分别根据变压器运行规程、DGA知识以及模糊c均值聚类法对气体含量和比值进行离散化处理,再进行属性约简,并将约简结果作为神经网络的前置输入,对神经网络训练及故障进行诊断.实验结果表明,该方法可以对变压器故障进行准确判定,具有更好的工程实用性. 展开更多
关键词 不确定数据 蒙特卡洛 粗糙集 神经网络
在线阅读 下载PDF
不确定数据查询处理 被引量:21
4
作者 蒋涛 高云君 +2 位作者 张彬 周傲英 乐光学 《电子学报》 EI CAS CSCD 北大核心 2013年第5期966-976,共11页
数据的不确定性在现实世界中的经济、军事、物流、金融、电信等领域普遍存在.不确定数据广泛应用于环境维护、市场分析、基于位置的服务LBS以及数量经济研究等应用.由于这些应用的重要性以及收集和累积的不确定数据数量的快速增长,查询... 数据的不确定性在现实世界中的经济、军事、物流、金融、电信等领域普遍存在.不确定数据广泛应用于环境维护、市场分析、基于位置的服务LBS以及数量经济研究等应用.由于这些应用的重要性以及收集和累积的不确定数据数量的快速增长,查询这些数据已经成为一个重要的任务,并日益受到广大数据库研究者的关注.本文介绍了不确定数据查询的基本原理,并对不确定数据的近邻查询、逆向近邻查询、排序查询、Top-k查询以及连接查询进行了详细的讨论.同时对这些技术的优缺点进行了分析、对比.最后给出了未来的研究方向. 展开更多
关键词 不确定数据 近邻 逆向近邻 连接 查询处理
在线阅读 下载PDF
不确定性数据管理技术研究综述 被引量:185
5
作者 周傲英 金澈清 +1 位作者 王国仁 李建中 《计算机学报》 EI CSCD 北大核心 2009年第1期1-16,共16页
随着数据采集和处理技术的进步,人们对数据的不确定性的认识也逐步深入.在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据... 随着数据采集和处理技术的进步,人们对数据的不确定性的认识也逐步深入.在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.目前,根据应用特点与数据形式差异,研究者已经提出了多种针对不确定数据的数据模型.这些不确定性数据模型的核心思想都源自于可能世界模型.可能世界模型从一个或多个不确定的数据源演化出诸多确定的数据库实例,称为可能世界实例,而且所有实例的概率之和等于1.尽管可以首先分别为各个实例计算查询结果,然后合并中间结果以生成最终查询结果,但由于可能世界实例的数量远大于不确定性数据库的规模,这种方法并不可行.因此,必须运用排序、剪枝等启发式技术设计新型算法,以提高效率.文中介绍了不确定性数据管理技术的概念、特点与挑战,综述了数据模型、数据预处理与集成、存储与索引、查询处理等方面的工作. 展开更多
关键词 不确定数据 可能世界模型 数据集成 世系 不确定数据
在线阅读 下载PDF
不确定数据频繁项集挖掘方法综述 被引量:19
6
作者 汪金苗 张龙波 +2 位作者 邓齐志 王凤英 王勇 《计算机工程与应用》 CSCD 北大核心 2011年第20期121-125,共5页
近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基... 近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基本算法,分析了在此基础上提出的适用于不确定数据以及不确定数据流的频繁项集挖掘的方法,并探讨了今后可能的研究方向。 展开更多
关键词 不确定数据 频繁项集 数据挖掘
在线阅读 下载PDF
不确定数据查询技术研究 被引量:17
7
作者 王意洁 李小勇 +1 位作者 祁亚斐 孙伟东 《计算机研究与发展》 EI CSCD 北大核心 2012年第7期1460-1466,共7页
当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用... 当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用,目前已成为数据库和网络计算等领域的一个研究热点.从目前不确定数据查询研究的各种查询类型介绍和查询特点分析出发,主要综述了4种典型的不确定数据查询类型,即不确定Skyline查询、不确定Top-k查询、不确定最近邻(NN)查询以及不确定聚集查询;重点论述了各种不确定数据查询的定义,各类查询的特点,并分类介绍了当前各类不确定数据查询研究的现状和各种查询方法的优缺点;最后,基于当前不确定数据查询技术的最新研究动态指出了未来研究工作的趋势. 展开更多
关键词 不确定数据 查询 SKYLINE TOP-K 最近邻 聚集 数据 概率
在线阅读 下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
8
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
在线阅读 下载PDF
基于不确定数据的频繁项查询算法 被引量:10
9
作者 王爽 杨广明 朱志良 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期344-347,共4页
频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概... 频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低搜索空间,改善在不确定数据上的查询性能. 展开更多
关键词 频繁项 不确定数据 剪枝规则 不确定数据模型 查询处理
在线阅读 下载PDF
一种不确定数据流聚类算法 被引量:34
10
作者 张晨 金澈清 周傲英 《软件学报》 EI CSCD 北大核心 2010年第9期2173-2182,共10页
提出了EMicro算法,以解决不确定数据流上的聚类问题.与现有技术大多仅考虑元组间的距离不同,EMicro算法综合考虑了元组之间的距离与元组自身不确定性这两个因素,同时定义新标准来描述聚类结果质量.还提出了离群点处理机制,系统同时维护... 提出了EMicro算法,以解决不确定数据流上的聚类问题.与现有技术大多仅考虑元组间的距离不同,EMicro算法综合考虑了元组之间的距离与元组自身不确定性这两个因素,同时定义新标准来描述聚类结果质量.还提出了离群点处理机制,系统同时维护两个缓冲区,分别存放正常的微簇与潜在的离群点微簇,以期得到理想的性能.实验结果表明,与现有工作相比,EMicro的效率更高,且效果良好. 展开更多
关键词 不确定数据 聚类 离群点
在线阅读 下载PDF
障碍空间中不确定数据聚类算法 被引量:11
11
作者 曹科研 王国仁 +3 位作者 韩东红 袁野 胡雅超 齐宝雷 《计算机科学与探索》 CSCD 2012年第12期1087-1097,共11页
近些年,由于数据采集的不精确和数据本身的不确定性,使不确定性在位置数据中普通存在。在障碍空间中,聚类不确定数据面临新的挑战。提出了障碍空间中聚类不确定数据的OBS-UK-means(obstacle uncertain K-means)算法,并提出了分别基于R树... 近些年,由于数据采集的不精确和数据本身的不确定性,使不确定性在位置数据中普通存在。在障碍空间中,聚类不确定数据面临新的挑战。提出了障碍空间中聚类不确定数据的OBS-UK-means(obstacle uncertain K-means)算法,并提出了分别基于R树和Voronoi图的两种剪枝策略和最近距离区域的概念,大大减少了计算量。通过实验验证了OBS-UK-means算法的高效性和准确性,同时证明了剪枝策略在不损害聚类有效性的情况下,能够有效地提高聚类效率。 展开更多
关键词 聚类 不确定数据 障碍空间
在线阅读 下载PDF
不确定数据的决策树分类算法 被引量:12
12
作者 李芳 李一媛 王冲 《计算机应用》 CSCD 北大核心 2009年第11期3092-3095,共4页
经典决策树算法不能处理树构建和分类过程中的不确定数据。针对这一局限,将可用于不确定数据表达的证据理论与决策树分类算法相结合,把决策树分类技术扩展到含有不确定数据的环境中。为避免在决策树构建过程中出现组合爆炸问题,引入新... 经典决策树算法不能处理树构建和分类过程中的不确定数据。针对这一局限,将可用于不确定数据表达的证据理论与决策树分类算法相结合,把决策树分类技术扩展到含有不确定数据的环境中。为避免在决策树构建过程中出现组合爆炸问题,引入新的测量算子和聚集算子,提出了D-S证据理论决策树分类算法。实验结果表明,D-S证据理论决策树分类算法能有效地对不确定数据进行分类,有较好的分类准确度,并能有效避免组合爆炸。 展开更多
关键词 决策树 不确定数据 证据理论 数据挖掘 分类
在线阅读 下载PDF
在不确定数据集上挖掘优化的概率干预策略 被引量:6
13
作者 王悦 唐常杰 +4 位作者 杨宁 张悦 李红军 郑皎凌 朱军 《软件学报》 EI CSCD 北大核心 2011年第2期285-297,共13页
提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了... 提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了大量实验比较,验证了所提出的干预策略评价优化算法具有较高精度,效率比朴素方法高出3个数量级,适合在实际系统中处理海量干预评价. 展开更多
关键词 不确定数据 概率干预策略 策略评价 数据挖掘 海量数据分析
在线阅读 下载PDF
大数据环境下的不确定数据流在线分类算法 被引量:9
14
作者 吕艳霞 王翠荣 +1 位作者 王聪 于长永 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第9期1245-1249,共5页
在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法... 在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率. 展开更多
关键词 不确定数据 加权贝叶斯 VFDT 分类算法 数据
在线阅读 下载PDF
不确定数据聚类的U-PAM算法和UM-PAM算法的研究 被引量:7
15
作者 何云斌 张志超 +1 位作者 万静 李松 《计算机科学》 CSCD 北大核心 2016年第6期263-269,共7页
UK-means算法在处理不确定数据时对孤立点非常敏感,而且事先必须已知不确定数据的分布函数或概率密度,然而这在实际中往往很难获得。因此,针对UK-means在处理不确定测量数据时的不足,首先提出了基于区间数的PAM不确定聚类算法——U-PAM... UK-means算法在处理不确定数据时对孤立点非常敏感,而且事先必须已知不确定数据的分布函数或概率密度,然而这在实际中往往很难获得。因此,针对UK-means在处理不确定测量数据时的不足,首先提出了基于区间数的PAM不确定聚类算法——U-PAM,该算法用区间数和标准差合理地描述了不确定测量数据的不确定性,进而完成有效的聚类;其次,针对海量不确定测量数据难以聚类的问题,基于U-PAM聚类算法,采用抽样技术提出了处理海量不确定测量数据的算法——UM-PAM算法,该算法先抽样,对样本数据聚类,然后再总体聚类;最后,基于UPAM算法和CH聚类的有效性指标函数对聚类结果进行分析,以确定最佳聚类数。实验理论表明,所提算法聚类效果明显。关键词不确定数据,区间数,聚类算法,PAM算法和 CH 聚类的有效性指标函数对聚类结果进行分析,以确定最佳聚类数。实验理论表明,所提算法聚类效果明显。 展开更多
关键词 不确定数据 区间数 聚类算法 PAM
在线阅读 下载PDF
面向不确定数据的近似骨架启发式聚类算法 被引量:12
16
作者 金萍 宗瑜 +2 位作者 屈世超 胡燕 田园 《南京大学学报(自然科学版)》 CSCD 北大核心 2015年第1期197-205,共9页
不确定数据聚类是传统数据挖掘的扩展,面对不确定数据聚类,研究者们经常把聚类问题描述成组合优化问题,并设计启发式聚类算法进行求解.现有的启发式聚类算法,如UK-means和UK-Medoids具有容易理解和实现简单等优点,但初始解敏感问题严重... 不确定数据聚类是传统数据挖掘的扩展,面对不确定数据聚类,研究者们经常把聚类问题描述成组合优化问题,并设计启发式聚类算法进行求解.现有的启发式聚类算法,如UK-means和UK-Medoids具有容易理解和实现简单等优点,但初始解敏感问题严重影响了聚类质量.本文在近似骨架理论的基础上,提出了一种近似骨架启发式聚类算法APPGCU(Approximate backbone guided heuristic clustering algorithm for uncertain data).该算法首先对原数据集完成P次采样,在采样后的规模较小的P个数据集上分别执行UK-Medoids算法得到P个局部最优解;然后通过对P个局部最优解求交得到近似骨架,并从中提取初始簇心;最后从初始簇心开始,启发式搜索出聚类结果.在仿真和实际数据集中的实验结果表明,算法APPGCU的聚类结果明显高于实验对比的启发式聚类算法,提高了聚类质量. 展开更多
关键词 NP-难解 启发式算法 近似骨架 不确定数据聚类
在线阅读 下载PDF
不确定性数据流上频繁项集挖掘的有效算法 被引量:14
17
作者 刘殷雷 刘玉葆 陈程 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期1-7,共7页
在很多应用中,不确定性数据都是以流的形式产生,例如传感器网络数据,移动对象跟踪数据等等.已有的基于不确定性数据流的频繁项集挖掘算法往往具有数据流储存结构繁琐、维护困难以及算法的计算量大等缺点.针对这种情况,提出了一种有效的... 在很多应用中,不确定性数据都是以流的形式产生,例如传感器网络数据,移动对象跟踪数据等等.已有的基于不确定性数据流的频繁项集挖掘算法往往具有数据流储存结构繁琐、维护困难以及算法的计算量大等缺点.针对这种情况,提出了一种有效的数据结构SRUF-tree用于储存不确定性数据事务流的项集,该结构由全局树SRtree、临时表Table和窗口队列Queue三部分组成,其中全局树压缩着最近窗口容纳的所有的项集,临时表存储着每批项集的信息.基于该结构设计了一种新的算法SRUF-mine,它挖掘流频繁项集时只需要深度遍历全局树,动态维护SRUF-tree结构只需要处理窗口队列中最旧一批项集的临时表.理论和实验结果表明,SRUF-mine算法是一种有效的挖掘不确定性数据流频繁项集的算法,时空效率和扩展性均优于UF-streaming算法. 展开更多
关键词 不确定数据 数据 频繁项集
在线阅读 下载PDF
RFID不确定数据管理技术 被引量:14
18
作者 许嘉 于戈 +1 位作者 谷峪 王艳秋 《计算机科学与探索》 CSCD 2009年第6期561-576,共16页
有关不确定数据管理的研究是当前国际数据库研究领域的一个热点。不确定性作为RFID系统的一个重要特征,贯穿于RFID应用的整个生命周期。RFID系统主要存在两类不确定性:一类是客观不确定性,即原始数据客观存在不完整和不准确,这是造成RFI... 有关不确定数据管理的研究是当前国际数据库研究领域的一个热点。不确定性作为RFID系统的一个重要特征,贯穿于RFID应用的整个生命周期。RFID系统主要存在两类不确定性:一类是客观不确定性,即原始数据客观存在不完整和不准确,这是造成RFID系统数据不确定的最直接原因;另一类是主观不确定性,这是由于对漏读数据的填补、对位置信息的推测、对事件语义的抽取和对事件发生时间的估计而产生的不确定性。详细归纳了RFID系统中数据不确定性的来源,介绍了RFID不确定数据管理技术的研究现状,并指出了目前面临的挑战。 展开更多
关键词 无线射频识别技术 不确定数据 可能世界模型 复杂事件处理 普适计算
在线阅读 下载PDF
基于模糊C-均值的空间不确定数据聚类 被引量:7
19
作者 肖宇鹏 何云斌 +1 位作者 万静 李松 《计算机工程》 CAS CSCD 北大核心 2015年第10期47-52,共6页
针对现实世界中样本对象的不确定性及样本对象间界限划分的模糊性,提出基于模糊C-均值的空间不确定数据聚类算法UFCM。但由于UFCM算法在聚类过程中涉及大量期望距离的复杂积分计算,导致UFCM算法性能不理想,进而给出改进算法I_UFCM,将空... 针对现实世界中样本对象的不确定性及样本对象间界限划分的模糊性,提出基于模糊C-均值的空间不确定数据聚类算法UFCM。但由于UFCM算法在聚类过程中涉及大量期望距离的复杂积分计算,导致UFCM算法性能不理想,进而给出改进算法I_UFCM,将空间不确定对象聚类问题转化为传统的确定对象聚类问题,采用相似度计算公式减少期望距离的计算量,提高聚类结果的质量。实验结果表明,与UFCM和UK-Means算法相比,I_UFCM算法在空间不确定数据集上具有更好的聚类性能,CUP耗时降低了90%以上。 展开更多
关键词 模糊C-均值 不确定数据 概率密度函数 期望距离 质心
在线阅读 下载PDF
基于模式增长的不确定数据的频繁模式挖掘算法 被引量:7
20
作者 王乐 常艳芬 王水 《计算机应用》 CSCD 北大核心 2015年第7期1921-1926,共6页
为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法。首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阈值进行比较,以确定某一项集是... 为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法。首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阈值进行比较,以确定某一项集是否为候选频繁项集,并对候选项集建立子树以递归挖掘频繁模式。实验中,UFPMMP算法与AT-Mine算法进行了对比,并在6个典型的数据集上进行实验验证。实验结果表明,UFPM-MP算法的时空效率得到了提高,稀疏数据集上提高约30%,稠密数据集上的效率提高更为明显(约3~4倍)。预估期望支持数的策略有效地减少了子树和头表项的数量,从而提高了算法的时空效率;且最小期望支持数越小,或需要挖掘的频繁模式越多的时候,算法的时间效率提高越多。 展开更多
关键词 不确定数据 频繁模式 频繁项集 模式增长
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部