期刊文献+
共找到138篇文章
< 1 2 7 >
每页显示 20 50 100
联邦数据库查询处理的规则化及其性能分析 被引量:2
1
作者 孙志挥 陈明生 《计算机研究与发展》 EI CSCD 北大核心 1997年第4期270-274,共5页
联邦数据库系统由异构分布且自治共享的成员数据库系统组成.联邦用户提交的查询事务不仅涉及本库数据,而且涉及异地多库数据.本文提出一种基于规则的联邦查询分解优化策略,可提高系统优化性能,使联邦事务处理规则化。
关键词 联邦数据库 查询处理 转换规则 数据库系统
在线阅读 下载PDF
一种解决联邦数据库系统查询处理的模式转换方法 被引量:2
2
作者 孙志挥 白义传 《计算机研究与发展》 EI CSCD 北大核心 1995年第2期46-50,共5页
本文在分析联邦数据库系统成员异构的特点后,论述了一种基于输入/输出模式和概念模式的转换方法,通过该转换处理可以有效地解决模式异构的问题。这种方法已在SU-FDBS原型中实现。
关键词 联邦数据库 联邦模式 模式转换 数据库
在线阅读 下载PDF
联邦数据库系统协商机制的设计和实现 被引量:1
3
作者 孙志挥 白义传 《计算机集成制造系统-CIMS》 EI CSCD 1995年第1期34-37,共4页
联邦分布数据库系统支持异构自治和多库共享,为此,系统要解决的一个主要问题是协商机制的实现.本文论述了协商机制的结构、访问权限协商模型以及实现的主要步骤和技术,该机制具有灵活可扩充的联邦特点,可以方便地对系统进行剪裁.
关键词 联邦分布式数据库 协商 模式
在线阅读 下载PDF
松耦合多数据库集成系统中的最大子查询算法
4
作者 孙志挥 陈明生 《软件学报》 EI CSCD 北大核心 1997年第A00期137-142,共6页
本文提出一种松耦合多数据库系统环境下的查询处理策略。查询优化的目标是全局和局部两个操作层次开发系统,以减少执行一个查询的整体代价。
关键词 数据库系统 集成系统 算法 查询优化
在线阅读 下载PDF
联邦式异构分布数据库的性能分析
5
作者 孙志挥 陈明生 《东南大学学报(自然科学版)》 EI CAS CSCD 1997年第1期1-4,共4页
从网络数据传输量和响应时间这两个性能因素出发,分析了联邦数据库管理系统(FDBMS)原型系统SU-FDBS的运行性能。
关键词 联邦数据库系统 查询优化 联邦事务管理 数据库
在线阅读 下载PDF
联邦数据库系统嵌套查询的处理方法
6
作者 孙志挥 白义传 《东南大学学报(自然科学版)》 EI CAS CSCD 1994年第5期49-53,共5页
本文介绍一种解决联邦数据库系统嵌套查询的处理方法:它将嵌套语句转化为一个不含嵌套的语句,或分解为一组子查询,嵌套留在本地库综合处理。这样使得不论成员库是否支持嵌套查询,它的关系总能被嵌套语句使用。
关键词 数据管理 FDBS 数据库 查询
在线阅读 下载PDF
微机文件组织中的数据压缩技术
7
作者 孙志挥 陈依桂 刘维良 《计算机应用与软件》 1988年第3期23-26,共4页
本文介绍一个仓库器材管理系统中的文件组织压缩技术,包括编码叠加、前缀压缩、权表示和地址映射。该系统已在BL-Z8000微机上实现。系统的运行说明这些技术是有效可行的。
关键词 数据压缩技术 器材管理 字节 物资管理 字符串 微机 文件记录 工业建筑 仓库
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
8
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
基于聚类杂交的隐私保护轨迹数据发布算法 被引量:26
9
作者 吴英杰 唐庆明 +2 位作者 倪巍伟 孙志挥 廖尚斌 《计算机研究与发展》 EI CSCD 北大核心 2013年第3期578-593,共16页
传统关于轨迹数据发布的隐私保护研究大多采用聚类技术,其相关算法只关注每条轨迹的隐私保护,忽视对轨迹聚类组特征的保护.通过理论分析和实验验证发现,对采用聚类发布技术产生的轨迹数据进行二次聚类,可得到原始轨迹数据在发布之前的... 传统关于轨迹数据发布的隐私保护研究大多采用聚类技术,其相关算法只关注每条轨迹的隐私保护,忽视对轨迹聚类组特征的保护.通过理论分析和实验验证发现,对采用聚类发布技术产生的轨迹数据进行二次聚类,可得到原始轨迹数据在发布之前的聚类组特征,从而可能导致隐私泄露.为了有效预防二次聚类攻击,提出一种(k,δ,Δ)-匿名模型和基于该模型的聚类杂交隐私保护轨迹数据发布算法CH-TDP,算法CH-TDP对采用(k,δ)-匿名模型及相关算法处理得到的聚类分组先进行组间杂交,而后再进行组内扰乱,其目标在防止出现二次聚类攻击的前提下,保证发布轨迹数据的质量不低于阈值Δ.实验对算法CH-TDP的可行性及有效性与同类算法进行比较分析,结果表明算法CH-TDP是有效可行的. 展开更多
关键词 隐私保护 轨迹数据发布 二次聚类攻击 聚类 杂交
在线阅读 下载PDF
关联规则挖掘中若干关键技术的研究 被引量:62
10
作者 陈耿 朱玉全 +3 位作者 杨鹤标 陆介平 宋余庆 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解... Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· 展开更多
关键词 数据挖掘 关联规则 频繁项目集
在线阅读 下载PDF
最大频繁项目集的快速更新 被引量:47
11
作者 吉根林 杨明 +1 位作者 宋余庆 孙志挥 《计算机学报》 EI CSCD 北大核心 2005年第1期128-135,共8页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题 .为克服基于Apriori的最大频繁项目集挖掘算法存在的不足 ,DMFIA采用FP tree存储结构及自顶向下的搜索策略 ,有效地提高了最大频繁项目集的挖掘效率 .但对于频繁项目多而最大频繁项... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题 .为克服基于Apriori的最大频繁项目集挖掘算法存在的不足 ,DMFIA采用FP tree存储结构及自顶向下的搜索策略 ,有效地提高了最大频繁项目集的挖掘效率 .但对于频繁项目多而最大频繁项目集维数相对较小的情况 ,DMFIA要经过多层搜索且在每一层产生大量的候选项目集 ,因而影响算法的执行效率 .为此 ,该文提出了DMFIA的改进算法IDMFIA(theImprovedalgorithmofDMFIA) .IDMFI A采用自顶向下和自底向上双向搜索策略 ,可尽早修剪掉较短最大频繁项目集的超集和较长最大频繁项目集的子集 .另外 ,该文还提出最大频繁项目集更新算法FUMFIA(FastUpdatingMaximumFrequentItemsetsAlgorithm) ,该算法充分利用已建立的FP tree和已挖掘的最大频繁项目集 ,可对已挖掘的最大频繁项目集进行高效维护 .实验结果表明 ,IDMFIA和FUMFIA可有效提高最大频繁项目集的挖掘和更新效率 . 展开更多
关键词 数据挖掘 频繁模式树 最大频繁项目集 更新
在线阅读 下载PDF
基于频繁模式树的关联规则增量式更新算法 被引量:81
12
作者 朱玉全 孙志挥 季小俊 《计算机学报》 EI CSCD 北大核心 2003年第1期91-96,共6页
研究了大型事务数据库中关联规则的增量式更新问题 ,提出了一种基于频繁模式树的关联规则增量式更新算法 ,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题 。
关键词 频繁模式树 关联规则 增量式更新算法 数据挖掘 数据库
在线阅读 下载PDF
基于局部信息熵的加权子空间离群点检测算法 被引量:28
13
作者 倪巍伟 陈耿 +2 位作者 陆介平 吴英杰 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2008年第7期1189-1194,共6页
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象."维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间... 离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象."维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD.通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念.采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点.算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的. 展开更多
关键词 高维数据 离群点检测 信息熵 子空间挖掘 权向量
在线阅读 下载PDF
数据挖掘技术及其应用 被引量:79
14
作者 吉根林 帅克 孙志挥 《南京师大学报(自然科学版)》 CAS CSCD 2000年第2期25-27,共3页
数据挖掘是数据库研究中一个很有应用价值的课题 ,它融合了数据库、人工智能、机器学习等多个领域的理论和技术 .本文介绍数据挖掘系统的体系结构、数据挖掘的方法及应用 .
关键词 数据挖掘 知识发现 决策支持 数据库 体系结构
在线阅读 下载PDF
核密度估计及其在聚类算法构造中的应用 被引量:69
15
作者 李存华 孙志挥 +1 位作者 陈耿 胡云 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1712-1719,共8页
经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估... 经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估计相对于核密度估计的均方误差界 ,提出基于网格数据重心的分箱核近似方法 在不改变计算复杂度的条件下 ,基于网格数据重心的分箱核近似密度函数计算可以有效地降低近似误差 ,这一思想方法对于构造高效大规模数据聚类分析算法具有指导意义 展开更多
关键词 核密度估计 分箱规则 聚类算法
在线阅读 下载PDF
基于邻域属性熵的隐私保护数据干扰方法 被引量:16
16
作者 倪巍伟 徐立臻 +3 位作者 崇志宏 吴英杰 刘腾腾 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2009年第3期498-504,共7页
隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,... 隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,提出邻域属性熵和邻域主属性等概念,对原始数据中数据点的邻域主属性值用其k邻域点集内数据点在该属性的均值进行干扰替换,在较好地维持原始数据k邻域关系的情况下达到保护原始数据隐私不泄露的目的.理论分析表明,NETPA干扰方法具有良好地避免隐私泄露的效果,同时可以较好地维持原始数据的聚类模式.实验采用DBSCAN和k-LDCHD聚类算法对干扰前后的数据进行聚类分析比对.实验结果表明,干扰前后数据聚类结果具有较高的相似度,算法是有效可行的. 展开更多
关键词 隐私保护 聚类挖掘 邻域属性熵 邻域主属性 数据干扰
在线阅读 下载PDF
快速挖掘全局最大频繁项目集 被引量:27
17
作者 陆介平 杨明 +1 位作者 孙志挥 鞠时光 《软件学报》 EI CSCD 北大核心 2005年第4期553-560,共8页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法FMGMFI(fast mining globalmaximum frequent itemsets),该算法采用FP-tree存储结构,可方便地从各局部FP-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,FMGMF算法是有效、可行的. 展开更多
关键词 分布式数据库 数据挖掘 频繁模式树 全局最大频繁项目集
在线阅读 下载PDF
快速更新频繁项集 被引量:63
18
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
在线阅读 下载PDF
高维类别属性数据流离群点快速检测算法 被引量:21
19
作者 周晓云 孙志挥 +1 位作者 张柏礼 杨宜东 《软件学报》 EI CSCD 北大核心 2007年第4期933-942,共10页
提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categoric... 提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性. 展开更多
关键词 数据流 离群点检测 频繁模式 高维 概念转移
在线阅读 下载PDF
一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法 被引量:21
20
作者 宋余庆 朱玉全 +1 位作者 孙志挥 杨鹤标 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期777-783,共7页
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些... 目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约束条件,提出了一种快速的基于FPtree的约束最大频繁项目集挖掘算法CMFIMA,并对其更新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式树 增量式更新
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部