期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
动态数据集环境下的强邻近对查询 被引量:9
1
作者 李松 张丽平 郝忠孝 《计算机研究与发展》 EI CSCD 北大核心 2015年第3期749-759,共11页
数据集中的强邻近对查询在空间数据挖掘、大数据处理、空间数据库、地理信息系统、数据的相似分析和推理等方面具有重要的作用.已有的数据查询方法无法有效处理动态数据集中的强邻近对查询问题,针对动态数据集中的强邻近对查询的特点和... 数据集中的强邻近对查询在空间数据挖掘、大数据处理、空间数据库、地理信息系统、数据的相似分析和推理等方面具有重要的作用.已有的数据查询方法无法有效处理动态数据集中的强邻近对查询问题,针对动态数据集中的强邻近对查询的特点和复杂性,基于Voronoi图和R树空间索引结构提出了处理初始数据环境下的双数据集中的强邻近对查询算法VR_SNP.针对分布区域不规则且数据点分布密度差异较大的情况利用Voronoi图进行计算查询,反之,则利用R树进行查询.通过对初始强邻近对集和候选邻近对集进行二次判断计算,筛选出有效结果,给出了数据集动态增加和动态减少环境下的强邻近对查询算法VR_SNP_DA和算法VR_SNP_DE.进一步提出了移动点位置变化情况下的强邻近对查询算法VR_SNP_DL.理论研究和实验比较表明在数据集的数据量、新增点集和删除点集的规模较大、移动点的位置变化次数较多等情况下,所提出的算法具有较为明显的查询优势. 展开更多
关键词 空间数据 VORONOI图 动态数据集 最近邻查询 强邻近对查询
在线阅读 下载PDF
一种求解动态数据集中k-支配轮廓的算法 被引量:1
2
作者 董雷刚 刘国华 +1 位作者 崔晓微 张东明 《小型微型计算机系统》 CSCD 北大核心 2009年第4期617-622,共6页
在对高维数据集进行轮廓查询时,k-支配轮廓查询算法能够返回较少的轮廓点,有利于用户的决策,但目前的算法都是针对静态数据集设计,无法对动态数据集进行处理.动态数据可分为非数据流数据和数据流数据,本文针对这两种情况提出了相应的增... 在对高维数据集进行轮廓查询时,k-支配轮廓查询算法能够返回较少的轮廓点,有利于用户的决策,但目前的算法都是针对静态数据集设计,无法对动态数据集进行处理.动态数据可分为非数据流数据和数据流数据,本文针对这两种情况提出了相应的增量求解算法,即当数据集发生变化时,以现有的k-支配轮廓为基础,通过对部分数据点进行计算得到新的k-支配轮廓.证明了算法的正确性和有效性,并通过实验对算法进行了分析和验证. 展开更多
关键词 高维空间 动态数据集 k-支配轮廓查询
在线阅读 下载PDF
基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法 被引量:7
3
作者 武毅 王丹 蒋宗礼 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期248-256,共9页
研究了动态集值属性数据重发布中的隐私保护问题.真实的数据随时间的推移因插入、删除、修改等操作而产生动态变化.更新后数据的重发布将面临攻击者使用历史发布结果对敏感信息揭露的风险.提出了一种面向动态集值属性数据重发布的隐私... 研究了动态集值属性数据重发布中的隐私保护问题.真实的数据随时间的推移因插入、删除、修改等操作而产生动态变化.更新后数据的重发布将面临攻击者使用历史发布结果对敏感信息揭露的风险.提出了一种面向动态集值属性数据重发布的隐私保护模型,延续使用事务型k-anonymity原则保护记录间的不可区分性,并通过维持记录中敏感元素在更新过程中的多样性和连续性阻止其被揭露.结合局部重编码泛化和隐匿技术降低数据匿名产生的信息损失,进而提出了完整的重发布算法.通过在真实数据集上进行的实验和比较,研究结果表明提出的方法能有效阻止敏感信息的泄露,并降低发布结果的信息损失. 展开更多
关键词 隐私保护 事务型k-anonymity 值属性数据 动态数据集 重发布
在线阅读 下载PDF
数据集动态重构的集成迁移学习 被引量:5
4
作者 刘伟 张化祥 《计算机工程与应用》 CSCD 北大核心 2010年第12期126-128,共3页
目前很多数据挖掘和机器学习方法都有一个基本假设:训练数据和测试数据必须服从相同的分布。但是在很多情况下这种假设不成立,没有考虑分布差异的传统机器学习方法就不能正确分类了。提出了一种新的迁移学习方法DRTAT,对原训练数据进行... 目前很多数据挖掘和机器学习方法都有一个基本假设:训练数据和测试数据必须服从相同的分布。但是在很多情况下这种假设不成立,没有考虑分布差异的传统机器学习方法就不能正确分类了。提出了一种新的迁移学习方法DRTAT,对原训练数据进行动态分割重组,适时地淘汰冗余数据,并进行分类器的集成。通过在多个文本数据集和UCI数据集上进行测试,并与TrAdaboost算法进行比较,表明了算法的先进性。 展开更多
关键词 分布差异 知识迁移 动态数据集重组 冗余数据淘汰 分类器
在线阅读 下载PDF
缺失数据数据集的组增量式特征选择 被引量:6
5
作者 王锋 魏巍 《计算机科学》 CSCD 北大核心 2015年第7期285-290,共6页
实际应用中获取到的数据集通常是动态增加的,且随着数据获取工具的迅速发展,新数据通常会一组一组地增加。为此,针对含有缺失数据的动态数据集,基于粗糙集理论,提出了一种组增量式的粗糙特征选择算法。首先分析、证明了信息熵的组增量... 实际应用中获取到的数据集通常是动态增加的,且随着数据获取工具的迅速发展,新数据通常会一组一组地增加。为此,针对含有缺失数据的动态数据集,基于粗糙集理论,提出了一种组增量式的粗糙特征选择算法。首先分析、证明了信息熵的组增量计算公式,并以信息熵作为特征重要度的度量,在此基础上设计了基于信息熵的可有效处理含有缺失数据的动态数据集的组增量式特征选择算法。实验结果进一步证明了新算法的可行性和高效性。 展开更多
关键词 动态数据集 缺失数据 信息熵 组增量特征选择
在线阅读 下载PDF
面向缺失数据的动态特征选择 被引量:2
6
作者 王锋 宋鹏 《小型微型计算机系统》 CSCD 北大核心 2018年第12期2585-2589,共5页
随着数据获取工具的快速发展,实际获取到的数据通常是动态更新的,且更新的速度也越来越快.数据集的动态更新通常有三中类型,即数据规模的更新、维数的更新和数据取值的更新.为此,本文针对含有缺失数据的数据集,通过讨论和分析信息熵随... 随着数据获取工具的快速发展,实际获取到的数据通常是动态更新的,且更新的速度也越来越快.数据集的动态更新通常有三中类型,即数据规模的更新、维数的更新和数据取值的更新.为此,本文针对含有缺失数据的数据集,通过讨论和分析信息熵随数据变化的更新机制,设计了一种基于信息熵的动态特征选择算法.算法中以信息熵的变化作为特征重要度的度量,进而给出了含有缺失数据的数据集中特征选择结果随数据取值变化的动态更新策略.实验结果进一步验证了新算法的可行性和高效性. 展开更多
关键词 缺失数据 动态数据集 特征选择 信息熵
在线阅读 下载PDF
动态决策树算法研究 被引量:9
7
作者 尹阿东 谢霖铨 +1 位作者 龙誉 杨立东 《计算机工程与应用》 CSCD 北大核心 2004年第33期103-105,132,共4页
该文在增量决策树算法的基础上,提出一种能够处理变化数据集的减量决策树算法,提出并证明了减量决策树算法中的三个基本定理,保证了减量决策树算法的可靠性。同时将传统的增量决策树算法与该文所提出的减量决策树算法相结合,构造出一种... 该文在增量决策树算法的基础上,提出一种能够处理变化数据集的减量决策树算法,提出并证明了减量决策树算法中的三个基本定理,保证了减量决策树算法的可靠性。同时将传统的增量决策树算法与该文所提出的减量决策树算法相结合,构造出一种动态决策树算法,该算法很好地解决了发生增减变化的动态数据集构造决策树的问题,另外动态决策树算法的提出也促进了在线规则提取的发展与完善。 展开更多
关键词 决策树算法 动态数据集 信息熵
在线阅读 下载PDF
动态增量聚类的设计与实现 被引量:7
8
作者 孟海东 王淑玲 郝永宽 《计算机工程与应用》 CSCD 北大核心 2009年第24期130-132,共3页
传统聚类算法往往只适用于静态数据集的聚类。对于动态数据集,新增数据后,前期的聚类结果不再可靠,运用此类算法则需要重新聚类,这样会造成效率低下和计算资源浪费。在基于密度和自适应密度可达聚类算法的基础上,提出了一种新的增量聚... 传统聚类算法往往只适用于静态数据集的聚类。对于动态数据集,新增数据后,前期的聚类结果不再可靠,运用此类算法则需要重新聚类,这样会造成效率低下和计算资源浪费。在基于密度和自适应密度可达聚类算法的基础上,提出了一种新的增量聚类算法。理论分析和实验结果证明该算法能够有效地处理动态数据集,提高聚类效率和资源的利用率。 展开更多
关键词 动态数据集 密度可达 增量聚类
在线阅读 下载PDF
动态回归模型在变形分析中的应用 被引量:4
9
作者 邓兴升 陈石桥 殷自成 《大地测量与地球动力学》 CSCD 北大核心 2011年第5期132-135,145,共5页
为了使回归模型适应动态数据集,推导了动态回归模型的递推最小二乘算法,数据更新时,采用修正方式更新回归系数计算两个矩阵,避免了重复矩阵求逆运算,实现了观测数据增加而矩阵阶数不增加,理论上减少了计算时间。以柘溪和东江两大坝变形... 为了使回归模型适应动态数据集,推导了动态回归模型的递推最小二乘算法,数据更新时,采用修正方式更新回归系数计算两个矩阵,避免了重复矩阵求逆运算,实现了观测数据增加而矩阵阶数不增加,理论上减少了计算时间。以柘溪和东江两大坝变形分析多元动态回归模型为例进行实验,结果表明:该方法建模过程简洁、无需迭代计算,易于编程实现,在计算效率与预报精度等方面均具优势,可应用于实时变形分析建模。 展开更多
关键词 动态回归模型 递推最小二乘算法 数据更新 动态数据集 变形分析
在线阅读 下载PDF
基于粒化单调的不完备混合型数据增量式属性约简算法 被引量:3
10
作者 张雨新 孙达明 李飞 《计算机应用与软件》 北大核心 2021年第3期279-286,共8页
增量式属性约简是一种针对动态数据集的新型属性约简方法。然而目前的增量式属性约简很少有对不完备混合型的信息系统进行研究。针对这类问题提出一种属性增加时的增量式属性约简算法。在不完备混合型信息系统下引入邻域容差关系。基于... 增量式属性约简是一种针对动态数据集的新型属性约简方法。然而目前的增量式属性约简很少有对不完备混合型的信息系统进行研究。针对这类问题提出一种属性增加时的增量式属性约简算法。在不完备混合型信息系统下引入邻域容差关系。基于邻域容差关系的粒化单调性,提出信息系统属性增加时邻域容差条件熵的增量式更新方法,并提出了不完备混合型信息系统下的邻域容差条件熵增量式属性约简算法。实验分析表明了该算法的有效性。 展开更多
关键词 粗糙 粒计算 属性约简 动态数据集 增量式学习
在线阅读 下载PDF
基于Web Service技术分布式并行数据挖掘的研究与实现 被引量:1
11
作者 金春霞 白秋产 《现代电子技术》 2008年第10期42-44,共3页
主要介绍基于Web Service技术的一个数据挖掘系统,在一个关联规则挖掘的并行算法—CD算法的基础上,结合一种基于动态数据集划分的并行关联规则挖掘算法,利用动态方式分配数据量,使每个处理器获得相同多的数据集,解决在网络中大量分散的... 主要介绍基于Web Service技术的一个数据挖掘系统,在一个关联规则挖掘的并行算法—CD算法的基础上,结合一种基于动态数据集划分的并行关联规则挖掘算法,利用动态方式分配数据量,使每个处理器获得相同多的数据集,解决在网络中大量分散的数据因通信等问题而引起的负载平衡,从而提高了数据挖掘效率。 展开更多
关键词 WEB服务 关联规则 并行数据挖据 动态数据集
在线阅读 下载PDF
特征选择:一种面向数据取值更新的批处理机制 被引量:7
12
作者 张娇鹏 王锋 梁吉业 《小型微型计算机系统》 CSCD 北大核心 2017年第2期264-267,共4页
实际应用中获取到的数据通常是动态更新的,且随着数据观测工具的快速发展,数据库中数据更新的速度也越来越快,同一时刻更新的规模也越来越大.面向动态数据集的数据挖掘研究中,数据库中数据取值的动态更新也是一种数据集动态变化的类型.... 实际应用中获取到的数据通常是动态更新的,且随着数据观测工具的快速发展,数据库中数据更新的速度也越来越快,同一时刻更新的规模也越来越大.面向动态数据集的数据挖掘研究中,数据库中数据取值的动态更新也是一种数据集动态变化的类型.特征选择是一种有效的数据预处理工具,面向数据取值动态更新的特征选择方法也已经引起了众多研究者的广泛关注.为此,基于粗糙集理论和信息熵的概念,提出一种面向数据取值动态变化数据集的特征选择方法,可一次处理一组取值发生变化的数据.算法中首先分析了信息熵随数据取值动态变化的更新机制,以信息熵作为特征重要度的度量,设计了基于信息熵的粗糙特征选择算法.实验结果进一步验证了新算法的可行性和高效性. 展开更多
关键词 动态数据集 粗糙 特征选择 信息熵
在线阅读 下载PDF
IEC 61850标准作为变电站出站远动协议的可行性分析 被引量:20
13
作者 王文龙 《电力系统自动化》 EI CSCD 北大核心 2012年第17期109-112,共4页
叙述了建设一体化电网运行系统以及调度中心与变电站之间上下数据贯通的必要性,分析了上下贯通所面临的数据模型、图形(接线图)、传输协议、源端维护与订阅/发布等问题,提出了采用IEC 61850标准作为出站协议的基本原则、建模方法、服务... 叙述了建设一体化电网运行系统以及调度中心与变电站之间上下数据贯通的必要性,分析了上下贯通所面临的数据模型、图形(接线图)、传输协议、源端维护与订阅/发布等问题,提出了采用IEC 61850标准作为出站协议的基本原则、建模方法、服务实现细节,在基于IEC 61850标准的变电站出站协议的基础上叙述了IEC 61850标准与公共信息模型(CIM)之间的转换规则以及源端维护和订阅/发布的实现方法。 展开更多
关键词 IEC 61850标准 变电站 远动协议 动态数据集 模型转换 综合数据传输
在线阅读 下载PDF
基于IEC 61850的多视窗主站源端维护方法 被引量:1
14
作者 张晓悦 陈哲 +3 位作者 袁方方 王广民 李永照 张思远 《广东电力》 2016年第9期67-72,共6页
当前多视窗主站源端维护普遍采用IEC61970标准进行建模和IEC60870-5-104扩展规约进行传输,针对这种实现方式在建模和传输过程中存在的问题,提出基于IEC61850的多视窗主站源端维护方法。该方法基于IEC61850建立主子站模型,取消中间文件,... 当前多视窗主站源端维护普遍采用IEC61970标准进行建模和IEC60870-5-104扩展规约进行传输,针对这种实现方式在建模和传输过程中存在的问题,提出基于IEC61850的多视窗主站源端维护方法。该方法基于IEC61850建立主子站模型,取消中间文件,使主子站模型文件保持一致;通过部署动态数据集,实现主站形成转发表后直接向子站下发;提出基于消息总线的传输模式,实现源端维护的功能。最后,提出基于IEC61850的多视窗主站源端维护方法的实施方案,该方案能够解决目前工程实施中存在的文件交互过多以及主子站模型转换繁琐的不足,提升主子站交互的效率和可靠性。 展开更多
关键词 IEC61850 IEC61970 源端维护 公共信息模型 动态数据集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部