期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
面向位置数据划分的差分隐私保护研究进展
1
作者 韩慧慧 刘晴晴 +1 位作者 吴锦华 孟令兵 《信息工程大学学报》 2024年第2期219-226,共8页
移动定位技术的发展促进了位置数据的收集和共享,导致位置数据集隐私面临泄露风险,而现有的隐私保护技术难以抵抗攻击者背景知识的攻击。差分隐私作为一种严格可证明的隐私保护模型,可以有效防止任意背景知识攻击。对差分隐私基础理论... 移动定位技术的发展促进了位置数据的收集和共享,导致位置数据集隐私面临泄露风险,而现有的隐私保护技术难以抵抗攻击者背景知识的攻击。差分隐私作为一种严格可证明的隐私保护模型,可以有效防止任意背景知识攻击。对差分隐私基础理论以及它在位置数据划分的应用进行综述,重点阐述了差分隐私预算分配策略和位置数据划分方法,并对其方法进行分析总结。在现有技术对比分析的基础上,指出了需要进一步深入研究的方向。 展开更多
关键词 差分隐私 位置数据 隐私保护 数据划分
在线阅读 下载PDF
基于共享模式的SaaS多租户数据划分机制研究 被引量:11
2
作者 李晓娜 李庆忠 +1 位作者 孔兰菊 庞成 《通信学报》 EI CSCD 北大核心 2012年第S1期110-120,共11页
对SaaS模式下,对共享模式的多租户数据在云中多节点环境的划分问题进行了研究,提出一种支持SaaS应用的多租户数据划分模型和算法。与目前主要面向分析型应用并且缺乏事务支持的分区技术和云数据库解决方案进行比较,理论分析和实验结果... 对SaaS模式下,对共享模式的多租户数据在云中多节点环境的划分问题进行了研究,提出一种支持SaaS应用的多租户数据划分模型和算法。与目前主要面向分析型应用并且缺乏事务支持的分区技术和云数据库解决方案进行比较,理论分析和实验结果同时表明,该划分机制能有效地实现云环境中系统规模动态扩展,同时最大限度地降低分布式事务代价。 展开更多
关键词 SAAS 多租户数据 共享模式 数据划分
在线阅读 下载PDF
分布式并行地形分析中数据划分机制研究 被引量:5
3
作者 宋效东 窦万峰 +3 位作者 汤国安 江岭 赵菁 赵明伟 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第1期130-135,共6页
数据粒度是海量空间数据并行计算的重要问题之一。通过对不同性质的并行算法的对比分析,提出空间数据粒度模型,量化地反映并行地形分析中数据划分的规模,建立并行数据粒度评价模型。通过研究集群环境下不同算法的数据并行数据粒度问题,... 数据粒度是海量空间数据并行计算的重要问题之一。通过对不同性质的并行算法的对比分析,提出空间数据粒度模型,量化地反映并行地形分析中数据划分的规模,建立并行数据粒度评价模型。通过研究集群环境下不同算法的数据并行数据粒度问题,提出基于并行数据粒度评价模型的优化数据粒度调度算法。通过计算每一次并行计算的时间与数据粒度效率,从而实现对计算数据粒度动态更新以追求更高的加速比。经过实验验证,该算法较之传统算法,可提供更高的任务执行效率并具有更好的可移植性。 展开更多
关键词 并行计算 数字地形分析 数据划分 数据粒度
在线阅读 下载PDF
矢量多边形并行栅格化数据划分方法 被引量:4
4
作者 周琛 李满春 +2 位作者 陈振杰 姜朋辉 陈东 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第5期21-28,共8页
针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合... 针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合问题。在多核CPU环境下实现并行算法,选用多个典型土地利用现状数据集进行测试。结果表明:针对不同类型多边形数据集,所提方法较传统方法可获得更高的并行加速比和更好的负载均衡;针对大数据量数据集,以多边形节点数为度量标准可更精确地估算分块计算量,从而更好地实现负载均衡。 展开更多
关键词 地理信息系统 并行计算 多边形栅格化 数据划分 负载均衡
在线阅读 下载PDF
面向图形处理器重叠通信与计算的数据划分方法 被引量:5
5
作者 张保 曹海军 +2 位作者 董小社 李丹 胡雷钧 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第4期1-5,11,共6页
针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,... 针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,将应用数据按比例划分为大小不同的数据块后分批提交给GPU处理,使系统的传输资源PCI-E总线和计算资源GPU在一段时间内并行工作,从而实现了应用通信与计算的重叠.在处理按照比例划分的数据块过程中,尽可能充分利用系统的传输资源和计算资源,以减少数据传输和计算的相互等待时间.实验结果表明,采用数据比例划分方法后的应用性能明显提高,可以有效地重叠通信与计算时间,矩阵相乘和快速傅里叶变换总执行时间比未划分时分别减少了5%和30%左右,比平均划分时分别减少了3%和6%左右. 展开更多
关键词 图形处理器 重叠通信与计算 数据划分
在线阅读 下载PDF
基于数据划分最大信息的聚类有效性函数 被引量:10
6
作者 吴成茂 范九伦 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2001年第6期781-784,共4页
基于样本最大分类信息的改进划分系数仅仅利用了数据的模糊分类信息 ,为了将数据分类的几何结构信息考虑进去 ,结合数据分类的最大类内变差 ,提出一个聚类有效性标准 .实验结果表明 。
关键词 聚类有效性函数 最大分类信息 数据划分 模式识别
在线阅读 下载PDF
基于数据划分的分布式模型及其负载均衡算法 被引量:4
7
作者 杨小虎 王新宇 毛明 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第4期602-607,681,共7页
介绍了基于应用划分的对称式集群和非对称式集群两种经典的分布式模型,分析两种经典模型在企业级应用中的缺陷.为了克服这些缺陷,引入基于数据划分的分布式模型,并提出适用于企业级系统的基于数据库访问量的负载均衡机制.通过测试与分析... 介绍了基于应用划分的对称式集群和非对称式集群两种经典的分布式模型,分析两种经典模型在企业级应用中的缺陷.为了克服这些缺陷,引入基于数据划分的分布式模型,并提出适用于企业级系统的基于数据库访问量的负载均衡机制.通过测试与分析,获得负载均衡机制中两个关键参数Dmax和VSRT的阈值.该模型和负载均衡机制具有更好的运行性能、横向可扩展性和动态负载均衡能力,已经被应用于单机金融遗留系统到J2EE分布式环境的再工程项目中,成功地实现了基于数据划分的系统架构,取得了理想的效果. 展开更多
关键词 分布式模型 数据划分 负载均衡 对称式集群 非对称式集群
在线阅读 下载PDF
面向并行空间连接的两轮映射数据划分方法 被引量:1
8
作者 付仲良 赵星源 +1 位作者 王楠 杨元维 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2017年第1期212-224,共13页
针对数据划分结果高冗余、低均衡可能会增加系统的工作负荷和影响系统的负载均衡这一问题,提出两轮映射数据划分方法.在第一轮映射中,通过充分利用划分对象的空间属性来减少冗余数据,通过合理设置阈值来均衡划分数据;在第二轮映射中,通... 针对数据划分结果高冗余、低均衡可能会增加系统的工作负荷和影响系统的负载均衡这一问题,提出两轮映射数据划分方法.在第一轮映射中,通过充分利用划分对象的空间属性来减少冗余数据,通过合理设置阈值来均衡划分数据;在第二轮映射中,通过动态映射机制,提高划分结果的数据量均衡度.与Oracle Spatial数据划分方法、线性编码轮询调度划分方法以及Hilbert编码轮询调度划分方法进行比较可知,采用两轮映射方法可以有效地控制冗余数据的产生,大幅提高划分结果的数据量均衡度,具备较好的划分效率. 展开更多
关键词 地理信息系统 空间数据划分 空间连接
在线阅读 下载PDF
面向离散点云并行插值数据划分方法研究 被引量:2
9
作者 钱辰 窦万峰 《南京师范大学学报(工程技术版)》 CAS 2013年第2期63-67,共5页
插值是数字高程模型的核心分析方法,也是构建数字高程模型的常用手段.面对海量的离散点云数据,插值生成DEM的过程需要消耗大量的时间,将并行计算运用到插值计算中会显著缩短计算时间.结合点云数据分布不均匀的特点,本文提出了一套针对... 插值是数字高程模型的核心分析方法,也是构建数字高程模型的常用手段.面对海量的离散点云数据,插值生成DEM的过程需要消耗大量的时间,将并行计算运用到插值计算中会显著缩短计算时间.结合点云数据分布不均匀的特点,本文提出了一套针对离散点云并行插值生成格网DEM的数据划分方法,将读取、搜索邻域、插值计算、输出4个过程的处理时间量化,保证划分后形成的子块处理时间均衡,提高了并行计算效率. 展开更多
关键词 数字高程模型 并行插值 离散点云 数据划分
在线阅读 下载PDF
并行数据库交互式数据划分工具的设计 被引量:1
10
作者 张爱文 王宇颖 《大庆石油学院学报》 CAS 北大核心 2005年第2期73-75,127,共4页
分析了数据划分模式对并行数据库系统整体性能的影响,设计了并行数据库系统中数据自动划分的框架,开发了基于DB2查询优化的交互式划分工具. 应用该划分工具对一个给定的由一组SQL语句组成的负载,可寻找在多个节点间划分数据的有利模式.... 分析了数据划分模式对并行数据库系统整体性能的影响,设计了并行数据库系统中数据自动划分的框架,开发了基于DB2查询优化的交互式划分工具. 应用该划分工具对一个给定的由一组SQL语句组成的负载,可寻找在多个节点间划分数据的有利模式. 测试结果表明:该交互工具能够在合理的时间内为负载中每个语句推荐好的候选划分,并可避免初始数据倾斜,减轻数据库管理员的负担. 展开更多
关键词 数据划分 并行数据 并行数据库管理系统
在线阅读 下载PDF
面向图形处理器重叠通信与计算的数据划分方法
11
作者 吴志海 《黑龙江科技信息》 2014年第17期145-145,共1页
本篇文章主要是利用数据平均划分的形式,来使得主协式处理架构本身所表现出的一些额外性质通信开销,无法完全对资源加以利用的问题进行了解决?而提出了以图形处理器与系统通信贷款相结合的计算形式,让通信和计算的重叠得以实现?
关键词 图形处理器 重叠通信与计算 数据划分
在线阅读 下载PDF
基于Gaussian混合的距离度量学习数据划分方法 被引量:1
12
作者 郑德重 杨媛媛 +2 位作者 谢哲 倪扬帆 李文涛 《上海交通大学学报》 EI CAS CSCD 北大核心 2021年第2期131-140,共10页
针对有限样本情况下,多次训练模型时容易出现不稳定和偏差问题,提出一种基于Gaussian混合的距离度量学习数据划分方法,通过更合理地划分数据集来解决该问题.距离度量学习依靠深度神经网络优异的特征提取能力,将原始数据提取的特征嵌入... 针对有限样本情况下,多次训练模型时容易出现不稳定和偏差问题,提出一种基于Gaussian混合的距离度量学习数据划分方法,通过更合理地划分数据集来解决该问题.距离度量学习依靠深度神经网络优异的特征提取能力,将原始数据提取的特征嵌入到新的度量空间中;然后,在该新的度量空间中基于深层次特征使用Gaussian混合模型进行聚类分析和样本分布估计;最后,依据样本分布特点进行分层采样对数据进行合理划分.研究表明,该方法可以更好地理解数据分布的特点,获得更加合理的数据划分,进而提升模型的准确性和泛化性. 展开更多
关键词 人工智能训练 数据划分 深度神经网络 Gaussian混合模型
在线阅读 下载PDF
基于数据压缩和异步通信策略的分布式图算法优化研究
13
作者 梁彦 聂娜 +3 位作者 曹华伟 马丽娜 叶笑春 范东睿 《高技术通讯》 北大核心 2025年第2期145-156,共12页
图是一种非常重要的数据结构形式,被广泛用于社交网络、交通网络和搜索引擎等领域。随着图数据规模爆发式增长,存储容量受限,分布式图计算成为处理大规模图数据的焦点。宽度优先搜索(breadth first search,BFS)算法是图遍历和许多图分... 图是一种非常重要的数据结构形式,被广泛用于社交网络、交通网络和搜索引擎等领域。随着图数据规模爆发式增长,存储容量受限,分布式图计算成为处理大规模图数据的焦点。宽度优先搜索(breadth first search,BFS)算法是图遍历和许多图分析算法的基础,而在分布式图计算过程中存在严重的通信开销。针对上述问题,本文提出了一种综合的数据压缩编码优化方案,结合位图和变长压缩数组,通过更高的压缩率来降低数据通信开销;此外,还提出了一种点对点异步环形通信策略,进一步降低分布式图计算中计算-通信的同步开销。通过这些优化手段,本文在8节点的分布式集群上对优化后BFS算法的性能进行了系统评估,结果表明,当图数据规模为28时,优化后的BFS算法平均性能为46.79亿条边每秒遍历(giga-traversed edges per second,GTEPS),性能比优化前提升了接近7.82%。 展开更多
关键词 宽度优先搜索 数据划分 压缩编码 异步环形通信 并行优化
在线阅读 下载PDF
基于时序数据集划分和时序交叉验证优化燃煤锅炉NO_(x)建模
14
作者 屈可扬 程静 +1 位作者 甘云华 陈东升 《中南大学学报(自然科学版)》 CSCD 北大核心 2024年第12期4665-4674,共10页
针对氮氧化物NO_(x)生成量进行机器学习建模。因燃煤锅炉系统具有时序特性,为了克服常规机器学习流程中随机数据集划分方式对时序数据集划分产生的测试数据泄露问题,提出使用时序数据集划分和时序交叉验证方法对燃煤锅炉NO_(x)建模进行... 针对氮氧化物NO_(x)生成量进行机器学习建模。因燃煤锅炉系统具有时序特性,为了克服常规机器学习流程中随机数据集划分方式对时序数据集划分产生的测试数据泄露问题,提出使用时序数据集划分和时序交叉验证方法对燃煤锅炉NO_(x)建模进行优化。使用基于贝叶斯方法的超参数优化算法,对模型的超参数进行搜索和优化。当使用时序交叉验证评价作为超参数优化的目标函数时,每组超参数评估的总耗时最高减少94.19%。在实际应用中,时序划分方式得到的模型平均绝对值误差比随机方式得到的模型平均绝对值误差更低,支持向量机、多层感知器和弹性网络回归模型平均绝对值误差分别减少18.49%、1.57%、0.73%。相比于随机划分方式,时序划分方式的预期精度与模型实际精度之间的误差更小,预期均方根误差与实际均方根误差间的相对误差最大减少235.32%,时序划分方式能够更准确地得出模型NO_(x)生成量的实际精度。 展开更多
关键词 电站锅炉 NO_(x)生成量 时序数据划分 时序交叉验证 贝叶斯超参数优化
在线阅读 下载PDF
一种满足个性化差分隐私的多方垂直划分数据合成机制
15
作者 朱友文 王珂 周玉倩 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期2159-2176,共18页
当今时代,随着大数据技术的飞速发展和数据量的持续增加,大量数据不断被不同的公司或者机构收集,把来自不同公司或机构的数据聚合起来并发布,有助于更好地提供服务、支持决策。然而他们各自的数据中可能包含敏感程度不同的隐私信息,所... 当今时代,随着大数据技术的飞速发展和数据量的持续增加,大量数据不断被不同的公司或者机构收集,把来自不同公司或机构的数据聚合起来并发布,有助于更好地提供服务、支持决策。然而他们各自的数据中可能包含敏感程度不同的隐私信息,所以在聚合发布各方数据时需要满足个性化隐私保护要求。针对个性化隐私保护的多方数据聚合发布问题,该文提出满足个性化差分隐私的多方垂直划分数据合成机制(PDP-MVDS)。该机制通过生成低维边缘分布实现对高维数据的降维,用低维边缘分布更新随机初始的数据集,最终发布和各方的真实聚合数据集分布近似的合成数据集;同时通过划分隐私预算实现个性化差分隐私保护,利用安全点积协议和门限Paillier加密保证各方数据在聚合过程中的隐私性,利用分布式拉普拉斯机制有效保护了多方聚合边缘分布的隐私。该文通过严格的理论分析证明了PDP-MVDS能够确保每个参与方数据和发布数据集的安全。最后,在公开数据集上进行了实验评估,实验结果表明PDP-MVDS机制能够以低开销生成高效用的多方合成数据集。 展开更多
关键词 隐私保护 多方数据发布 安全多方计算 个性化差分隐私 垂直划分数据
在线阅读 下载PDF
高分辨率遥感影像并行处理数据分配策略研究 被引量:29
16
作者 沈占锋 骆剑承 +2 位作者 陈秋晓 黄光玉 盛昊 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第11期1968-1971,1976,共5页
在高分辨率遥感影像信息提取过程中,为提高信息提取的精度,采用基于特征基元的尺度分割方法;为提高信息提取的速度,采用并行计算机制实现遥感影像的信息提取.在采用并行计算实现遥感影像特征提取过程中,提出非均匀数据分配策略,并对其... 在高分辨率遥感影像信息提取过程中,为提高信息提取的精度,采用基于特征基元的尺度分割方法;为提高信息提取的速度,采用并行计算机制实现遥感影像的信息提取.在采用并行计算实现遥感影像特征提取过程中,提出非均匀数据分配策略,并对其进行基于MPI的实现及效率的分析.结果表明,非均匀的遥感数据划分策略在针对特定图像的并行处理时能够得到比常规均匀划分策略更高的效率. 展开更多
关键词 MPI 并行计算 信息提取 尺度 数据划分
在线阅读 下载PDF
一种大规模高维数据集的高效聚类算法 被引量:2
17
作者 周晓云 孙志挥 张柏礼 《应用科学学报》 CAS CSCD 北大核心 2006年第4期396-400,共5页
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题... 大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果. 展开更多
关键词 聚类算法 子空间聚类 最优分割 数据划分
在线阅读 下载PDF
基于划分方法的浅水波方程并行求解的实现 被引量:1
18
作者 付立东 赵永刚 《西安科技大学学报》 CAS 北大核心 2006年第4期524-528,共5页
针对浅水波方程(shallow-water wave)的差分格式,通过分析数据关系,应用数据划分的策略方法,将参加计算的数据分配到4个进程中并行进行计算,提高了在机群系统中求解大型数值的速度和效率。并给出了网格点数分别是64×64,128×12... 针对浅水波方程(shallow-water wave)的差分格式,通过分析数据关系,应用数据划分的策略方法,将参加计算的数据分配到4个进程中并行进行计算,提高了在机群系统中求解大型数值的速度和效率。并给出了网格点数分别是64×64,128×128和256×256的3种问题规模下在4台工作站机群(C luster)系统中浅水波方程并行程序的运行结果。 展开更多
关键词 浅水波 差分格式 MPI 机群 数据划分 进程通信 幻象点
在线阅读 下载PDF
基于无共享的数据库集群系统结构的设计 被引量:4
19
作者 金蓉 龚卫华 《浙江理工大学学报(自然科学版)》 2007年第4期448-452,共5页
针对目前在企业级应用中大型的数据库系统已不能满足大量并发OLTP事务处理的性能要求,在无共享的数据库集群基础上研究并设计了一种通用的中间件系统结构,该系统由自治的节点数据库组成,具有全局事务管理和模式集成功能,支持水平数据划... 针对目前在企业级应用中大型的数据库系统已不能满足大量并发OLTP事务处理的性能要求,在无共享的数据库集群基础上研究并设计了一种通用的中间件系统结构,该系统由自治的节点数据库组成,具有全局事务管理和模式集成功能,支持水平数据划分和数据复制,TPC-C实验测试证明无共享的数据库集群系统具有次线性的加速比,系统的有效性指标达到80%以上。 展开更多
关键词 数据库集群 数据划分 事务处理
在线阅读 下载PDF
一致性哈希算法在数据库集群上的拓展应用 被引量:11
20
作者 赵飞 苏忠 《成都信息工程学院学报》 2015年第1期52-58,共7页
在数据库集群的研究中,可扩展性是一个重要的性能指标。为实现在数据高速增长或部分集群服务器故障情况下,数据依然能够快速、可靠、安全的分布到新的集群服务器节点上的目的,就必须合理设置数据划分的策略。将Key-Value存储技术中使用... 在数据库集群的研究中,可扩展性是一个重要的性能指标。为实现在数据高速增长或部分集群服务器故障情况下,数据依然能够快速、可靠、安全的分布到新的集群服务器节点上的目的,就必须合理设置数据划分的策略。将Key-Value存储技术中使用的一致性哈希算法思想借鉴运用到并行分析型数据库集群中,提出针对大规模结构化类特殊数据的一致性哈希划分方法,并在MapReduce框架下设计具体的数据划分方案。最后,以TPC-DS作为测试基准,与同类系统进行性能对比测试,实验结果表明方案不仅有良好的划分性能,且扩展性也较好。 展开更多
关键词 计算机应用技术 数据 并行分析型数据库集群 一致性哈希算法 数据划分
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部