期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
融合衍生特征的时间序列事件分类方法
1
作者 张翰林 王俊陆 宋宝燕 《计算机应用》 北大核心 2025年第2期428-435,共8页
时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。... 时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。首先,在时间序列上构建时间序列事件集合后,根据每个时间序列事件构建突变图、协同图、启发图,以减少噪声对高维特征的干扰;其次,融合多图的特征作为衍生特征,并抽取时间序列事件的多个时间级别的特征;最后,提出一种融合衍生特征的多图卷积分类模型级联时间序列和图特征作为时间序列事件的高维特征。实验结果表明,与TF-C(Time-Frequency Consistency)和BiLSTM+隐马尔可夫模型(Bi-directional Long Short-Term Memory-Hidden Markov Model,BL-HMM)方法相比,TSEC-FDF在4个真实数据集上的准确率、精确率、查全率、F1值、AUROC(Area Under the Receiver Operating Characteristic curve)以及AUPRC(Area Under the Precision versus Recall Curve)至少提升了3.2%、4.7%、7.8%、6.3%、0.9%和2.2%。 展开更多
关键词 转换图 衍生特征 图卷积神经网络 多图融合 时间序列分类 图构建
在线阅读 下载PDF
自学习星型链空间自适应分配方法
2
作者 杜立宽 刘晨 +1 位作者 王俊陆 宋宝燕 《计算机科学》 北大核心 2025年第3期359-365,共7页
区块链分片技术是提高区块链系统吞吐量的有效方法。现有的区块链分片方法大多采用静态平行架构分片方案,未解决跨分片交易比例高的问题,导致吞吐量降低以及潜在的无限交易确认延迟。针对这些问题,提出一种基于自学习的星型链空间自适... 区块链分片技术是提高区块链系统吞吐量的有效方法。现有的区块链分片方法大多采用静态平行架构分片方案,未解决跨分片交易比例高的问题,导致吞吐量降低以及潜在的无限交易确认延迟。针对这些问题,提出一种基于自学习的星型链空间自适应分配架构。首先,针对区块链分片系统中跨分片交易比例高的问题,提出一种信标链-分片链架构吞吐量模型;其次,综合分片区块链的吞吐量和时延的关系,在星型链空间的动态决策过程中设计星型链空间奖励函数;最后,提出一种分布式多智能体强化学习动态聚类方法,将每个分片作为智能体共同学习合作策略。实验结果表明,所提方法在吞吐量、跨分片交易比率和交易确认延迟等方面,相比现有方法分别约提升31.74%,35.96%和37.13%。 展开更多
关键词 区块链 分片 深度强化学习 跨分片交易
在线阅读 下载PDF
面向主从区块链的多级索引构建方法
3
作者 王俊陆 张桂月 +2 位作者 杜立宽 李素 陈廷伟 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期799-807,共9页
主从区块链是一种面向领域的、采用高效密码学原理进行大数据可信化通信及存储的新型信息处理技术.随着领域数据规模的指数级增长,现有主从区块链系统存在的查询效率低、溯源时间长等问题愈发严重.针对这些问题,提出一种面向主从区块链... 主从区块链是一种面向领域的、采用高效密码学原理进行大数据可信化通信及存储的新型信息处理技术.随着领域数据规模的指数级增长,现有主从区块链系统存在的查询效率低、溯源时间长等问题愈发严重.针对这些问题,提出一种面向主从区块链的多级索引构建方法(multi-level index construction method for master-slave blockchain,MSMLI).首先,MSMLI引入权重矩阵,基于主链结构将整个主从区块链进行分片,并对各个分片进行权重赋值;其次,针对每个分片内的主区块链,提出基于跳跃一致性哈希的主链索引构建方法(master chain index construction method based on jump consistent Hash,JHMI),输入节点关键值和索引槽位数量,输出主链索引;最后,引入布隆过滤器,改进基于列的选择函数,对各个主区块对应的从属区块链构建2级复合索引.在3种约束条件和2类数据集上的实验结果表明,MSMLI对比现有方法,平均能够缩减9.28%的索引构建时间,提升12.07%的查询效率,同时降低24.4%的内存开销. 展开更多
关键词 区块链 索引 分片 跳跃一致性哈希 改进布隆过滤器
在线阅读 下载PDF
面向联邦学习的随机验证区块链构建 被引量:1
4
作者 陈廷伟 张嘉诚 王俊陆 《计算机应用》 CSCD 北大核心 2024年第9期2770-2776,共7页
针对现有联邦学习模型中存在的本地设备模型梯度泄露、中心化服务器设备可随意退出、全局模型无法抵御恶意用户攻击等问题,提出面向联邦学习的随机验证区块链构建及隐私保护方法。首先,引入可验证哈希函数以随机选举区块链的领导节点,... 针对现有联邦学习模型中存在的本地设备模型梯度泄露、中心化服务器设备可随意退出、全局模型无法抵御恶意用户攻击等问题,提出面向联邦学习的随机验证区块链构建及隐私保护方法。首先,引入可验证哈希函数以随机选举区块链的领导节点,确保节点出块的公平性;其次,设计了验证节点的交叉检测机制防御恶意节点的攻击;最后,基于差分隐私技术训练区块链节点,根据节点对模型的贡献程度构建激励规则进行节点激励,提高联邦学习模型的训练准确率。实验结果表明,所提方法在20%恶意节点的情况下,对于恶意节点的投毒攻击能够达到80%的准确率,相较于Google FL提升了61个百分点,而所提方法在噪声方差为10-3时梯度匹配损失比Google FL提升了14个百分点。可见,相较于Google FL等联邦学习方法,所提方法在提升模型的安全性前提下能够保证良好的精确度,具有更好的安全性和鲁棒性。 展开更多
关键词 联邦学习 区块链 差分隐私 激励机制 异常检测
在线阅读 下载PDF
基于变色龙哈希和可验证秘密共享的联盟链修改方法
5
作者 宋宝燕 丁俊翔 +1 位作者 王俊陆 张浩林 《计算机应用》 CSCD 北大核心 2024年第7期2087-2092,共6页
区块链具有去中心化、不可篡改、可追溯等特征。现有的联盟链系统在数据上链后会全程留痕,当出现敏感信息或恶意数据时无法处理,或处理后区块链分叉、中断。针对这些问题,提出一种基于变色龙哈希和可验证秘密共享的联盟链数据修改方法... 区块链具有去中心化、不可篡改、可追溯等特征。现有的联盟链系统在数据上链后会全程留痕,当出现敏感信息或恶意数据时无法处理,或处理后区块链分叉、中断。针对这些问题,提出一种基于变色龙哈希和可验证秘密共享的联盟链数据修改方法。首先,把变色龙哈希的陷门再分配给身份节点,从而将发起修改者与实际修改者进行隔离;其次,为保证再分配值的正确性,将不同时间周期变色龙哈希所对应的数据设为可验证数据,用验证节点上传承诺到可验证数据,并用提案节点通过承诺验证秘密共享值;最后,为防止节点作恶,提出基于奖励金机制的数据纠正方法提高节点纠正作恶的积极性,降低作恶的可能。在中山大学区块链与智能金融研究中心InPlusLab开发的DApps数据集上进行实验的结果表明:当恶意节点数30个时,所提方法相较于用传统变色龙哈希修改联盟链数据的方法在处理恶意节点的效率方面提高了44.1%;当恶意数据量达到30条时,在处理恶意数据的时间上缩短了53.7%。 展开更多
关键词 可修改联盟链 变色龙哈希 秘密共享 可验证数据 奖励金机制
在线阅读 下载PDF
文档级事件抽取反向推理模型
6
作者 纪婉婷 马宇航 +2 位作者 鲁闻一 王俊陆 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期122-129,共8页
事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件... 事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件抽取反向推理模型(reverse inference model for document-level event extraction,RIDEE)。基于无触发词的设计,将文档级事件抽取转化为候选事件要素抽取和事件触发推理两个子任务,并行式抽取事件要素并检测事件类型。此外,设计了一种用于存储历史事件的事件依赖池,使得模型在处理多事件文本时可以充分利用事件之间的依赖关系。公开数据集上的实验结果表明,与现有事件抽取模型相比,RIDEE在进行文档级事件抽取时具有更优的性能。 展开更多
关键词 文档级事件抽取 反向推理 无触发词 事件依赖池
在线阅读 下载PDF
基于元组相似度的不完备数据填补方法研究 被引量:6
7
作者 王俊陆 王玲 +1 位作者 王妍 宋宝燕 《计算机科学》 CSCD 北大核心 2017年第2期98-102,106,共6页
随着互联网及信息技术的发展,数据缺失、损坏等问题越来越普遍,尤其随着数据收集工作从人工转向机器,存储介质的不稳定性及网络传输出现遗漏等原因都导致数据缺失更加严重。数据库中大量的缺失值不仅严重影响了用户查询质量,还对数据挖... 随着互联网及信息技术的发展,数据缺失、损坏等问题越来越普遍,尤其随着数据收集工作从人工转向机器,存储介质的不稳定性及网络传输出现遗漏等原因都导致数据缺失更加严重。数据库中大量的缺失值不仅严重影响了用户查询质量,还对数据挖掘与数据分析结果的正确性造成了影响,进而误导决策。目前,对缺失数据的填补还没有一种比较通用的方法,大部分策略都是针对某一类型的缺失值问题进行处理。因此,针对不同缺失类型同时出现在不完备数据中的复杂情况,提出了一种基于元组相似度的不完备数据填补方法(IATS)。采用数据挖掘的方法提取出不完备数据集中的加权关联规则,并根据此规则进行常规缺失数据的填补,而对于数据集的异常缺失问题,又引入数据推荐算法,采用推荐筛选策略进行元组相似度的计算并实现相应填补,在很大程度上提高了数据的有效利用率和用户查询结果的质量。实验表明,IATS策略在保证填补率的前提下具有更好的准确率。 展开更多
关键词 海量数据 缺失类型 加权关联规则 元组相似度
在线阅读 下载PDF
基于Gram矩阵的T-CNN时间序列分类方法 被引量:2
8
作者 王俊陆 李素 +2 位作者 纪婉婷 姜天 宋宝燕 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第2期267-276,共10页
时间序列分类是流式数据事件分析和数据挖掘的基础.针对现有方法损失时间属性、分类准确率低、效率低等问题,提出基于Gram矩阵的T-CNN时间序列分类方法.该方法对时间序列进行小波阈值去噪,过滤正态曲线噪声,提出基于Gram矩阵的无损时间... 时间序列分类是流式数据事件分析和数据挖掘的基础.针对现有方法损失时间属性、分类准确率低、效率低等问题,提出基于Gram矩阵的T-CNN时间序列分类方法.该方法对时间序列进行小波阈值去噪,过滤正态曲线噪声,提出基于Gram矩阵的无损时间域图像转换方法,保留事件全部信息.改进时间序列CNN分类方法,在卷积层计算引入Toeplitz卷积核矩阵,实现矩阵乘积替换卷积运算.引入Triplet网络思想,构建T-CNN分类模型,通过计算同类事件与不同类事件间的相似度优化CNN的平方损失函数,提高T-CNN模型梯度下降的收敛速率及分类准确性.实验表明,相比现有方法,T-CNN时间序列分类方法能够提高35%的分类准确率、35%的分类精确率及40%的分类效率. 展开更多
关键词 GRAM矩阵 T-CNN模型 TOEPLITZ 损失函数 Triplet网络
在线阅读 下载PDF
基于B-Spline曲线的流式数据事件模板构建方法 被引量:2
9
作者 王俊陆 杨兴东 +1 位作者 罗浩 宋宝燕 《小型微型计算机系统》 CSCD 北大核心 2019年第4期861-865,共5页
流式数据处理系统中常常要提取出事件的模板,进而针对将来发生在流式数据上的事件做预测分析处理.针对目前的流式数据系统中存在的事件模板的构建过程计算量过大,使用的数据节点较多,误差较大等问题,文本提出一种基于B-Spline曲线的流... 流式数据处理系统中常常要提取出事件的模板,进而针对将来发生在流式数据上的事件做预测分析处理.针对目前的流式数据系统中存在的事件模板的构建过程计算量过大,使用的数据节点较多,误差较大等问题,文本提出一种基于B-Spline曲线的流式数据事件模板构建方法.该方法首先给出了流式数据上的事件和事件模板的定义,在此基础上确定了基本尺度事件,基于该事件给出了基于线性变换变的流式数据事件的归一化处理方法.其次,本文提出使用B-Spline曲线来进行事件模板的拟合,采用均匀的节点矢量,通过遗传算法求解B-Spline的控制节点.实验表明,本文提出的方法能有效的减小事件模板构建过程中存在的计算量过大,使用数据节点较多、误差较大等问题,具有较高的可用性. 展开更多
关键词 流式数据 曲线拟合 遗传算法 B-Spline曲线 归一化
在线阅读 下载PDF
基于Map-Reduce的向量空间约束连接路径查询方法
10
作者 王俊陆 张永普 +2 位作者 宋宝燕 丁琳琳 张师文 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2056-2059,共4页
随着交通路网、社交网络等与空间位置有关的新型服务逐渐增多,向量空间数据规模正以极快速度增长和累积,传统数据处理技术在大规模向量空间数据上的执行效率及结果集优化等方面面临着巨大的挑战.本文提出一种基于Map-Reduce的向量空间... 随着交通路网、社交网络等与空间位置有关的新型服务逐渐增多,向量空间数据规模正以极快速度增长和累积,传统数据处理技术在大规模向量空间数据上的执行效率及结果集优化等方面面临着巨大的挑战.本文提出一种基于Map-Reduce的向量空间约束连接路径查询算法,首先,算法在向量空间上进行等边距网格划分,以距离为阈值进行约束连接;其次,利用MapReduce框架,通过节点到单元格的筛选、节点所在约束区域的筛选、单向边集合的筛选以及节点到节点的距离筛选的四阶段筛选策略找到满足约束条件的全部备选路径,从而减少大量的文本复制和路径计算过程.实验表明,本文提出的算法具有较高的执行效率和较低的误差率. 展开更多
关键词 向量空间 MAP-REDUCE 约束连接 路径查询
在线阅读 下载PDF
基于区块链的双分支结构扩展模型
11
作者 王俊陆 刘强 +2 位作者 张冉 纪婉婷 宋宝燕 《计算机科学》 CSCD 北大核心 2023年第8期365-371,共7页
随着区块链技术的迅速发展,区块链面临着存储开销和数据吞吐率方面的可扩展性挑战。受全体一致性共识原则影响,区块链节点需存储整个区块链的全局账本,数据存储开销大;同时,为维持区块内交易一致和可信,区块链网络中所有节点均需参与到... 随着区块链技术的迅速发展,区块链面临着存储开销和数据吞吐率方面的可扩展性挑战。受全体一致性共识原则影响,区块链节点需存储整个区块链的全局账本,数据存储开销大;同时,为维持区块内交易一致和可信,区块链网络中所有节点均需参与到交易验证同步中,导致网络中区块同步延迟高,带宽征用受阻,进一步降低了数据吞吐量。针对这些问题,提出了一种基于区块链的双分支结构扩展模型。首先,建立区块链三元存储扩展结构,节点对存储任务进行精准划分,分别存储区块链的单一、部分、全局账本,有效降低节点存储负担。其次,提出双分支结构模型,将主链进行信息分流,通过多通道子链并行存储数据,显著提升数据存储速率。针对分流后子链存在的兼容问题,引入双向轮换机制实现链式结构间融合过渡;针对分流后子链安全问题,提出赌徒扩展-F、赌徒扩展-S策略,对两种链式结构进行模拟安全攻击,并对攻击过程进行数学建模。最后,构建两个模型的安全性约束,验证双分支模型的安全性。实验结果表明,所提双分支结构扩展模型能有效抵御恶意双花攻击,且在存储开销、数据吞吐率方面有很大优势。 展开更多
关键词 区块链扩容 二度分支链 三元存储扩展 双向轮换机制 赌徒扩展模式
在线阅读 下载PDF
基于泛化中心聚类的不完备数据集填补方法 被引量:11
12
作者 王妍 王凤桐 +2 位作者 王俊陆 宋宝燕 石展 《小型微型计算机系统》 CSCD 北大核心 2017年第9期2017-2021,共5页
随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统... 随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统的缺失数据的填补方法大部分都只考虑不完备集中数据完全缺失情况下的填补,然而,在海量数据集中,由于人为或者机械等原因会对数据造成一定程度的损坏,有些数据会完全缺失,而有些数据只是部分缺失,传统的填补方法未对不同程度上损坏的数据进行划分,全部按照完全缺失数据进行填补分析,忽略了部分缺失数据对数据填补结果的影响.因此,提出一种基于泛化中心聚类的填补方法(GCF),采用泛化中心聚类思想对数据进行分簇,并对随机损坏数据与聚类结果一起进行缺失数据的填补,以提高填补后数据集的正确率.实验表明,针对不同缺失度的数据集样本,提出的GCF策略在填补正确率方面都具有良好的表现. 展开更多
关键词 海量数据 不完备数据集 泛化中心聚类 数据损坏度
在线阅读 下载PDF
基于范德蒙码的HDFS优化存储策略研究 被引量:18
13
作者 宋宝燕 王俊陆 王妍 《计算机学报》 EI CSCD 北大核心 2015年第9期1825-1837,共13页
随着大数据时代的到来,新型文件系统HDFS(Hadoop分布式文件系统)的应用越来越广泛.但其本身也存在着整体存储成本过高、可扩展性低、节点负载均衡能力不足等问题.因此,该文提出了一种基于范德蒙码的HDFS分散式动态副本存储优化策略,针对... 随着大数据时代的到来,新型文件系统HDFS(Hadoop分布式文件系统)的应用越来越广泛.但其本身也存在着整体存储成本过高、可扩展性低、节点负载均衡能力不足等问题.因此,该文提出了一种基于范德蒙码的HDFS分散式动态副本存储优化策略,针对HDFS大多部署在大量的廉价硬件集群上的实际情况,在范德蒙码优化策略的基础上,采用分散式动态副本控制的思想对HDFS文件操作的计算过程、计算模式以及译码触发策略进行系统的改进,并通过校验码动态设置的方式将容错度控制在一个理想的范围之内,此外,结合伽罗华有限域理论对范德蒙码的编译码操作及计算方法进行全面优化,在不影响HDFS存储结构的前提下,降低了范德蒙码编译码的时间代价和计算的内存压力,节约了HDFS约30%的存储开销,数据可靠性提高了约200%,均衡HDFS系统节点负载能力,译码恢复效率平均提升约40%,形成了一套完整的、系统的优化方案,为未来HDFS的发展提供了一条有效途径. 展开更多
关键词 大数据 HDFS 范德蒙码 分散式动态副本 优化存储
在线阅读 下载PDF
基于压缩的海量不完整数据近似查询方法 被引量:7
14
作者 王妍 刘赓浩 +1 位作者 王俊陆 宋宝燕 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期571-581,共11页
随着数据的爆炸式增加,不完整数据普遍存在,传统的数据修复方法对于海量数据处理代价过高,且不能彻底修复,在这些不完整的海量数据上进行满足给定需求的近似查询引起了学术界的关注.因此,提出一种基于压缩的海量不完整数据近似查询方法... 随着数据的爆炸式增加,不完整数据普遍存在,传统的数据修复方法对于海量数据处理代价过高,且不能彻底修复,在这些不完整的海量数据上进行满足给定需求的近似查询引起了学术界的关注.因此,提出一种基于压缩的海量不完整数据近似查询方法,该方法对属性值缺失字段进行标记,根据频繁查询条件对标记后的数据进行压缩,并建立对应索引;根据属性划分对索引文件再次压缩以节省存储空间,采用编码字典对索引压缩文件进行选择和投影操作,最终获得不完整数据的近似查询结果.实验表明,该方法能够快速定位不完整数据的压缩位置,提高了查询效率,节省了存储空间,并且保证了查询结果的完整性. 展开更多
关键词 不完整数据 近似查询 数据压缩 索引 编码字典
在线阅读 下载PDF
粉煤灰与污泥制备陶粒工艺研究 被引量:11
15
作者 邵青 周靖淳 +2 位作者 王俊陆 王红萍 黄种买 《中国农村水利水电》 北大核心 2015年第4期138-142,共5页
以粉煤灰和污水处理厂剩余污泥为主要原料,开展了粉煤灰污泥陶粒的制备工艺研究。利用正交试验研究了材料配比、预热时间、预热温度、烧结时间、烧结温度等因素对陶粒制备工艺及性能的影响。结果表明:无论是制备建筑骨料还是水处理滤料... 以粉煤灰和污水处理厂剩余污泥为主要原料,开展了粉煤灰污泥陶粒的制备工艺研究。利用正交试验研究了材料配比、预热时间、预热温度、烧结时间、烧结温度等因素对陶粒制备工艺及性能的影响。结果表明:无论是制备建筑骨料还是水处理滤料,烧结温度及配方比例的控制是最重要的因素。如果用于建筑骨料,建议配方中各组分质量分数为粉煤灰70%,污泥20%,黏土及煤粉10%,控制预热温度450℃,预热时间15min,烧结温度1 150℃,烧结时间20min;如果用于水处理滤料,建议配方中各组分质量分数为粉煤灰45%,污泥45%,黏土及煤粉10%,预热温度400℃,预热时间15min,烧结温度1 050℃左右,烧结时间25min。 展开更多
关键词 粉煤灰 剩余污泥 陶粒 烧结温度 污泥掺量
在线阅读 下载PDF
基于自适应变频的链型传感网络数据采集策略 被引量:10
16
作者 王妍 郭敬玉 +2 位作者 邓庆绪 宋知润 王俊陆 《电子测量与仪器学报》 CSCD 北大核心 2015年第11期1594-1602,共9页
近年来,物联网的应用越来越广泛,如电网监测系统等。无线传感器网络作为此类监测系统的重要感知手段,在监测大规模狭长区域时,出现了传感器节点数据采集量过多、传输能耗过大等问题。针对上述问题,本文提出了一种基于自适应变频的链型... 近年来,物联网的应用越来越广泛,如电网监测系统等。无线传感器网络作为此类监测系统的重要感知手段,在监测大规模狭长区域时,出现了传感器节点数据采集量过多、传输能耗过大等问题。针对上述问题,本文提出了一种基于自适应变频的链型传感器网络数据采集策略(SAF),该策略适用于狭长地带的监测环境,通过分析时间序列中采集数据的线性关系,构建一元回归线性模型;根据采集数据与阈值之间的变化趋势,自适应的调整采集时间间隔;采用动态实时更新模型的方式,保持数据的时效性。实验结果表明,该方法可以降低数据采集量约30%左右,减少数据传输总量约80%左右,网络数据传输能耗降低约70%以上。 展开更多
关键词 无线传感器网络 自适应变频 链型结构
在线阅读 下载PDF
基于MapReduce的增广动态Skyline查询处理方法 被引量:2
17
作者 丁琳琳 崔子强 +2 位作者 尹显坤 王俊陆 宋宝燕 《电子学报》 EI CAS CSCD 北大核心 2018年第5期1062-1070,共9页
Skyline查询能够计算大规模的数据集中满足多个标准的最优解,被广泛应用于多目标决策等领域.动态skyline查询作为skyline查询的一种重要变体,其结果随着查询点的不同而动态改变,为用户在指定查询要求方面提供了更大的灵活性.然而,随着... Skyline查询能够计算大规模的数据集中满足多个标准的最优解,被广泛应用于多目标决策等领域.动态skyline查询作为skyline查询的一种重要变体,其结果随着查询点的不同而动态改变,为用户在指定查询要求方面提供了更大的灵活性.然而,随着数据量的不断增加,动态skyline查询会产生大量的查询结果,忽略了查询点的维度方向性和数据的全局整体性,给用户的选择带来极大困难.因此,需要进一步优化动态skyline查询的结果集,提高全局整体性,过滤冗余数据.针对上述问题,提出一种基于MapReduce的增广动态skyline查询处理方法.该方法将原始数据按照维度信息进行分区,在多个节点并行计算动态skyline,优化传统动态skyline结果集,同时提供全局更优的结果供用户选择.在此基础上,针对用户给出某些维度的容忍度的情况,提出一种引入用户容忍度的增广动态skyline查询处理方法.该方法可以根据用户容忍度缩减增广动态skyline查询的原始数据集,很大程度上减少中间结果的比较次数,并且提高了结果集的准确度.大量实验证明,基于MapReduce的增广动态skyline查询处理方法具有更好的有效性、准确性和可用性. 展开更多
关键词 动态skyline查询 MAPREDUCE 用户容忍度 大数据
在线阅读 下载PDF
煤矿灾害漂移特征的反走样模型及多级预警方法 被引量:2
18
作者 宋宝燕 李晓燕 王俊陆 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2072-2076,共5页
煤矿微震信号在研究震动特征、衰减规律、灾害评估方面起着至关重要的作用.但由于受到地质构造、能量损耗等因素影响,同一种类灾害的微震波信号在时间域上传播会出现减缓或加剧等数据漂移现象,影响煤矿灾害预警的准确性.因此,本文提出... 煤矿微震信号在研究震动特征、衰减规律、灾害评估方面起着至关重要的作用.但由于受到地质构造、能量损耗等因素影响,同一种类灾害的微震波信号在时间域上传播会出现减缓或加剧等数据漂移现象,影响煤矿灾害预警的准确性.因此,本文提出的预警方法首先引入音频识别领域中的动态时间规整算法(DTW)构建反走样模型,将实时微震感知数据与历史灾害数据模板波形进行相似性拟合,识别是否为灾害信号;其次,若感知数据是灾害信号,在相似性拟合过程中,为确定感知数据与灾害模板波形匹配的起始点,实现实时匹配,本文提出一种可变滑动窗口策略实现波形的对齐,通过感知窗口渐进滑动的方式找出感知灾害波与模板波的起始对齐位置,保证信号对比的准确性;最后,基于窗口匹配策略及煤矿灾害波形的特点,提出多级预警机制,以1/N窗口大小作为预警阈值,逐步提高预警级别.实验表明,本文提出的预警方法具有更高的准确性和实时性. 展开更多
关键词 微震信号 数据漂移 动态时间规整 反走样 多级预警
在线阅读 下载PDF
基于区域分簇的大规模无线传感器网络生命周期优化策略
19
作者 王妍 章婷婷 +2 位作者 宋知润 王俊陆 郭敬玉 《计算机应用》 CSCD 北大核心 2015年第11期3031-3037,共7页
针对环境监测、电网冰灾监测等大规模监测系统中监测区域覆盖广、传感器数量大等特性,为节约网络能耗以延长生命周期,提出了一种基于区域分簇的大规模无线传感器网络生命周期优化策略(RCS)。该策略首先利用传感器节点的位置信息进行凝... 针对环境监测、电网冰灾监测等大规模监测系统中监测区域覆盖广、传感器数量大等特性,为节约网络能耗以延长生命周期,提出了一种基于区域分簇的大规模无线传感器网络生命周期优化策略(RCS)。该策略首先利用传感器节点的位置信息进行凝聚的层次聚类(AGNES)算法将大规模网络分区以优化簇首的分布;其次,候选簇首节点竞选簇首成功后进行不均匀分簇,同时加入时间阈值来均衡簇首节点的能耗;最后,采用簇间多跳路由,根据节点剩余能量、与汇聚点距离计算网络能耗代价来构建最小生成树进行路由选择。在仿真实验中,该策略与经典的低功耗自适应分簇(LEACH)协议和能量高效的非均匀分簇(EEUC)算法比较,簇首能耗平均分别减少了45.1%和2.4%,网络生命周期分别延长了38%和3.7%。实验结果表明,RCS在大规模网络中能有效均衡整体网络能耗,显著延长了网络的生命周期。 展开更多
关键词 无线传感器网络 分区 非均匀分簇 最小生成树 生命周期
在线阅读 下载PDF
海量不完整数据上基于维度组合的Skyline查询
20
作者 王妍 银彪 +2 位作者 刘赓浩 宋宝燕 王俊陆 《计算机科学与探索》 CSCD 北大核心 2016年第4期495-503,共9页
随着互联网、物联网等信息技术的快速发展,多维数据日益增多,这些海量数据中往往伴随着大量的不完整数据,如何从海量不完整数据中高效地获取用户所需的近似的结果集是一个亟需解决的问题。针对海量高维的不完整数据集,提出了一种基于维... 随着互联网、物联网等信息技术的快速发展,多维数据日益增多,这些海量数据中往往伴随着大量的不完整数据,如何从海量不完整数据中高效地获取用户所需的近似的结果集是一个亟需解决的问题。针对海量高维的不完整数据集,提出了一种基于维度组合的Skyline查询算法,通过构建Rank List数据结构提高查询效率,并减少不完整数据对查询结果的影响;利用维度的不同组合,划分出查询子空间,并渐进地查询出每个子空间的最优先点,从而获得海量不完整数据集上均匀分布的Skyline点。实验结果表明,该算法与Iskyline算法相比,平均查询效率提高了85%,并且在数据量大、维度高时,较普通方法查询效率更高。 展开更多
关键词 海量不完整数据 维度组合 SKYLINE
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部