期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
基于大规模流式车牌识别数据的即时伴随车辆发现 被引量:4
1
作者 朱美玲 王雄斌 +2 位作者 张守利 刘晨 韩燕波 《中国科学技术大学学报》 CAS CSCD 北大核心 2016年第1期47-55,共9页
提出了一种基于流式大规模车牌识别数据集的伴随车辆(伴随车辆是指在一段持续的时间内一起移动的车辆组群)即时发现方法,可实现即时发现疑似伴随车辆并将其按伴随概率排序.该方法充分利用了云基础设施的并行计算能力,基于整数划分思想... 提出了一种基于流式大规模车牌识别数据集的伴随车辆(伴随车辆是指在一段持续的时间内一起移动的车辆组群)即时发现方法,可实现即时发现疑似伴随车辆并将其按伴随概率排序.该方法充分利用了云基础设施的并行计算能力,基于整数划分思想建立并行发现的负载均衡模型,优化了伴随车辆的发现性能,可用于对时间敏感的交通应用场景,如发现并监控运钞车等特殊车辆的跟踪车辆等.实验证明,该方法能够有效处理大规模的流式车牌识别数据,并实时地输出发现结果. 展开更多
关键词 伴随车辆 车牌识别数据 流数据 即时性 点伴随
在线阅读 下载PDF
大数据使能的柔性工作流及其应用
2
作者 丁维龙 田涵 +2 位作者 徐进东 杨坤峰 赵卓峰 《计算机集成制造系统》 北大核心 2025年第5期1806-1816,共11页
业务工作流可以提高业务执行的效率,实现业务过程的自动化,在科技服务、物联网机器人等领域得到广泛应用。当前,面向业务领域积累的海量数据,基于工作流的数据预处理,往往需要大数据技术的辅助。但是,业务工作流在处理大数据时,仍存在... 业务工作流可以提高业务执行的效率,实现业务过程的自动化,在科技服务、物联网机器人等领域得到广泛应用。当前,面向业务领域积累的海量数据,基于工作流的数据预处理,往往需要大数据技术的辅助。但是,业务工作流在处理大数据时,仍存在不支持规范化的大数据抽象,以及流程不能即时调整的局限,无法适应快速变化的业务需求。因此,基于现有工作流规范提出了一种工作流技术方案,不但在构造时支持大数据活动的建模,并且在运行时支持流程的动态变更及柔性保障。通过在科技服务领域的实际案例表明,所述的柔性工作流可提升快速响应的能力;在物联网机器人领域的案例表明,低时延的快速响应可明显提升业务运行效率。 展开更多
关键词 大数据 柔性工作流 BPMN 工作流引擎 业务流程管理
在线阅读 下载PDF
基于大规模船舶轨迹数据的航道边界提取方法 被引量:14
3
作者 徐垚 李卓然 +3 位作者 孟金龙 赵利坡 温建新 王桂玲 《计算机应用》 CSCD 北大核心 2019年第1期105-112,共8页
传统的道路数据获取方法成本高、更新慢等无法适用于海洋航道的获取,从众源轨迹数据中提取道路或航道信息具有成本低、更新快等特性,然而,由于船舶轨迹数据噪声多、数据量大、不同区域分布不均使得航道边界提取面临较大挑战。针对该问题... 传统的道路数据获取方法成本高、更新慢等无法适用于海洋航道的获取,从众源轨迹数据中提取道路或航道信息具有成本低、更新快等特性,然而,由于船舶轨迹数据噪声多、数据量大、不同区域分布不均使得航道边界提取面临较大挑战。针对该问题,提出一种基于大规模船舶轨迹数据进行航道边界提取的方法。首先对大规模的船舶轨迹数据进行并行化去噪、插值、轨迹分段;然后,基于并行化及基于Geohash编码的空间聚类,将轨迹数据化简为多个方形区域的点集数据;其次,对其进行窗口划分,对传统的Ni Black方法进行扩展,提出Spatial Ni Black算法,对方形区域进行航道识别;最后,提出一种新的提取算法del-alpha-shape,基于航道识别结果获得航道边界。理论分析与实验结果表明,所提方法在最大密度值是200,最小密度值是10,窗口长和宽分别为5和5时,可同时达到86. 7%的准确率和79. 4%的召回率。实验结果表明,该方法可以从大规模的轨迹数据中提取有价值的航道边界,是一种有效的航道提取方法。 展开更多
关键词 轨迹数据 自动识别系统 时空大数据 DELAUNAY三角网 航道提取
在线阅读 下载PDF
基于云计算的流数据集成与服务 被引量:52
4
作者 王桂玲 韩燕波 +1 位作者 张仲妹 朱美玲 《计算机学报》 EI CSCD 北大核心 2017年第1期107-125,共19页
当前,大数据的管理和处理是云基础设施的重点用武之地,而服务是落实云计算环境中各类资源及能力交付和使用模式的主要方式.随着感知设备的普及,系统规模急剧扩张,数据多元异构复杂性提升,流数据并发数量及速度剧增,传统的流数据系统在... 当前,大数据的管理和处理是云基础设施的重点用武之地,而服务是落实云计算环境中各类资源及能力交付和使用模式的主要方式.随着感知设备的普及,系统规模急剧扩张,数据多元异构复杂性提升,流数据并发数量及速度剧增,传统的流数据系统在处理能力、可扩展性、容错性等方面面临瓶颈问题,而云计算技术依靠其良好的可伸缩性、数据的并行化处理能力、对服务使用模式的支持、容错性等特点,可作为流数据管理与处理的基础.基于云计算对来自不同类型设备的大规模流数据进行集成、处理及服务化正是文中关注的焦点所在.从应用需求出发,该文对大规模流数据集成和实时处理及服务的概念框架、集成方法、流数据查询处理、定制化服务、可伸缩性保障和可靠性保障以及相关评测基准等要点进行了剖析,归纳了大规模流数据的集成与服务研究面临的挑战,探讨了云计算环境下求解相关问题的思路. 展开更多
关键词 流数据 云服务 数据服务 云数据集成
在线阅读 下载PDF
基于服务的云边端协同流数据处理体系结构研究 被引量:2
5
作者 张守利 刘晨 《山东农业大学学报(自然科学版)》 北大核心 2024年第3期385-395,共11页
物联网相关技术的快速发展产生了大规模传感流数据和对流数据的高并发处理需求,云边端协同计算正成为低延迟、高可靠的流数据处理的有效途径。为了提升流数据处理系统的灵活性和可扩展性,降低流数据处理延迟,本文提出一种基于服务的分... 物联网相关技术的快速发展产生了大规模传感流数据和对流数据的高并发处理需求,云边端协同计算正成为低延迟、高可靠的流数据处理的有效途径。为了提升流数据处理系统的灵活性和可扩展性,降低流数据处理延迟,本文提出一种基于服务的分散式云边端协同流数据处理体系结构,设计了面向大规模流数据的主动式数据服务模型,流数据及流数据处理被抽象为合适粒度、可被独立部署和动态调度的服务,解耦数据与计算。引入事件驱动机制,提出了基于事件驱动的云边端服务动态协作机制,有效提升了系统的灵活性。基于真实的电能质量传感流数据验证了本文所提出架构的正确性和有效性。 展开更多
关键词 流数据处理 云边端协同 服务计算 事件驱动 服务协作
在线阅读 下载PDF
融合深度强化学习与算子优化的流式任务调度
6
作者 郭陈虹 王菁 +2 位作者 巩会龙 郭浩浩 张睿轩 《郑州大学学报(理学版)》 CAS 北大核心 2025年第1期15-22,共8页
针对实时性要求高和作业量大的流处理作业执行过程中,多个作业之间存在的相同处理片段可能会导致流处理引擎重复计算、资源浪费和处理性能低下的问题,提出了融合深度强化学习与算子优化的流式任务调度方法。首先利用算子优化算法将多个... 针对实时性要求高和作业量大的流处理作业执行过程中,多个作业之间存在的相同处理片段可能会导致流处理引擎重复计算、资源浪费和处理性能低下的问题,提出了融合深度强化学习与算子优化的流式任务调度方法。首先利用算子优化算法将多个复杂的作业去重、重构,其次将重构得到的作业输入循环神经网络中得到任务的调度策略,最后利用强化学习模型进行调度策略的优化。所提方法利用算子优化减少了每个作业中创建的算子实例,结合深度强化学习自动发现最优的调度策略,有效地避免了因大量实例运行而造成的系统资源不足、数据拥塞等问题。对比实验结果表明,所提方法在吞吐量和延迟方面的表现更优异。 展开更多
关键词 流处理作业 任务调度 算子优化 深度强化学习
在线阅读 下载PDF
基于车牌识别流数据的车辆伴随模式发现方法 被引量:12
7
作者 朱美玲 刘晨 +1 位作者 王雄斌 韩燕波 《软件学报》 EI CSCD 北大核心 2017年第6期1498-1515,共18页
针对伴随车辆检测这一新兴的智能交通应用,在一种特殊的流式时空大数据——车牌识别流式大数据(ANPR)下,重新定义了Platoon伴随模式,提出PlatoonFinder算法,即时地在车牌识别数据流上挖掘Platoon伴随模式.主要贡献包括:第一,将Platoon... 针对伴随车辆检测这一新兴的智能交通应用,在一种特殊的流式时空大数据——车牌识别流式大数据(ANPR)下,重新定义了Platoon伴随模式,提出PlatoonFinder算法,即时地在车牌识别数据流上挖掘Platoon伴随模式.主要贡献包括:第一,将Platoon伴随模式发现问题映射为数据流上的带有时空约束的频繁序列挖掘问题,与传统频繁序列挖掘算法仅考虑序列元素之间位置关系不同,该算法能够在频繁序列挖掘的过程中有效处理序列元素之间复杂的时空约束关系;第二,该算法融入了伪投影等性能优化技术,针对数据流的特点进行了性能优化,能够有效应对车牌识别流式大数据的速率和规模,从而实现车辆Platoon伴随模式的即时发现.通过在真实车牌识别数据集上的实验分析表明:PlatoonFinder算法的平均延时显著低于经典的Aprior和PrefixSpan等频繁模式挖掘算法,也低于真实情况下交通摄像头的车牌识别最小时间间隔.因此,所提出的算法可以有效地发现伴随车辆组及其移动模式. 展开更多
关键词 流式时空大数据 大数据分析 伴随模式 频繁序列挖掘
在线阅读 下载PDF
基于云架构的交通感知数据集成处理平台 被引量:12
8
作者 赵卓峰 丁维龙 韩燕波 《计算机研究与发展》 EI CSCD 北大核心 2016年第6期1332-1341,共10页
海量、多源、不间断的交通感知数据环境下,如何提供集成化的交通感知数据处理支持是多样化交通应用实施中的难点.现有的通用计算框架及平台由于缺少对具有时空相关等特征的交通感知数据和应用间交通感知数据共享的支持,使得交通感知数... 海量、多源、不间断的交通感知数据环境下,如何提供集成化的交通感知数据处理支持是多样化交通应用实施中的难点.现有的通用计算框架及平台由于缺少对具有时空相关等特征的交通感知数据和应用间交通感知数据共享的支持,使得交通感知数据处理应用的开发存在较高的复杂性并且易于造成大量重复的数据跨节点传输而影响应用性能.针对此问题,通过分析交通感知数据及其处理需求特征,提出一种基于可跨应用共享的时空数据对象的交通感知数据处理模型,通过引入时空数据对象这一新的概念抽象并提供易并行划分的时空数据对象组织及共享支持,实现分布计算中对时空型交通感知数据的优化管理.在此基础上,设计并实现了交通感知数据集成处理平台.通过实际应用和基于真实交通数据的实验测试表明:该平台相对于传统的交通感知数据处理方法及系统在性能及扩展性等方面均具有一定的优势. 展开更多
关键词 云架构 交通感知数据 时空数据对象 实时MapReduce 流计算
在线阅读 下载PDF
基于JDBC的数据访问优化技术 被引量:14
9
作者 韩兵 江燕敏 方英兰 《计算机工程与设计》 北大核心 2017年第8期1991-1996,2031,共7页
为使Web应用系统能够有效、快速地访问数据,分析当前Web系统三层框架有关数据缓存和访问优化的技术,通过对JDBC接口原理及实现技术的深入研究,提出基于JDBC的数据自主识别、前置驻留与快速访问的策略和实现方案。使用key-value存储机制... 为使Web应用系统能够有效、快速地访问数据,分析当前Web系统三层框架有关数据缓存和访问优化的技术,通过对JDBC接口原理及实现技术的深入研究,提出基于JDBC的数据自主识别、前置驻留与快速访问的策略和实现方案。使用key-value存储机制,通过客户端-应用层的快照数据快速访问机制提升Web系统综合性能。测试结果表明,该方案能够有效提高Web系统在数据访问的响应速度,实现多客户端的数据共享,具有一定的普适性和推广价值。 展开更多
关键词 JAVA数据库连接 数据识别 数据前置 访问过滤 快照数据
在线阅读 下载PDF
支持探索式研判分析的动态ETL流程服务 被引量:3
10
作者 张硕 赵卓峰 +1 位作者 王桂玲 刘杰 《小型微型计算机系统》 CSCD 北大核心 2019年第1期176-180,共5页
ETL(Extract-Transformation-Loading)作为一种将不同来源的原始数据转换为有效信息的数据集成手段,可为基于综合信息的研判分析提供支持.然而,在当前信息共享和大数据等发展趋势下,各行业研判分析活动表现出多样化、动态性的特征,往往... ETL(Extract-Transformation-Loading)作为一种将不同来源的原始数据转换为有效信息的数据集成手段,可为基于综合信息的研判分析提供支持.然而,在当前信息共享和大数据等发展趋势下,各行业研判分析活动表现出多样化、动态性的特征,往往需要面对大量动态、突发的数据抽取、转换及加载需求,传统预定义式的ETL方式难以快速实现.为此,提出一种支持探索式研判分析的动态ETL流程服务,包括探索式研判分析的基本思路、动态ETL流程服务的实现及ETL处理并发性能优化方法,并结合某公安联合作战指挥应用案例对动态ETL流程服务进行了验证,实际应用表明该服务能够支持以"边构造边执行"的方式实现用于研判分析的ETL流程. 展开更多
关键词 探索式研判分析 动态ETL流程 服务 并发性能优化
在线阅读 下载PDF
SDaaS:一种传感流数据的服务化封装方法 被引量:5
11
作者 张仲妹 刘晨 +2 位作者 苏申 张守利 韩燕波 《计算机学报》 EI CSCD 北大核心 2017年第2期445-463,共19页
来自不同传感器网络的流数据共享和集成对于带动相关业务和行业的创新具有重要意义.现有的传感网络往往是任务导向或领域专用的,仅适用于特定的应用场景,难以有效地在不同应用间共享和重用其数据资源.传感流数据的服务化是一种有效解决... 来自不同传感器网络的流数据共享和集成对于带动相关业务和行业的创新具有重要意义.现有的传感网络往往是任务导向或领域专用的,仅适用于特定的应用场景,难以有效地在不同应用间共享和重用其数据资源.传感流数据的服务化是一种有效解决物理传感网络数据资源共享和重用的方法.针对已有服务化方法在应对大规模传感流数据共享和用户并发访问方面存在的局限性,该文提出了一种面向传感流数据的服务化封装方法——SDaaS(Stream Data as a Service),该方法使用事件的方式驱动传感流数据的处理和传输,通过对传感数据的融合操作实现服务对传感流数据的深层次加工,并基于Pub/Sub机制实现传感流数据的按需分发.文中基于Spark Streaming实现对大规模流数据加工操作的封装,并通过对传统的基于匹配树的事件匹配算法进行改进实现了高效的流数据内容分发,以保障将传感数据实时的分发给相应需求.该文通过实验验证了流数据服务的性能,印证了流数据服务能够响应不同的数据需求,在毫秒级别将数据流分发给不同应用. 展开更多
关键词 传感流数据 流数据服务 Pub/Sub机制 事件驱动 事件匹配 云计算
在线阅读 下载PDF
基于车牌识别流数据的伴随车辆发现算法 被引量:5
12
作者 王路辉 王桂玲 《计算机工程》 CAS CSCD 北大核心 2017年第8期193-199,共7页
针对伴随车辆发现及其实时性问题,基于随时间变化的车牌识别流数据,提出一种采用并行频繁项集发现(PFID)技术的伴随车辆组实时发现算法。该算法根据频繁项挖掘Eclat算法的思想,并利用分布式流数据处理框架Spark Streaming生成最大伴随... 针对伴随车辆发现及其实时性问题,基于随时间变化的车牌识别流数据,提出一种采用并行频繁项集发现(PFID)技术的伴随车辆组实时发现算法。该算法根据频繁项挖掘Eclat算法的思想,并利用分布式流数据处理框架Spark Streaming生成最大伴随车辆组。实验结果表明,与排列组合算法及FP-Growth算法相比,PFID算法消耗内存更少,响应时间更短,在秒级响应时间内能找到伴随车辆组,达到及时预警目的。 展开更多
关键词 智能交通系统 车牌自动识别流数据 伴随车辆组 SPARK Streaming并行框架 DStream模型 Eclat算法
在线阅读 下载PDF
基于负载均衡的多源流数据实时存储系统 被引量:12
13
作者 郭会云 房俊 李冬 《计算机工程与科学》 CSCD 北大核心 2017年第4期641-647,共7页
物联网感知流数据多以时序数据为主,具有数据量大、连续到达、多来源等特点。现有的基于HBase的交通流数据存储系统在数据写入并发量大时,仍然存在存储效率低与系统可用性不高的问题。针对该问题,设计并实现了基于负载均衡的多源流数据... 物联网感知流数据多以时序数据为主,具有数据量大、连续到达、多来源等特点。现有的基于HBase的交通流数据存储系统在数据写入并发量大时,仍然存在存储效率低与系统可用性不高的问题。针对该问题,设计并实现了基于负载均衡的多源流数据实时存储系统。该系统将数据代理扩展为集群架构,提出了一种基于负载均衡的任务调度算法,实现了任务与数据代理之间的按序匹配,使数据代理集群负载均衡地处理任务,实现数据并行存储到HBase数据库中。实验对比结果表明:该系统使各数据代理的数据分配比例维持在0.3~0.4,同时以约1.5倍于单数据代理的速度将数据写入HBase数据库。 展开更多
关键词 多源流数据 HBASE 实时存储系统 数据代理 负载均衡 任务调度
在线阅读 下载PDF
面向流数据的实时处理及服务化系统 被引量:3
14
作者 狄程 杨中国 +1 位作者 韩燕波 刘晨 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第7期75-83,共9页
流数据的处理需求复杂多变,业务人员要进行相应的算法定制,不仅需要相关的编程知识,更要应对繁琐的处理流程和冗长的开发周期。为解决上述问题,文中设计并实现了基于流程建模的流数据处理及服务化系统,提供了对于多源流数据的实时接入,... 流数据的处理需求复杂多变,业务人员要进行相应的算法定制,不仅需要相关的编程知识,更要应对繁琐的处理流程和冗长的开发周期。为解决上述问题,文中设计并实现了基于流程建模的流数据处理及服务化系统,提供了对于多源流数据的实时接入,流数据服务化以及流数据处理服务化的能力。该系统将流数据处理过程封装为服务提供给用户,允许用户拖拽组合流数据处理和服务化模块、配置相关参数,定义流数据处理及服务化的过程,快速又自然地实现流数据处理及服务化的任务,将处理结果经由服务路由实时推送到其他应用系统,满足不同的业务需求。案例分析表明,与传统的流数据处理系统相比,本系统具有高效、灵活、可配置等特点,在实用性、可用性和伸缩性方面都更有优势。 展开更多
关键词 流数据 视图驱动 实时处理 规则引擎 服务化
在线阅读 下载PDF
面向高速公路大数据的短时流量预测方法 被引量:10
15
作者 王雪菲 丁维龙 《计算机应用》 CSCD 北大核心 2019年第1期87-92,共6页
针对高速公路传统的短时交通流预测方法适用数据规模小、全网预测效率较低、数据的时空关系被忽视等问题,提出一种结合了K近邻(KNN)模型且面向高速大数据的短时交通流预测方法。首先,对模型的K值和距离度量进行调优,利用交叉验证进行模... 针对高速公路传统的短时交通流预测方法适用数据规模小、全网预测效率较低、数据的时空关系被忽视等问题,提出一种结合了K近邻(KNN)模型且面向高速大数据的短时交通流预测方法。首先,对模型的K值和距离度量进行调优,利用交叉验证进行模型参数的对比实验;然后,考虑数据内在的业务时空关联,建模基于时空特性的特征向量;最后,在大数据环境下建立回归预测模型,以最优参数的模型实现预测。实验结果表明,与传统时间序列模型相比,所提方法一次可预测出全站点的流量,单次运行速度快,效率提高了77%,平均绝对百分比误差(MAPE)和绝对百分比误差中位数(MDAPE)均有明显减低,且具有良好的水平扩展性。 展开更多
关键词 交通流量 短时预测 K近邻 时空数据 大数据
在线阅读 下载PDF
大数据环境下基于元模型控制的数据质量保障技术研究 被引量:10
16
作者 杨冬菊 徐晨阳 《计算机工程与科学》 CSCD 北大核心 2019年第2期197-206,共10页
数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题,提出了基于元数据模型控制的ETL集成模型... 数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题,提出了基于元数据模型控制的ETL集成模型,并对数据集成过程中的各种映射规则进行了详细的定义,通过将抽取、转换、加载环节的元模型和映射机制相结合,能够有效地保证集成后数据的数据质量。提出的元模型已经应用到科技资源管理数据集成业务中。通过科技资源管理数据集成实例分析,验证了此数据集成方案能够有效地支撑大数据环境下数据仓库的构建和集成后数据质量的提升。 展开更多
关键词 大数据 数据仓库 ETL 元数据模型 映射 数据集成
在线阅读 下载PDF
基于关系图谱的科技数据分析算法 被引量:3
17
作者 张寒烁 杨冬菊 《计算机科学》 CSCD 北大核心 2021年第3期174-179,共6页
随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据。对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务。由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中... 随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据。对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务。由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理。首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系图谱;其次,对关系图谱进行分析,提出了一种基于改进FP-growth的图数据频繁项挖掘算法;然后,设计了基于图数据的数据筛选流程,进行数据的筛选、分析,并定义评分矩阵,对待筛选数据情况进行评价,最终给出分析意见,且数据筛选的评价标准可以进行自定义;最后,结合构建的关系图谱,将算法进行了实际应用,并将其封装为服务。实验结果表明,提出的基于改进FP-growth的频繁项挖掘算法相比传统FP-growth算法在时间上有10%~12%的提升,数据筛选过程的准确率达到97%左右。 展开更多
关键词 关系图谱 数据分析 图谱构建 人员关系图谱 数据挖掘 服务应用
在线阅读 下载PDF
数据驱动的自动化机器学习流程生成方法 被引量:2
18
作者 陈高建 王菁 +2 位作者 栗倩文 袁云静 曹嘉琛 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第3期185-193,共9页
自动化机器学习是机器学习前沿的一个重要问题,自动化机器学习工具根据数据集及任务需求组合机器学习算子来构造流程,使领域用户在不具备专业机器学习知识的情况下也能完成相应数据分析工作,但目前的自动化机器学习工具普遍存在耗时长... 自动化机器学习是机器学习前沿的一个重要问题,自动化机器学习工具根据数据集及任务需求组合机器学习算子来构造流程,使领域用户在不具备专业机器学习知识的情况下也能完成相应数据分析工作,但目前的自动化机器学习工具普遍存在耗时长和精度低的问题。本文基于数据集相似性和强化学习原理,提出一种数据驱动的自动化机器学习流程的生成方法,利用相似数据集的历史知识,将神经网络与MCTS相结合,指导机器学习流程的生成。实验结果表明:该方法在耗时方面缩短至分钟级别,流程性能也得到提升。 展开更多
关键词 AutoML 数据集相似性 MCTS 强化学习
在线阅读 下载PDF
面向IoT数据工作流的分割与调度方法 被引量:1
19
作者 秦生辉 赵卓峰 杨中国 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第1期153-162,共10页
物联网数据是当前一类典型的大数据,其应用正成为诸多行业领域的热点,围绕物联网数据的应用往往可以被表7K为由一组大数据处理与分析任务构成的工作流.与传统工作流不同的是,IoT(Internet of Things)环境下这种数据驱动的工作流具有数... 物联网数据是当前一类典型的大数据,其应用正成为诸多行业领域的热点,围绕物联网数据的应用往往可以被表7K为由一组大数据处理与分析任务构成的工作流.与传统工作流不同的是,IoT(Internet of Things)环境下这种数据驱动的工作流具有数据来源分散、数据规模大、云边协同分布执行等特点,给IoT数据工作流的执行带来了数据流控制管理、数据传输调度等方面的诸多挑战.针对IoT数据工作流的执行约束和数据传输优化问题.提出一种面向IoT数据工作流的分割与调度优化方法.首先对IoT数据工作流的执行约束条件、边缘节点负载以及数据传输量进行建模,进而以数据传输和执行时间优化为目标设计一种云边架构下IoT数据工作流的分割算法和子工作流执行调度算法.通过基于WorkflowSim的仿真实验结果表明,提出的算法与典型的HEFT和MINMIN算法相比,可以在保障边缘节点执行约束和负载均衡的条件下有效降低IoT数据工作流的执行时间. 展开更多
关键词 IoT工作流 分割调度 数据传输优化 多目标优化 物联网服务
在线阅读 下载PDF
一种适于跨租户数据共享的多租户数据存储模式 被引量:1
20
作者 丁洪翔 赵卓峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期491-501,共11页
随着SaaS(Software-as-a-Service)软件中台化和业务服务范围的发展,跨租户的业务协作和数据共享需求愈发突出,对传统以租户数据隔离为主要内容的多租户数据存储模式带来了新的挑战,在已有多租户数据模式基础上支持跨租户的数据共享按需... 随着SaaS(Software-as-a-Service)软件中台化和业务服务范围的发展,跨租户的业务协作和数据共享需求愈发突出,对传统以租户数据隔离为主要内容的多租户数据存储模式带来了新的挑战,在已有多租户数据模式基础上支持跨租户的数据共享按需定制成为多租户数据存储模式设计的新问题.为此,提出一种支持可定制共享的多租户数据存储模式——共享宽表.该模式在传统宽表下扩展了用于存储租户之间关系的逻辑表,并增加了对于异构数据的映射机制,可以在保障租户数据隔离要求下同时适用于租户之间数据共享的灵活定制.实验表明,相对于传统宽表数据模式,提出的多租户数据存储模式可以更简单地支持跨租户的数据共享定义,并且具有更好的共享查询效率. 展开更多
关键词 多租户 共享宽表 数据共享 存储模式 映射机制
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部