期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
Haddon模型视角下大数据和人工智能在COVID-19疫情防控中的应用分析
1
作者 高景宏 王言研 +4 位作者 蒋帅 付航 段彦然 王素凡 王成增 《中国全科医学》 北大核心 2024年第1期111-117,共7页
大数据和人工智能技术在新型冠状病毒感染(COVID-19)疫情防控中发挥了积极作用,但是目前鲜有研究对其应用情况和未来趋势进行综合探讨。本研究从COVID-19疫情防控面临的问题出发,在介绍大数据和人工智能技术优势的基础上,对疫情防控过... 大数据和人工智能技术在新型冠状病毒感染(COVID-19)疫情防控中发挥了积极作用,但是目前鲜有研究对其应用情况和未来趋势进行综合探讨。本研究从COVID-19疫情防控面临的问题出发,在介绍大数据和人工智能技术优势的基础上,对疫情防控过程中常用的大数据和人工智能技术及其实际应用案例进行概述;并基于Haddon模型视角,从疫情发生前、发生中和发生后3个阶段,针对传染病的传染源、传播途径和易感人群三要素,对大数据和人工智能技术在其中的应用进行了深入探讨。研究结果对明确大数据和人工智能技术在COVID-19疫情各流行阶段的积极作用及发展应用方向,提升疫情的防控效率和质量,有效应对未来新发传染病等具有重要意义。 展开更多
关键词 新型冠状病毒感染 Haddon模型 大数据 人工智能 疫情防控 应用
在线阅读 下载PDF
医院全面预算管理的数据建模与计算机实现
2
作者 朱海燕 顾晓鸣 孙万驹 《计算机应用与软件》 北大核心 2025年第8期101-105,146,共6页
全面预算管理在医院具体执行过程中存在较多问题,其中关键有两大问题:一是如何建立科学的预算方法,这涉及到医疗大数据的统计学问题;二是如何用计算机系统来执行并应用该预算制度,使复杂的专业计算过程通过普通医护管理人员易于理解的... 全面预算管理在医院具体执行过程中存在较多问题,其中关键有两大问题:一是如何建立科学的预算方法,这涉及到医疗大数据的统计学问题;二是如何用计算机系统来执行并应用该预算制度,使复杂的专业计算过程通过普通医护管理人员易于理解的计算机界面呈现,便于医院的医学和管理人员理解和决策执行。该文医院信息化应用的特点,从这两方面阐述了医院全面预算管理的数据建模方法与具体计算机应用系统的实现。 展开更多
关键词 医疗 大数据 预算 建模 计算机 应用
在线阅读 下载PDF
一种基于ANTLR的MongoDB数据库SQL转化模型 被引量:11
3
作者 李常青 谷建华 《西北工业大学学报》 EI CAS CSCD 北大核心 2017年第1期143-147,共5页
作为非关系型数据的典型存储和管理模型,NoSQL(not only structured query language)技术随着大数据发展浪潮已成为研究热点之一。通过对著名NoSQL数据库MongoDB特点的分析,针对其缺乏SQL(structured query language)访问接口的不足,提... 作为非关系型数据的典型存储和管理模型,NoSQL(not only structured query language)技术随着大数据发展浪潮已成为研究热点之一。通过对著名NoSQL数据库MongoDB特点的分析,针对其缺乏SQL(structured query language)访问接口的不足,提出了一种基于ANTLR的MongoDB数据库SQL转化模型,并重点研究了该模型的分层构成、SQL解析、语义转换以及运行机制。基于该模型,设计开发了原型系统,对该模型的效果进行了验证,达到了预期的目标。这一研究成果的突出贡献在于,它可以使得软件开发人员对MongoDB数据库的学习曲线变得平坦,减少了编制程序的工作量,提高了软件的开发效率。 展开更多
关键词 SQL NO SQL Mongo DB 大数据 转化模型 ANTLR
在线阅读 下载PDF
大数据背景下基于改进RNN的低压配电网线损智能分析方法 被引量:7
4
作者 李学军 张世元 《沈阳工业大学学报》 北大核心 2025年第1期130-136,共7页
【目的】在电力系统中,线损率是衡量电网系统设计、运维和管理水平的重要经济技术指标,对于保障电网的稳定经济运行、提高供电效率具有重要意义。然而,在用户数量激增、用能特征多样化的大数据背景下,线损率的计算评价工作面临较大挑战... 【目的】在电力系统中,线损率是衡量电网系统设计、运维和管理水平的重要经济技术指标,对于保障电网的稳定经济运行、提高供电效率具有重要意义。然而,在用户数量激增、用能特征多样化的大数据背景下,线损率的计算评价工作面临较大挑战。传统线损计算方法依赖于电网参数,精细化程度偏低,计算准确率不佳。【方法】针对该问题,提出了一种基于改进循环神经网络(RNN)的低压配电网线损智能分析方法,旨在通过智能化手段提高线损计算的准确性和效率。方法利用K-means算法对智能配电网的海量用户数据进行分类预处理,以降低数据冗余度。采用层次分析法(AHP)从分类数据中提取线损指标,这些指标随后被输入到深度学习模型中,其中,核心深度学习模型是由卷积神经网络(CNN)和改进长短时记忆网络(LSTM)模型融合而成,该模型能够挖掘配电网数据特征,实现线损的智能分析。通过IEEE33节点的仿真模型进行实验验证,充分展示所提方法的有效性。【结果】实验结果表明,所提方法的均方误差(MSE)和相对误差百分数(RE)分别为3.15 MW和2.43%,计算精度较高。与现有方法相比,所提方法在大数据背景下的配电网线损智能分析中具有明显优势,能够全面考虑各种配电网的影响因素,获得更精准的线损计算结果。此外,通过与两种经典文献方法进行对比实验,进一步验证所提方法的性能优势。【结论】基于改进RNN模型的低压配电网线损智能分析方法通过K-means算法和AHP预处理提取线损指标,再利用CNN-LSTM模型进行深入分析,有效提高了线损计算的准确性和效率。该方法主要针对低压配电网线路侧的线损进行分析,对于更高等级电压的线损分析尚未深入研究,但其在低压配电网线损智能分析中显示出优异的结果,具有实际应用价值。未来的研究将扩展到更广泛的校验分析,以提高方法的全面性和可靠性。此外,该方法的提出也为智能配电网的进一步研究和应用提供了新的思路和工具,有助于推动智能电网技术的发展和应用。通过这种方法,不仅可以提高线损计算的准确性,还能为电网的优化管理提供科学依据,对于提升电网运行效率、降低能源损耗具有重要的实际意义。随着技术的不断进步和数据量的日益增加,智能化的线损分析方法将成为电力系统运维中不可或缺的一部分。 展开更多
关键词 大数据 低压配电网 K-MEANS聚类 层次分析法 特征提取 CNN-LSTM模型 智能线损分析 循环神经网络
在线阅读 下载PDF
大数据应用、创新要素配置与制造业企业劳动生产率
5
作者 孙献贞 《工业技术经济》 北大核心 2025年第4期90-98,共9页
大数据应用可以促进企业生产方式重构,为制造业企业提升劳动生产率提供推动力量。本文以2013~2023年中国制造业上市公司为研究对象,构建面板双向固定效应模型进行实证检验。研究发现:大数据应用能够显著促进制造业企业劳动生产率,且经... 大数据应用可以促进企业生产方式重构,为制造业企业提升劳动生产率提供推动力量。本文以2013~2023年中国制造业上市公司为研究对象,构建面板双向固定效应模型进行实证检验。研究发现:大数据应用能够显著促进制造业企业劳动生产率,且经过一系列稳健性和内生性检验回归结果依然稳健。机制分析结果表明,大数据应用通过优化创新要素配置,进而促进制造业企业劳动生产率。异质性分析结果表明,大数据应用对制造业企业劳动生产率的影响存在异质性,非国有企业、大规模企业、资本密集型企业和东部地区企业大数据应用对劳动生产率的促进作用更大。本文揭示了大数据应用提升制造业企业劳动生产率的作用机理,为促进制造业企业劳动生产率提升提供了理论基础和现实借鉴。 展开更多
关键词 大数据应用 劳动生产率 创新要素配置 制造业企业 数字技术 数据基础设施 面板双向固定效应模型 生产率悖论
在线阅读 下载PDF
基于电力大数据的钢铁企业大气污染物排放核算模型构建及应用 被引量:1
6
作者 周卫青 杨俊琦 +4 位作者 宁亮 吴华成 薄宇 张强 田贺忠 《环境科学研究》 CAS CSCD 北大核心 2024年第2期299-307,共9页
近年来,各级生态环境部门与国家电网公司积极签署战略合作协议,促进电力大数据在生态环境管理信息化平台的应用.本研究通过梳理电力大数据在大气污染防治中的应用,以唐山市钢铁行业为例构建基于电力大数据的大气污染物高时间精度排放核... 近年来,各级生态环境部门与国家电网公司积极签署战略合作协议,促进电力大数据在生态环境管理信息化平台的应用.本研究通过梳理电力大数据在大气污染防治中的应用,以唐山市钢铁行业为例构建基于电力大数据的大气污染物高时间精度排放核算模型,进一步挖掘电力大数据在大气污染排放控制中的应用潜力.结果表明:①模型核算的2019年唐山市17家钢铁企业的大气污染物排放量与2019年唐山市大气污染物排放清单(简称“城市清单”)结果一致性较好,SO_(2)、NOx和PM_(2.5)排放量分别为1017.90、2047.75、1141.81t,误差介于-0.46%~4.27%之间.②基于工序而言,以PM_(2.5)为例,模型预测结果与城市清单结果的相对误差在-17.34%~10.60%之间.③唐山某钢铁企业2022年SO_(2)、NOx、PM_(2.5)月排放量受钢铁市场价格影响较大,1月和6月分别为最高和最低污染物排放月,而其日排放受行业特征影响较为平稳,小时排放可能受电价波动影响较大.研究显示,基于电力大数据的大气污染物核算模型阐明了电力大数据和污染排放的动态响应关系,一定程度上提升了排放核算的时间精细度,实证了基于电力大数据核算大气污染物排放的研究意义和可行性. 展开更多
关键词 电力大数据 应用现状 大气污染物排放核算模型 高时间精度
在线阅读 下载PDF
法律大语言模型的司法应用及其规范 被引量:9
7
作者 魏斌 《东方法学》 CSSCI 北大核心 2024年第5期57-73,共17页
法律大语言模型因其超级学习和“涌现”能力,在法律任务中表现出卓越的性能,引发了法律科技领域的新一轮革命。法律大语言模型的司法应用主要体现在法律语言理解、法律知识问答、法律预测和法律文本生成等领域。然而,随着其在审判等司... 法律大语言模型因其超级学习和“涌现”能力,在法律任务中表现出卓越的性能,引发了法律科技领域的新一轮革命。法律大语言模型的司法应用主要体现在法律语言理解、法律知识问答、法律预测和法律文本生成等领域。然而,随着其在审判等司法实践中的应用,暴露出可解释性弱和“幻觉”等问题。法律大语言模型仍然难以胜任法律人的核心工作,包括法律推理、司法证明、法律解释、法律论证和疑难案件中的道德判断等。法律大语言模型在情感、道德、逻辑推理、决策机制和经验学习等方面仍然与法律人有本质的差异,因此,法律大语言模型的司法应用需要在严格的规范之下合理使用。 展开更多
关键词 生成式人工智能 法律大语言模型 法律大数据 司法应用 数据安全 法律科技
在线阅读 下载PDF
面向在线教育领域的大数据研究及应用 被引量:51
8
作者 陈池 王宇鹏 +2 位作者 李超 张勇 邢春晓 《计算机研究与发展》 EI CSCD 北大核心 2014年第S1期67-74,共8页
随着互联网和视频通信技术的发展,在线教育如火如荼地展开,在线教育平台产生的数据日益增多.面向在线教育领域的大数据研究及应用对于在线教育的高效性至关重要.首先明确了在线教育平台上大数据的基本概念、分类及特点,其次介绍教育数... 随着互联网和视频通信技术的发展,在线教育如火如荼地展开,在线教育平台产生的数据日益增多.面向在线教育领域的大数据研究及应用对于在线教育的高效性至关重要.首先明确了在线教育平台上大数据的基本概念、分类及特点,其次介绍教育数据挖掘、学习分析和知识图谱等有关技术,然后构建面向在线教育领域的大数据模型,最后按照服务对象的分类重点描述有关大数据的功能,勾勒出未来在线教育平台上大数据应用的基本轮廓,为之后在线教育领域大数据的研发起到指导性作用. 展开更多
关键词 在线教育 大数据 应用 模型 智能化
在线阅读 下载PDF
智能配用电大数据需求分析与应用研究 被引量:186
9
作者 王继业 季知祥 +3 位作者 史梦洁 黄复鹏 朱朝阳 张东霞 《中国电机工程学报》 EI CSCD 北大核心 2015年第8期1829-1836,共8页
智能电网是大数据的重要技术应用领域之一。随着智能电网的发展,高级量测体系、各种监控系统的大规模部署产生和积累了大量数据,充分挖掘这些数据的价值具有重要意义。针对智能配用电业务,首先分析智能配用电大数据的特征;然后分析数据... 智能电网是大数据的重要技术应用领域之一。随着智能电网的发展,高级量测体系、各种监控系统的大规模部署产生和积累了大量数据,充分挖掘这些数据的价值具有重要意义。针对智能配用电业务,首先分析智能配用电大数据的特征;然后分析数据融合后的智能配用电大数据整体业务需求和应用场景,其中重点研究大数据环境下的用户用电行为和负荷预测两个典型应用场景,提出大数据环境下的研究思路和方法;接着分析业务应用中的大数据关键技术;最后给出了智能配用电大数据应用技术架构。 展开更多
关键词 智能配用电 大数据技术 需求分析 应用研究
在线阅读 下载PDF
智能配电网大数据应用技术与前景分析 被引量:183
10
作者 赵腾 张焰 张东霞 《电网技术》 EI CSCD 北大核心 2014年第12期3305-3312,共8页
针对大数据在智能配电网中的应用问题,在分析智能配电网大数据现状和特征以及梳理数据关系网的基础上,阐述了大数据在智能配电网中应用所涉及到的大数据存储与处理以及大数据解析等关键技术。提出了数据价值链和面向大数据应用的"... 针对大数据在智能配电网中的应用问题,在分析智能配电网大数据现状和特征以及梳理数据关系网的基础上,阐述了大数据在智能配电网中应用所涉及到的大数据存储与处理以及大数据解析等关键技术。提出了数据价值链和面向大数据应用的"飞机型"理论框架,并从用电预测与协同调度、智能配电网网架发展趋势分析与优化规划,以及智能用电与网络降损等方面分析了大数据在智能配电网中的应用前景,提出了应用路线图。 展开更多
关键词 大数据 智能配电网 关系网与价值链 数据可视化 数据驱动的决策 应用路线
在线阅读 下载PDF
大数据背景下智慧旅游应用模型体系构建 被引量:40
11
作者 张建涛 王洋 刘力钢 《企业经济》 CSSCI 北大核心 2017年第5期116-123,共8页
随着创新驱动发展战略的不断深化,基于大数据平台的智慧旅游发展受到旅游产业利益相关者的日益关注,物联网、通信网以及云计算等先进技术的广泛应用,使得我国智慧旅游的可持续发展成为可能。本文基于对大数据与智慧旅游的内涵阐述,剖析... 随着创新驱动发展战略的不断深化,基于大数据平台的智慧旅游发展受到旅游产业利益相关者的日益关注,物联网、通信网以及云计算等先进技术的广泛应用,使得我国智慧旅游的可持续发展成为可能。本文基于对大数据与智慧旅游的内涵阐述,剖析了大数据背景下智慧旅游发展面临的问题,并有针对性地构建了以大数据平台为依托的智慧旅游应用模型。模型分为政府旅游部门子平台、旅游者子平台、旅游企业子平台和社区居民子平台四个子平台,各子平台依托大数据各尽其责。大数据背景下智慧旅游应用模型的实现有利于实现旅游业利益相关者的协作共赢,为我国旅游产业的全面、协调、可持续发展提供理论依据。最后,提出了大数据背景下智慧旅游发展的地位与作用等实现路径。 展开更多
关键词 大数据 应用模型体系 智慧旅游
在线阅读 下载PDF
云计算环境中面向OLTP应用的数据分布研究 被引量:10
12
作者 王晓燕 陈晋川 杜小勇 《计算机学报》 EI CSCD 北大核心 2016年第2期253-269,共17页
云计算为大型OLTP应用中分布式数据的高效存储和管理带来了新的机遇,大数据则对分布式数据的存储与管理提出了新的挑战,自动数据分布逐渐成为分布式系统中的研究重点和难点.该文对影响数据分布问题的三要素数据、负载和节点进行分析,将... 云计算为大型OLTP应用中分布式数据的高效存储和管理带来了新的机遇,大数据则对分布式数据的存储与管理提出了新的挑战,自动数据分布逐渐成为分布式系统中的研究重点和难点.该文对影响数据分布问题的三要素数据、负载和节点进行分析,将该问题抽象为数据分片、数据分配和负载执行3个相互关联的子问题,提出了数据分布问题的三角架构DaWN.由于不同的系统有不同的应用需求,DaWN架构以代价模型为枢纽,对特定应用需要达到的效能目标和资源限制进行调配,并提出了数据分布问题所面临的技术挑战.该文对DaWN架构中以顶点为代表的3个基本要素进行详细分析,着重对以边为代表的3条关联关系进行阐释,并据此对云环境中大规模OLTP应用的数据分片、数据分配和负载执行3个数据分布子问题的研究成果和进展进行归纳和总结.基于以上分析,该文以数据分片、数据分片和负载执行为变量,使用真值表覆盖数据分布问题中的8种类型,并采用三维立体坐标系的方式对相关工作的分布进行归纳总结和呈现.最后,该文从代价模型研究、测试基准研究、自动化数据分布技术研究、特定应用研究等4个角度,对数据分布问题的未来发展方向进行展望. 展开更多
关键词 数据分布 三角架构 数据分片 数据分配 OLTP 大数据
在线阅读 下载PDF
Hadoop大数据平台的搭建与测试 被引量:18
13
作者 崔文斌 牟少敏 +2 位作者 王云诚 浩庆波 昌腾腾 《山东农业大学学报(自然科学版)》 CSCD 北大核心 2013年第4期550-555,共6页
大数据处理平台Apache?Hadoop是一个开源的分布式系统框架,可以运行分布式应用程序。在大数据时代Hadoop有着良好的发展前景。本文简要介绍了Hadoop的发展史,分析了Hadoop集群的构造模块和组件,搭建了Hadoop集群并进行了测试。
关键词 大数据 HADOOP 分布式应用程序 分布式系统
在线阅读 下载PDF
基于MapReduce的高能物理数据分析系统 被引量:9
14
作者 臧冬松 霍菁 +1 位作者 梁栋 孙功星 《计算机工程》 CAS CSCD 2014年第2期1-5,共5页
将MapReduce思想引入到高能物理数据分析中,提出一个基于Hadoop框架的高能物理数据分析系统。通过建立事例的TAG信息数据库,将需要进一步分析的事例数减少2-3个数量级,从而减轻I/O压力,提高分析作业的效率。利用基于TAG信息的事例... 将MapReduce思想引入到高能物理数据分析中,提出一个基于Hadoop框架的高能物理数据分析系统。通过建立事例的TAG信息数据库,将需要进一步分析的事例数减少2-3个数量级,从而减轻I/O压力,提高分析作业的效率。利用基于TAG信息的事例预筛选模型以及事例分析的MapReduce模型,设计适用于ROOT框架的数据拆分、事例读取、结果合并等MapReduce类库。在北京正负电子对撞机实验上进行系统实现后,将其应用于一个8节点实验集群上进行测试,结果表明,该系统可使4×10-6个事例的分析时间缩短23%,当增加节点个数时,每秒钟能够并发分析的事例数与集群的节点数基本呈正比,说明事例分析集群具有良好的扩展性。 展开更多
关键词 高能物理 大数据 数据分析 MAPREDUCE模型 集群 分布式计算
在线阅读 下载PDF
面向配网台区的综合评价模型研究与可视化应用 被引量:13
15
作者 刘飞 贲树俊 +4 位作者 周嘉 邓松 毛艳芳 冯鹏 杨佩 《电网与清洁能源》 北大核心 2017年第5期63-68,共6页
随着配电网规模的不断扩大,海量异构数据呈指数级增长,为了提高配电网的运维管理水平,解决配网建设、规划中的诸多问题。文中提出基于大数据、GIS、可视化技术,从配网最小单元台区入手,利用Kmean聚类分析、主客观权重加成、神经网络等... 随着配电网规模的不断扩大,海量异构数据呈指数级增长,为了提高配电网的运维管理水平,解决配网建设、规划中的诸多问题。文中提出基于大数据、GIS、可视化技术,从配网最小单元台区入手,利用Kmean聚类分析、主客观权重加成、神经网络等方法建立配网台区综合评价模型,并利用可视化技术对评价结合进行多维立体展示,让工作人员快速定位问题,找出问题台区;从而对配网线路、变电站及整个台区的运维状态充分把握,提升问题异动分析的精确度,通过实践所提内容切实可行,能够对台区状态进行立体展示,促进整体配网运维与规划。 展开更多
关键词 配网台区 神经网络 评价模型 大数据 可视化
在线阅读 下载PDF
基于D5000平台的调配一体技术方案 被引量:14
16
作者 殷自力 钱静 +3 位作者 陈宇星 黄文英 关胜亮 任晓辉 《电力系统自动化》 EI CSCD 北大核心 2016年第18期162-167,共6页
基于对调度控制系统、配电自动化主站系统技术特点的分析,提出调配一体系统设计的基本原则,即一体化平台、一体化维护、一体化展示、核心应用独立运行;从调配一体建模、调配应用运行框架、调配应用协同三方面,探讨了基于智能电网调度控... 基于对调度控制系统、配电自动化主站系统技术特点的分析,提出调配一体系统设计的基本原则,即一体化平台、一体化维护、一体化展示、核心应用独立运行;从调配一体建模、调配应用运行框架、调配应用协同三方面,探讨了基于智能电网调度控制系统基础平台(简称D5000平台)调配一体系统的关键技术;结合实际案例,介绍了D5000平台的调配一体系统的特点和研究成果。考虑到配网自动化建设因地制宜、分步实施的特点,作为现阶段提高配电网调度技术的支撑手段,推行调配一体系统有着积极长远的意义。 展开更多
关键词 D5000平台 调配一体 一体化建模 信息分流 应用协同
在线阅读 下载PDF
教育大数据视角下的内容语义分析模型及应用研究 被引量:18
17
作者 刘清堂 张思 +2 位作者 范桂林 王洋 吴林静 《电化教育研究》 CSSCI 北大核心 2017年第1期54-61,93,共9页
教育大数据为分析学习行为与过程、提升学习绩效、科学规划与决策提供了巨大可能。当面临社会化学习中大容量、增殖速度快、具有一定情境特征的海量教育数据时,传统的分析方法遇到了瓶颈。如何建立可靠的学习分析模型,对教育数据进行科... 教育大数据为分析学习行为与过程、提升学习绩效、科学规划与决策提供了巨大可能。当面临社会化学习中大容量、增殖速度快、具有一定情境特征的海量教育数据时,传统的分析方法遇到了瓶颈。如何建立可靠的学习分析模型,对教育数据进行科学合理的分析和解释,成为当下研究的热点和难点。本文首先介绍了内容语义分析的概念、一般过程和分析方法,在此基础上提出了数字化课堂内容语义分析方法,以及社会化学习中的内容语义分析模型和应用框架,探讨了内容语义分析模型在数字化课堂教学、教育技术学领域本体库构建、网络研修社区教师反思水平分析中的应用,以期为探索教育大数据环境下的教育研究途径和方法提供借鉴。 展开更多
关键词 教育大数据 内容语义分析 分析模型 应用研究
在线阅读 下载PDF
支持分布式大数据应用建模的模型理论 被引量:4
18
作者 张文燚 项连志 王小芳 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2015年第5期671-677,共7页
针对当前尚无面向分布式大数据应用、支持多组件协作应用建模的一般实用模型理论的问题。首先,给出了分布式大数据应用问题的形式化定义和问题求解的一般表达形式;然后,引入包含多结构化状态关系代数、协议代数和交互计算总线格代数的... 针对当前尚无面向分布式大数据应用、支持多组件协作应用建模的一般实用模型理论的问题。首先,给出了分布式大数据应用问题的形式化定义和问题求解的一般表达形式;然后,引入包含多结构化状态关系代数、协议代数和交互计算总线格代数的交互式计算范畴,并由此建立了交互式计算模型MIC,作为分布式大数据应用建模的模型理论基础。目前,MIC已在住房和城乡建设部的信息资源统一规划和国家住房信息系统建设中取得了成功的应用。 展开更多
关键词 分布式大数据应用建模 模型理论 范畴 求解算子
在线阅读 下载PDF
数据依赖约束下的任务调度资源选择算法 被引量:5
19
作者 廖彬 于炯 +1 位作者 张陶 杨兴耀 《计算机应用》 CSCD 北大核心 2014年第8期2260-2266,共7页
大数据环境下的计算任务往往具有一定数据依赖性关系(如MapReduce),现有的分布式存储系统任务资源选择策略选择离请求者最近的数据块响应服务,忽略了对数据块所在服务器CPU、磁盘I/O与网络等资源负载状态的考虑。在分析研究系统集群结... 大数据环境下的计算任务往往具有一定数据依赖性关系(如MapReduce),现有的分布式存储系统任务资源选择策略选择离请求者最近的数据块响应服务,忽略了对数据块所在服务器CPU、磁盘I/O与网络等资源负载状态的考虑。在分析研究系统集群结构、文件分块、数据块存储机制的基础上,定义了集群节点矩阵、CPU负载矩阵、磁盘I/O负载矩阵、网络负载矩阵、文件分块矩阵、数据块存储矩阵与数据块存储节点状态矩阵,为任务与数据之间的依赖性构建了基础数据模型,提出了一种数据依赖约束下的最优资源选择算法(ORS2DC)。任务调度节点负责维护基础数据,MapReduce任务与数据块读取任务由于依赖资源不同而采取不同的选择策略。实验结果表明:所提算法能够为任务选择质量更高的资源,提高任务完成质量的同时减轻了NameNode负担,减小了单点故障发生的概率。 展开更多
关键词 大数据计算 分布式存储系统 任务调度 数据模型 资源选择
在线阅读 下载PDF
我国图情领域有关数据研究的态势分析——基于灰色预测算法 被引量:7
20
作者 张宁 袁勤俭 沈洪洲 《情报杂志》 CSSCI 北大核心 2017年第8期156-160,共5页
[目的/意义]为了深入揭示数据主题的发展轨迹和规律,探析未来发展趋势,为后续相关研究提供参考借鉴。[方法/过程]对近五年来(2012-2016年)我国中文社会科学引文索引收录的图书情报学的18种期刊所刊载论文及其题录数据进行计量研究,并采... [目的/意义]为了深入揭示数据主题的发展轨迹和规律,探析未来发展趋势,为后续相关研究提供参考借鉴。[方法/过程]对近五年来(2012-2016年)我国中文社会科学引文索引收录的图书情报学的18种期刊所刊载论文及其题录数据进行计量研究,并采用灰色预测GM(1,1)模型,对最具有代表性的6个数据主题类团进行计算,预测这些关键词所代表的研究主题在之后两年可能出现的频率,同时利用R语言依次进行模型精度检测和拟合,最后逐个分析各个主题类团的研究现状和研究趋势。[结果/结论]研究发现:数据主题的相关研究在近五年持续增长;大数据类主题研究预计在未来两年仍然保持高速增长的趋势,并与各个学科产生深度交叉;数据组织类、数据对象类、数据管理类和数据应用服务类预计持续保持小幅增长趋势;单纯研究数据分析类主题的关键词热度预计有所下降。 展开更多
关键词 图书情报学 大数据 数据组织 数据对象 数据管理 数据应用 数据服务 灰色模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部