期刊文献+
共找到2,357篇文章
< 1 2 118 >
每页显示 20 50 100
基于UDDI扩展的e-service元数据设计 被引量:1
1
作者 涂静 《武汉科技大学学报》 CAS 2006年第4期404-406,共3页
基于UDD I注册中心因缺乏对服务语义的支持而不足以成为e-service的服务目录问题,在对UDD I元数据进行扩展的基础上,为e-service设计了企业级元数据和服务级元数据,同时给出了服务语义发布和发现的实例。
关键词 UDDI e-service元数据 语义
在线阅读 下载PDF
中国创业教育年谱制作与元分析检验--基于时间视角的大数据经验证据
2
作者 傅颖 贾建锋 曹曼婷 《东北大学学报(社会科学版)》 北大核心 2025年第3期142-150,共9页
创业教育既是大学转型发展的抓手,也是建设创新型国家的动能。来自管理学和教育学的学者进行了大量基于实践总结的创业教育研究,但缺乏系统、全面和高可信度的梳理与总结。将时间因素加入到创业教育研究中,基于过程演化视角研究创业教... 创业教育既是大学转型发展的抓手,也是建设创新型国家的动能。来自管理学和教育学的学者进行了大量基于实践总结的创业教育研究,但缺乏系统、全面和高可信度的梳理与总结。将时间因素加入到创业教育研究中,基于过程演化视角研究创业教育并探索其效果。利用大数据爬虫技术和人工编码,在大量史料中再现了中国创业教育发展轨迹,弥补了中国创业教育年谱制作的空白,进行了较为客观的创业教育阶段划分;进一步利用51篇实证文献和240957个样本,运用元分析研究方法揭示了2015年后创业教育对大学生创业意向的影响效果更为显著,刻画了2015年在中国创业教育历史进程中所发挥的具有转折点性质的作用。 展开更多
关键词 创业教育 年谱 数据 分析 中国经验 创业意向
在线阅读 下载PDF
基于元数据技术的国民经济核算分类编码方法研究
3
作者 贾小爱 孟国峰 郭川 《统计与决策》 北大核心 2025年第5期55-61,共7页
分类编码是国民经济核算的基础,而元数据技术则是推动国民经济核算分类编码方法创新的重要工具。文章通过系统梳理国民经济核算分类编码发展历程发现,现有国民经济核算分类编码存在系统性不足、覆盖面有限、实用性较弱等问题。因此,采... 分类编码是国民经济核算的基础,而元数据技术则是推动国民经济核算分类编码方法创新的重要工具。文章通过系统梳理国民经济核算分类编码发展历程发现,现有国民经济核算分类编码存在系统性不足、覆盖面有限、实用性较弱等问题。因此,采用面状与线状相结合的多维列举层级分面组配法优化分类结构,同时引入数字与字母混合型的编码方法,构建国民经济核算分类编码标准;在此基础上,依据元数据理论,构建了包含3个类别共28个元素的国民经济核算分类编码元数据标准,以实现分类编码的标准化信息描述与管理。 展开更多
关键词 国民经济核算 分类编码 数据 分面组配法
在线阅读 下载PDF
产权属性、元宇宙与数据资产界定 被引量:3
4
作者 毛政珍 伍中信 张荣武 《财会月刊》 北大核心 2025年第6期29-34,共6页
数据是数字经济时代的新型生产要素和战略性资源,数据资产的清晰界定对数据要素价值创造和经济发展至关重要。本文深入分析数据资产的产权属性、内涵、界定及未来趋势,结果表明:数据资产具有“双重性”“共享权”“区块链确权”等特殊... 数据是数字经济时代的新型生产要素和战略性资源,数据资产的清晰界定对数据要素价值创造和经济发展至关重要。本文深入分析数据资产的产权属性、内涵、界定及未来趋势,结果表明:数据资产具有“双重性”“共享权”“区块链确权”等特殊产权属性;元宇宙时代的数据资产是基础性资源,能更好地确权与交易,具有更广阔的价值创造空间和更大的经济影响力;数据资产定义的核心点是“能确权”“有价值”,数据资产与存货、无形资产等资产能进行明确的分类界定;数据资产将在数量、流通、作用等方面形成新的发展态势。本文不仅深化了数据资产理论研究,还为企业数据资产管理实践提供了重要参考。 展开更多
关键词 数据资产 产权属性 宇宙 数字技术
在线阅读 下载PDF
ScaleFS:面向大语言模型的高性能可扩展元数据设计 被引量:1
5
作者 尚碧筠 韩银俊 +3 位作者 肖蓉 陈正华 屠要峰 董振江 《计算机研究与发展》 北大核心 2025年第3期589-604,共16页
近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准... 近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准备、模型训练和推理阶段的存储访问特征,深入探讨了传统存储系统在大模型场景下面临的主要问题和瓶颈.针对这些挑战,提出并实现了一种高性能、可扩展的分布式元数据设计Scale FS.通过目录树元数据与属性元数据解耦的架构设计,并结合深度与广度均衡的目录树分层分区策略设计,Scale FS实现了高效的路径解析、负载均衡和系统扩展能力,能够高效管理千亿级文件.此外,Scale FS设计了细粒度元数据结构,优化了元数据访问模式,并构建了面向文件语义优化的元数据键值存储底座,显著提升了元数据访问效率并减少了磁盘I/O操作.实验结果表明,Scale FS的每秒操作次数(operations per second,OPS)是HDFS的1.04~7.12倍,而延迟仅为HDFS的12.67%~99.55%.在千亿级文件规模下,Scale FS的大部分操作性能优于HDFS在十亿级文件规模下的表现,展现出更高的扩展性和访问效率,能够更好地满足大模型场景对千亿级文件存储及高效访问的需求. 展开更多
关键词 大语言模型 大模型训练 存储系统 数据管理 可扩展性
在线阅读 下载PDF
AI生成元数据赋能图书馆资源建设的实践与启示——基于国内外案例调查
6
作者 张谙宁 叶兰 +2 位作者 周文琦 张倩 张欢庆 《大学图书馆学报》 北大核心 2025年第4期90-104,共15页
分析国内外图书馆在资源建设中应用AI生成元数据的实践经验,为国内图书馆提升AI应用能力和资源建设水平提供参考。通过调研国内外20个实践案例,围绕实施主体、资源对象、应用技术、应用场景和赋能成效总结实践现状和经验。研究从两个方... 分析国内外图书馆在资源建设中应用AI生成元数据的实践经验,为国内图书馆提升AI应用能力和资源建设水平提供参考。通过调研国内外20个实践案例,围绕实施主体、资源对象、应用技术、应用场景和赋能成效总结实践现状和经验。研究从两个方面提出实践建议与启示:一是制定AI生成元数据的技术应用方案,包括基于大语言模型的提示词工程、基于机器学习的领域数据训练和基于知识图谱的检索增强生成;二从战略规划、质量监控和人才能力等方面保障AI生成元数据赋能成效。 展开更多
关键词 人工智能 数据 资源建设 图书馆
在线阅读 下载PDF
元宇宙环境中虚实交互数据故事的生成路径 被引量:1
7
作者 靳庆文 刘慧 李胡蓉 《图书馆论坛》 北大核心 2025年第1期96-107,共12页
基于元宇宙视角研究虚实交互数据故事的技术方案与生成路径,对于充分发挥数据故事的沉浸式交互体验和虚实场景下的融合共享功能至关重要。文章分析元宇宙与数据故事在故事要素、交互方式、虚实内容等方面的交互融合,从政策制度、实现技... 基于元宇宙视角研究虚实交互数据故事的技术方案与生成路径,对于充分发挥数据故事的沉浸式交互体验和虚实场景下的融合共享功能至关重要。文章分析元宇宙与数据故事在故事要素、交互方式、虚实内容等方面的交互融合,从政策制度、实现技术和融合路径层面出发,基于“用户层架构”构建元宇宙环境下七层次的虚实交互数据故事生成框架,对国内外开展元宇宙研究的典型企业进行案例分析。国内外企业在虚实交互数据故事的生成路径中存在技术创新、个性化用户体验、平台的开放性和互操作性、多业务场景覆盖等方面的共性,未来应构建“真实业务数据”与“沉浸式虚拟环境”相结合的、对现实世界产生实际影响的“故事化元宇宙”。 展开更多
关键词 宇宙 数据故事 虚实交互 生成路径 沉浸式体验
在线阅读 下载PDF
基于BERT-RL的红色文献元数据标注研究
8
作者 武帅 何琳 +2 位作者 杨秀璋 孙绍丹 桂思思 《大学图书馆学报》 北大核心 2025年第4期76-89,共14页
红色文献普遍存在数量庞大、分散且类型复杂多样等特点,使得基于零基础训练的大语言模型较难实现高效应用。如何利用少量已标注数据来微调大型语言模型,从而实现红色文献领域元数据的自动化标注,是当前亟须解决的关键问题之一。文章设... 红色文献普遍存在数量庞大、分散且类型复杂多样等特点,使得基于零基础训练的大语言模型较难实现高效应用。如何利用少量已标注数据来微调大型语言模型,从而实现红色文献领域元数据的自动化标注,是当前亟须解决的关键问题之一。文章设计了一种基于增量学习的大语言模型微调方法,并结合深度学习技术,实现了红色文献元数据表示体系的自动化标注。首先,根据红色文献的内容特征,将其归纳为事件叙述、人物评价、情感表达、文献摘录和场景描述五类文本数据集;其次,采用增量学习方式对大语言模型进行微调;最后,构建融合BERT-RL预训练模型和CNN-BiGRU-MHA-CRF的自动化标注模型,以实现对红色文献元数据的自动化标注。研究结果表明,目标领域数据集的数据特征多样性有助于提升基于增量学习微调大语言模型的效果。 展开更多
关键词 增量学习 红色文献 数据表示体系 自动化标注 BERT-RL
在线阅读 下载PDF
分布式文件系统的元数据管理方案演变:整体到粒度
9
作者 路垚 段红军 +1 位作者 张利莹 王振飞 《小型微型计算机系统》 北大核心 2025年第2期305-313,共9页
元数据的存取性能对于分布式文件系统至关重要,近年来已成为学术界和工业界研究的热点.早期的分布式文件系统未严格区分元数据和数据管理,导致可扩展性和性能优化方面的挑战.针对此问题,主流分布式文件系统采用元数据和文件数据分离的架... 元数据的存取性能对于分布式文件系统至关重要,近年来已成为学术界和工业界研究的热点.早期的分布式文件系统未严格区分元数据和数据管理,导致可扩展性和性能优化方面的挑战.针对此问题,主流分布式文件系统采用元数据和文件数据分离的架构,以提高系统的可扩展性和效率.然而,随着数据量的进一步增长和对系统性能的不断追求,最新的文件系统开始提出将元数据进一步细化管理的概念.这一趋势意味着系统对元数据的管理将更加精细化和灵活,能够更好地适应不断变化的需求和数据规模.对国内外分布式文件系统元数据管理方案的最新进展进行归纳、比较和分析,并结合国家发展战略和重大应用需求,选取与我国国计民生密切相关的领域,从典型应用分析总结元数据相关技术的行业进展.最后,就未来的技术挑战和研究方向进行展望. 展开更多
关键词 分布式文件系统 数据管理 粒度 可扩展性
在线阅读 下载PDF
数据湖元数据管理体系:需求剖析、功能架构与未来展望
10
作者 张贵香 贾君枝 薛鹏珍 《图书与情报》 北大核心 2025年第1期106-116,共11页
随着全球数据产量呈现指数级增长,传统数据管理系统正面临数量庞大、多样化和实时性要求的挑战。数据湖作为大型原始数据存储库,已成为有效处理各种类型和规模数据的关键工具。为了防止数据湖演变为数据沼泽,必须重视元数据的有效管理... 随着全球数据产量呈现指数级增长,传统数据管理系统正面临数量庞大、多样化和实时性要求的挑战。数据湖作为大型原始数据存储库,已成为有效处理各种类型和规模数据的关键工具。为了防止数据湖演变为数据沼泽,必须重视元数据的有效管理。文章聚焦数据湖数据生命周期,探究数据湖元数据管理需求,归纳数据湖元数据类型;综合分析各领域的元数据架构,梳理数据湖元数据系统功能,揭示其在整个数据湖系统中的关键作用,并提出了数据湖元数据管理发展方向。探讨了数据湖的运作机制以及数据湖元数据管理逻辑,为应对不断增长的数据挑战提供了有力支持。 展开更多
关键词 数据 数据管理 数据系统
在线阅读 下载PDF
政府数据服务质量影响因素与提升路径研究——基于元分析与模糊集QCA组合分析
11
作者 黄平平 石乐怡 吴应强 《现代情报》 北大核心 2025年第9期165-176,共12页
[目的/意义]当前关于政府数据服务质量的影响因素尚未形成一致性结论,运用元分析与模糊集QCA组合分析,尝试得出关于政府数据服务质量影响因素的普适性结论,以期为政府数据服务高质量发展提供参考。[方法/过程]通过系统性文献筛选归纳政... [目的/意义]当前关于政府数据服务质量的影响因素尚未形成一致性结论,运用元分析与模糊集QCA组合分析,尝试得出关于政府数据服务质量影响因素的普适性结论,以期为政府数据服务高质量发展提供参考。[方法/过程]通过系统性文献筛选归纳政府数据服务质量影响因素,运用元分析方法揭示不同因素对政府数据服务质量的影响。在此基础上选取中国已上线的22个省级政府数据开放平台作为研究案例,借助模糊集QCA方法探明政府数据服务质量提升的3种组态路径。[结果/结论]研究结果表明,制度支持、个性化服务、准确性、基础设施、便利性、感知价值、用户信任是影响政府数据服务质量的关键要素。制度—信任驱动型、个性化—信任驱动型、制度—个性化驱动型是服务质量提升的组态路径。 展开更多
关键词 政府 数据服务 服务质量 分析 模糊集QCA
在线阅读 下载PDF
人工智能生成元数据的哲学叙事
12
作者 涂良川 高镁琪 《理论与改革》 北大核心 2025年第3期39-50,154,155,共14页
人工智能时代,元数据是我们绕不开的社会历史存在,其以技术逻辑通过规则的具象生成、客观创设与迁移拓展具体影响着人类生存与生活的逻辑。元数据作为判定原则、推理规范和预测根据,既表达数据的特质,又规定了系统生成知识、创设对象和... 人工智能时代,元数据是我们绕不开的社会历史存在,其以技术逻辑通过规则的具象生成、客观创设与迁移拓展具体影响着人类生存与生活的逻辑。元数据作为判定原则、推理规范和预测根据,既表达数据的特质,又规定了系统生成知识、创设对象和提升智能的逻辑。从元数据的生成逻辑来讲,人工智能生成元数据,使人工智能以区别人类智能的方式技术性地再现了智能的运行过程及其对对象的“认知”;从元数据的社会历史效应来看,元数据作为人工智能以数据为对象确立规则的原则与逻辑,既复现了客观存在的关系,又以数码的方式泛化了智能系统发现的规则,从而变革了人类主体与对象世界之间的互动关系与影响逻辑。因此,面对人工智能定义历史的现实,我们只有从人工智能生成元数据的逻辑出发,直面人工智能时代数据与物的转换逻辑,重释数据网络中的主体与客体关系,探寻现实世界与可能世界的因果联结,才能有效统合客观世界的生成与实践世界的创造,推进智能本质的认知与智能能力的发展,实现“人—机”的共在与“虚—实”的结合。 展开更多
关键词 人工智能 数据 数码环境 数码物 哲学叙事 算法
在线阅读 下载PDF
基于智能化矿山数据分类与编码规范的元数据标准构建方法 被引量:5
13
作者 汪莹 祖子帅 王振华 《工矿自动化》 CSCD 北大核心 2024年第7期130-135,146,共7页
目前智能化矿山建设面临数据标准不健全、多源异构数据集成难度大、共享机制有待完善等问题。建立统一的智能化矿山元数据标准,对形成多源异构数据融合共享机制具有重要意义。基于智能化矿山数据分类与编码规范,研究了智能化矿山元数据... 目前智能化矿山建设面临数据标准不健全、多源异构数据集成难度大、共享机制有待完善等问题。建立统一的智能化矿山元数据标准,对形成多源异构数据融合共享机制具有重要意义。基于智能化矿山数据分类与编码规范,研究了智能化矿山元数据标准构建方法,明确了元数据标准构建是对数据分类与编码的延伸研究与价值挖掘。定义了元数据实体与元数据属性的内涵,设计了包含基础描述框架与扩展描述框架的智能化矿山元数据描述框架,给出了反映智能化矿山业务场景特征的基础元数据属性描述项和智能化矿山数据分类与编码规范中基础类、生产类、安全类、管理类4大主题域组的拓展元数据属性描述项,从而构成元数据标准。以生产主题域组中采煤机惯导系统的惯导传感器为例,介绍了元数据标准的构建过程。基于智能化矿山数据分类与编码规范构建元数据标准,可以解决多源异构数据的融合与共享问题,促使矿山企业更加高效地管理、分析和应用数据,提高矿山数据治理的智能化水平。 展开更多
关键词 智能化矿山 数据治理 数据分类与编码 数据标准 数据描述框架
在线阅读 下载PDF
基于元数据增强的多模态会话推荐模型
14
作者 党伟超 程炳阳 《计算机工程与设计》 北大核心 2024年第11期3427-3433,共7页
为学习会话推荐中不同项目属性的共享表示和提升推荐性能,提出一种基于元数据增强的多模态会话推荐模型。应用项目元数据模态感知模块从项目元数据中学习不同项目属性的共享表示,将离散重组编码学习集成到推荐模型中,设计一种双循环知... 为学习会话推荐中不同项目属性的共享表示和提升推荐性能,提出一种基于元数据增强的多模态会话推荐模型。应用项目元数据模态感知模块从项目元数据中学习不同项目属性的共享表示,将离散重组编码学习集成到推荐模型中,设计一种双循环知识蒸馏框架,最大化不同通道学习到的会话嵌入的互信息。与现有主流模型相比,该模型在大压缩比下实现了快速推理,展示出优越的推荐性能。 展开更多
关键词 会话推荐 数据 多模态 项目数据感知 重组编码 双循环知识蒸馏 互信息
在线阅读 下载PDF
元宇宙金融:全新场景与风险监管 被引量:2
15
作者 沈伟 《上海师范大学学报(哲学社会科学版)》 北大核心 2025年第1期71-84,共14页
元宇宙意指通过技术建构的“超越现实宇宙的另一个宇宙”,兼具物理世界和虚拟世界的双重特性。随着元宇宙和人工智能技术的不断发展与深入应用,科技企业、金融科技企业以及新兴银行、传统金融企业均纷纷展开对基于元宇宙的金融体系、金... 元宇宙意指通过技术建构的“超越现实宇宙的另一个宇宙”,兼具物理世界和虚拟世界的双重特性。随着元宇宙和人工智能技术的不断发展与深入应用,科技企业、金融科技企业以及新兴银行、传统金融企业均纷纷展开对基于元宇宙的金融体系、金融服务、数字资产、虚拟货币的建构布局与竞争。文章旨在梳理与分析与元宇宙金融场景相关的金融监管挑战与潜在的法律风险样态。针对与元宇宙金融相关的金融犯罪、数据安全与个人隐私问题、垄断与不正当竞争问题以及跨法域问题,从民众教育、法律地位厘清、完善多元规制框架以及主动参与国际规则建设等方面提出了相应的监管应对措施。 展开更多
关键词 宇宙金融 金融风险 金融监管 数据安全 个人隐私 金融诈骗 不正当竞争
在线阅读 下载PDF
《数据论文出版元数据》国家标准研制与实践 被引量:4
16
作者 高瑜蔚 朱艳华 +2 位作者 胡良霖 孔丽华 赵欢 《中国科学数据(中英文网络版)》 CSCD 2024年第1期69-78,共10页
2023年8月,《GB/T 42813-2023数据论文出版元数据》国家标准正式发布,该标准规定了数据论文出版元数据的内容与结构,包括数据集元数据、数据论文元数据及其描述方法、扩展原则与方法。适用于数据论文及其关联数据集的描述、保存、在线... 2023年8月,《GB/T 42813-2023数据论文出版元数据》国家标准正式发布,该标准规定了数据论文出版元数据的内容与结构,包括数据集元数据、数据论文元数据及其描述方法、扩展原则与方法。适用于数据论文及其关联数据集的描述、保存、在线出版和共享服务等。该标准的发布标志着首次从国家层面对数据论文出版这一科学数据开放共享新模式进行了总体约定,解决了数据出版领域缺少标准规范指导的问题。有助于数据出版机构快速地发布数据论文和关联数据,为科学数据确权、产权保护提供支撑,对于推动科学数据开放共享生态建设具有重要意义。自标准发布以后,一些数据期刊或科学数据出版平台开始使用标准规定的元素与定义,开展较为广泛的实践。 展开更多
关键词 开放科学 数据论文 科学数据出版 数据 标准规范 科学数据
在线阅读 下载PDF
跨文档类型的语义元数据支持方法 被引量:1
17
作者 王詠萱 李宁 田英爱 《计算机工程与设计》 北大核心 2024年第11期3507-3513,共7页
针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位... 针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位方法,避免数据冗余。为实现元数据的共享,提出一种流式文档到版式文档的元数据支持方法,充分发挥元数据的作用。通过实际系统的构建验证了所述方法的可行性。研究成果对于文档的自动理解和智能化处理具有应用价值。 展开更多
关键词 语义数据 数据转换 流式文档 固定版式文档 数据定位 数据嵌入 数据提取
在线阅读 下载PDF
面向低数据资源的语音识别研究综述
18
作者 许春冬 吴子煜 葛凤培 《计算机工程与应用》 北大核心 2025年第4期59-71,共13页
近年来,自动语音识别的研究重心由传统识别方法转向基于深度学习的语音识别方法。“大模型”现象反映出深度学习方法的性能随着训练数据量的增加呈现显著上升的趋势。然而,现实环境的复杂性、语音数据分布的非均匀性和用户隐私的保护等... 近年来,自动语音识别的研究重心由传统识别方法转向基于深度学习的语音识别方法。“大模型”现象反映出深度学习方法的性能随着训练数据量的增加呈现显著上升的趋势。然而,现实环境的复杂性、语音数据分布的非均匀性和用户隐私的保护等因素给数据的收集造成困难。同时,语音数据的标注需要大量专业人员的参与,导致标注成本很高。因此,语音识别在实际应用中经常面临数据资源不足的问题。在这种低数据资源条件下构建性能优异且稳定的语音识别系统仍是研究难点。简单归纳了语音识别的发展历程,总结了语音识别的基本框架以及常见的国内外开源数据集。围绕低数据资源问题,详细分析了低数据资源的判定方法,继而梳理了四类技术方案,包括数据增强、联邦学习、自监督学习以及元学习,并对它们的性能状况以及优缺点进行了系统的剖析。最后讨论了该研究方向未来潜在的发展趋势和可能面临的问题。 展开更多
关键词 语音识别 数据资源 数据增强 联邦学习 自监督学习 学习
在线阅读 下载PDF
基于大数据元分析的调节效应识别:基础模型与实证检验 被引量:1
19
作者 林伟杰 周文杰 +1 位作者 魏志鹏 杨克虎 《情报学报》 CSSCI CSCD 北大核心 2024年第5期553-562,共10页
作为实证研究中识别因果关系的一种重要方法,调节效应检验有助于揭示自变量和因变量之间的深层次关系,然而该方法存在无法获得真实效应值且外部效度低等问题。受限于原始研究与生俱来的缺陷,循证领域亟待发展出新的调节效应识别模型。... 作为实证研究中识别因果关系的一种重要方法,调节效应检验有助于揭示自变量和因变量之间的深层次关系,然而该方法存在无法获得真实效应值且外部效度低等问题。受限于原始研究与生俱来的缺陷,循证领域亟待发展出新的调节效应识别模型。本研究采用大数据循证理念,利用循环方法对控制变量进行排列组合,从而模拟了“穷尽”所有可能的原始研究设计,对全部可能的变量间关系进行了回归分析并记录所有效应值。进而,使用元分析法对全部原始效应量进行全覆盖式合并,以获得真实的效应值,以此提升调节效应结果的外部效度。最后,本研究以信息贫困研究为例,详细展示了大数据循证视角下调节效应识别的所有流程。本研究的主要贡献在于完善了大数据循证理念下的元分析方法体系,从大量原始研究效应中提取了真实效应值,提高了调节效应的外部效度与因果关系识别的可靠性。 展开更多
关键词 数据分析 调节效应 循证社会科学 因果关系
在线阅读 下载PDF
一种基于动态空间划分和压缩布隆过滤器相结合的分布式元数据负载均衡算法 被引量:2
20
作者 薛梅婷 俞万刚 +3 位作者 张纪林 曾艳 袁俊峰 周丽 《计算机工程与科学》 CSCD 北大核心 2024年第8期1381-1389,共9页
分布式元数据管理系统利用多个元数据服务器对大量元数据进行存储和管理。该系统将海量元数据通过不同的映射策略分配到不同的元数据服务器上,减少单台元数据服务器所处理的数据量,从而减少磁盘访问次数,进而提高整个元数据管理系统的... 分布式元数据管理系统利用多个元数据服务器对大量元数据进行存储和管理。该系统将海量元数据通过不同的映射策略分配到不同的元数据服务器上,减少单台元数据服务器所处理的数据量,从而减少磁盘访问次数,进而提高整个元数据管理系统的性能。元数据管理系统通常会使用哈希函数将元数据键映射到不同的元数据服务器中。然而,当数据特征值相似时,由于散列函数的单向性,会导致数据分布不均衡的问题,造成元数据服务器性能下降。为解决上述问题,提出了一种动态空间划分和压缩布隆过滤器相结合的元数据负载均衡算法,该算法首先构建一个哈希桶来组织元数据键,通过哈希算法将元数据键映射到不同的哈希桶中;在映射过程中,根据元数据服务器的负载情况动态调整目标哈希桶,并在上述哈希桶中有序地保存元数据键的映射信息。当访问元数据时,首先通过压缩布隆过滤器对元数据键进行预处理,然后通过二分查找在指定的哈希桶中进行元数据映射信息的查找。与近年来提出的元数据管理算法相比,所提算法在映射键发生倾斜时仍能保证元数据服务器负载均衡,并通过对比实验表明,所提算法相比最优的元数据管理算法,在内存占用仅提升2%的条件下,获得了20%的搜索性能提升。 展开更多
关键词 分布式数据管理 负载均衡算法 一致性哈希 压缩布隆过滤器
在线阅读 下载PDF
上一页 1 2 118 下一页 到第
使用帮助 返回顶部