空间科学论文数据仓储(Space Science Article Data Repository,SADR)是国家空间科学数据中心(NSSDC)面向广大空间科学领域科研工作者和学生推出的免费论文数据存储、出版和获取平台(http://sadr.nssdc.ac.cn/)。SADR通过云服务模式,满...空间科学论文数据仓储(Space Science Article Data Repository,SADR)是国家空间科学数据中心(NSSDC)面向广大空间科学领域科研工作者和学生推出的免费论文数据存储、出版和获取平台(http://sadr.nssdc.ac.cn/)。SADR通过云服务模式,满足用户对论文数据的存储和管理需求,同时也响应了期刊对论文数据开放获取的出版要求,是在保障数据所有人权益的基础上,助力我国科学数据开放共亨工作的又一重要举措。NSSDC希望通过SADR促进论文数据的可发现、可访问、互操作和可重用(FAIR Principles),推动数据共享文化在中国空间科学领域的培育与良性发展。展开更多
[目的/意义]为揭示数据论文与期刊论文关联出版的新形态,对目前数据期刊的开放共享、数据论文与期刊论文之间的关联进行研究,有助于推动科学数据的开放共享发展,促进科学数据的高效流通,使科学数据在多层维度释放数据价值。[方法/过程]...[目的/意义]为揭示数据论文与期刊论文关联出版的新形态,对目前数据期刊的开放共享、数据论文与期刊论文之间的关联进行研究,有助于推动科学数据的开放共享发展,促进科学数据的高效流通,使科学数据在多层维度释放数据价值。[方法/过程]基于FAIR原则,从元数据元素、文献服务等角度出发,构建数据流向视角下数据论文与期刊论文之间的互关联模型,分析数据论文与期刊论文之间的关联过程,并选取代表性数据期刊Data in Brief的数据论文为实例展开模型验证与实践参照。[结果/结论]本文基于“可访问”“可发现”对“开放共享”展开研究;基于“可互操作”和“可重用”对“关联”展开研究。通过构建理论模型、实例验证,厘清数据论文与期刊论文之间的关联模式以及验证理论模型的可行性与合理性。展开更多
数据论文是数据集的描述文档。追踪数据论文引用情况,有助于更好地了解数据出版及其数据开放共享情况。为更好地支持引文语义研究需要,本文提出一种引文文献语料自动抽取方法。该方法围绕数据论文施引文献及其元数据,提供一套涵盖引文...数据论文是数据集的描述文档。追踪数据论文引用情况,有助于更好地了解数据出版及其数据开放共享情况。为更好地支持引文语义研究需要,本文提出一种引文文献语料自动抽取方法。该方法围绕数据论文施引文献及其元数据,提供一套涵盖引文全文结构化清洗、参考文献搜索匹配、引文文本遍历、引文位置识别与引文段落自动抽取,最终整编形成引文语料数据集的全过程解决方案。选取地球科学领域数据期刊《地球系统科学数据》(Earth System Science Data,ESSD)2014至2023年间引用量前十名数据论文的6007篇施引文献,采取自动化方法、辅助人工校验,形成包括10459条引文段落信息在内的语料数据集。经检验,该自动化方法具有较高质量和可靠性,其查全率达97.37%,结合人工质控后,数据集抽样准确率达到92.54%。该引文语料自动抽取方法以及ESSD语料数据集实例的整编实践,为更好地了解数据出版与共享提供了数据支撑,亦可为其他引文语料数据集的建设使用。展开更多
文摘[目的/意义]为揭示数据论文与期刊论文关联出版的新形态,对目前数据期刊的开放共享、数据论文与期刊论文之间的关联进行研究,有助于推动科学数据的开放共享发展,促进科学数据的高效流通,使科学数据在多层维度释放数据价值。[方法/过程]基于FAIR原则,从元数据元素、文献服务等角度出发,构建数据流向视角下数据论文与期刊论文之间的互关联模型,分析数据论文与期刊论文之间的关联过程,并选取代表性数据期刊Data in Brief的数据论文为实例展开模型验证与实践参照。[结果/结论]本文基于“可访问”“可发现”对“开放共享”展开研究;基于“可互操作”和“可重用”对“关联”展开研究。通过构建理论模型、实例验证,厘清数据论文与期刊论文之间的关联模式以及验证理论模型的可行性与合理性。
文摘数据论文是数据集的描述文档。追踪数据论文引用情况,有助于更好地了解数据出版及其数据开放共享情况。为更好地支持引文语义研究需要,本文提出一种引文文献语料自动抽取方法。该方法围绕数据论文施引文献及其元数据,提供一套涵盖引文全文结构化清洗、参考文献搜索匹配、引文文本遍历、引文位置识别与引文段落自动抽取,最终整编形成引文语料数据集的全过程解决方案。选取地球科学领域数据期刊《地球系统科学数据》(Earth System Science Data,ESSD)2014至2023年间引用量前十名数据论文的6007篇施引文献,采取自动化方法、辅助人工校验,形成包括10459条引文段落信息在内的语料数据集。经检验,该自动化方法具有较高质量和可靠性,其查全率达97.37%,结合人工质控后,数据集抽样准确率达到92.54%。该引文语料自动抽取方法以及ESSD语料数据集实例的整编实践,为更好地了解数据出版与共享提供了数据支撑,亦可为其他引文语料数据集的建设使用。