期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向SW26010P的异形矩阵乘法众核并行优化技术研究
1
作者 胡怡 陈道琨 杨超 《计算机工程与应用》 北大核心 2025年第6期150-163,共14页
矩阵乘法广泛应用于科学与工程计算领域,是基础线性代数库中的关键优化对象。随着人工神经网络、计算流体力学等领域的快速发展,异形(irregular-shaped)矩阵乘法正在迅速引起关注。研究集中在针对国产新一代神威超级计算机采用的SW26010... 矩阵乘法广泛应用于科学与工程计算领域,是基础线性代数库中的关键优化对象。随着人工神经网络、计算流体力学等领域的快速发展,异形(irregular-shaped)矩阵乘法正在迅速引起关注。研究集中在针对国产新一代神威超级计算机采用的SW26010P众核处理器,探讨异形矩阵乘法的众核并行优化技术。具体而言,结合SW26010P的硬件特性和异形矩阵的数据布局,设计了多样化任务划分映射的并行算法,提高直接内存访问(direct memory access,DMA)访存带宽利用率。结合SW26010P的硬件流水线和向量化访存/计算指令,抽象运算中涉及的计算类型进行底层汇编优化,提高了计算效率。提出了远程内存访问(remote memory access,RMA)点对点机制下的数据共享策略,降低数据访存和传输开销,并提出了嵌套双缓冲技术进一步提高异形矩阵乘法的性能。此外,针对不同种类异形矩阵乘法行实现时面临的分块参数适配问题,基于SW26010P众核处理器进行实验分析研究,确定了各函数并行化时的最优分块参数。实验结果显著,所优化的异形矩阵乘法的性能最高可达roofline模型预测性能上限的93%,相较于常规大规模矩阵乘法算法平均获得了5.43倍的性能加速,最高可获得51.5倍的性能加速。 展开更多
关键词 异形矩阵乘法 SW26010P众核处理器 多样化任务划分映射 RMA点对点机制 嵌套双缓冲技术
在线阅读 下载PDF
碳中和导向下中国生物质能消费分析 被引量:1
2
作者 李峰 张舒涵 +1 位作者 邵天铭 庞军 《全球能源互联网》 北大核心 2025年第2期192-200,共9页
生物质能替代化石燃料是减少碳排放的有效途径,而生物质能配备碳捕集与封存(bioenergy with carbon capture and storage,BECCS)技术更是实现碳中和的关键支撑技术。利用本土化改进中国能源系统的全球变化分析模型(Global Change Analys... 生物质能替代化石燃料是减少碳排放的有效途径,而生物质能配备碳捕集与封存(bioenergy with carbon capture and storage,BECCS)技术更是实现碳中和的关键支撑技术。利用本土化改进中国能源系统的全球变化分析模型(Global Change Analysis Model,GCAM),详细考虑生物质能在中国各能源部门的应用,模拟分析碳中和导向下未来中国生物质能消费。情景结果表明:①柴等传统生物质在2030年后基本完全退出使用,现代生物质能在2030年后开始迅速发展,到2060年,生物质能占中国一次能源消费15%;②未来,中国生物质能呈现发电和炼油为主导的多元化发展趋势,到2060年,发电和炼油共占中国生物质能消费近80%,生物质发电占全国总发电量6%,生物燃油占全国液体燃料总产量42%;③中国生物质能需要大幅配备碳捕集与封存(carbon capture and storage,CCS)技术,到2060年,86%的生物质在应用过程中配备CCS,BECCS年捕集量达15亿t CO_(2)。 展开更多
关键词 生物质能 碳中和 综合评估模型 BECCS
在线阅读 下载PDF
面向算力网络的跨集群数据迁移系统的设计和实现
3
作者 李俊哲 付振新 +3 位作者 杨宏辉 马银萍 李若淼 樊春 《计算机工程与科学》 北大核心 2025年第5期775-786,共12页
在算力网络的建设中,如何在不同地域算力中心的集群之间进行高效可靠的数据迁移,是影响算力网络建设成功与否的关键研究课题。鉴于此,设计并实现了基于RSYNC的高性能传输软件SCOW-SYNC。首先,SCOW-SYNC采用队列和线程池架构,对传统的RS... 在算力网络的建设中,如何在不同地域算力中心的集群之间进行高效可靠的数据迁移,是影响算力网络建设成功与否的关键研究课题。鉴于此,设计并实现了基于RSYNC的高性能传输软件SCOW-SYNC。首先,SCOW-SYNC采用队列和线程池架构,对传统的RSYNC进行了优化,通过并行建立多个TCP连接和并行传输,提高了带宽利用率。此外,SCOW-SYNC还支持大文件自动切分、动态压缩、后台运行、进度实时查询和SSH连接池管理等功能。经测试,SCOW-SYNC相比RSYNC能够达到125%~130%的加速比。其次,为了提高传输的安全性,面向算力中心提出了一套可靠的跨集群传输系统架构,数据传输仅在“传输节点”之间发起,使用“传输密钥”进行加密,该密钥由“管理节点”负责动态检查、生成和分发。最后,将SCOW-SYNC集成到高性能计算门户和管理平台SCOW中,实现了SCOW的跨集群传输模块,使得用户可以通过浏览器在不同集群之间进行高性能的数据迁移,并通过容器化技术部署到了北京大学跨集群环境中,提高了生产效率。 展开更多
关键词 高性能计算系统软件 算力网络 并行传输 RSYNC 集群安全
在线阅读 下载PDF
基于使用特性的两阶段多因素作业运行时间预测算法
4
作者 尚秋言 李奕聪 +3 位作者 温瑞林 马银萍 欧阳荣彬 樊春 《计算机科学》 北大核心 2025年第2期261-267,共7页
为了解决用户所提供的作业预计时间不准确对高性能计算平台调度系统的连锁影响,以鹤思调度系统为研究模板,提出了一种通用的两阶段多因素作业运行时间预测算法(TSMF)。TSMF融合了复杂的用户行为模式和作业上下文特征,以确保预测准确可靠... 为了解决用户所提供的作业预计时间不准确对高性能计算平台调度系统的连锁影响,以鹤思调度系统为研究模板,提出了一种通用的两阶段多因素作业运行时间预测算法(TSMF)。TSMF融合了复杂的用户行为模式和作业上下文特征,以确保预测准确可靠,并能够无缝嵌入到大多数高性能计算平台的调度系统中,从而改善其性能。在北京大学高性能计算集群的数据集及真实调度系统上进行的多角度模拟实验显示,TSMF在预测准确性方面表现出色,能够在绝大部分作业上实现精准预测。例如,在多达60.8%的作业中,其预测误差在1min以内。此外,TSMF显著改进了实际情境中的调度算法,提高了资源利用率并大幅缩短了用户等待时间。 展开更多
关键词 高性能计算 作业运行时间预测 作业调度 行为模式 机器学习
在线阅读 下载PDF
数据商和第三方专业服务机构的培育动力机制研究 被引量:11
5
作者 黄卓 张晓冬 《社会科学辑刊》 CSSCI 北大核心 2023年第6期165-172,共8页
数据交易场所的“公共属性”和“市场属性”未能完全分割是过去我国数据要素市场建设进展缓慢的主要原因之一。在此背景下,国家明确提出“所商分离”“培育一批数据商和第三方专业服务机构”,并在政策制度上给予了有力支持。不过,在培... 数据交易场所的“公共属性”和“市场属性”未能完全分割是过去我国数据要素市场建设进展缓慢的主要原因之一。在此背景下,国家明确提出“所商分离”“培育一批数据商和第三方专业服务机构”,并在政策制度上给予了有力支持。不过,在培育过程中,我国却面临着中西部地区布局少、相关产业类型少、中小企业数量少的“三少”问题。从企业参与数据要素市场行为的动力机制出发,我们运用“感知利益—准备状态—外部关系”分析框架全面剖析了现阶段培育难题的深层原因,并借鉴国外培育经验,提出积极营造良好的外部环境,加快中西部地区产业布局;提升企业技术资金实力,补齐重点产业发展短板;健全数据要素市场规则,降低企业交易合规成本;提升企业数字化能力,推动中小企业进场服务等政策建设。 展开更多
关键词 数据商 第三方专业服务机构 数据要素市场参与者培育
在线阅读 下载PDF
科技金融赋能新质生产力发展:理论框架、现实挑战与对策建议 被引量:9
6
作者 张晓冬 黄卓 《湖湘论坛》 CSSCI 北大核心 2024年第6期53-66,共14页
科技金融作为金融服务科技创新的重要抓手,能够为科技企业提供充足的资金支持,对于推动“科技—产业—金融”良性循环,促进新质生产力发展具有重要作用。虽然已有研究注意到科技金融对新质生产力的重要影响,但是并未考虑科技金融的系统... 科技金融作为金融服务科技创新的重要抓手,能够为科技企业提供充足的资金支持,对于推动“科技—产业—金融”良性循环,促进新质生产力发展具有重要作用。虽然已有研究注意到科技金融对新质生产力的重要影响,但是并未考虑科技金融的系统性特征,且研究视角相对狭隘,缺乏整体系统的分析。文章以创新生态系统理论为基础,从宏观、中观、微观三个层面构建了科技金融赋能新质生产力发展的理论框架,并针对新质生产力培育过程中面临的三大矛盾,提出充分发挥不同金融机构的职能优势,以企业科技创新激发新质生产力形成的动力源泉;优化资金供给结构,以新兴产业、未来产业筑牢新质生产力形成的产业根基;深化体制机制改革,以科技金融制度体系建设为抓手完善新质生产力形成的制度环境等政策建议。 展开更多
关键词 科技金融 新质生产力 创新生态系统 科技—产业—金融循环
在线阅读 下载PDF
基于文本数据增强的中文水稻育种问句命名实体识别 被引量:7
7
作者 牛培宇 侯琛 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期333-343,共11页
针对现有水稻育种问答系统存在数据管理水平低、知识粒度大,水稻育种领域缺乏用于命名实体识别的标注数据、人工标注成本高等问题,提出了一种基于文本数据增强的方法来识别水稻育种问句的命名实体,通过构建水稻育种知识图谱,对水稻育种... 针对现有水稻育种问答系统存在数据管理水平低、知识粒度大,水稻育种领域缺乏用于命名实体识别的标注数据、人工标注成本高等问题,提出了一种基于文本数据增强的方法来识别水稻育种问句的命名实体,通过构建水稻育种知识图谱,对水稻育种问句中的大类命名实体进行分类,从而增强实体边界,降低知识粒度。针对水稻育种数据标注成本高导致命名实体识别性能不佳的难点,通过在BERT-BILSTM-CRF模型中引入数据增强层,提出了DA-BERT-BILSTM-CRF模型。实验以标注的水稻育种问句为训练数据,将所提出的模型与其他基线模型进行比较。结果表明,本文方法在水稻育种问句中命名实体识别的单类别识别任务和整体识别任务上均优于其他方法,其中单类别识别精确率达到94.26%,F1值达到93.32%;整体识别精确率达到93.86%,F1值达到93.34%。 展开更多
关键词 水稻育种 问答系统 命名实体识别 文本数据增强 知识图谱
在线阅读 下载PDF
超算集群无损RoCEv2网络性能评测
8
作者 龙汀汀 付振新 +3 位作者 李若淼 龚翔宇 吴涛 樊春 《通信学报》 CSCD 北大核心 2024年第S2期113-121,共9页
为了评估无损RoCEv2网络技术在高性能计算(HPC)领域的实际表现,以无损RoCEv2、TCP/IP和InfiniBand这3种网络为测试对象,搭建HPC集群,使用主流的HPC Benchmark和科学计算应用对上述3种网络进行对比测试,获取各网络的基本性能数据以及在... 为了评估无损RoCEv2网络技术在高性能计算(HPC)领域的实际表现,以无损RoCEv2、TCP/IP和InfiniBand这3种网络为测试对象,搭建HPC集群,使用主流的HPC Benchmark和科学计算应用对上述3种网络进行对比测试,获取各网络的基本性能数据以及在科学计算应用场景下的实际表现,还测试了基于RoCEv2的240节点集群的HPL效率。实验结果表明,在超算集群中,无损RoCEv2与InfiniBand有基本相当的性能,且都显著优于TCP网络。随着集群节点数量的增加,RoCEv2网络具有较好的线性可扩展性。无损RoCEv2网络相对于InfiniBand,在保持成本优势的同时具有大致相当的性能。 展开更多
关键词 高性能计算 RoCEv2 INFINIBAND 无损网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部