期刊文献+
共找到3,198篇文章
< 1 2 160 >
每页显示 20 50 100
一种基于Crossbar结构的分布式共享缓存交换机设计与实现
1
作者 杨乾明 邵靖杰 +5 位作者 曾聘 袁梦 宋卓秦 邓秋严 张剑锋 王勇 《计算机工程与科学》 北大核心 2025年第6期951-957,共7页
交换机的交换结构、缓存方式和多端口读写并存等架构实现方式决定了交换机的性能。随着交换端口数目的增加与端口速率的提升,交换机如何提高多端口数据转发性能是一个值得研究的课题。为满足多端口数据转发、数据交换内部无阻塞的需求,... 交换机的交换结构、缓存方式和多端口读写并存等架构实现方式决定了交换机的性能。随着交换端口数目的增加与端口速率的提升,交换机如何提高多端口数据转发性能是一个值得研究的课题。为满足多端口数据转发、数据交换内部无阻塞的需求,提出一种基于Crossbar结构的分布式共享缓存交换机架构,首先,采用了一种基于Crossbar全相连的输入缓存结构,以满足多端口数据的无阻塞输入需求;其次,在交换结构上创新性地采用了分布式共享缓存方式,以提高数据交换速率;最后,在FPGA开发板上对设计进行了仿真和验证。结果表明,相比传统交换机,提出的分布式共享缓存的多端口交换机架构支持大容量数据转发,能有效提升数据传输带宽。 展开更多
关键词 多端口 交叉开关 分布式共享缓存 读写缓存并行
在线阅读 下载PDF
面向概念漂移的磁盘故障动态集成预测方法
2
作者 丁建立 梁烨文 李静 《小型微型计算机系统》 北大核心 2025年第5期1105-1111,共7页
在大规模数据中心中,磁盘日志通常随着时间的推移不断从磁盘生成,磁盘日志数据的分布会随着时间的推移发生不可预测的变化,产生概念漂移.然而当前磁盘故障预测方法大多是离线训练的,预测性能会随着时间的流逝而逐渐降低,无法对数据分布... 在大规模数据中心中,磁盘日志通常随着时间的推移不断从磁盘生成,磁盘日志数据的分布会随着时间的推移发生不可预测的变化,产生概念漂移.然而当前磁盘故障预测方法大多是离线训练的,预测性能会随着时间的流逝而逐渐降低,无法对数据分布的变化做出反映.针对这一问题,提出了一种面向概念漂移的磁盘故障动态集成预测方法AIDF.该方法从数据分析到磁盘故障预测整个环节都是动态进行的,是一个完整的自动化磁盘故障预测方法.首先,提出了AIDF总体架构.其次,对磁盘故障动态集成预测模型进行构建.包括以下3个方面:对磁盘数据流进行实时数据分析;根据磁盘数据流中存在的概念漂移类型,改进了基学习器的概念漂移检测过程,并基于磁盘故障预测性能为基学习器分配动态权重,建立集成学习模型;为了解决磁盘数据流中特征选择更新问题,提出一种基于概念漂移的动态特征更新与模型再训练算法,当磁盘数据流出现概念漂移并且所选择的最优特征集发生变化时,使用近期窗口中的数据再训练基学习器.实验结果表明,AIDF能够很好地应对磁盘故障预测模型老化的问题,长期保持95%以上的故障检测率,并且适用于实际动态应用环境. 展开更多
关键词 磁盘故障 概念漂移 集成学习 动态预测 增量学习
在线阅读 下载PDF
面向低磨损存内计算的多状态逻辑门综合 被引量:1
3
作者 赵安宁 许诺 +4 位作者 刘康 罗莉 潘炳征 薄子怡 谭承浩 《计算机研究与发展》 北大核心 2025年第3期620-632,共13页
通过融合布尔逻辑和非易失存储的功能,忆阻状态逻辑电路可以消除计算过程中的数据移动,实现在存储器中计算,打破传统冯·诺依曼计算系统的“存储墙”和“能耗墙”.近年来,通过构建条件转变到数学逻辑关系之间的映射,已经有一系列存... 通过融合布尔逻辑和非易失存储的功能,忆阻状态逻辑电路可以消除计算过程中的数据移动,实现在存储器中计算,打破传统冯·诺依曼计算系统的“存储墙”和“能耗墙”.近年来,通过构建条件转变到数学逻辑关系之间的映射,已经有一系列存内状态逻辑门被提出,功能覆盖IMP,NAND,NOR,NIMP等多个逻辑运算.然而,复杂计算过程到存内状态逻辑实现的自动化综合映射方法仍处于萌芽阶段,特别是缺少针对器件磨损的探讨,限制了设备维修不便的边缘计算场景应用.为降低复杂存内状态逻辑计算过程的磨损(翻转率),实现了一种面向低磨损存内计算的多状态逻辑门综合映射过程.与领域内熟知的SIMPLER MAGIC状态逻辑综合流程相比,该综合映射流程在复杂计算过程的翻转率上实现了对EPFL,LGSynth91的典型基准测试电路分别平均35.55%,47.26%以上的改进;与最新提出的LOSSS状态逻辑综合流程相比,在复杂计算过程的翻转率上实现了对EPFL,LGSynth91的典型基准测试电路分别平均8.48%,6.72%以上的改进. 展开更多
关键词 忆阻器 状态逻辑 翻转率 逻辑综合与映射 低磨损
在线阅读 下载PDF
前言
4
作者 舒继武 王意洁 《计算机研究与发展》 北大核心 2025年第3期543-544,共2页
近年来,随着科技和生产力的飞速更新,AI大模型迈入规模应用的新阶段,人工智能成为助推科技高质量发展、赋能千行百业的重要推手.数据作为核心生产要素,已逐渐成为国家重要战略资源.存储作为承载数据的重要载体,已成为释放数据价值的重... 近年来,随着科技和生产力的飞速更新,AI大模型迈入规模应用的新阶段,人工智能成为助推科技高质量发展、赋能千行百业的重要推手.数据作为核心生产要素,已逐渐成为国家重要战略资源.存储作为承载数据的重要载体,已成为释放数据价值的重要基石,数据潜能的有效激发取决于数据的高效分析处理.那么,大模型及其应用的出现给传统的存储管理带来哪些新的挑战?大模型是否会完全取代传统机器学习模型,并在数据分析处理中取得新的突破?大模型时代的存储管理与数据分析已经成为学术界和产业界广泛关注的焦点.为促进存储领域技术交流,《计算机研究与发展》推出了本期“大模型时代的存储管理与数据分析”专题.本专题收录了6篇论文,聚焦大模型给存储管理与数据分析带来的机遇与挑战,深入探讨支持大模型预训练、微调、评估和推理等的存储管理技术,以及基于大模型的数据分析处理技术,希望能为从事相关工作的读者提供借鉴和帮助. 展开更多
关键词 存储管理 数据分析处理 存储领域 人工智能 数据价值 核心生产要素 模型预训练 技术交流
在线阅读 下载PDF
混洗SRAM:SRAM中的并行按位数据混洗
5
作者 张敦博 曾灵灵 +2 位作者 王若曦 王耀华 沈立 《计算机研究与发展》 北大核心 2025年第1期75-89,共15页
向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来... 向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来处理混洗指令将带来昂贵的数据移动开销,并且数据混洗单元只能串行混洗数据.事实上,混洗操作只会改变数据的布局,理想情况下混洗操作应在内存中完成.随着存内计算技术的发展,SRAM不仅可以作为存储部件,同时还能作为计算单元.为了实现存内混洗,提出了混洗SRAM,它可以在SRAM体中逐位地并行混洗多个向量.混洗SRAM的关键思想是利用SRAM体中位线的数据移动能力来改变数据的布局.这样SRAM体中位于同一位线上不同数据的相同位可以同时被移动,从而使混洗操作拥有高度的并行性.通过适当的数据布局和向量混洗扩展指令的支持,混洗SRAM可以高效地处理常用的混洗操作.评测结果表明,对于常用的混洗操作,混洗SRAM可以实现平均28倍的性能增益,对于FFT,AlexNet,VggNet等实际的应用,可以实现平均3.18倍的性能增益.混洗SRAM相较于传统SRAM的面积开销仅增加了4.4%. 展开更多
关键词 向量单指令多数据体系结构 静态随机访问存储器 混洗操作 向量内存 存内计算
在线阅读 下载PDF
PDM-Shuffle:基于被动分离式内存的数据混洗系统设计
6
作者 程丽云 吴婧雅 +2 位作者 卢文岩 钟浪辉 鄢贵海 《高技术通讯》 北大核心 2025年第4期370-384,共15页
利用存算分离架构,可以将数据混洗的计算和存储过程解耦,从而提高分布式数据处理应用的可扩展性。然而,将混洗数据传输到远端存储节点的过程增加了额外网络开销,存储节点将成为新的通信瓶颈。为应对引入存算分离架构后数据混洗过程面临... 利用存算分离架构,可以将数据混洗的计算和存储过程解耦,从而提高分布式数据处理应用的可扩展性。然而,将混洗数据传输到远端存储节点的过程增加了额外网络开销,存储节点将成为新的通信瓶颈。为应对引入存算分离架构后数据混洗过程面临的新挑战,本文提出一种基于被动分离式内存的数据混洗(passive disaggregated memoryshuffle,PDM-Shuffle)系统,利用新型一致性总线互连协议计算快速链接(compute express link,CXL)直连共享内存设备存储并交换混洗中间数据,避免了数据的硬盘存储及传输控制协议/网际协议(transmission control protocol/Internet protocol,TCP/IP)的传输过程。鉴于内存设备仅支持被动数据写入,本文采用了内存预分区和元数据控制节点分配内存地址等方法来保证同分区数据的预聚合和共享内存的一致性访问管理。实验结果表明,在处理大规模数据集时,与传统的集中式架构相比,PDM-Shuffle系统可将排序和图计算的综合类应用程序Terasort和PageRank的单个作业完成时间分别减少49%和65%,相对于存算分离架构下已有的优化方案Zeus,分别提升了36%和18%。 展开更多
关键词 数据混洗 存算分离 分离式内存系统 计算快速链接 内存一致性 预聚合
在线阅读 下载PDF
基于1T1R忆阻器交叉阵列与CMOS激活函数的全模拟神经网络
7
作者 赵航 杨董行健 +2 位作者 王聪 梁世军 缪峰 《南京大学学报(自然科学版)》 北大核心 2025年第5期867-878,共12页
基于忆阻器阵列的类脑电路为实现高能效神经网络计算提供了极具潜力的技术路线.然而,现有方案通常需要使用大量的模数转换过程,成为计算电路能效进一步提升的瓶颈.因此,提出了一种基于1T1R(1 Transistor 1 Resistor)忆阻器交叉阵列与CMO... 基于忆阻器阵列的类脑电路为实现高能效神经网络计算提供了极具潜力的技术路线.然而,现有方案通常需要使用大量的模数转换过程,成为计算电路能效进一步提升的瓶颈.因此,提出了一种基于1T1R(1 Transistor 1 Resistor)忆阻器交叉阵列与CMOS(Complementary Metal-Oxide-Semiconductor)激活函数的全模拟神经网络架构,以及与其相关的训练优化方法 .该架构采用1T1R忆阻器交叉阵列来实现神经网络线性层中的模拟计算,同时利用CMOS非线性电路来实现神经网络激活层的模拟计算,在全模拟域实现神经网络大幅减少了模数转换器的使用,优化了能效和面积成本.实验结果验证了忆阻器作为神经网络权重层的可行性,同时设计多种CMOS模拟电路,在模拟域实现了多种非线性激活函数,如伪ReLU(Rectified Linear Unit)、伪Sigmoid、伪Tanh、伪Softmax等电路.通过定制化训练方法来优化模拟电路神经网络的训练过程,解决了实际非线性电路的输出饱和条件下的训练问题.仿真结果表明,即使在模拟电路的激活函数与理想激活函数不一致的情况下,全模拟神经网络电路在MNIST(Modified National Institute of Standards and Technology)手写数字识别任务中的识别率仍然可以达到98%,可与基于软件的标准网络模型的结果相比. 展开更多
关键词 全模拟神经网络 忆阻器 类脑电路 CMOS激活函数 1T1R交叉阵列
在线阅读 下载PDF
一种软硬件协同的访存踪迹实时分析处理工具
8
作者 李作骏 卢天越 +1 位作者 朱晨光 陈明宇 《高技术通讯》 北大核心 2025年第8期813-823,共11页
本文提出一种软硬件协同的访存踪迹实时分析处理工具,通过硬件采集并实时回传访存踪迹、实时分析处理访存踪迹、提取语义信息即时指导访存系统调控,解决了当前基于访存踪迹信息进行访存调控的软硬件系统研究中缺乏有效的实时分析处理手... 本文提出一种软硬件协同的访存踪迹实时分析处理工具,通过硬件采集并实时回传访存踪迹、实时分析处理访存踪迹、提取语义信息即时指导访存系统调控,解决了当前基于访存踪迹信息进行访存调控的软硬件系统研究中缺乏有效的实时分析处理手段的问题。该工具通过定制现场可编程门阵列(field programmable gate array,FPGA)采集卡,在双路Intel E52680 v4服务器平台中实现同机访存踪迹回传和实时分析处理。基准测试表明该工具的最低传输延迟为1.5μs,能够实时处理DDR4-1600速率下的高带宽访存,在安全监测场景实验中的平均异常检测响应时间为28.0μs,基于该工具的实时远端内存预取方案性能在25.0%和50.0%本地内存负载下分别比Fastswap高24.9%和32.0%。 展开更多
关键词 内存访问 踪迹 实时分析 软硬件协同 安全监测
在线阅读 下载PDF
分布式文件系统的元数据管理方案演变:整体到粒度
9
作者 路垚 段红军 +1 位作者 张利莹 王振飞 《小型微型计算机系统》 北大核心 2025年第2期305-313,共9页
元数据的存取性能对于分布式文件系统至关重要,近年来已成为学术界和工业界研究的热点.早期的分布式文件系统未严格区分元数据和数据管理,导致可扩展性和性能优化方面的挑战.针对此问题,主流分布式文件系统采用元数据和文件数据分离的架... 元数据的存取性能对于分布式文件系统至关重要,近年来已成为学术界和工业界研究的热点.早期的分布式文件系统未严格区分元数据和数据管理,导致可扩展性和性能优化方面的挑战.针对此问题,主流分布式文件系统采用元数据和文件数据分离的架构,以提高系统的可扩展性和效率.然而,随着数据量的进一步增长和对系统性能的不断追求,最新的文件系统开始提出将元数据进一步细化管理的概念.这一趋势意味着系统对元数据的管理将更加精细化和灵活,能够更好地适应不断变化的需求和数据规模.对国内外分布式文件系统元数据管理方案的最新进展进行归纳、比较和分析,并结合国家发展战略和重大应用需求,选取与我国国计民生密切相关的领域,从典型应用分析总结元数据相关技术的行业进展.最后,就未来的技术挑战和研究方向进行展望. 展开更多
关键词 分布式文件系统 元数据管理 粒度 可扩展性
在线阅读 下载PDF
远端内存访问性能优化关键技术综述
10
作者 王鹿鸣 卢天越 陈明宇 《高技术通讯》 北大核心 2025年第6期565-578,共14页
在数据中心,应用对于内存的需求越来越大。一系列提供更大容量但访问延迟也更高的远端内存技术被引入到数据中心中。然而,其较长的访存延迟和高波动性对于传统的处理器体系结构构成了全新的挑战。本文系统性地总结了远端内存对传统处理... 在数据中心,应用对于内存的需求越来越大。一系列提供更大容量但访问延迟也更高的远端内存技术被引入到数据中心中。然而,其较长的访存延迟和高波动性对于传统的处理器体系结构构成了全新的挑战。本文系统性地总结了远端内存对传统处理器设计带来的挑战,并综述了近年来的优化访存延迟的关键技术及其在远端内存应用上的优缺点。本文归纳指出,解决远端内存访存问题需要采用软硬件结合的方案。硬件提供足够的资源维护并发的访存请求,软件辅助参与指令调度;在支持大量并发访存请求的基础上,需要平衡专用性与通用性,尽量不牺牲通用处理器的性能。此外,还需考虑优化分支误预测的处理机制,减少猜测执行失败回滚对系统性能造成的影响。 展开更多
关键词 远端内存 内存级并行 延迟容忍
在线阅读 下载PDF
一种多端口寄存器文件的全自动物理编译器
11
作者 明天波 刘必慰 +3 位作者 胡春媚 吴振宇 宋睿强 宋芳芳 《计算机工程与科学》 北大核心 2025年第6期976-987,共12页
在专用微处理器设计中,设计师需反复尝试不同的体系结构参数以实现最佳应用支持。多端口寄存器文件作为核心部件,仍采用全定制或传统编译器辅助设计,但是这2种方法往往难以兼顾高性能需求与设计灵活性,因此难以与体系结构联合优化。提... 在专用微处理器设计中,设计师需反复尝试不同的体系结构参数以实现最佳应用支持。多端口寄存器文件作为核心部件,仍采用全定制或传统编译器辅助设计,但是这2种方法往往难以兼顾高性能需求与设计灵活性,因此难以与体系结构联合优化。提出一种用于多端口寄存器文件的物理编译器,可以全自动地快速生成指定容量和端口数的寄存器文件电路与版图。此外,还提出了优化的端口结构,以提升寄存器文件的并行访问性能;并提出了性能驱动的启发式算法,以实现优化的布局布线结果。使用所提出的编译器生成寄存器文件的时间约为数十小时,满足联合优化需求。与全定制设计相比,所提编译器速度提升了31.5%,功耗降低了28.8%;与传统编译器辅助设计相比,所提编译器速度提升了20.7%,功耗降低了33.9%。 展开更多
关键词 多端口寄存器文件 物理编译器 端口优化技术 启发式算法 计算机体系结构
在线阅读 下载PDF
大气中子在系统级封装器件中引起的单粒子效应特性及机理研究
12
作者 叶结锋 梁朝辉 +5 位作者 张战刚 郑顺顺 雷志锋 刘志利 耿高营 韩慧 《原子能科学技术》 北大核心 2025年第5期1154-1164,共11页
基于大气中子辐照谱仪(ANIS)提供的宽能谱中子束流,开展了系统级封装(SiP)器件的加速辐照实验,观察到了中子辐照导致SiP器件发生单粒子翻转(SEU)及单粒子功能中断(SEFI)效应。SEU发生于数字信号处理器(DSP)内部的静态随机存取存储器(SR... 基于大气中子辐照谱仪(ANIS)提供的宽能谱中子束流,开展了系统级封装(SiP)器件的加速辐照实验,观察到了中子辐照导致SiP器件发生单粒子翻转(SEU)及单粒子功能中断(SEFI)效应。SEU发生于数字信号处理器(DSP)内部的静态随机存取存储器(SRAM)模块以及现场可编程门阵列(FPGA)内部的块随机存取存储器(BRAM)模块。SEFI的错误类型主要是上位机程序闪退以及DSP状态机卡死。基于加速辐照实验结果计算了中子导致的SEU截面,探讨了工艺节点、中子束流能谱对SEU截面的影响。当工艺节点从40 nm减小到28 nm时,U型SEU截面减少了73%。热中子对SRAM模块的SEU截面有较大影响,滤除中子束流中的热中子成分后,SRAM的SEU截面下降了28.8%。基于GEANT4仿真软件对实验结果进行了分析,解释了实验组SEU截面较低的原因。最后,通过计算纽约海平面的软错误率发现,SEU最敏感模块为FPGA内部的BRAM,能量大于1 MeV高能中子引起的软错误率为766.8 FIT/Mbit,未在第二代双倍数据率同步动态随机存取存储器(DDR2 SDRAM)、FPGA内部的可配置逻辑块(CLB)和只读存储器(ROM)中发现SEU;SEFI最敏感模块为DSP。实验数据对SiP的抗中子辐照设计有重要意义。 展开更多
关键词 单粒子效应 中子辐照 系统级封装 单粒子翻转截面 热中子 软错误率
在线阅读 下载PDF
铁电基的存算一体组合优化求解器
13
作者 钱煜 杨泽禹 +7 位作者 王然然 蔡嘉豪 李超 黄庆荣 樊凌雁 李云龙 卓成 尹勋钊 《电子与信息学报》 北大核心 2025年第9期3104-3115,共12页
组合优化问题在诸多领域应用广泛,大多属于非确定多项式时间难题,基于冯·诺依曼架构的传统数字计算机难以满足其极高计算复杂度的需求。具有阈值电压可编程特性和多端口输入结构的铁电晶体管(FeFET)为高效求解组合优化问题提供了... 组合优化问题在诸多领域应用广泛,大多属于非确定多项式时间难题,基于冯·诺依曼架构的传统数字计算机难以满足其极高计算复杂度的需求。具有阈值电压可编程特性和多端口输入结构的铁电晶体管(FeFET)为高效求解组合优化问题提供了新的机遇。基于FeFET的存算一体架构具有能效高、延时低等特点,同时支持对向量-矩阵及向量-矩阵-向量乘法等复杂算子的加速,非常适合求解组合优化问题。该文回顾了FeFET的器件特性,介绍了组合优化问题的基本求解过程,并进一步探讨了近年来面向等式约束、不等式约束和纳什均衡场景下基于FeFET的存算一体组合优化求解器工作。最后,该文从多个方面分析并展望了基于FeFET的存算一体组合优化求解器的前景与挑战。 展开更多
关键词 铁电晶体管 存算一体 组合优化
在线阅读 下载PDF
一种基于相位误差校正技术的快速启动晶体振荡器 被引量:2
14
作者 王子轩 王山虎 +5 位作者 王鑫 姚佳飞 张珺 胡善文 蔡志匡 郭宇锋 《电子学报》 EI CAS CSCD 北大核心 2024年第4期1182-1188,共7页
随着超低功耗(Ultra-Low Power,ULP)物联网(Internet of Things,IoT)系统的发展,采用能量注入技术的快速启动晶体振荡器因对IoT系统功耗影响巨大而逐渐成为研究热点.能量注入技术可以显著降低晶体振荡器的启动时间和启动能量,但是对注... 随着超低功耗(Ultra-Low Power,ULP)物联网(Internet of Things,IoT)系统的发展,采用能量注入技术的快速启动晶体振荡器因对IoT系统功耗影响巨大而逐渐成为研究热点.能量注入技术可以显著降低晶体振荡器的启动时间和启动能量,但是对注入源的精度要求苛刻.为了扩大注入频偏容限以及实现高注入效率,本文提出了一种基于延迟锁定环的相位误差校正技术.该技术将注入频偏容限扩大到2%,启动过程的非注入持续时间仅为4个周期,实现了高效注入.本文所述晶体振荡器采用40 nm CMOS工艺设计并流片.在1.0 V电源电压下采用24 MHz晶体进行测试,当注入频偏高达2%时,实现了7.2μs的启动时间,启动能量为5.1 nJ.相比同频偏下的传统注入方案,启动时间缩短了99.66%. 展开更多
关键词 相位误差校正 晶体振荡器 快速启动 延迟锁定环 能量注入
在线阅读 下载PDF
存储系统中低修复成本的局部修复阵列码
15
作者 唐金华 黄鹃 +4 位作者 杨洋 唐聃 蔡红亮 余洪州 熊攀 《计算机应用研究》 北大核心 2025年第9期2765-2771,共7页
在大规模分布式存储系统的广泛应用背景下,传统容错编码方案在单盘和双盘故障修复过程中面临读取资源消耗高、修复效率不足等技术难题,提出一种具有局部修复特性的混合校验编码方案——VC-code(vertical central symmetric code)。VC-c... 在大规模分布式存储系统的广泛应用背景下,传统容错编码方案在单盘和双盘故障修复过程中面临读取资源消耗高、修复效率不足等技术难题,提出一种具有局部修复特性的混合校验编码方案——VC-code(vertical central symmetric code)。VC-code通过融合横纵式阵列码的快速修复与负载均衡特性,设计了一种局部水平校验与对角校验交叉融合的结构,并采用纵向中心对称校验布局优化数据依赖关系。该设计将单盘和双盘故障修复的数据读取量显著降低,同时通过缩短修复链提升整体效率。理论分析表明,在单双盘故障恢复时大幅降低了数据读取开销。实验结果进一步验证了其性能优势,与RDP码、LRRDP码以及DRDP码相比,VC-code在单盘故障修复时间上减少了10.45%~29.57%,在双盘故障修复时间上减少了6.35%~33.24%。 展开更多
关键词 分布式存储系统 阵列码 局部修复 负载均衡 读取开销
在线阅读 下载PDF
低修复成本的局部混合修复阵列码模型
16
作者 王宇恒 熊攀 +1 位作者 唐聃 蔡红亮 《计算机应用研究》 北大核心 2025年第1期222-230,共9页
具有局部修复性质的水平阵列码将编码矩阵进行分区管理,降低磁盘发生故障时需要读取的数据总量并提升修复效率,但仍存在修复时读写负载集中于单个磁盘的问题。针对局部水平阵列码磁盘读写不均和单双盘修复效率有待提升的问题,结合水平... 具有局部修复性质的水平阵列码将编码矩阵进行分区管理,降低磁盘发生故障时需要读取的数据总量并提升修复效率,但仍存在修复时读写负载集中于单个磁盘的问题。针对局部水平阵列码磁盘读写不均和单双盘修复效率有待提升的问题,结合水平阵列码和垂直阵列码的特点,对其进行局部冗余改造,提出一种具有局部修复性质的混合式阵列码修复模型——LHRC。LHRC根据垂直阵列码的思想将局部水平阵列码的对角校验列迁移至矩阵的中间行,加深数据块与校验块之间的联系,分散读写负载至其他磁盘并减少参与修复的数据总量。通过理论分析,LHRC具有良好的编译码复杂度,改善了磁盘修复时读写不均匀的问题并减少单双盘故障时需要读取的数据总量,提升了三盘故障的修复成功率。实验结果表明LHRC与RDP、LRRDP、DRDP相比,LHRC可将单盘故障修复时间节省3.92%~29.91%、双盘故障修复时间节省7.79%~30.64%。 展开更多
关键词 阵列码 存储系统 局部修复 读取开销
在线阅读 下载PDF
基于工艺相关建模方法的三维结构快闪存储器残余应力不对称性分析及缓解策略
17
作者 崔翰文 高彦泽 +7 位作者 张坤 王诗兆 田志强 郭宇铮 夏志良 张召富 霍宗亮 刘胜 《电子与信息学报》 北大核心 2025年第9期3070-3080,共11页
为进一步提升三维结构快闪存储器(3D NAND)架构的性能表现,行业内涌现出一系列水平与垂直微缩设计思路。这些创新设计方案在突破存储密度瓶颈的同时,也带来了新的集成挑战,其中制造过程中的热机械应力影响尤为突出,制约器件生产的良率... 为进一步提升三维结构快闪存储器(3D NAND)架构的性能表现,行业内涌现出一系列水平与垂直微缩设计思路。这些创新设计方案在突破存储密度瓶颈的同时,也带来了新的集成挑战,其中制造过程中的热机械应力影响尤为突出,制约器件生产的良率及性能表现。该文基于局部代表性体积单元(RVE)有限元过程相关建模框架,针对多层堆叠结构及不同区块(Block)架构设计的技术特点,构建了高精度的3D NAND工艺力学模型。通过系统性研究,深入剖析了3D NAND制造过程中不均匀应力产生的根源,并动态监测了不同微缩方案下机械应力水平及分布规律。研究成果对提高良率和器件可靠性具有重要潜在价值,为提升3D NAND存储密度过程中面临的关键难题提供了有效方案。 展开更多
关键词 三维结构快闪存储器 工艺力学 体积表征元 有限单元法
在线阅读 下载PDF
SIC:面向大语言模型训练的增量检查点技术
18
作者 王志强 朱文喆 +1 位作者 闫超美 李永坤 《计算机应用研究》 北大核心 2025年第11期3397-3404,共8页
大语言模型训练过程会频繁产生各种软硬件故障,造成训练延长和资源浪费。检查点技术作为关键容错机制在保障训练持续性方面发挥重要作用,但传统的全量检查点方法限制了检查点频率并消耗大量存储资源。为此,提出了一种重要性感知增量检... 大语言模型训练过程会频繁产生各种软硬件故障,造成训练延长和资源浪费。检查点技术作为关键容错机制在保障训练持续性方面发挥重要作用,但传统的全量检查点方法限制了检查点频率并消耗大量存储资源。为此,提出了一种重要性感知增量检查点方法(SIC)。该方法设计了分层感知的参数更新过滤算法,有效识别每层网络的重要参数更新;此外,通过动态阈值调节机制,在训练过程中实时调节参数变化阈值,确保不丢失关键更新;最后,从理论上证明了SIC对训练收敛性的影响可控。实验表明,单次迭代保存2%的数据足以保证模型的精度和收敛性;相比于最先进的全量检查点方法,在相同开销约束下SIC检查点频率提升了9~17倍,存储开销仅为3%。因此,SIC兼具了高执行效率、低存储开销的优势。 展开更多
关键词 大语言模型 容错训练 检查点技术 增量检查点
在线阅读 下载PDF
前言
19
作者 舒继武 王意洁 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期555-556,共2页
进入数字经济时代,数据已成为新的核心生产要素,其重要战略资源地位日益凸显,数据潜能的有效激发取决于数据的存储与分析处理.随着先进计算以计算为核心逐步向以数据为中心的不断演进,高效安全存储和智能数据分析成为学术界和产业界广... 进入数字经济时代,数据已成为新的核心生产要素,其重要战略资源地位日益凸显,数据潜能的有效激发取决于数据的存储与分析处理.随着先进计算以计算为核心逐步向以数据为中心的不断演进,高效安全存储和智能数据分析成为学术界和产业界广泛关注的焦点. 展开更多
关键词 安全存储 智能数据分析 以数据为中心 核心生产要素 有效激发 数据的存储 产业界
在线阅读 下载PDF
基于动态页面映射的远程交换系统内存管理优化
20
作者 李昱祁 王霄阳 +1 位作者 朱文喆 李永坤 《计算机应用研究》 北大核心 2025年第10期3099-3105,共7页
远程交换系统利用内核的页面交换机制透明地使用远程内存,是构建分离式内存架构的一种常见方法。然而,现有系统在创建远程交换分区时,会预先分配完整容量的远程内存,导致内部碎片并降低内存使用率。针对此问题,设计了一种新型远程内存... 远程交换系统利用内核的页面交换机制透明地使用远程内存,是构建分离式内存架构的一种常见方法。然而,现有系统在创建远程交换分区时,会预先分配完整容量的远程内存,导致内部碎片并降低内存使用率。针对此问题,设计了一种新型远程内存管理方法,动态地为系统中正在使用的交换条目映射远程页面,减少非必要内存占用。该方法引入高效的节点间内存分配与回收机制,以支持细粒度内存管理并确保计算节点间的内存访问隔离性。实验结果表明,该方法可以在不同场景下将远程交换分区的内存利用率提高5.2%~89.1%,同时仅引入较少的额外开销。因此,该方法可以有效提高远程交换系统的内存管理效率。 展开更多
关键词 远程交换系统 内存管理 动态页面映射 远程直接内存访问
在线阅读 下载PDF
上一页 1 2 160 下一页 到第
使用帮助 返回顶部