期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
含预应力服务器机箱结构动态数值模拟分析 被引量:1
1
作者 龚宝龙 《现代制造工程》 CSCD 北大核心 2017年第3期101-105,121,共6页
利用有限元模拟仿真技术,采用Static Structural、Modal及Harmonic Response模块,对含预应力状态下的服务器机箱结构进行动态数值模拟分析,其中包含模态分析及谐响应分析,得出服务器机箱的固有频率及振型、风扇振动引起谐响应规律,并对... 利用有限元模拟仿真技术,采用Static Structural、Modal及Harmonic Response模块,对含预应力状态下的服务器机箱结构进行动态数值模拟分析,其中包含模态分析及谐响应分析,得出服务器机箱的固有频率及振型、风扇振动引起谐响应规律,并对含预应力及不含预应力的模态结果进行对比分析。研究结果表明,第2阶模态90Hz附近的振型以底座后部振动为主,易引起主板的损坏;含预应力及不含预应力状态下的机箱结构固有频率差值很小,故在服务器模态分析中,可通过取消预应力的设定来简化模态分析过程;风扇作为振动源产生的机箱谐响应振动,最大振幅在90Hz附近,位于机箱底座后部。 展开更多
关键词 服务器机箱 模态分析 谐响应 数值模拟 动态分析
在线阅读 下载PDF
基于尺寸优化的服务器机箱结构优化设计 被引量:6
2
作者 刘升福 吴安 王羽茜 《机械设计》 CSCD 北大核心 2021年第S01期178-182,共5页
为提高服务器机箱的结构强度,基于有限元仿真分析的方法对机箱扭转变形进行模拟分析,并通过Hypermesh和Optistruct对其进行结构优化设计。考虑机箱实际应用中的强度,在机箱变形给定的约束限制下,采用尺寸优化的方法确定了机箱各部件最... 为提高服务器机箱的结构强度,基于有限元仿真分析的方法对机箱扭转变形进行模拟分析,并通过Hypermesh和Optistruct对其进行结构优化设计。考虑机箱实际应用中的强度,在机箱变形给定的约束限制下,采用尺寸优化的方法确定了机箱各部件最优尺寸组合,有效降低了扭转变形且满足轻量化设计。通过尺寸优化改善的节点机箱Y方向位移下沉量为3.2 mm,较优化前改善了50%,质量仅增加3.4%。尺寸优化基于仿真分析的强度分布对薄弱的部件针对性优化厚度,该优化技术为机箱前期开发设计中赋予截面尺寸参数提供了良好的理论指导和参考依据。 展开更多
关键词 服务器机箱 尺寸优化 强度 扭转 变形
在线阅读 下载PDF
一种基于Kyber算法的NTT硬件加速器实现
3
作者 李拓 邹晓峰 +3 位作者 孔令军 王贤坤 庞兆春 张璐 《计算机应用与软件》 北大核心 2025年第8期259-262,共4页
现有NTT计算电路的所需参数一般是固定的,可计算的数据格式不够灵活。该文提出一种基于Kyber算法的NTT硬件加速器,提供了一种参数可配置的NTT计算,旋转因子、特殊素数、所计算元素的宽度、点数都可以进行配置,最高可计算256点、16 bit... 现有NTT计算电路的所需参数一般是固定的,可计算的数据格式不够灵活。该文提出一种基于Kyber算法的NTT硬件加速器,提供了一种参数可配置的NTT计算,旋转因子、特殊素数、所计算元素的宽度、点数都可以进行配置,最高可计算256点、16 bit宽的数据,具有一定的灵活性。当选择具体的参数来实现Kyber算法的NTT加速时,利用NTT硬件加速器,可以在1.6μs的时间完成NTT计算,比Cortex-M4上的软件实现快201倍。因此,此设计可以应用在包含Kyber算法在内的格密码方案中,有效地提升密码方案的整体运算速度。 展开更多
关键词 信息安全 RISC-V 加速器
在线阅读 下载PDF
磁盘阵列中基于IB通信的内存镜像技术的设计与实现 被引量:1
4
作者 吕烁 文中领 +1 位作者 杨帆 杨金刚 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期84-88,共5页
基于镜像原理,设计和实现了磁盘阵列中基于RDMA通信的内存镜像方案.其原理是在数据读写时,将数据同时写入到两个独立的内存区域中,相对于现在内存访问只在单内存区域上进行的情况,有效地防止了多控制器中的任一控制器由于意外故障而导... 基于镜像原理,设计和实现了磁盘阵列中基于RDMA通信的内存镜像方案.其原理是在数据读写时,将数据同时写入到两个独立的内存区域中,相对于现在内存访问只在单内存区域上进行的情况,有效地防止了多控制器中的任一控制器由于意外故障而导致缓存里的数据丢失.测试证明,该设计较好地在保证数据完整性的前提下,最大带宽损失不到10%,最大IOPS不到15%. 展开更多
关键词 内存镜像 RDMA 磁盘阵列 带宽
在线阅读 下载PDF
计算机体系结构模拟技术现状、挑战与展望 被引量:3
5
作者 王恩东 陈继承 +3 位作者 王洪伟 倪璠 唐士斌 史宏志 《小型微型计算机系统》 CSCD 北大核心 2016年第1期178-185,共8页
体系结构模拟技术在计算机体系结构研究和系统设计中发挥着重要作用.通过对计算机系统的建模、仿真及评估,科研人员可以验证新型体系结构设计;将该技术导入产品设计则可以优化系统方案、降低设计风险并提升开发效率.随着半导体工艺的迅... 体系结构模拟技术在计算机体系结构研究和系统设计中发挥着重要作用.通过对计算机系统的建模、仿真及评估,科研人员可以验证新型体系结构设计;将该技术导入产品设计则可以优化系统方案、降低设计风险并提升开发效率.随着半导体工艺的迅速提升,分布式共享内存计算机系统已步入千核时代,处理器微结构、存储层次、片间互连及cache一致性协议等对系统性能的影响愈发复杂,对体系结构模拟技术也提出更高挑战.本文依据计算机体系结构模拟技术特征,从精度、速度、可用性和易用性四个方面对现有体系结构模拟技术进行了分析、总结.针对计算机系统发展趋势与当前模拟器存在的问题,归纳了体系结构模拟技术面临的挑战,进而提出了未来体系结构模拟技术发展的4A理论. 展开更多
关键词 体系结构模拟 模拟器 精度 速度 可用性 易用性
在线阅读 下载PDF
基于虚拟化技术的远程数据镜像系统的实现 被引量:1
6
作者 张雷 张宇 +1 位作者 文中领 王永海 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期147-152,共6页
介绍了一种远程镜像系统VRDMS,它具有如下特点:1)支持多种块级设备的传输协议;2)适用于多种不同的网络环境以充分发挥数据镜像的适应性,可适应云存储的架构的部署环境;3)利用站点式方式管理各个数据源卷和镜像卷;4)结合虚拟化技术以减... 介绍了一种远程镜像系统VRDMS,它具有如下特点:1)支持多种块级设备的传输协议;2)适用于多种不同的网络环境以充分发挥数据镜像的适应性,可适应云存储的架构的部署环境;3)利用站点式方式管理各个数据源卷和镜像卷;4)结合虚拟化技术以减少用户的使用复杂性的同时增加数据复制性能.目前该系统已应用于"八六三"海量存储项目的高端磁盘阵列中. 展开更多
关键词 远程数据镜像 块级设备 虚拟化技术
在线阅读 下载PDF
深度学习编译器模型训练负载均衡优化方法 被引量:4
7
作者 王丽 高开 +3 位作者 赵雅倩 李仁刚 曹芳 郭振华 《计算机科学与探索》 CSCD 北大核心 2024年第1期111-126,共16页
对于计算密集型的人工智能(AI)训练应用,其计算图网络结构更加复杂,数据加载、计算图的任务划分以及任务调度的负载均衡性都会成为影响计算性能的关键因素。为了使深度学习编译器中模型训练应用的任务调度达到负载均衡的状态,提出了三... 对于计算密集型的人工智能(AI)训练应用,其计算图网络结构更加复杂,数据加载、计算图的任务划分以及任务调度的负载均衡性都会成为影响计算性能的关键因素。为了使深度学习编译器中模型训练应用的任务调度达到负载均衡的状态,提出了三种计算图负载均衡优化方法:第一,通过自动建立数据加载与模型训练的高效流水实现中央处理器和后端计算设备的负载均衡,提高了系统整体能效;第二,通过计算图的分层优化技术,实现计算图在后端设备执行调度时的负载均衡;最后,通过自动建立层间的高效流水提高后端设备的资源利用率。实验结果表明,计算图负载均衡优化方法实现了训练任务到底层硬件设备自动映射过程中系统的负载均衡,与Tensorflow、nGraph等传统的深度学习框架和编译器相比,在不同模型训练中通过任务调度负载均衡优化技术分别获得了2%~10%的性能提升,同时能够使系统整体的能耗降低10%以上。 展开更多
关键词 模型训练 编译器优化 负载均衡 分层调度 自动流水
在线阅读 下载PDF
自动驾驶多传感器融合的时间校准方法研究 被引量:6
8
作者 张晶威 刘铁军 +3 位作者 李仁刚 刘丹 詹景麟 阚宏伟 《汽车工程》 EI CSCD 北大核心 2022年第2期215-224,共10页
针对自动驾驶感知域系统的激光雷达、图像传感器、惯性测量单元3种传感器数据融合的时基校准问题,利用机械式激光雷达自身特征设计校准设备、系统及实验方法。基于激光雷达的触发事件和车载图像传感器感知特征,实现两种传感器时基在线标... 针对自动驾驶感知域系统的激光雷达、图像传感器、惯性测量单元3种传感器数据融合的时基校准问题,利用机械式激光雷达自身特征设计校准设备、系统及实验方法。基于激光雷达的触发事件和车载图像传感器感知特征,实现两种传感器时基在线标定,并通过示波器测量校验证明该方法的有效性。利用激光雷达扫描频率与触发事件时间差相互关联的特征,将激光雷达与惯性测量单元的标定系统结合,对激光雷达与惯性测量单元时基进行标定,并通过惯性测量单元标定实验证明方法有效性。 展开更多
关键词 自动驾驶 传感器融合 时间校准
在线阅读 下载PDF
面向混合异构架构的模型并行训练优化方法 被引量:2
9
作者 高开 郭振华 +3 位作者 陈永芳 王丽 赵雅倩 赵坤 《计算机工程与科学》 CSCD 北大核心 2021年第1期42-48,共7页
随着混合异构平台的发展,出现了类型不一的加速设备,如何在混合异构平台中充分利用这些不同类型的设备,以及如何在多个计算设备之间部署深度学习模型,而且训练大型和复杂模型的重要性不断提高。数据并行(DP)是应用最广泛的并行化策略,... 随着混合异构平台的发展,出现了类型不一的加速设备,如何在混合异构平台中充分利用这些不同类型的设备,以及如何在多个计算设备之间部署深度学习模型,而且训练大型和复杂模型的重要性不断提高。数据并行(DP)是应用最广泛的并行化策略,但是如果数据并行训练中的设备数量不断增加,设备之间的通信开销就会成为瓶颈。此外,每个步骤因设备性能差异处理的批总量不同会导致精度损失,即需要更长的训练周期以收敛到期望的精度。这些因素会影响整体训练时间,并且会影响某些设备的运行效率。除了数据并行(DP),每个训练步骤都可以通过模型并行(MP)来加速。提出了一种适合混合异构平台的模型并行训练优化算法。首先,为解决混合异构平台中设备性能分布不均问题,提出了层级并行和通道并行混合的模型并行划分策略,同时通过合并一些性能偏低的设备来减少流水线的长度和缓解通信压力。然后为了优化设备间的流水效果,通过分析流水线建立时间占比和设备性能利用率对整体训练时间的影响,提出了一种可以使两者达到均衡状态的微批次划分方法。实验表明,通过本文方法优化之后的模型并行流水训练算法比传统的模型并行算法具有更好的加速比,在单一类型设备的异构平台上的训练性能加速比提升4%左右,在混合异构平台的训练性能加速比要比没有使用优化方法之前提升7%左右。 展开更多
关键词 混合异构 模型并行 微批次 设备差异
在线阅读 下载PDF
面向模型并行训练的模型拆分策略自动生成方法 被引量:1
10
作者 王丽 郭振华 +3 位作者 曹芳 高开 赵雅倩 赵坤 《计算机工程与科学》 CSCD 北大核心 2020年第9期1529-1537,共9页
随着训练数据规模的增大以及训练模型的日趋复杂,深度神经网络的训练成本越来越高,对计算平台提出了更高的算力需求,模型训练并行化成为增强其应用时效性的迫切需求。近年来基于分布式训练的AI加速器(如FPGA、TPU、AI芯片等)层出不穷,... 随着训练数据规模的增大以及训练模型的日趋复杂,深度神经网络的训练成本越来越高,对计算平台提出了更高的算力需求,模型训练并行化成为增强其应用时效性的迫切需求。近年来基于分布式训练的AI加速器(如FPGA、TPU、AI芯片等)层出不穷,为深度神经网络并行训练提供了硬件基础。为了充分利用各种硬件资源,研究人员需要在集合了多种不同算力、不同硬件架构AI加速器的计算平台上进行神经网络的模型并行训练,因此,如何高效利用各种AI加速器计算资源,并实现训练任务在多种加速器上的负载均衡,一直是研究人员关心的热点问题。提出了一种面向模型并行训练的模型拆分策略自动生成方法,该方法能够基于静态的网络模型自动生成模型拆分策略,实现网络层在不同AI加速器上的任务分配。基于该方法自动生成的模型分配策略,能够高效利用单个计算平台上的所有计算资源,并保证模型训练任务在各设备之间的负载均衡,与目前使用的人工拆分策略相比,具有更高的时效性,节省拆分策略生成时间100倍以上,且降低了由于人为因素带来的不确定性。 展开更多
关键词 模型并行 模型训练 模型拆分 负载均衡
在线阅读 下载PDF
处理器互联体系结构的一些特点分析 被引量:1
11
作者 王恩东 秦济龙 《科学技术与工程》 2011年第30期7419-7424,共6页
介绍目前计算机工业界最新的处理器互联总线的最新进展。以QuickPath为例简要地叙述其现有的研究应用状况和介绍QuickPath体系结构的特点,及其这种新总线接口将给未来服务器体系结构带来影响的一些推测;并介绍在高端容错大型计算机高可... 介绍目前计算机工业界最新的处理器互联总线的最新进展。以QuickPath为例简要地叙述其现有的研究应用状况和介绍QuickPath体系结构的特点,及其这种新总线接口将给未来服务器体系结构带来影响的一些推测;并介绍在高端容错大型计算机高可靠性及可重构架构系统设计中的一些相关考虑。 展开更多
关键词 高性能计算 处理器互联 片外 可重配置 QuickPath Hyper-Transport 多处理器 计算机体系结构 可靠性 SERDES
在线阅读 下载PDF
一种面向三维众核微处理器的新型NoC拓扑结构
12
作者 陈继承 王洪伟 张闯 《计算机工程与科学》 CSCD 北大核心 2016年第8期1542-1549,共8页
三维微处理器具有集成度高、全局互连线短及连接部件多的优势,但是传统的三维拓扑结构在大规模系统中无法充分利用垂直方向上低延时高带宽的特性,很难满足大规模众核微处理器低直径、高带宽、高扩展性的需求。针对三维NoC网络直径大、... 三维微处理器具有集成度高、全局互连线短及连接部件多的优势,但是传统的三维拓扑结构在大规模系统中无法充分利用垂直方向上低延时高带宽的特性,很难满足大规模众核微处理器低直径、高带宽、高扩展性的需求。针对三维NoC网络直径大、可扩展性要求高以及路由端口多的问题,提出了一种基于多级垂直域的三维拓扑结构—V-Spidergon,其在水平层上采用Spidergon结构,在垂直方向上采用多级垂直域扩展结构,域内及域间均实现全互连。实验数据表明,在8层、16层和32层堆叠下,V-Spidergon结构的延时较3D-Mesh分别降低15.1%、28.5%和55.7%,较NoC-Bus分别降低11.5%、32.7%和77.6%;在15%和100%负载率注入情形下,V-Spidergon的平均延时表现出与水平层数增加不相关的特性。 展开更多
关键词 众核微处理器 片上网络 三维集成电路 3D—Mesh NoC—Bus 多级垂直域结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部