期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
大模型时代的混合专家系统优化综述 被引量:1
1
作者 史宏志 赵健 +5 位作者 赵雅倩 李茹杨 魏辉 胡克坤 温东超 金良 《计算机研究与发展》 北大核心 2025年第5期1164-1189,共26页
近年来,大模型推动自然语言处理、机器视觉等众多领域取得前所未有的进展.混合专家(mixture of experts,MoE)凭借在模型参数扩展、计算成本控制和复杂任务处理等方面的独特优势成为大模型的主流架构之一.然而,随着参数规模的持续增长,... 近年来,大模型推动自然语言处理、机器视觉等众多领域取得前所未有的进展.混合专家(mixture of experts,MoE)凭借在模型参数扩展、计算成本控制和复杂任务处理等方面的独特优势成为大模型的主流架构之一.然而,随着参数规模的持续增长,系统的执行效率和可扩展能力愈发难以满足需求,亟待解决.系统优化方法是解决这一挑战的有效途径,日益成为研究热点.故综述大模型时代MoE系统优化技术的研究现状,首先介绍MoE大模型的发展现状,并分析其在系统端面临的性能瓶颈;然后从内存占用、通信延迟、计算效率和并行扩展4个系统核心维度对最新的研究进展进行全面梳理和深入分析,并对其中涉及的关键技术、适用场景和待优化方向进行详细对比阐述;最后总结MoE系统优化的研究现状,并展望未来研究方向. 展开更多
关键词 大模型 混合专家 内存卸载 分层通信 专家放置 专家激活预测 自适应并行
在线阅读 下载PDF
基于可重构架构的数据中心异构加速软硬件系统级平台
2
作者 王彦伟 李仁刚 +1 位作者 徐冉 刘钧锴 《计算机研究与发展》 北大核心 2025年第4期963-977,共15页
构建数据中心加速服务的软硬件系统级原型平台,需要考虑高计算能力、扩展性、灵活性和低成本等因素.为了提高数据中心的能力,从软硬件协同的角度研究数据中心异构计算在云平台架构、硬件实现、高速互连和应用等方面的创新,研究设计并构... 构建数据中心加速服务的软硬件系统级原型平台,需要考虑高计算能力、扩展性、灵活性和低成本等因素.为了提高数据中心的能力,从软硬件协同的角度研究数据中心异构计算在云平台架构、硬件实现、高速互连和应用等方面的创新,研究设计并构建了一个可重构组合的软硬件加速原型系统,简化了现有以处理器为中心的系统级计算平台构建方法,实现目标软硬件设计的快速部署与系统级原型验证.针对以上目标,通过解耦的可重构架构设备虚拟化和远程映射等方法,发掘独立计算单元的潜力,构建了一套ISOF(independent system of FPGA(field programmable gate arrays))软硬件计算平台系统,可使其超越普通服务器设计所能提供的能力,实现计算单元低成本高效扩展,使客户端可灵活使用外设资源,并且为满足系统级通信挑战,设计了一套计算单元之间的通信硬件平台和交互机制.此外,为提升软硬件系统级平台的敏捷性,ISOF提供了灵活统一的调用接口.最后,通过对平台目标系统级的分析评估,验证了该平台在满足了当下计算与加速需求下,保证了高速、低延时的通信,以及良好的吞吐率和弹性扩容效率,另外在高速通信的基础上改进的拥塞避免和丢包恢复机制,满足了数据中心规模通信的稳定性需求. 展开更多
关键词 异构计算 加速平台 原型系统 高速互连 可重构架构 FPGA
在线阅读 下载PDF
一种大型电子邮件服务器系统的研究与实现 被引量:1
3
作者 杜哲君 伍卫国 +2 位作者 刘娟 董小社 胡雷钧 《计算机工程》 EI CAS CSCD 北大核心 2005年第20期214-216,共3页
电子邮件服务是目前互联网提供的最主要信息服务之一。为了充分利用曙光3000的资源,针对其结构特点,使用qmail及相关软件包,通过新设计两个通信模块,实现了一种大型邮件服务器系统。分析结果表明,新设计出的邮件服务器系统能支持百万级... 电子邮件服务是目前互联网提供的最主要信息服务之一。为了充分利用曙光3000的资源,针对其结构特点,使用qmail及相关软件包,通过新设计两个通信模块,实现了一种大型邮件服务器系统。分析结果表明,新设计出的邮件服务器系统能支持百万级用户量,系统具有良好的可扩展性及可用性。 展开更多
关键词 邮件服务器 机群 QMAIL
在线阅读 下载PDF
分布式训练系统及其优化算法综述 被引量:8
4
作者 王恩东 闫瑞栋 +1 位作者 郭振华 赵雅倩 《计算机学报》 EI CAS CSCD 北大核心 2024年第1期1-28,共28页
人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本... 人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本文首先阐述了单机训练面临的主要挑战.其次,分析了分布式训练系统亟需解决的三个关键问题.基于上述问题归纳了分布式训练系统的通用框架与四个核心组件.围绕各个组件涉及的技术,梳理了代表性研究成果.在此基础之上,总结了基于并行随机梯度下降算法的中心化与去中心化架构研究分支,并对各研究分支优化算法与应用进行综述.最后,提出了未来可能的研究方向. 展开更多
关键词 分布式训练系统 (去)中心化架构 中心化架构算法 (异)同步算法 并行随机梯度下降 收敛速率
在线阅读 下载PDF
Direct xPU:一种新型节点间通信优化的分布式异构计算架构 被引量:2
5
作者 李仁刚 王彦伟 +4 位作者 郝锐 肖麟阁 杨乐 杨广文 阚宏伟 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1388-1400,共13页
人工智能大模型应用的爆发式增长,使得难以依靠单一节点、单一类型的算力实现应用的规模部署,分布式异构计算成为主流选择,而节点间通信成为大模型训练或推理过程中的主要瓶颈之一.目前,主要由GPU,FPGA等头部芯片厂商所主导的各种计算... 人工智能大模型应用的爆发式增长,使得难以依靠单一节点、单一类型的算力实现应用的规模部署,分布式异构计算成为主流选择,而节点间通信成为大模型训练或推理过程中的主要瓶颈之一.目前,主要由GPU,FPGA等头部芯片厂商所主导的各种计算架构的节点间通信方案还存在一些问题.一方面,为了追求极致的节点间通信性能,一部分架构选择使用协议简单而可扩展性差的点对点传输方案.另一方面,传统的异构计算引擎(例如GPU)虽然在内存、计算管线等算力要素方面独立于CPU,但在通信要素方面却缺少专属的网络通信设备,需要完全或部分借助于CPU通过PCIe等物理链路来处理异构计算引擎与共享网络通信设备之间的通信.所实现的Direct xPU分布式异构计算架构,使得异构计算引擎在算力要素和通信要素两方面均具有独立的、专属的设备,实现了数据的零拷贝,并进一步消除了节点间通信过程中处理跨芯片传输数据所带来的能耗和延迟.测试结果表明,Direct xPU取得了与追求极致的节点间通信性能的计算架构相当的通信延迟,带宽接近物理通信带宽的上限. 展开更多
关键词 节点间通信 FPGA GPU RDMA 零拷贝
在线阅读 下载PDF
区块链与机密计算技术在材料数据库平台中的应用分析 被引量:1
6
作者 龚海燕 麻付强 +1 位作者 张达威 李晓刚 《农业大数据学报》 2024年第2期241-252,共12页
随着人工智能和材料科学数据驱动的材料设计热潮的兴起,材料科学数据成为生产要素、国家战略资源和国际竞争的焦点。然而,随着材料数据共享的增加,数据安全问题变得不可忽视。数据泄露、滥用、篡改等问题威胁着企业竞争力。本文综述了... 随着人工智能和材料科学数据驱动的材料设计热潮的兴起,材料科学数据成为生产要素、国家战略资源和国际竞争的焦点。然而,随着材料数据共享的增加,数据安全问题变得不可忽视。数据泄露、滥用、篡改等问题威胁着企业竞争力。本文综述了目前主流的数据安全保护技术,包括访问控制、加密技术,构成了传统的数据安全防护模型,实现数据传输、存储时的安全。区块链技术可以实现数据传输、存储时的机密性、完整性、可用性,但是这些机制仍无法解决数据使用时的隐私问题,无法保护使用中的数据机密性、完整性等问题。利用机密计算技术的优势,在硬件可信执行环境中执行计算,最小化计算环境的可信基,提供全方位的数据保护,践行“数据可用不可见”理念,实现对使用中的数据保护,进而构建端到端的全生命周期数据安全。本文结合区块链和机密计算技术的优势,提出基于区块链和机密计算的材料数据可信基础设施方案,以实现数据的全生命周期安全,为材料数据的安全应用提供有力支持。 展开更多
关键词 机密计算 区块链 材料数据 数据安全 数据共享
在线阅读 下载PDF
噪声激励下的硬盘频响特性研究和性能预测模型
7
作者 陈强 王羽茜 +2 位作者 刘广志 吴安 蒋少男 《振动与冲击》 EI CSCD 北大核心 2024年第17期331-338,共8页
针对服务器硬盘在高噪声环境下性能下降问题,设计了一种试验方法来分析噪声激励下硬盘性能损失的敏感度特性。通过编程模拟不同频率和强度的1/9倍频程带宽的均匀随机噪声,测试硬盘在噪声激励下产生的性能损失。通过机理分析和试验数据分... 针对服务器硬盘在高噪声环境下性能下降问题,设计了一种试验方法来分析噪声激励下硬盘性能损失的敏感度特性。通过编程模拟不同频率和强度的1/9倍频程带宽的均匀随机噪声,测试硬盘在噪声激励下产生的性能损失。通过机理分析和试验数据分析,建立回归方程,提出敏感度(K)的数学模型。建立了预测硬盘性能损失的数学模型,基于服务器机箱内散热风扇产生的真实噪声信号可计算出硬盘性能损失率。在多种场景的检验中发现预测模型的结果非常接近实际结果,证明此方法是一种非常准确的分析和预测手段,为服务器系统的声学设计提供有效的量化参考。 展开更多
关键词 噪声 硬盘(HOD) 风扇 性能预测
在线阅读 下载PDF
一种自定义高速串口存储网络浅析 被引量:1
8
作者 秦济龙 李仁刚 +2 位作者 林杨 李拓 刘刚 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期85-89,共5页
介绍目前工业界最新的存储网络交换传输的新进展和简要地叙述其现有的研究应用状况,以浪潮正在开发中的基于自定义高速串口的ISR存储交换网络为例介绍在大型IP-SAN网络存储传输器件设计和应用中的一些相关考虑.
关键词 IP-SAN 存储 SERDES 数据安全 RAS
在线阅读 下载PDF
一种路由交换阵列节点芯片及其系统的设计与实现 被引量:1
9
作者 秦济龙 李庆华 +5 位作者 王恩东 公维锋 张峰 牛赟 乌力吉 张向民 《计算机工程与科学》 CSCD 北大核心 2016年第12期2392-2401,共10页
介绍一种面向大数据处理数据中心应用的计算/控制/网络存储的路由交换阵列节点芯片及其所组成的安全交换阵列原型机的设计与实现;该路由交换阵列系统通过因特网远程使用软件定义网络(SDN)方式对高速安全交换网络的内部路由控制和安全等... 介绍一种面向大数据处理数据中心应用的计算/控制/网络存储的路由交换阵列节点芯片及其所组成的安全交换阵列原型机的设计与实现;该路由交换阵列系统通过因特网远程使用软件定义网络(SDN)方式对高速安全交换网络的内部路由控制和安全等模块进行集中编程控制,满足数据中心对数据传输带宽容量的需求;同时并行计算过程中消除网络传输瓶颈,避免了数据中心网络等资源的长期占用浪费,为下一代数据中心解决方案的形成打下基础。另外还简述了其在金融交易系统领域大数据应用尝试的研究近况。 展开更多
关键词 软件定义网络 大数据 交换 实时配置 IP安全协议 深度报文检测 高频交易
在线阅读 下载PDF
一种收发逻辑环回测试方法的设计与实现 被引量:6
10
作者 李仁刚 秦济龙 《科学技术与工程》 2010年第9期2202-2206,共5页
环回测试通常用于检查和分析芯片收发模块接口电路、内部逻辑以及传输线路物理实现的正确性。逻辑仿真过程中的环回测试主要用来验证收发模块逻辑设计以及环回设计功能的正确性。调试阶段的环回测试能够快速定位传输线路物理实现的故障... 环回测试通常用于检查和分析芯片收发模块接口电路、内部逻辑以及传输线路物理实现的正确性。逻辑仿真过程中的环回测试主要用来验证收发模块逻辑设计以及环回设计功能的正确性。调试阶段的环回测试能够快速定位传输线路物理实现的故障点,为研制工作节省时间开销和人力成本。介绍了一种优化设计实现的物理层芯片环回设计和测试方法,更加有效地缩短了调试周期。 展开更多
关键词 环回 发射器 接收器 FPGA 环回寄存器
在线阅读 下载PDF
一种物理链路检测电路设计及仿真模型实现方法 被引量:2
11
作者 李仁刚 王恩东 +1 位作者 胡雷钧 秦济龙 《科学技术与工程》 2010年第35期8816-8821,共6页
检测电路用于动态检测多节点系统中节点间物理传输链路连接故障,以便系统采用链路降宽、冗余设计等手段提高系统可靠性。其仿真模型是指在系统级功能仿真验证阶段建立合理的检测电路软件模型,以保证设计验证的顺利进展;同时也为研制工... 检测电路用于动态检测多节点系统中节点间物理传输链路连接故障,以便系统采用链路降宽、冗余设计等手段提高系统可靠性。其仿真模型是指在系统级功能仿真验证阶段建立合理的检测电路软件模型,以保证设计验证的顺利进展;同时也为研制工作节省时间开销和设计成本。介绍了一种物理链路检测电路的设计方法,并且实现了其软件仿真模型的设计方法。 展开更多
关键词 检测电路 仿真模型 可靠性
在线阅读 下载PDF
一种串行高速芯片互连接口逻辑设计与实现 被引量:1
12
作者 李仁刚 王恩东 +1 位作者 胡雷钧 秦济龙 《科学技术与工程》 北大核心 2012年第31期8235-8240,共6页
在计算机系统中,总线技术对整个系统的性能和功能都有直接影响,通过研究高速信号传输的特点,分析串行高速芯片互连协议,实现了一种串行高速芯片互连接口逻辑,并实现了FPGA平台的与处理器互连和芯片间互连的验证。最终达到了设计性能要... 在计算机系统中,总线技术对整个系统的性能和功能都有直接影响,通过研究高速信号传输的特点,分析串行高速芯片互连协议,实现了一种串行高速芯片互连接口逻辑,并实现了FPGA平台的与处理器互连和芯片间互连的验证。最终达到了设计性能要求和可靠性要求,互连接口数据传输速率达到6.4GT/s。 展开更多
关键词 串行总线接口 扰码 FPGA 可靠性
在线阅读 下载PDF
云数据中心操作系统副本分布算法的设计与实现 被引量:1
13
作者 颜秉珩 张明富 张俊 《计算机应用与软件》 CSCD 2011年第11期290-293,共4页
介绍云数据中心操作系统(云海OS)中的副本分布算法,该算法用于解决云存储环境下的副本分布问题,将存储节点的选择问题转化为一个多指标决策问题(MCDM),使用TOPSIS进行求解。算法能够充分利用云计算环境下的多种检测数据,结合灵活的权重... 介绍云数据中心操作系统(云海OS)中的副本分布算法,该算法用于解决云存储环境下的副本分布问题,将存储节点的选择问题转化为一个多指标决策问题(MCDM),使用TOPSIS进行求解。算法能够充分利用云计算环境下的多种检测数据,结合灵活的权重分配方式,适应多数云存储环境。模拟实验表明,云海OS算法在负载均衡和副本创建时间方面优于传统的Least和Ran-dom算法。 展开更多
关键词 云存储 数据副本 副本放置
在线阅读 下载PDF
PVFS客户端目录缓存设计与实现
14
作者 伍卫国 方敏 +2 位作者 吴小康 万群 胡雷钧 《计算机工程》 EI CAS CSCD 北大核心 2005年第23期206-207,213,共3页
缓存技术是提高并行文件系统性能的关键性技术。在并行文件系统中实现客户端目录缓存,不仅可以减轻目录服务器的压力,避免目录服务器成为系统瓶颈,而且可以简化客户端操作过程,提高并行文件系统的性能。该文对PVFS并行文件系统进行了分... 缓存技术是提高并行文件系统性能的关键性技术。在并行文件系统中实现客户端目录缓存,不仅可以减轻目录服务器的压力,避免目录服务器成为系统瓶颈,而且可以简化客户端操作过程,提高并行文件系统的性能。该文对PVFS并行文件系统进行了分析,建立了客户端目录缓存模型;就客户端目录缓存实现的一些关键性问题,如缓存池开辟位置、一致性等问题进行了研究,给出了解决方法,并在此基础上实现了一个客户端目录缓存的原型系统。测试结果表明,加入缓存后,PVFS系统性能有所提高。 展开更多
关键词 并行文件系统 目录缓存 元数据 PVFS
在线阅读 下载PDF
集群服务器多接口节点机系统的管理机制研究
15
作者 伍卫国 杨文贵 +3 位作者 刘爱华 董小社 钱德沛 胡雷均 《计算机工程》 EI CAS CSCD 北大核心 2006年第4期111-113,共3页
针对自行设计的一种多接口节点机系统中接口节点分布式的特点,综合使用JSP技术和代理技术,设计了分层分布式架构的集群服务器多接口节点机系统的管理软件,实现了系统的远程配置管理功能。该管理软件为集群管理员提供了简单方便的操作平... 针对自行设计的一种多接口节点机系统中接口节点分布式的特点,综合使用JSP技术和代理技术,设计了分层分布式架构的集群服务器多接口节点机系统的管理软件,实现了系统的远程配置管理功能。该管理软件为集群管理员提供了简单方便的操作平台,提高了多接口节点机系统的易用性与可管理性,具有一定的实用价值,可供相关管理系统的设计作借鉴。 展开更多
关键词 多接口节点机 集群服务器 代理 管理软件
在线阅读 下载PDF
集群管理系统前台的设计与实现 被引量:6
16
作者 卫建国 董渭清 +2 位作者 董小社 刘广红 张露 《计算机应用研究》 CSCD 北大核心 2004年第9期191-193,共3页
集群的应用越来越广泛,但是现有集群管理系统的人机交互界面都不尽人意。介绍了一种新的基于Web的集群管理系统,重点分析了前台的设计与实现过程。通过这样的前台可以进行单一映像的远程安装、管理和监控。
关键词 集群管理软件 JSP JAVA 安装 监控
在线阅读 下载PDF
自动驾驶多传感器融合的时间校准方法研究 被引量:6
17
作者 张晶威 刘铁军 +3 位作者 李仁刚 刘丹 詹景麟 阚宏伟 《汽车工程》 EI CSCD 北大核心 2022年第2期215-224,共10页
针对自动驾驶感知域系统的激光雷达、图像传感器、惯性测量单元3种传感器数据融合的时基校准问题,利用机械式激光雷达自身特征设计校准设备、系统及实验方法。基于激光雷达的触发事件和车载图像传感器感知特征,实现两种传感器时基在线标... 针对自动驾驶感知域系统的激光雷达、图像传感器、惯性测量单元3种传感器数据融合的时基校准问题,利用机械式激光雷达自身特征设计校准设备、系统及实验方法。基于激光雷达的触发事件和车载图像传感器感知特征,实现两种传感器时基在线标定,并通过示波器测量校验证明该方法的有效性。利用激光雷达扫描频率与触发事件时间差相互关联的特征,将激光雷达与惯性测量单元的标定系统结合,对激光雷达与惯性测量单元时基进行标定,并通过惯性测量单元标定实验证明方法有效性。 展开更多
关键词 自动驾驶 传感器融合 时间校准
在线阅读 下载PDF
一种Cache一致性协议验证中覆盖率驱动的随机验证方法 被引量:1
18
作者 李拓 王恩东 +1 位作者 胡雷均 秦济龙 《计算机应用与软件》 CSCD 2011年第11期167-170,共4页
随机验证技术是当今大规模集成电路仿真验证流程中的一项重要支撑技术,覆盖率驱动的随机测试生成方法是目前该领域研究的热点之一。针对Cache一致性协议的验证目标,介绍一种引入基于朴素贝叶斯模型的机器学习来完善基于覆盖率驱动的随... 随机验证技术是当今大规模集成电路仿真验证流程中的一项重要支撑技术,覆盖率驱动的随机测试生成方法是目前该领域研究的热点之一。针对Cache一致性协议的验证目标,介绍一种引入基于朴素贝叶斯模型的机器学习来完善基于覆盖率驱动的随机验证的方法,并结合相关的实际验证过程对该方法进行了分析和讨论。 展开更多
关键词 软件高速缓存(Cache) 随机验证 覆盖率驱动 机器学习 朴素贝叶斯模型
在线阅读 下载PDF
磁盘阵列中基于IB通信的内存镜像技术的设计与实现 被引量:1
19
作者 吕烁 文中领 +1 位作者 杨帆 杨金刚 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期84-88,共5页
基于镜像原理,设计和实现了磁盘阵列中基于RDMA通信的内存镜像方案.其原理是在数据读写时,将数据同时写入到两个独立的内存区域中,相对于现在内存访问只在单内存区域上进行的情况,有效地防止了多控制器中的任一控制器由于意外故障而导... 基于镜像原理,设计和实现了磁盘阵列中基于RDMA通信的内存镜像方案.其原理是在数据读写时,将数据同时写入到两个独立的内存区域中,相对于现在内存访问只在单内存区域上进行的情况,有效地防止了多控制器中的任一控制器由于意外故障而导致缓存里的数据丢失.测试证明,该设计较好地在保证数据完整性的前提下,最大带宽损失不到10%,最大IOPS不到15%. 展开更多
关键词 内存镜像 RDMA 磁盘阵列 带宽
在线阅读 下载PDF
基于预防性散热的服务器功耗优化方法研究 被引量:1
20
作者 林楷智 宗艳艳 张雁南 《计算机工程与科学》 CSCD 北大核心 2020年第8期1331-1338,共8页
随着互联网行业的高速发展和5G时代的到来,对于高性能服务器和存储设备的需求越来越大,但同时对于设备功耗优化的要求也越来越高。提出了一种基于预防性散热的功耗优化控制策略对服务器的功耗进行优化。首先获取设备的最高温度,与温度... 随着互联网行业的高速发展和5G时代的到来,对于高性能服务器和存储设备的需求越来越大,但同时对于设备功耗优化的要求也越来越高。提出了一种基于预防性散热的功耗优化控制策略对服务器的功耗进行优化。首先获取设备的最高温度,与温度阈值比较后设为参考点,通过评估参考点的电流变化来预测温度变化的趋势,随后发出相对应的控制信号来预先调节风扇转速,达到功耗优化的目的。搭建了实验系统,并针对系统的功耗优化问题,设计不同周期相同占空比、相同周期不同占空比以及不同温度3组实验来对所提控制策略进行验证,实验结果表明所提出的控制策略可以有效地降低设备功耗。 展开更多
关键词 高性能服务器 存储 预测 功耗优化
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部