题名 大规模智算中心光电交换网络架构演化综述
1
作者
叶通
胡卫生
机构
上海交通大学
出处
《电信科学》
北大核心
2025年第4期32-43,2,共13页
基金
国家自然科学基金资助项目(No.62271306,No.62331017)。
文摘
随着智算中心规模向百万卡级演进,以“数据中心光互联(data center optical interconnection,DCI)+电分组交换(electrical packet switching,EPS)”为特征的传统智算中心网络面临功耗高、时延高、可靠性不足的挑战。近几年工业界开始探索引入光子技术的方案,以降低智算中心网络的功耗并增强其扩展性、灵活性和可靠性。回顾了工业界研究的“DCI+EPS+光线路交换(optical circuit switching,OCS)”和“DCI+光分组交换(fast optical switching,FOS)”两类智算中心网络架构。结合工业界头部企业的实际案例及科研机构的相关探索,探讨了两种架构的技术路径、性能优势及待研究问题,为未来智算中心网络的设计提供参考。
关键词
智算中心
光电交换网络
算力集群
Keywords
artificial intelligence data center
optical-electrical switching network
computing power cluster
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 数据处理单元赋能的智算中心网络拥塞控制机制
被引量:2
2
作者
陈锦前
郭少勇
刘畅
亓峰
邱雪松
机构
北京邮电大学网络与交换技术全国重点实验室
出处
《通信学报》
北大核心
2025年第2期1-17,共17页
基金
国家自然科学基金资助项目(No.62322103)
北京市自然科学基金资助项目(No.4232009)
中央高校基本科研业务费专项资金资助项目(No.2023ZCTH11)。
文摘
针对智算中心集群间交互频繁造成网络拥塞频发导致智能业务实时性难以保障的问题,以数据处理单元(DPU)为核心载体构建了深度强化学习算法驱动的拥塞控制模型,利用剪枝与量化融合的方式对模型进行压缩,并通过知识蒸馏方法生成高效梯度增强决策树,实现调速动作与网络实时状态的精准匹配。仿真结果表明,所提机制在泛化能力和控制效果方面均优于现有方法,在多个压力测试场景中提升网络有效吞吐率与公平性指标JAIN10.8%和8.9%以上,降低P99端到端时延与丢包率17.31%和11.47%以上,降低并行计算场景下数据流传输任务完成时间11.23%以上,且具备应对网络状态突变的快速响应能力。
关键词
拥塞控制
多智能体深度强化学习
智算中心网络
远程直接内存访问网络
数据处理单元
Keywords
congestion control
multi-agent deep reinforcement learning
intellig ent computing center network
remote direct memory access network
data processing unit
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 面向智算中心间互联的光网络关键技术研究
3
作者
李韫瑄
杨亚萍
涂佳一
顾仁涛
纪越峰
机构
北京邮电大学信息与通信工程学院
北京邮电大学信息光子学与光通信全国重点实验室
出处
《电信科学》
北大核心
2025年第4期3-19,2,共18页
基金
国家自然科学基金资助项目(No.62271078)
北京市自然科学基金资助项目(No.L247024)。
文摘
智算中心作为大模型应用的关键算力基础设施,其高效运行依赖于高性能的光网络传输底座。然而,智算中心间光网络面临包括高实时性、高突发性和高可靠性的三重互联需求带来的诸多技术挑战。基于此,需要以高实时资源分配技术,助力智算光网络资源分配突破局部调度限制,以应对业务传输与调度时延挑战;以自适应协同优化技术,引导网络从被动调整向主动协同持续发展,以应对业务动态高突发性挑战;以前摄性故障恢复技术,推动网络从被动恢复故障向主动干预有序演进,以应对智算光网络的高可靠性挑战。展望未来,高实时大规模调度技术、算网深度协同技术和智算数字孪生技术,将为智算中心间互联的进一步发展提供新的机遇。
关键词
智算中心
资源分配
网络优化
故障恢复
Keywords
artificial intellig ent data center
resource allocation
network optimization
failure recovery
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 数据中心冷热电联产系统的前摄式智能节能优化算法
4
作者
李庆华
冉泳屹
刘启晨
孙彤瑶
陈双武
雒江涛
机构
重庆邮电大学通信与信息工程学院
纽卡斯尔大学建筑、规划与景观学院
中国科学技术大学信息科学技术学院
出处
《智能系统学报》
北大核心
2025年第1期139-149,共11页
基金
国家自然科学基金项目(U23A20275,62101525,62171072)
重庆市自然科学基金项目(cstc2021jcyj-msxmX0586).
文摘
现有的数据中心节能降碳优化方法没有综合考虑碳足迹涉及的能源输入、生产耗能以及废余利用等环节的耦合性,难以实现系统性节能降碳。为此,提出了一种基于深度强化学习的优化算法DeepCCHP(deep combined cooling,heating and power generation),针对数据中心冷热电联产系统,联合控制供电子系统和制冷子系统,优化用电成本、碳排放量和能效。DeepCCHP结合长、短期时间序列网络和深度强化学习方法对联合优化问题进行求解,实现前摄式的联合控制发电设备和制冷设备。在基于Trnsys软件的仿真环境中,通过阿里巴巴数据中心集群数据的训练和验证。实验结果表明,与基准算法相比,DeepCCHP算法可以节省最高40%的成本和28%的碳排放量,且能够在能源成本、碳排放和能效三者之间取得更好的折中与平衡。
关键词
绿色数据中心
冷热电联产
智能节能
深度强化学习
碳排放优化
能效提升
联合控制
预测网络
Keywords
green data center
combined cooling,heating and power generation
intellig ent energy-saving
deep reinforcement learning
carbon emission optimization
energy efficiency improvement
joint control
predictive network
分类号
TP272
[自动化与计算机技术—检测技术与自动化装置]
题名 基于深度神经网络的数据中心光互连网络资源分配方法
被引量:5
5
作者
吕莹楠
尹奇龙
赵健
机构
黑龙江东方学院
出处
《激光杂志》
CAS
北大核心
2024年第2期181-186,共6页
基金
黑龙江省科技厅重点研发计划项目(No.GZ20210163,GZ20220154)。
文摘
在人工智能环境下为了提高数据中心光互联网络组件和软件的安全性,需要构建优化的资源分配模型,提出基于深度神经网络的数据中心光互连网络资源分配方法。采用用户关联和功率谱分配联合优化方法构建数据中心光互连网络资源调度模型,结合对网络资源粒度的服务请求QoS资源配置实现对不同种类资源的融合和聚类处理,提取数据中心光互连网络资源的空间、时间、频谱等多维网格抽象模型参数,通过深度神经网络学习方法实现对网络资源分配过程中的多种资源粒度融合和收敛性寻优控制,建立用户之间分配数据中心光互连网络资源的信道模型,通过传输链路均衡配置方案实现对网络资源的优化分配和均衡配置。仿真结果表明,本方法的资源分配传输比特率为18 bit/s,延时较小,资源分配阻塞率低,为0.05%,且资源持有度较高,可始终维持在100%,说明本方法具有对较强的资源均衡配置能力。
关键词
人工智能
软件安全
深度神经网络
数据中心光互连网络
资源分配
Keywords
artificial intelligence
software security
deep neural network
data center optical interconnection network
resource allocation
分类号
TN911
[电子电信—通信与信息系统]
题名 面向人工智能的数据通信网络发展
被引量:1
6
作者
高巍
高静
杨哲
机构
中国信息通信研究院
出处
《中兴通讯技术》
北大核心
2024年第6期3-9,共7页
文摘
基于人工智能技术与业务对数据通信网络的需求,分析现有网络面向数据入算、智算中心互联、大规模AI训练3类场景时存在的问题,阐述“入算”“算内”“算间”网络关键技术创新情况,包括入算网络的业务创新探索,算内网络围绕架构以太网技术等多方面的革新,以及算间网络从IT、IP、光层开展的技术改进,并提出包含运营层、网络管控层、业务连接层、物理网络层的4层网络架构以优化数据通信网络。认为合理推动产业发展需有序规划标准化研究工作,递进式开展关键技术试点验证。
关键词
人工智能
数据通信网络
入算网络
算间网络
算内网络
Keywords
artificial intelligence
data communication network
access-artificial intelligence data center network
inter-artificial intelligence data center network
intra-artificial intelligence data center network
分类号
TN915
[电子电信—通信与信息系统]
题名 深圳城际铁路客站绿色节能系统设计
被引量:3
7
作者
张亚伟
杨国元
陈瑞凤
白伟
伍柳伊
王小书
机构
中国铁道科学研究院集团有限公司电子计算技术研究所
出处
《铁道运输与经济》
北大核心
2023年第7期157-163,共7页
基金
深圳都市圈智能城际铁路咨询项目(STT-DTZX001/2021)
中国铁道科学研究院集团有限公司电子计算技术研究所博士科研项目(DZYF22-11)
中国铁道科学研究院集团有限公司科研项目(2021YJ301)。
文摘
城际铁路客站是乘客跨城出行的重要场所,绿色节能是现代化智能车站所要求的方向,而车站作为能源消耗大户亟需实现绿色节能。结合深圳城际铁路客站的建设和网络部署特点,对车站进行绿色节能需求分析,以设备能耗监测、智能照明、智能导向屏、设备设施运维、风水联动五大节能功能为研究点,利用节能测算公式计算节点量和节电率;提出深圳城际铁路客站绿色节能系统架构,包括设备感知层、网络传输层、中台层、业务应用层和展示层;在车站、线路中心、线网中心部署软硬件,实现数据流转、分析和存储,形成数据架构。该功能和架构构成的深圳城际铁路客站绿色节能系统以节能为目标,最终实现车站智能化,为城际铁路客站绿色节能系统设计研究提供借鉴。
关键词
城际铁路客站
智能车站
绿色节能
线网中心
数据流转
Keywords
Intercity Railway Passenger Station
intellig ent Station
Green Energy Saving
Line network center
data Flow
分类号
U291.61
[交通运输工程—交通运输规划与管理]
题名 印刷企业实施网络协同制造的思路与技术实现
8
作者
叶壮志
庞也驰
胡行同
刘彤
机构
中国印刷科学技术研究院有限公司
包装印刷新技术北京市重点实验室
印刷环保与智能技术重点实验室
出处
《数字印刷》
CAS
北大核心
2022年第2期110-121,共12页
文摘
印刷包装业属于离散型制造业,企业在实施数字化转型、智能化升级改造过程中,应重点关注以下着力点:工艺分析与优化和产线自动化要协同,业务流程与组织重构和管理信息化要协同,数据集成与网络化运营和数字化转型要协同。本研究重点从企业生产运营中各类数据链角度出发,通过印刷智能制造信息公共服务平台,链接印刷包装大数据中心,汇聚出版生态系统资源和印企制造信息,提出在印刷企业实施网络协同制造的思路,以及生产过程数据采集与集成、跨系统多设备间的信息交互、跨领域企业内外部的业务互联,云化部署的技术实现方法。
关键词
智能制造
数字化转型
网络协同制造
信息交互
数据集成
数据中台
Keywords
intellig ent manufacturing
Digital transformation
network collaborative manufacturing
Information interaction
data integration
data center
分类号
TS808
[轻工技术与工程]