期刊文献+
共找到371篇文章
< 1 2 19 >
每页显示 20 50 100
智算中心Scale-Out网络的演进及GSE的实践
1
作者 程伟强 李新双 +1 位作者 白艳 吕勇 《中兴通讯技术》 北大核心 2025年第2期14-20,共7页
探讨了人工智能(AI)大模型时代智算中心网络面临的技术挑战,重点分析了传统互联网协议(IP)网络在负载均衡和突发流量处理方面的局限性,并对比了基于以太网融合远程直接内存访问(RoCE)的优化与网络架构重构两种技术路线。研究聚焦中国自... 探讨了人工智能(AI)大模型时代智算中心网络面临的技术挑战,重点分析了传统互联网协议(IP)网络在负载均衡和突发流量处理方面的局限性,并对比了基于以太网融合远程直接内存访问(RoCE)的优化与网络架构重构两种技术路线。研究聚焦中国自主研发的全调度以太网(GSE)技术,详细阐述了其核心技术:基于报文容器(PKTC)的负载均衡机制和动态全调度队列(DGSQ)端到端拥塞控制技术。这些技术有效解决了智算网络中的流量极化和拥塞丢包问题。同时,系统分析了GSE网络设备在接口设计、转发引擎和队列管理等关键环节的创新架构,论证了GSE技术在构建高带宽、低时延、无阻塞新型网络方面的技术优势,为智算中心网络演进提供了重要参考。 展开更多
关键词 AI大模型 智算中心 scale-Out GSE RoCE 负载均衡 拥塞避免
在线阅读 下载PDF
Decentralized robust stabilization of discrete-time fuzzy large-scale systems with parametric uncertainties: a LMI method 被引量:1
2
作者 Zhang Yougang Xu Bugong 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2006年第4期836-845,共10页
Decentralized robust stabilization problem of discrete-time fuzzy large-scale systems with parametric uncertainties is considered. This uncertain fuzzy large-scale system consists of N interconnected T-S fuzzy subsyst... Decentralized robust stabilization problem of discrete-time fuzzy large-scale systems with parametric uncertainties is considered. This uncertain fuzzy large-scale system consists of N interconnected T-S fuzzy subsystems, and the parametric uncertainties are unknown but norm-bounded. Based on Lyapunov stability theory and decentralized control theory of large-scale system, the design schema of decentralized parallel distributed compensation (DPDC) fuzzy controllers to ensure the asymptotic stability of the whole fuzzy large-scale system is proposed. The existence conditions for these controllers take the forms of LMIs. Finally a numerical simulation example is given to show the utility of the method proposed. 展开更多
关键词 fuzzy large-scale system parametric uncertainties decentralized parallel distributed compensation linear matrix inequalities.
在线阅读 下载PDF
A Class of Real-Time Parallel Combined Methods ofDigital Simulation for Large Systems
3
作者 Liu Degui & Chen Lirong(Beijing Institute of Computer Application and Simulation Technology, 100854, P. R. China) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2000年第2期25-31,共7页
In this paper, a class of real-time parallel combined methods (RTPCM) of the digital simulation for a partitioned large system is presented. By means of combination of the parallelism across the system with the parall... In this paper, a class of real-time parallel combined methods (RTPCM) of the digital simulation for a partitioned large system is presented. By means of combination of the parallelism across the system with the parallelism across the method, stiff and non-stiff subsystems are solved in parallel on parallel computer by a parallel Rosenbrock method and a parallel RK method, respectively. Their construction, convergence and numerical stability are discussed, and the digitalsimulation experiments are conducted. 展开更多
关键词 large system Real-time parallel combined method parallel computer
在线阅读 下载PDF
大尺度复杂构件群体机器人协同并行制造系统集成的关键技术 被引量:1
4
作者 王哲 丰飞 郭峰 《航空制造技术》 北大核心 2025年第4期53-66,共14页
以航空、航天、航海及轨道交通等领域大尺度复杂构件的高效、高质量加工需求为导向,探究基于群体机器人集群化并行制造系统的大构件多移动机器人协同制造系统的关键技术。围绕典型大尺度构件的加工工艺需求,基于移动测量机器人、移动加... 以航空、航天、航海及轨道交通等领域大尺度复杂构件的高效、高质量加工需求为导向,探究基于群体机器人集群化并行制造系统的大构件多移动机器人协同制造系统的关键技术。围绕典型大尺度构件的加工工艺需求,基于移动测量机器人、移动加工机器人和移动装配机器人等多种类、多形式移动机器人的设计和研制,提出基于多移动机器人协同并行制造方案、大构件机器人化加工机器人本体设计方案、多模态协作机器人感知与测量方案、多机器人协同的加工机器人本体控制器及群体加工机器人系统控制方案。阐述多群体机器人移动加工的机器人控制策略与方案,针对加工机器人群体协同并行加工方法、大构件测量与群体机器人协同控制等关键技术,不但从本体研发、控制器等方面探究了国产工业机器人性能提升与优化的方法,也力图为后续航空航天等领域的大构件加工拓展工作思路。 展开更多
关键词 大尺度构件 自主移动机器人 群体机器人 自主控制 多机器人协同并行制造
在线阅读 下载PDF
基于云计算的多类型大规模激光图像快速识别研究
5
作者 李洋 张阳 陶锐 《激光杂志》 北大核心 2025年第2期149-153,共5页
大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有... 大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有强大的计算能力和灵活的资源配置优势,研究基于云计算的多类型大规模激光图像快速识别方法。通过非线性匹配方式处理激光图像,确定激光图像中目标点位姿变化矩阵;将处理后的激光图像,以机器算法作特征筛选,划分不同类型激光图像中的关键特征;采用云计算关联方法,构建快速识别模型,通过模型内目标函数,实现多类型大规模激光图像快速识别。实验结果表明:以两组不同类型的连续帧激光图像作为测试样本,所研究方法可以实现设计方案下的快速识别,具有应用价值。 展开更多
关键词 云计算 多类型 大规模 激光图像 快速识别 匹配方式 关键特征
在线阅读 下载PDF
医学人工智能临床应用的伦理困境:从信息系统到机器人
6
作者 王兰英 郑睿 刘宪伟 《医学与哲学》 北大核心 2025年第9期24-29,共6页
分析从经典的影像诊断信息系统到智能决策、自主操作的手术机器人等不同自主程度的医学人工智能所面临的主要伦理困境,探讨数据三角定位导致的隐私泄露、数据价值的分配、针对罕见病与弱势群体的偏见、医学人工智能对医生角色的挑战和... 分析从经典的影像诊断信息系统到智能决策、自主操作的手术机器人等不同自主程度的医学人工智能所面临的主要伦理困境,探讨数据三角定位导致的隐私泄露、数据价值的分配、针对罕见病与弱势群体的偏见、医学人工智能对医生角色的挑战和对医患关系的重塑、患者个体获益不明确、责任归属不清晰等核心问题,提出按照自主程度对医学人工智能进行分级管理;医学伦理理论为医学人工智能的系统发展提供框架;教育引导医患双方正确认识和使用医学人工智能等治理对策。 展开更多
关键词 医学人工智能 数据伦理 医疗责任归属 人机关系 医患关系 医疗大规模预训练模型
在线阅读 下载PDF
Pipe-RLHF:计算模式感知的RLHF并行加速框架
7
作者 徐颖 王梦迪 +4 位作者 程龙 刘炼 赵世新 张磊 王颖 《计算机研究与发展》 北大核心 2025年第6期1513-1529,共17页
基于人类反馈的强化学习(reinforcement learning with human feedback,RLHF)作为当前大语言模型(large language models,LLMs)对齐的主流方法,其核心优化算法——近端策略优化(proximal policy optimization,PPO)却面临着显著的效率问... 基于人类反馈的强化学习(reinforcement learning with human feedback,RLHF)作为当前大语言模型(large language models,LLMs)对齐的主流方法,其核心优化算法——近端策略优化(proximal policy optimization,PPO)却面临着显著的效率问题.PPO由生成、推理、训练3个相互关联的阶段组成,各个阶段有着不同的计算特性.然而,现有的RLHF并行框架采用相同并行策略顺序执行PPO的所有阶段,这导致以下2个问题:其一,生成阶段不能充分利用计算资源,进而影响整体效率;其二,阶段间严格串行执行,未能充分利用潜在并行性.针对上述问题,提出了一个新型RLHF并行框架——Pipe-RLHF.该框架能够自适应地根据各阶段的计算特征确定最优并行策略,突破现有阶段串行范式,采用异步PPO算法发掘阶段间的并行性.具体而言,创新性地提出了适用于PPO生成阶段的延迟批间流水线并行方法,显著提升了该阶段的计算资源利用率;再次,使用异步PPO解放阶段间的依赖关系,将阶段间并行应用到PPO的加速上;最后,针对PPO算法的整体优化,构建了分层并行策略空间,并提出了一套优化算法以实现该空间中的最优解搜索.通过在多个大语言模型上的性能评估实验表明,相较于现有方法,Pipe-RLHF最高可实现3.7倍的加速比,充分验证了该框架的有效性和优越性. 展开更多
关键词 基于人类反馈的强化学习 近端策略优化 大模型微调 分布式系统 并行计算
在线阅读 下载PDF
Resilio:一种大模型弹性训练容错系统
8
作者 李焱 杨偲乐 +9 位作者 刘成春 王林梅 田瑶琳 张信航 朱昱 李莼蒲 孙磊 颜深根 肖利民 张伟丰 《计算机研究与发展》 北大核心 2025年第6期1380-1395,共16页
具备千亿级参数的大型语言模型正在引领当今人工智能与异构计算的技术革新及商业模式的深刻转变.然而,大模型训练任务需要长时间占用大量的硬件资源,软硬件故障发生的频率高且类型较多,并且故障原因难定位导致训练中断时间较长.针对大... 具备千亿级参数的大型语言模型正在引领当今人工智能与异构计算的技术革新及商业模式的深刻转变.然而,大模型训练任务需要长时间占用大量的硬件资源,软硬件故障发生的频率高且类型较多,并且故障原因难定位导致训练中断时间较长.针对大模型训练过程中面临的网络中断、节点宕机、进程崩溃等多种典型故障,提出一种大模型弹性容错系统Resilio来提供高效自动的恢复机制.基于模型训练的并行策略与硬件的存储层次特点,Resilio通过多层次优化检查点读写操作和即时检查点保存机制,对于千亿规模参数模型,可以将端到端故障恢复时间缩短至10min以内,模型中断后的重新训练时间缩短至单次训练迭代时间.当集群资源弹性变化时,Resilio能够快速准确地获取大模型训练最优并行策略配置,与容错调度组件共同确保系统的自适应能力,弹性调度训练资源用以提升作业的训练效率和集群GPU资源利用率. 展开更多
关键词 大模型训练 深度学习 容错 故障检测 弹性训练 自动并行
在线阅读 下载PDF
一种软硬件协同的多核系统模拟器的设计与实现
9
作者 王鉴 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第3期335-342,共8页
基于软件实现的多核系统模拟器执行计算密集/数据密集任务的时效性极差,且存在模拟精度和性能评估准确性差的不足,限制其在多核系统结构优化探索中的应用。文章提出一种周期精确的软硬件协同多核系统模拟器(cycle accurate hardware-sof... 基于软件实现的多核系统模拟器执行计算密集/数据密集任务的时效性极差,且存在模拟精度和性能评估准确性差的不足,限制其在多核系统结构优化探索中的应用。文章提出一种周期精确的软硬件协同多核系统模拟器(cycle accurate hardware-software co-simulator,CAHSCS),通过在传统模拟器架构中引入硬件计算和存储模块,CAHSCS能有效改善全系统的模拟速度、精度,提高性能评估的准确性。复杂真实任务加载实验结果表明,CAHSCS将大规模复杂数据的运算效率提高了10倍,显著加快了系统设计收敛速度。 展开更多
关键词 软硬件协同模拟器 多核系统模拟器 大规模数据运算 硬件计算 模拟器加速
在线阅读 下载PDF
云计算下大规模激光图像快速分类和识别方法
10
作者 朱阳燕 梅香香 《激光杂志》 北大核心 2025年第3期113-119,共7页
大规模激光图像识别方法受到计算能力和数据处理速度的限制,难以满足快速分类和识别需求。云计算的出现,给解决该问题提供了思路。设计一种云计算下大规模激光图像快速分类和识别方法。利用云计算平台对激光图像进行数学形态分析和预处... 大规模激光图像识别方法受到计算能力和数据处理速度的限制,难以满足快速分类和识别需求。云计算的出现,给解决该问题提供了思路。设计一种云计算下大规模激光图像快速分类和识别方法。利用云计算平台对激光图像进行数学形态分析和预处理,确保图像在后续处理中能够保持一致的形态和特征。借助平台上的小波分析技术,对预处理后的激光图像实施降噪处理,有效去除图像中的噪声干扰,提升图像质量。在得到无噪声图像后,进一步利用云计算平台的分布式资源,高效提取图像特征,获取精确描述图像纹理属性的特征参量。将这些特征参量与其他特征相结合,共同构建出完整的图像特征向量。通过比较不同图像的特征向量,准确判断它们之间的相似性和差异性,实现激光图像的精确分类和识别。实验数据对比分析表明,相较于传统方法,该方法在处理速度和识别精度上均有显著的提升,不仅能够有效地处理大规模激光图像数据,还能显著提高图像识别的准确性和效率,为激光图像识别技术的发展提供了新的思路和方法。 展开更多
关键词 云计算 大规模激光图像 降噪处理 特征提取 快速识别
在线阅读 下载PDF
代理模型辅助进化算法求解大规模电动车辆路径问题
11
作者 王朝 查帮政 秦芳 《哈尔滨工程大学学报》 北大核心 2025年第4期755-763,共9页
针对大规模电动车辆路径问题,本文提出一种基于代理模型辅助加速的进化算法。该算法基于通用的路由-充电两阶段优化框架,通过在充电优化阶段引入代理模型,以部分替代费时的真实充电优化过程,加速算法搜索效率。在路由优化阶段,采用改进... 针对大规模电动车辆路径问题,本文提出一种基于代理模型辅助加速的进化算法。该算法基于通用的路由-充电两阶段优化框架,通过在充电优化阶段引入代理模型,以部分替代费时的真实充电优化过程,加速算法搜索效率。在路由优化阶段,采用改进的最大最小蚁群系统算法生成高质量客户路由;在充电优化阶段,利用大量历史数据基于代理模型构建客户路由与总行驶距离之间的对应关系,实现输入客户路由直接预测加入充电站后完整路由的总距离,从而降低对大规模客户路由进行真实充电优化所需时间。结果表明:本文算法在获得相当质量解的同时,计算效率平均提高了将近14%,为电动车辆路径优化问题提供了一种高效且实用的解决方案,具有良好的应用前景。 展开更多
关键词 电动车辆路径问题 充电优化问题 进化算法 大规模优化 代理模型 蚁群算法 两阶段优化 计算效率
在线阅读 下载PDF
基于新课标的中小学生计算思维量表构建研究 被引量:9
12
作者 张屹 陈邓康 +3 位作者 付卫东 刘金芳 林裕如 丁双婷 《电化教育研究》 CSSCI 北大核心 2024年第3期90-98,共9页
对学生计算思维的培养已成为数字时代的核心议题,科学、精准的评价则是培养学生计算思维能力的基础。然而,针对义务教育阶段学生的计算思维测评,目前国内尚无依托相关课程标准制定的本土化的、权威的量表。为此,研究首次依托《义务教育... 对学生计算思维的培养已成为数字时代的核心议题,科学、精准的评价则是培养学生计算思维能力的基础。然而,针对义务教育阶段学生的计算思维测评,目前国内尚无依托相关课程标准制定的本土化的、权威的量表。为此,研究首次依托《义务教育信息科技课程标准(2022年版)》(以下简称“新课标”)中的计算思维定义及培养要求,共以12920名(N1=1029,N2=1458,N3=10433)小学生和初中生为研究样本,运用收敛混合方法构建一个面向我国教育实际的、经严格论证的中小学生计算思维量表。结果显示:经过两轮的收敛混合分析,修改后的计算思维量表共包含5个因子及15个题项,具有良好的内容效度;经过大样本实证检验分析,量表具有良好的信效度,且具有跨性别、年级和地区测量等值性,可以用来测量中小学生的计算思维水平。 展开更多
关键词 新课标 计算思维量表 收敛混合方法 大样本实证调研 义务教育
在线阅读 下载PDF
电大山区地物环境中电波传播的电磁计算 被引量:1
13
作者 王楠 刘俊志 +2 位作者 陈贵齐 赵延安 张玉 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第1期21-28,共8页
在无人驾驶与无人机等新兴行业中,信号覆盖范围的要求较高,不仅仅在城市,在人迹罕至的山地、沙漠、森林中也需要无线信号的覆盖才能真正完成远程操控,这些地区更多需要考虑的是地势变化对电磁传播所带来的影响。计算电磁学中的一致性几... 在无人驾驶与无人机等新兴行业中,信号覆盖范围的要求较高,不仅仅在城市,在人迹罕至的山地、沙漠、森林中也需要无线信号的覆盖才能真正完成远程操控,这些地区更多需要考虑的是地势变化对电磁传播所带来的影响。计算电磁学中的一致性几何绕射理论方法是分析电大环境电磁问题的有效方法,使用计算电磁学的方法研究电磁波在山区地物环境中的传播规律。给出了一种建立不规则地形模型的新方法,可以通过数字高程的网格数据生成电磁算法可用的三次多项式曲面,使用多个立方曲面对不规则地形进行拼接,使用平均均方根误差验证模型数据的准确性。基于所得的地形数据,完成了并行的几何光学算法,并对区域电磁场的分布进行了仿真计算。选取了实际山区地物环境进行了实地测量,测量结果与仿真结果对比趋势一致,验证了该方法在非规则地形中电磁波传播分析中的有效性。考虑环境电磁计算的规模,建立了相应的并行策略,100核测试的并行效率可以保持在80%以上。 展开更多
关键词 电大山区地物环境 电波传播 数字高程 分形建模 几何光学 并行计算
在线阅读 下载PDF
计算机视觉技术在规模化猪场应用的研究进展 被引量:1
14
作者 邓永涛 陈希文 《中国兽医杂志》 CAS 北大核心 2024年第2期101-106,共6页
作为人工智能的一个主要分支,计算机视觉技术在许多领域取得了很大的成就,其在规模化猪场中的应用将为猪场带来产业性的变革。计算机视觉技术可以大幅度减少规模化猪场中人员工作量,同时使猪场对生猪的相关判断更加准确。本文简述了规... 作为人工智能的一个主要分支,计算机视觉技术在许多领域取得了很大的成就,其在规模化猪场中的应用将为猪场带来产业性的变革。计算机视觉技术可以大幅度减少规模化猪场中人员工作量,同时使猪场对生猪的相关判断更加准确。本文简述了规模化猪场的现状和计算机视觉技术,重点综述了计算机视觉技术在规模化猪场中对猪只的行为监测、疾病预测、情感状态分析、猪只判别、生产管理、生物安全和防疫以及企业的落地探索等方面的研究进展,以期为促进我国规模化猪场的现代化和智能化发展提供参考。 展开更多
关键词 计算机视觉技术 规模化猪场 行为监测 疾病预测 猪只判别
在线阅读 下载PDF
基于轻量化多尺度神经网络的ZPW-2000移频信号检测方法
15
作者 武晓春 刘欣然 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第5期187-197,共11页
针对ZPW-2000移频信号在不平衡牵引电流干扰时低频信号难以检测的问题,提出基于卷积注意力模块的轻量化多尺度神经网络的移频信号低频信息检测方法。首先,根据ZPW-2000移频信号的载频范围,使用不同卷积核大小的多尺度层提取相应载频调... 针对ZPW-2000移频信号在不平衡牵引电流干扰时低频信号难以检测的问题,提出基于卷积注意力模块的轻量化多尺度神经网络的移频信号低频信息检测方法。首先,根据ZPW-2000移频信号的载频范围,使用不同卷积核大小的多尺度层提取相应载频调制下的移频信号特征;其次,建立线性倒残差模块实现网络轻量化,在保证网络检测准确率的同时减少网络参数,缩短网络检测时长;最后,引入卷积注意力模块,标定通道和空间特征权重,提升网络性能,通过全连接层进行分类,输出18种低频信号的概率分布。结果表明:将含有工频谐波干扰等5类噪声的移频信号输入低频检测模型中进行检测,平均准确率可达99.22%,召回率达到99.21%,综合评价指标值为0.992,检测时间不超过0.249 s。该方法检测效果更优,具有良好的抗干扰能力,可为带内噪声干扰条件下检测ZPW-2000移频信号的低频信息提供重要参考。 展开更多
关键词 轻量化卷积神经网络 谐波干扰 多尺度神经网络 信号检测 ZPW-2000移频信号
在线阅读 下载PDF
基于自然图像模型微调的小鼠脑部电镜图像实例分割 被引量:1
16
作者 承骜 赵国强 +1 位作者 张若冰 王丽荣 《光学精密工程》 EI CAS CSCD 北大核心 2024年第18期2836-2845,共10页
分割模型的准确性和鲁棒性是小鼠脑电镜图像处理中的主要考虑因素。针对电镜图像的技术特点,提出了高度稳健的二维分割算法,准确识别每张切片中各物体的形态结构。本文提出了基于大型自然图像模型的主干网络微调的大尺度二维电镜图像分... 分割模型的准确性和鲁棒性是小鼠脑电镜图像处理中的主要考虑因素。针对电镜图像的技术特点,提出了高度稳健的二维分割算法,准确识别每张切片中各物体的形态结构。本文提出了基于大型自然图像模型的主干网络微调的大尺度二维电镜图像分割模型EM-SAM,用于脑部电镜图像中的实例分割。模型主干网络采用大型自然图像模型SAM中的已训练完成的图像编码器,在电镜图像处理任务中最大化模型提取图像特征的能力。此外,模型采用了U型的解码器设计,并通过小鼠脑电镜图像分割任务进行微调。实验结果表明:在公开数据集SNEMI3D中A-Rand可达到0.054;在公开数据集MitoEM中AP-50和AP-75分别可达到0.883,0.604。EM-SAM在电镜图像神经分割任务中准确性高、鲁棒性强,并且可针对不同任务进行微调。 展开更多
关键词 深度学习 分割 大模型 电镜图像 小鼠脑部
在线阅读 下载PDF
煤矿工业数据AI模型自动推理技术 被引量:3
17
作者 张智星 付翔 +6 位作者 张小强 李浩杰 秦一凡 刘萌 孙岩 贾一帆 杨宇琪 《工矿自动化》 CSCD 北大核心 2024年第9期138-143,共6页
煤矿生产过程的智能化主要依托于人工智能(AI)技术分析煤矿工业数据,但单一应用场景AI模型无法适用于煤矿复杂的应用场景,且仅使用分布式计算来处理AI模型输入特征值会导致模型应用效率降低。针对上述问题,提出了一种煤矿工业数据AI模... 煤矿生产过程的智能化主要依托于人工智能(AI)技术分析煤矿工业数据,但单一应用场景AI模型无法适用于煤矿复杂的应用场景,且仅使用分布式计算来处理AI模型输入特征值会导致模型应用效率降低。针对上述问题,提出了一种煤矿工业数据AI模型自动推理技术。该技术架构包括数据层、计算驱动层和模型推理层:数据层采集各类监测数据并统一存储,为计算驱动层提供原始数据;计算驱动层将数据层采集的海量原始数据转换成煤矿应用场景AI模型输入特征值,通过煤矿应用场景AI模型输入特征值双计算引擎自动切换机制,根据数据量自动合理地选择使用基于Spark的分布式计算方式或基于Python的单机计算方式,解决了海量数据计算速度慢、数据应用延迟大的问题;模型推理层将特征值输入应用场景AI模型进行推理,引入煤矿应用场景AI模型多触发方式协同推理机制,通过定时触发、人为交互触发、信号反馈触发3种触发方式,解决了在煤矿复杂的应用条件下单一应用场景AI模型利用效果差的问题。测试和应用结果表明,该技术可实现多应用场景AI模型输入特征值的快速计算,以及不同应用场景AI模型的快速、自动、协同推理。 展开更多
关键词 煤矿人工智能 煤矿工业数据 AI模型推理 海量数据计算 AI模型应用
在线阅读 下载PDF
面向大规模异构计算平台的MiniGo高效训练方法
18
作者 李荣春 贺周雨 +3 位作者 乔鹏 姜晶菲 窦勇 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第5期209-218,共10页
提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入... 提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入/输出部署,消除网络通信瓶颈。提出了面向CPU-DSP共享内存结构的异构计算内存管理,减少异构设备间的数据搬运。实现了共享内存编程优化,并利用DSP实现密集卷积计算算子加速优化。结果表明,与16核CPU计算相比,单核DSP算子加速最大加速比达16.44;该方法实现计算节点规模从1 067扩展至4 139,得到达到给定终止条件所需时间从43.02 h降至16.05 h,可扩展效率为69.1%。评估表明,该方法能够实现MiniGo在大规模异构计算平台的高效并行训练。 展开更多
关键词 MiniGo 大规模异构计算平台 数字信号处理器
在线阅读 下载PDF
分布式模型训练中的通信优化方法:现状及展望
19
作者 赵海燕 易庆奥 +2 位作者 汤敬华 钱诗友 曹健 《小型微型计算机系统》 CSCD 北大核心 2024年第12期2964-2978,共15页
在进行大模型训练时,采用分布式训练是解决单个GPU卡或单个节点无法处理庞大模型参数和数据集的有效方法.通过将训练任务分配给多个节点,分布式模型训练实现了计算资源的并行利用,从而提高了训练效率.然而,随着模型规模的迅速增大,通信... 在进行大模型训练时,采用分布式训练是解决单个GPU卡或单个节点无法处理庞大模型参数和数据集的有效方法.通过将训练任务分配给多个节点,分布式模型训练实现了计算资源的并行利用,从而提高了训练效率.然而,随着模型规模的迅速增大,通信成为制约分布式训练性能的瓶颈.近年来,许多研究者对分布式训练中的通信问题进行了深入的研究,本文对相关研究进行全面的综述,从5个不同角度对分布式训练中的通信问题进行了分析,并总结了相应的优化方法.这些优化方法包括但不限于通信拓扑优化、梯度压缩技术、同步和异步算法、重叠通信与计算、以及通信库及硬件的优化.最后,本文对未来的研究方向进行了分析与展望. 展开更多
关键词 大模型 分布式训练 并行 通信优化
在线阅读 下载PDF
柔性防护系统冲击大变形视觉监测方法
20
作者 田永丁 杨啸宇 +3 位作者 余志祥 骆丽茹 程强 许浒 《振动与冲击》 EI CSCD 北大核心 2024年第14期163-171,共9页
局域少数点位的变形监测往往难以反馈复杂柔性防护系统的实际工作形态,常造成预警误报,为此提出了基于多点分布式的柔性防护系统变形视觉采集分析方法。利用帧间光流算法实现了落石冲击下柔性防护网系统全场二维速度场识别,据此建立了... 局域少数点位的变形监测往往难以反馈复杂柔性防护系统的实际工作形态,常造成预警误报,为此提出了基于多点分布式的柔性防护系统变形视觉采集分析方法。利用帧间光流算法实现了落石冲击下柔性防护网系统全场二维速度场识别,据此建立了速度幅值二维分布图,通过相邻帧图像的速度分布差值图实现了柔性防护系统全场冲击变形状态的实时追踪,进一步提出了复杂运动叠加情形下柔性防护网系统稠密测点变形高鲁棒性提取算法,并分析了其变形规律同时提取了最大变形量,实现了有限测点监测到无限分布式传感的突破。设计了三跨柔性防护系统足尺模型,开展了750 kJ落石冲击试验,通过高速相机非接触式监测了落石冲击防护系统全过程影像数据。研究表明:所提议方法实现了落石冲击下柔性防护系统全场变形状态非接触、全历程追踪,冲击过程包含落锤接触防护系统、最大冲击变形与触底反弹三个阶段;为验证所提方法的可靠性,提取了落石冲击下柔性防护系统跨中区域冲击大变形曲线,发现750 kJ能量冲击下柔性防护系统的最大变形量为-6.201 m,与数值模拟和理论计算结果的相对误差分别为6.19%和0.93%。所提方法实现了足尺冲击试验中柔性防护系统工作形态的远程监测,有潜力应用于落石灾害下柔性防护系统的形态评价。 展开更多
关键词 柔性防护系统 落石冲击 冲击大变形 计算机视觉技术 足尺试验
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部