期刊文献+
共找到1,468篇文章
< 1 2 74 >
每页显示 20 50 100
Multi-core optimization for conjugate gradient benchmark on heterogeneous processors
1
作者 邓林 窦勇 《Journal of Central South University》 SCIE EI CAS 2011年第2期490-498,共9页
Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at t... Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at this problem,a parallelization approach was proposed with six memory optimization schemes for CG,four schemes of them aiming at all kinds of sparse matrix-vector multiplication (SPMV) operation. Conducted on IBM QS20,the parallelization approach can reach up to 21 and 133 times speedups with size A and B,respectively,compared with single power processor element. Finally,the conclusion is drawn that the peak bandwidth of memory access on Cell BE can be obtained in SPMV,simple computation is more efficient on heterogeneous processors and loop-unrolling can hide local storage access latency while executing scalar operation on SIMD cores. 展开更多
关键词 multi-core processor NAS parallelization CG memory optimization
在线阅读 下载PDF
Impacts of optimization strategies on performance,power/energy consumption of a GPU based parallel reduction 被引量:1
2
作者 Phuong Thi Yen Lee Deok-Young Lee Jeong-Gun 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第11期2624-2637,共14页
In the era of modern high performance computing, GPUs have been considered an excellent accelerator for general purpose data-intensive parallel applications. To achieve application speedup from GPUs, many of performan... In the era of modern high performance computing, GPUs have been considered an excellent accelerator for general purpose data-intensive parallel applications. To achieve application speedup from GPUs, many of performance-oriented optimization techniques have been proposed. However, in order to satisfy the recent trend of power and energy consumptions, power/energy-aware optimization of GPUs needs to be investigated with detailed analysis in addition to the performance-oriented optimization. In this work, in order to explore the impact of various optimization strategies on GPU performance, power and energy consumptions, we evaluate performance and power/energy consumption of a well-known application running on different commercial GPU devices with the different optimization strategies. In particular, in order to see the more generalized performance and power consumption patterns of GPU based accelerations, our evaluations are performed with three different Nvdia GPU generations(Fermi, Kepler and Maxwell architectures), various core clock frequencies and memory clock frequencies. We analyze how a GPU kernel execution is affected by optimization and what GPU architectural factors have much impact on its performance and power/energy consumption. This paper also categorizes which optimization technique primarily improves which metric(i.e., performance, power or energy efficiency). Furthermore, voltage frequency scaling(VFS) is also applied to examine the effect of changing a clock frequency on these metrics. In general, our work shows that effective GPU optimization strategies can improve the application performance significantly without increasing power and energy consumption. 展开更多
关键词 parallel REDUCTION GPU code optimization POWER energy voltage frequency SCALING
在线阅读 下载PDF
Chaotic migration-based pseudo parallel genetic algorithm and its application in inventory optimization 被引量:1
3
作者 ChenXiaofang GuiWeihua WangYalin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第2期411-417,共7页
Considering premature convergence in the searching process of genetic algorithm, a chaotic migration-based pseudo parallel genetic algorithm (CMPPGA) is proposed, which applies the idea of isolated evolution and infor... Considering premature convergence in the searching process of genetic algorithm, a chaotic migration-based pseudo parallel genetic algorithm (CMPPGA) is proposed, which applies the idea of isolated evolution and information exchanging in distributed Parallel Genetic Algorithm by serial program structure to solve optimization problem of low real-time demand. In this algorithm, asynchronic migration of individuals during parallel evolution is guided by a chaotic migration sequence. Information exchanging among sub-populations is ensured to be efficient and sufficient due to that the sequence is ergodic and stochastic. Simulation study of CMPPGA shows its strong global search ability, superiority to standard genetic algorithm and high immunity against premature convergence. According to the practice of raw material supply, an inventory programming model is set up and solved by CMPPGA with satisfactory results returned. 展开更多
关键词 parallel genetic algorithm CHAOS premature convergence inventory optimization.
在线阅读 下载PDF
Parallel discrete lion swarm optimization algorithm for solving traveling salesman problem 被引量:4
4
作者 ZHANG Daoqing JIANG Mingyan 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期751-760,共10页
As a typical representative of the NP-complete problem, the traveling salesman problem(TSP) is widely utilized in computer networks, logistics distribution, and other fields. In this paper, a discrete lion swarm optim... As a typical representative of the NP-complete problem, the traveling salesman problem(TSP) is widely utilized in computer networks, logistics distribution, and other fields. In this paper, a discrete lion swarm optimization(DLSO) algorithm is proposed to solve the TSP. Firstly, we introduce discrete coding and order crossover operators in DLSO. Secondly, we use the complete 2-opt(C2-opt) algorithm to enhance the local search ability.Then in order to enhance the efficiency of the algorithm, a parallel discrete lion swarm optimization(PDLSO) algorithm is proposed.The PDLSO has multiple populations, and each sub-population independently runs the DLSO algorithm in parallel. We use the ring topology to transfer information between sub-populations. Experiments on some benchmarks TSP problems show that the DLSO algorithm has a better accuracy than other algorithms, and the PDLSO algorithm can effectively shorten the running time. 展开更多
关键词 discrete lion swarm optimization(DLSO)algorithm complete 2-opt(C2-opt)algorithm parallel discrete lion swarm optimization(PDLSO)algorithm traveling salesman problem(TSP)
在线阅读 下载PDF
A topology optimization method based on element independent nodal density 被引量:2
5
作者 易继军 曾韬 +1 位作者 荣见华 李艳梅 《Journal of Central South University》 SCIE EI CAS 2014年第2期558-566,共9页
A methodology for topology optimization based on element independent nodal density(EIND) is developed.Nodal densities are implemented as the design variables and interpolated onto element space to determine the densit... A methodology for topology optimization based on element independent nodal density(EIND) is developed.Nodal densities are implemented as the design variables and interpolated onto element space to determine the density of any point with Shepard interpolation function.The influence of the diameter of interpolation is discussed which shows good robustness.The new approach is demonstrated on the minimum volume problem subjected to a displacement constraint.The rational approximation for material properties(RAMP) method and a dual programming optimization algorithm are used to penalize the intermediate density point to achieve nearly 0-1 solutions.Solutions are shown to meet stability,mesh dependence or non-checkerboard patterns of topology optimization without additional constraints.Finally,the computational efficiency is greatly improved by multithread parallel computing with OpenMP. 展开更多
关键词 topology optimization element independent nodal density Shepard interpolation parallel computation
在线阅读 下载PDF
Remarks on a benchmark nonlinear constrained optimization problem 被引量:1
6
作者 Luo Yazhong Lei Yongjun Tang Guojin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2006年第3期551-553,共3页
Remarks on a benchmark nonlinear constrained optimization problem are made. Due to a citation error, two absolutely different results for the benchmark problem are obtained by independent researchers. Parallel simulat... Remarks on a benchmark nonlinear constrained optimization problem are made. Due to a citation error, two absolutely different results for the benchmark problem are obtained by independent researchers. Parallel simulated annealing using simplex method is employed in our study to solve the benchmark nonlinear constrained problem with mistaken formula and the best-known solution is obtained, whose optimality is testified by the Kuhn Tucker conditions. 展开更多
关键词 nonlinear constrained optimization parallel simulated annealing Kuhn-Tucker theorem.
在线阅读 下载PDF
基于GPU并行计算的拓扑优化全流程加速设计方法
7
作者 张长东 吴奕凡 +3 位作者 周铉华 李旭东 肖息 张自来 《航空制造技术》 北大核心 2025年第12期34-41,67,共9页
随着大尺寸航空航天装备的发展需求,高效高精度的大规模拓扑优化设计成为该领域关注的焦点。针对现有大规模拓扑优化设计存在的计算量巨大、计算效率低下等问题,基于GPU并行计算开展了拓扑优化全流程加速设计方法的研究。对网格划分、... 随着大尺寸航空航天装备的发展需求,高效高精度的大规模拓扑优化设计成为该领域关注的焦点。针对现有大规模拓扑优化设计存在的计算量巨大、计算效率低下等问题,基于GPU并行计算开展了拓扑优化全流程加速设计方法的研究。对网格划分、刚度矩阵计算与组装、有限元求解等过程进行了并行加速,实现了高效高精度的体素网格划分及有限元过程的高效求解。此外,该方法针对拓扑优化设计过程的加速需求,对灵敏度过滤过程进行了并行加速处理。以300万体素单元的姿态推力器模型为设计对象,发现相比于Abaqus 2022软件的拓扑优化并行加速计算,本文所提方法的加速比提高了1259%,且两种方法的相似度极高,验证了所提方法的有效性与实用性。 展开更多
关键词 拓扑优化 并行计算 GPU加速 符号距离场 稀疏矩阵 网格划分
在线阅读 下载PDF
木勺分拣机械手轨迹规划与刚柔耦合仿真分析
8
作者 赵辉 朱子瑞 +2 位作者 张天祥 赵雨菡 李明 《林产工业》 北大核心 2025年第4期73-78,共6页
为分析木勺分拣并联机械手在高速拾取时的运动精度,对并联机械手进行动态建模并模拟其耦合特性。轨迹规划直接影响到并联机械手的动态特性,对比分析传统的修正梯形加减速运动规律与改进粒子群优化的混合多项式轨迹规划对机械手关节变化... 为分析木勺分拣并联机械手在高速拾取时的运动精度,对并联机械手进行动态建模并模拟其耦合特性。轨迹规划直接影响到并联机械手的动态特性,对比分析传统的修正梯形加减速运动规律与改进粒子群优化的混合多项式轨迹规划对机械手关节变化规律的影响,以提高抓取与放置过程中的平稳性,减少冲击。使用有限元软件对从动杆柔性化导入动力学仿真软件中进行联合仿真,同时分析两种轨迹规划对机械手末端误差和运动过程中柔性杆的变形。结果表明:粒子群优化轨迹规划可提高机械手在高速分拣过程中的运动精度。 展开更多
关键词 并联机械手 轨迹规划 粒子群优化 刚柔耦合 偏移误差
在线阅读 下载PDF
4PC-2R并联机构设计及运动分析
9
作者 栾飞 李爱霞 +3 位作者 王晓峰 王子征 门鑫蕊 张博豪 《西北工业大学学报》 北大核心 2025年第3期437-446,共10页
针对电动重卡的换电作业过程,设计了一种以移动副作为输入的新型3T1R并联机构。利用SolidWorks软件完成了2-PCR并联机构的三维建模。基于螺旋理论对机构的自由度进行了深入分析,并通过G-K公式对其分析结果进行了验证,确保了理论分析的... 针对电动重卡的换电作业过程,设计了一种以移动副作为输入的新型3T1R并联机构。利用SolidWorks软件完成了2-PCR并联机构的三维建模。基于螺旋理论对机构的自由度进行了深入分析,并通过G-K公式对其分析结果进行了验证,确保了理论分析的准确性;采用闭环矢量法对其进行运动学求解;针对2-PCR机构X方向移动和绕Z轴转动相互干涉这一不足,对机构进行优化得到4PC-2R并联机构。对4PC-2R并联机构进行了相应的自由度分析和运动学求解,通过2个机构的对比,可知4PC-2R并联机构运动更平稳。运用遗传算法优化机构参数,进一步扩大了4PC-2R机构的工作空间,该机构用于电动重卡的换电装置上,可以有效提高电动重卡的换电效率和安全性。 展开更多
关键词 并联机构 工作空间 运动学分析 结构优化设计
在线阅读 下载PDF
一种并联机器人机构工作空间的优化研究
10
作者 张家祥 刘明东 《机械设计与制造》 北大核心 2025年第3期267-273,共7页
本研究提出了一种四自由度并联机器人机构模型,具备几何对称、简单运动学特性以及可在直线导轨上无限扩展的平移工作空间。采用投影法进行对并联机器人的位移进行分析,采用闭环向量法分析并联机器人的瞬时运动学特性。在雅可比矩阵的基... 本研究提出了一种四自由度并联机器人机构模型,具备几何对称、简单运动学特性以及可在直线导轨上无限扩展的平移工作空间。采用投影法进行对并联机器人的位移进行分析,采用闭环向量法分析并联机器人的瞬时运动学特性。在雅可比矩阵的基础上,研究了并联机器人各个典型构型。此外,对带偏置角的并联机器人局部奇异特性进行了分析。基于工作空间分析,建立了以机构最大占用面积为目标函数的优化模型,提出了优化模型的遗传算法,对并联机器人的结构参数进行了优化,实现了并联机器人可达的最大工作空间。 展开更多
关键词 并联机器人 四自由度 运动特性 特性优化
在线阅读 下载PDF
面向典型风险情景的驾驶人潜在风险感知能力评估
11
作者 徐磊 崔雄博 +2 位作者 赵刘昌 任超宇 彭金栓 《中国安全科学学报》 北大核心 2025年第4期181-188,共8页
为降低交通事故风险,组织实车试验,研究熟练驾驶人和非熟练驾驶人在动态跟随摩托车和平行超车2种典型风险情景下的潜在风险感知能力差异;采用可穿戴式眼动仪采集驾驶人的动态视觉参数,分析驾驶人在不同情景下的视觉特性。结果表明:熟练... 为降低交通事故风险,组织实车试验,研究熟练驾驶人和非熟练驾驶人在动态跟随摩托车和平行超车2种典型风险情景下的潜在风险感知能力差异;采用可穿戴式眼动仪采集驾驶人的动态视觉参数,分析驾驶人在不同情景下的视觉特性。结果表明:熟练驾驶人相比非熟练驾驶人在2种场景下的风险感知能力显著性更强,尤其在动态跟随摩托车场景中,熟练驾驶人表现出更高的前方远处注视概率,能够更好地预测前方交通状况;在平行超车场景中,熟练驾驶人的注视时间更短,且其水平搜索广度和垂直搜索深度更大。此外,对后视镜的注视时间占比显著高于非熟练驾驶人,具有更高的视觉搜索效率和更强的后方交通监控能力。基于灰色近优综合评价法评估结果,熟练驾驶人的危险感知能力得分显著高于非熟练驾驶人。 展开更多
关键词 驾驶人 潜在风险感知能力 驾驶安全 动态跟随摩托车 平行超车 灰色近优综合评价法
在线阅读 下载PDF
轮毂电动机驱动车辆并联式复合制动策略
12
作者 付翔 肖帅 徐超 《江苏大学学报(自然科学版)》 CAS 北大核心 2025年第1期9-17,共9页
基于并联式轮毂电动机驱动实车构型,分析影响制动能量回收效率的主要因素,采用联邦卡尔曼滤波纵向车速估计算法,提出了三层式复合制动控制策略.该策略中的制动决策层根据踏板输入信号和行驶状态来识别制动工况,并进入相应的制动模式.制... 基于并联式轮毂电动机驱动实车构型,分析影响制动能量回收效率的主要因素,采用联邦卡尔曼滤波纵向车速估计算法,提出了三层式复合制动控制策略.该策略中的制动决策层根据踏板输入信号和行驶状态来识别制动工况,并进入相应的制动模式.制动控制层根据制动决策层的指令,在常规制动工况下通过粒子群优化(PSO)算法优化前、后轮电制动力矩分配,实现电池有效回收效率最大化;紧急制动工况下,通过模糊自整定PID算法实现车辆在不同附着路面上各轮滑移率的安全有效控制,优化了制动防抱死控制的鲁棒性,提高制动安全性.制动执行层响应制动控制层的指令,设计了电制动补偿机制,以迅速补偿调节各轮轮缸的压力误差,提高车辆制动稳定性.最后实车验证了该复合控制策略的有效性. 展开更多
关键词 轮毂电动机驱动车辆 并联式复合制动 粒子群优化 制动能量回收 模糊自整定PID
在线阅读 下载PDF
基于改进MOGWO算法的并联机器人轨迹优化
13
作者 郭彤颖 叶相涛 陈宇 《组合机床与自动化加工技术》 北大核心 2025年第6期20-25,共6页
针对并联机器人运行过程中短时间、低能耗、弱冲击等需求,提出了一种基于改进多目标灰狼算法(IMOGWO)的轨迹优化方法。首先,对并联机器人进行逆运动学求解,在笛卡尔空间选取关键点并映射至关节空间,采用4-3-3-4次多项式插值方法对其运... 针对并联机器人运行过程中短时间、低能耗、弱冲击等需求,提出了一种基于改进多目标灰狼算法(IMOGWO)的轨迹优化方法。首先,对并联机器人进行逆运动学求解,在笛卡尔空间选取关键点并映射至关节空间,采用4-3-3-4次多项式插值方法对其运动轨迹进行规划;其次,对多目标灰狼算法在收敛因子、围猎机制、头狼更新3个方面进行改进优化,优化后的算法具有搜索能力强、收敛速度快等优势;最终,利用改进的多目标灰狼算法对多项式轨迹进行时间-能耗-冲击多目标优化,仿真实验表明优化方法不仅缩短了机器人的运行时间,在降低能耗和减小冲击方面也取得了显著成效,使机器人总体性能得到了有效地提升。 展开更多
关键词 并联机器人 轨迹规划 改进多目标灰狼算法 多目标优化
在线阅读 下载PDF
非均匀功率分布的微波整流天线阵列功率合成优化方法
14
作者 肖冬萍 陈建楠 +1 位作者 陈宇立 舒梽卿 《电工技术学报》 北大核心 2025年第2期358-366,共9页
对于大型微波无线能量传输系统,其接收天线阵列上微波功率非均匀分布,由于整流电路的特性,采用现有的天线阵列布局和功率合成方式所得的能量转换效率较低。为此,该文提出一种基于遗传算法优化的混合功率合成方法:提出天线单元连接编码规... 对于大型微波无线能量传输系统,其接收天线阵列上微波功率非均匀分布,由于整流电路的特性,采用现有的天线阵列布局和功率合成方式所得的能量转换效率较低。为此,该文提出一种基于遗传算法优化的混合功率合成方法:提出天线单元连接编码规则,采用遗传算法将接收天线单元按目标功率进行分组和射频合成,使得各组射频合成后的微波功率均匀化,再输入整流电路;提出整流电路连接编码规则,基于遗传算法,以负载匹配为目标对整流电路进行动态串并联优化,使直流合成后获得最优转换效率。在进行功率合成前,需基于实验系统分析获得整流电路输入功率与转换效率关系、输出伏安特性曲线,从而确定射频功率合成的优化目标。该文以10×10接收阵列天线为例进行分析,将100个单元分为4组进行均匀化射频合成,均匀度评价指标低至1.804;再对整流输出进行串并联优化,在接近负载匹配的情况下使得整流转换效率达到91.37%。结果表明,采用该文提出的方法可快速有效地对接收天线阵列进行混合功率合成优化。 展开更多
关键词 微波无线能量传输 混合功率合成 编码规则 动态串并联优化 整流电路特性
在线阅读 下载PDF
6-PSU并联机器人动力学模型辩识及其驱动力矩估计新方法 被引量:1
15
作者 谢兴彪 张晓旭 +1 位作者 孙秀婷 徐鉴 《力学学报》 北大核心 2025年第1期183-198,共16页
并联机器人运动奇异常常会导致电机驱动力矩过载甚至损坏.为降低驱动电机的故障率,以6-PSU型并联机器人为研究对象,提出了基于动力学建模及其参数辨识的解决方案,能够根据预设轨迹提前精确估计驱动力矩以便用于安全性校核.首先,结合凯... 并联机器人运动奇异常常会导致电机驱动力矩过载甚至损坏.为降低驱动电机的故障率,以6-PSU型并联机器人为研究对象,提出了基于动力学建模及其参数辨识的解决方案,能够根据预设轨迹提前精确估计驱动力矩以便用于安全性校核.首先,结合凯恩方法和虚功原理,建立了包含滚珠丝杠模组摩擦、伺服电机摩擦和惯性的逆动力学精细化模型;其次,利用QR分解获得了最小可辨识参数集,并在此基础上考虑了连杆截面的对称性特点,发现了可忽略的连杆惯量,得到了简化的线性化模型;此外,利用统计的方法,验证了激励轨迹优化时考虑摩擦的必要性;然后,利用Simulink/Multibody搭建机器人物理仿真模型进行了参数辨识与驱动力矩估计仿真实验,针对最小可辨识参数集模型和简化模型分别定量分析了两者的参数辨识精度、驱动力估计精度以及抗噪能力;最后,在6-PSU型并联机器人平台上开展了实验验证.结果表明,提出的简化模型在保证相同驱动力矩估计精度的前提下,有效简化了模型复杂度,具有明确的工程价值. 展开更多
关键词 并联机器人 凯恩方法 关节摩擦 激励轨迹优化 参数辨识
在线阅读 下载PDF
飞机数字化装配系统运动学与动力学研究
16
作者 刘文平 祁若龙 +1 位作者 李论 赵吉宾 《组合机床与自动化加工技术》 北大核心 2025年第1期28-31,36,共5页
针对飞机大部件装配周期长,精度差和效率低等问题,提出了一种基于4-PPPS冗余并联机构的数字化装配对接方法。首先,基于旋量理论建立支链的运动学模型,得到支链运动学参数,进而推导出机构的运动学参数;其次,应用拉格朗日法建立机构的动... 针对飞机大部件装配周期长,精度差和效率低等问题,提出了一种基于4-PPPS冗余并联机构的数字化装配对接方法。首先,基于旋量理论建立支链的运动学模型,得到支链运动学参数,进而推导出机构的运动学参数;其次,应用拉格朗日法建立机构的动力学模型,利用虚功原理和范数最小原则,得到机构最优驱动力。通过比较动平台和驱动力的理论值与仿真值,验证了所建模型的正确性;最后,通过飞机中后部件对接试验,证明了所提方法的可行性和正确性。 展开更多
关键词 并联机构 旋量理论 运动学 动力学 驱动力优化
在线阅读 下载PDF
基于光量子计算机的电网停电后分区模型及量子比特扩容方法 被引量:1
17
作者 刘成骏 娄骐 +3 位作者 徐一骏 顾伟 文凯 马寅 《电力系统自动化》 北大核心 2025年第11期80-90,共11页
电网发生大停电事故后,采用分区并行恢复策略能够保证电网快速恢复正常运行,而精准、高效的分区方法则是恢复策略能够实施的重要前提之一。面对新型电力系统日益严格的时效性需求,现存方法无法直接求解模型且求解结果需要人工选择,并受... 电网发生大停电事故后,采用分区并行恢复策略能够保证电网快速恢复正常运行,而精准、高效的分区方法则是恢复策略能够实施的重要前提之一。面对新型电力系统日益严格的时效性需求,现存方法无法直接求解模型且求解结果需要人工选择,并受到经典计算机算力限制。针对上述问题,文中利用近年来新兴的量子计算技术,提出了基于量子计算的电网停电后快速恢复分区方法。首先,以切除线路权重和最小为目标,考虑电网实际运行安全约束,构建了大停电后网络分区模型,并将其转化为光量子计算机能直接求解的二元二次无约束优化模型;然后,考虑实机量子比特数限制,初步探讨了基于子问题抽取的量子比特扩容方法在实际应用中的可能性;最后,依托专用量子计算机,采用两个不同规模的系统分别验证了所提分区模型和量子扩容方法的有效性。 展开更多
关键词 新型电力系统 量子计算 量子比特扩容 停电 二元二次无约束优化 谱聚类 分区并行恢复
在线阅读 下载PDF
基于分布并行式增广拉格朗日协调的MDO方法
18
作者 桂俊涛 贺岩松 +2 位作者 唐中华 张志飞 徐中明 《计算机集成制造系统》 北大核心 2025年第2期579-589,共11页
鉴于增广拉格朗日协调方法在并行求解上存在一定局限性,为在分布式协调的框架下对子问题进行并行求解,提出分布并行式增广拉格朗日协调的多学科设计优化方法。在分布式协调结构中通过滞后的耦合信息构建一致性约束,采用自适应异步乘子... 鉴于增广拉格朗日协调方法在并行求解上存在一定局限性,为在分布式协调的框架下对子问题进行并行求解,提出分布并行式增广拉格朗日协调的多学科设计优化方法。在分布式协调结构中通过滞后的耦合信息构建一致性约束,采用自适应异步乘子更新策略克服了一致性约束不匹配的问题。根据耦合变量与乘子对惩罚权重进行更新的方案可避免惩罚权重过大的问题。两项改进避免了解发散与振荡的情况,在分布式协调中实现了子问题的并行求解。通过实例仿真证明了所提方法的可行性,与集中式协调方法相比,所提方法无需重构协调关系,并行化程度与求解效率更高。通过求解工程问题进一步验证了所提方法的可行性与有效性,为基于分解的优化方法子问题的并行化求解提供了参考。 展开更多
关键词 增广拉格朗日协调 分布式 并行计算 多学科设计优化 自适应更新策略
在线阅读 下载PDF
基于一维干涉测量的六自由度并联机器人精度补偿方法
19
作者 高磊 任子啸 +3 位作者 刘志华 王春蔓 孔明 蔡晨光 《计量学报》 北大核心 2025年第6期823-829,共7页
精度补偿能够在不增加制造成本的前提下提升六自由度并联机器人运动精度。然而,传统的精度补偿方法依赖多维坐标/位姿测量系统,测量精度有限,难以实现高精度补偿。为了提高并联机器人的精度,提出了一种基于一维干涉测量的高精度补偿方法... 精度补偿能够在不增加制造成本的前提下提升六自由度并联机器人运动精度。然而,传统的精度补偿方法依赖多维坐标/位姿测量系统,测量精度有限,难以实现高精度补偿。为了提高并联机器人的精度,提出了一种基于一维干涉测量的高精度补偿方法,通过提高测量精度提升精度补偿能力。建立了六自由度并联机器人的相对误差模型,利用一维激光干涉仪测量终端平台的相对距离,构建误差损失函数,通过结合优化算法实现降维误差补偿。实验结果表明:所提方法可将六自由度并联机器人的位置均方根误差从19.74μm降低至3.82μm,精度提升了约80.65%。 展开更多
关键词 几何量计量 并联机器人 精度补偿 一维测量 优化算法
在线阅读 下载PDF
一种集成于超算作业调度系统应用的并行参数优化方法
20
作者 张文帅 李会民 +1 位作者 李京 潘必才 《计算机工程》 北大核心 2025年第7期59-67,共9页
随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率... 随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率影响很大。随着计算规模与复杂度的提升,多个并行参数的可配置空间越来越大,用户越来越难以确定最佳的并行参数值。这类运行时优化问题在科学计算应用中较为普遍,但相关的研究与解决方法比较少见。以VASP(Vienna Ab initio Simulation Package)应用为例,首先分析了该应用的多层并行结构,展示了不同并行参数配置引发的巨大运行速度差异。然后提出了一个基于约化并行效率指标的全自动运行优化方法,其不仅可以帮助用户简单快捷地确定最佳应用并行参数,而且可以帮助用户确定最佳的计算资源使用量,使应用可以高效率地扩展到大规模的并行计算中。最后将该优化方法与计算集群作业调度系统相融合应用于用户提交的真实VASP计算作业。统计结果表明,该方法显著提升了作业运行速度与超算资源的使用效率,具有很好的工程应用前景。 展开更多
关键词 并行计算 作业调度 运行时优化 超级计算 VASP应用
在线阅读 下载PDF
上一页 1 2 74 下一页 到第
使用帮助 返回顶部