期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
基于ABWO的并行DCNN优化算法 被引量:1
1
作者 毛伊敏 刘映兴 《计算机工程与设计》 北大核心 2025年第2期353-359,共7页
针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异... 针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异性较大的特征;设计一种ResNet-CBAMDW模型,提升模型性能;提出一种基于自适应黑寡妇优化算法的并行训练策略PT-ABWO优化初始参数,加快参数更新速度;提出一种基于大数据基准测试的动态负载均衡策略DLB-BDB,合理分配任务负载,提升集群并行效率。实验结果表明,该算法能够有效提升DCNN在大数据环境下的训练效率。 展开更多
关键词 大数据 并行深度卷积神经网络算法 密度峰值聚类 自适应黑寡妇优化算法 并行训练 基准测试 负载均衡
在线阅读 下载PDF
面向特定应用的可配置CPU性能分析方法
2
作者 邓全 林荣臻 +2 位作者 罗莉 鲁建壮 王永文 《计算机工程与科学》 北大核心 2025年第11期1901-1911,共11页
随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系... 随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系结构工程师,缺乏一套科学方法进行指导,因此,提出了一种面向特定应用的可配置CPU性能分析方法。在软件层面,利用Perf工具快速定位应用程序在硬件执行时的热点代码块;在硬件层面,通过分析框架的2种计数模式(时钟周期计数与slots计数),锁定各个执行部件的热点执行情况,以便设计人员快速定位硬件执行的热点行为。对支持RISCV指令集的可配置DMR架构在流体力学典型程序NPB上进行了敏捷设计。实验结果表明,迭代后可配置CPU单核性能提升了13.2%,面积开销增加了12.2%。 展开更多
关键词 性能分析 可配置CPU PMU NPB 测试
在线阅读 下载PDF
OpenPerf:面向开源生态可持续发展的数据科学基准测试体系 被引量:3
3
作者 韩凡宇 毕枫林 +5 位作者 张琰彬 李晖 游兰 王伟 钱卫宁 周傲英 《计算机学报》 北大核心 2025年第3期632-649,共18页
基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。随着人工智能时代的到来,诸如ImageNet、DataPerf等这类新型的AI基准测试数据集逐步成为学术界和工业界的共识性... 基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。随着人工智能时代的到来,诸如ImageNet、DataPerf等这类新型的AI基准测试数据集逐步成为学术界和工业界的共识性标准。当前,关于开源生态的研究大多基于某一项具体的研究点展开分析而缺少对开源生态基准体系的构建,一个开源项目处于怎样的发展位置、企业开源程序办公能力处于行业什么位置、开发者活跃度、项目影响力等基础数据与评价,都是数据使用方迫切需要的开源领域知识。为了解决开源领域“有数据无基准”的局面,本文提出一种面向开源生态可持续发展的数据科学基准测试体系(OpenPerf)。该体系自下而上主要包含数据科学任务类基准、指数类基准以及标杆类基准,旨在为学术界、工业界提供不同的基准参考。本文定义了9个数据科学任务类基准,给出了3项典型的数据科学任务类基准测试结果、2项指数类基准以及1项标杆类基准,其中2项指数类基准被中国电子技术标准化研究院作为开源社区治理的评估标准。数据科学任务类基准主要应用于学术界,为不同研究方向的研究者提供自己擅长的研究领域的基准。指数类基准主要面向企业界,企业界可以通过影响力和活跃度等基准数据了解当前企业开源程序办公能力所处的行业位置以及旗下开源项目所处的发展位置。标杆类基准是一种可测量的业界最佳水平的成绩,用来比较参考尺度。最后,通过3个应用在阿里、蚂蚁以及华东师范大学等国内知名公司和高校的实际案例验证了OpenPerf在推动开源生态可持续发展中所起到的关键作用。 展开更多
关键词 基准测试 开源生态 可持续发展 基准任务 应用案例
在线阅读 下载PDF
铝合金板冲压成形Benchmark试验与有限元仿真 被引量:14
4
作者 闫康康 胡平 郭威 《农业机械学报》 EI CAS CSCD 北大核心 2009年第11期232-235,共4页
采用NUMISHEET2002会议提出的杯形件拉深Benchmark试验方案,在不同压边力工况下,对铝合金板6111-T4的拉深性能、各向异性行为、起皱缺陷进行了试验研究。研究表明:各向异性系数小并未对铝合金板的成形性能产生较大影响,通过增大压边力... 采用NUMISHEET2002会议提出的杯形件拉深Benchmark试验方案,在不同压边力工况下,对铝合金板6111-T4的拉深性能、各向异性行为、起皱缺陷进行了试验研究。研究表明:各向异性系数小并未对铝合金板的成形性能产生较大影响,通过增大压边力能有效解决起皱问题,铝合金板6111-T4具有良好的冲压成形性能。基于自主研发的冲压成形CAE软件KMAS平台,对Benchmark试验进行了仿真验证,与试验结果对比表明:KMAS软件采用的Barlat-Lian各向异性屈服准则和动力半显式算法能够准确模拟铝合金板的冲压成形。 展开更多
关键词 铝合金板 冲压成形 benchmark试验 有限元 仿真
在线阅读 下载PDF
基于改进淘金算法BP神经网络预测方法研究
5
作者 戴诗雨 孙哲 +1 位作者 袁凯 孙知信 《印刷与数字媒体技术研究》 北大核心 2025年第5期121-137,共17页
围绕时间序列数据精准预测的问题,本研究提出了基于改进淘金算法BP神经网络的预测方法。首先,针对传统淘金优化算法(GRO)收敛速度慢、易陷入局部最优等缺陷,引入了Tent混沌映射和莱维飞行策略,分别对该算法种群初始化和迭代寻优两个阶... 围绕时间序列数据精准预测的问题,本研究提出了基于改进淘金算法BP神经网络的预测方法。首先,针对传统淘金优化算法(GRO)收敛速度慢、易陷入局部最优等缺陷,引入了Tent混沌映射和莱维飞行策略,分别对该算法种群初始化和迭代寻优两个阶段进行改进,并通过算法测试和方法比较,验证了改进淘金优化算法(DGRO)在解决最优化问题方面的良好的性能。然后,设置BP神经网络基本参数,并利用DGRO对BP神经网络的初始连接权重和阈值进行调整,构建了DGRO-BP模型。最后,利用某快递驿站实际处理快件量的数据集对本研究提出的模型进行测试。结果显示,DGRO-BP在诸多预测精度评价指标上相较于BP和GWO-BP等具备优越性,尤其是在平均绝对误差(MAE)指标上,DGRO-BP模型的平均绝对误差比标准BP神经网络模型低了约46.15%,证实了DGRO-BP在处理该类问题上的优势,对时间序列数据预测问题的研究具有重要意义。 展开更多
关键词 淘金优化算法 算法优化 BP神经网络 快递数据预测 测试函数
在线阅读 下载PDF
面向鲲鹏处理器的HPL-MxP多重lookahead优化
6
作者 高昂 王银山 +3 位作者 燕雯 宋昌成 王龙 姚二林 《计算机工程》 北大核心 2025年第8期354-363,共10页
HPL-MxP基准测试程序被广泛用于衡量超算在混合精度计算下的计算能力。受制于该程序的并行实现算法,矩阵分块大小(NB)值的选取是一个需要兼顾矩阵乘效率和负载均衡的权衡问题。针对该问题,在鲲鹏920系统上进行优化研究,提出多重lookahea... HPL-MxP基准测试程序被广泛用于衡量超算在混合精度计算下的计算能力。受制于该程序的并行实现算法,矩阵分块大小(NB)值的选取是一个需要兼顾矩阵乘效率和负载均衡的权衡问题。针对该问题,在鲲鹏920系统上进行优化研究,提出多重lookahead优化策略,采用小NB值进行矩阵分块实现更好的负载均衡,同时通过合并多轮尾矩阵更新提升等效NB值,实现负载均衡与高矩阵乘效率两者兼得的目标。为实现多重lookahead优化方案,重构Panel存储方式,并设计计算与通信细粒度流水线,扩展HPL-MxP源程序接口。在鲲鹏920多节点平台上的单双精度混合测试结果表明,HPL-MxP在多重lookahead优化下可有效解决NB值的权衡问题,且相较单重lookahead策略未产生明显额外开销。 展开更多
关键词 HPL-MxP基准测试程序 矩阵分块 混合精度 多重lookahead优化策略 Panel存储方式
在线阅读 下载PDF
Benchmark性能测试综述 被引量:9
7
作者 王良 《计算机工程与应用》 CSCD 北大核心 2006年第15期45-48,共4页
基准(Benchmark)测试是一种应用广泛、内容繁杂的测试技术,也是目前最主要的信息系统性能测试技术。文章对Benchmark测试的规范和测试方法做了归纳总结,给出了选用Benchmark测试的建议和开发Benchmark测试规范需要解决的问题。最后介绍... 基准(Benchmark)测试是一种应用广泛、内容繁杂的测试技术,也是目前最主要的信息系统性能测试技术。文章对Benchmark测试的规范和测试方法做了归纳总结,给出了选用Benchmark测试的建议和开发Benchmark测试规范需要解决的问题。最后介绍了有代表性的Benchmark测试规范和程序集。 展开更多
关键词 基准测试 测试 性能
在线阅读 下载PDF
基于数据增强和两阶段训练的摘要忠实度评估
8
作者 赵金爽 黄德根 《计算机科学》 北大核心 2025年第10期266-274,共9页
文本摘要的忠实度,即其与原文在事实层面的一致性,对于自动文本摘要的实际应用具有重要意义。现有的摘要忠实度评估方法在利用文本摘要数据集方面存在不足,且构建的不忠实摘要与原文差异显著,这限制了评估方法的有效性。针对此问题,提... 文本摘要的忠实度,即其与原文在事实层面的一致性,对于自动文本摘要的实际应用具有重要意义。现有的摘要忠实度评估方法在利用文本摘要数据集方面存在不足,且构建的不忠实摘要与原文差异显著,这限制了评估方法的有效性。针对此问题,提出一种基于数据增强和两阶段训练的摘要忠实度评估模型——FaithEval。首先,定义两种数据增强方法,即同主题相似检索和外插掩码填充,用于生成与原文内容相关联的不忠实摘要,应用这些方法从文本摘要数据集中提取训练数据;然后,充分利用数据集的信息,基于原文和参考摘要构建的训练数据,分两个阶段对模型进行训练,逐步强化模型的忠实度评估能力;最后,人工构建摘要忠实度评估测试集SFETS,为检验模型性能提供基准。实验结果表明,在SFETS和Rank19数据集上,FaithEval均表现出色,尤其在SFETS数据集上,达到了当前最优的效果。 展开更多
关键词 文本摘要 忠实度评估 数据增强 两阶段训练 基准测试集
在线阅读 下载PDF
大型建筑设备-结构耦合效应的振动台试验研究
9
作者 秦昌安 张国伟 +3 位作者 宋金成 王晨 周洲 熊梓言 《实验技术与管理》 北大核心 2025年第7期26-33,共8页
为研究建筑中设备与建筑结构的相互作用,该文基于设备-Benchmark钢框架缩尺模型开展了振动台试验。文章以水冷机原型为例,采用解耦重构方法将设备系统分为质量特征部分和刚度特征部分,分析了不同质量和刚度下设备的频率,以及设备频率对... 为研究建筑中设备与建筑结构的相互作用,该文基于设备-Benchmark钢框架缩尺模型开展了振动台试验。文章以水冷机原型为例,采用解耦重构方法将设备系统分为质量特征部分和刚度特征部分,分析了不同质量和刚度下设备的频率,以及设备频率对耦合体系振型和动力响应的影响。试验结果表明随着设备频率的降低,建筑结构的一阶振型由平动向静止转变,而设备由静止向平动转变。耦合效应使得建筑结构的响应曲线更加尖锐,提升了振动剧烈持续时的加速度峰值,降低了位移峰值,而设备的加速度响应呈现出了相反的演变规律。该研究成果可为设备-结构耦合体系的抗震设计提供理论支撑。 展开更多
关键词 耦合效应 振动台试验 benchmark钢框架 动力响应
在线阅读 下载PDF
基于NAS Benchmarks的ORC性能测试
10
作者 林海波 汤志忠 《计算机科学》 CSCD 北大核心 2003年第3期141-145,共5页
Itanium is the first generation product processor based on IA-64 architecture. ORC(Open Research Compil-er )provides an open source IPF(Itanium Processor Family)research compiler infrastructure. We have compiled andru... Itanium is the first generation product processor based on IA-64 architecture. ORC(Open Research Compil-er )provides an open source IPF(Itanium Processor Family)research compiler infrastructure. We have compiled andrun NAS Benchmarks on the Itanium machine. This paper briefly describes the performance of orcc, sgicc and gcc inthe following 3 ways: execution time, compilation time, and executable file size. The results show that orcc has near-ly the same performance as sgicc, which is 2 fold faster over gcc in the aspect of execution time. We also find that evenwith the best-optimized program, the utilization ratio of process resources is no more that 70%. 展开更多
关键词 NASbenchmarks ORC 性能测试 安腾处理器 指令级并行性 体系结构
在线阅读 下载PDF
融合多策略的沙猫群算法及其应用
11
作者 班云飞 张达敏 +1 位作者 左锋琴 沈倩雯 《计算机工程与设计》 北大核心 2025年第7期2054-2062,共9页
针对沙猫群算法易陷入局部最优、收敛速度慢等问题,提出一种融合多策略的沙猫群算法。将经典SCSO搜索阶段的位置更新公式做结构变体,增加种群的多样性;提出自适应麻雀因子提高算法的收敛速度和精度;在开发阶段引入动态螺旋探索策略,以... 针对沙猫群算法易陷入局部最优、收敛速度慢等问题,提出一种融合多策略的沙猫群算法。将经典SCSO搜索阶段的位置更新公式做结构变体,增加种群的多样性;提出自适应麻雀因子提高算法的收敛速度和精度;在开发阶段引入动态螺旋探索策略,以一种选择概率控制该策略的作用阶段,避免算法陷入局部最优。与其它算法在8个基准测试函数和Wilcoxon秩和检验上进行对比,实验结果表明,改进算法的寻优精度高、收敛速度快且具有跳出局部最优的能力,同时将其应用在5G基站中心选址问题中,验证了算法在实际应用中的有效性和可行性。 展开更多
关键词 沙猫群算法 结构变体 自适应麻雀因子 动态螺旋探索策略 5G基站中心选址 基准测试函数 秩和检验
在线阅读 下载PDF
全局搜索和云模型动态扰动的鱼鹰优化算法
12
作者 左锋琴 张达敏 +1 位作者 邓佳欣 文裕杰 《计算机工程与设计》 北大核心 2025年第4期966-973,共8页
针对鱼鹰优化算法(OOA)收敛速度慢和稳定性低等问题,提出一种全局搜索和云模型动态扰动的鱼鹰优化算法(GDOOA)。利用正态云模型动态扰动策略更新种群最优解,加快算法收敛速度;在算法探索阶段,采用自适应更新机制平衡全局搜索和局部开发... 针对鱼鹰优化算法(OOA)收敛速度慢和稳定性低等问题,提出一种全局搜索和云模型动态扰动的鱼鹰优化算法(GDOOA)。利用正态云模型动态扰动策略更新种群最优解,加快算法收敛速度;在算法探索阶段,采用自适应更新机制平衡全局搜索和局部开发能力,提高算法的收敛精度;在开发阶段,引入全局优化导引策略为鱼鹰个体提供3种更新机制,提升个体的灵活性和算法的全局搜素能力。在8个基准测试函数和Wilcoxon秩和检验中进行对比实验,其结果表明,GDOOA在性能上具有优势。工程问题测试结果表明,GDOOA同时适用于实际工程应用问题。 展开更多
关键词 鱼鹰优化算法 云模型动态扰动 自适应更新机制 全局优化导引策略 基准测试 秩和检验 工程问题
在线阅读 下载PDF
多策略改进的蝴蝶优化算法
13
作者 张琪 顾腾达 +2 位作者 任宇辰 季津琪 陈海涛 《计算机工程与科学》 北大核心 2025年第7期1312-1320,共9页
针对蝴蝶优化算法存在搜索精度差、全局搜索和局部开发能力不平衡、容易陷入局部最优等问题,为提升蝴蝶优化算法的鲁棒性和寻优能力,提出一种多策略改进的蝴蝶优化算法。该算法选用随机一致性初始化蝴蝶种群,使蝴蝶个体在搜索空间中的... 针对蝴蝶优化算法存在搜索精度差、全局搜索和局部开发能力不平衡、容易陷入局部最优等问题,为提升蝴蝶优化算法的鲁棒性和寻优能力,提出一种多策略改进的蝴蝶优化算法。该算法选用随机一致性初始化蝴蝶种群,使蝴蝶个体在搜索空间中的各个维度分布更加均匀,对解空间的覆盖率更广;引入动态惯性权重策略,平衡全局搜索与局部搜索;引入精英差分变异策略,提高算法的全局搜索能力。将改进后的算法与7种优化算法在17个基准函数上进行实验对比,结果表明,改进后的算法相比于原始蝴蝶优化算法,具有更好的收敛性和求解精度,且全局寻优能力和鲁棒性得到了提升。 展开更多
关键词 蝴蝶优化算法 随机一致性初始化 差分进化算法 基准函数 Wilcoxon秩和检验
在线阅读 下载PDF
容错CORBA的Benchmark测试研究
14
作者 党新梅 刘惠 吴泉源 《计算机工程》 CAS CSCD 北大核心 2004年第22期50-52,共3页
以容错CORBA实现的ftbus为测试对象,提出了一个容错CORBA的 Benchmark测试的设计方案,涉及一个金融领域的银行应用场景和一个Benchmark测试框架。与此同时,给出了两个性能度量指标,并对每个指标进行了分析。
关键词 计算机网络 CORBA 应用软件 benchmark 测试
在线阅读 下载PDF
容错中间件FTBus的Benchmark测试的研究与分析
15
作者 党新梅 刘惠 +1 位作者 史殿习 吴泉源 《计算机工程与科学》 CSCD 2005年第3期93-95,107,共4页
本文以容错CORBA规范1.0的实现FTBus为测试对象,实现了对FTBus的Benchmark测试,测试指标包括性能损失、失效检测时间、失效恢复时间和重获稳定性时间等,并对测试结果进行了分析。
关键词 容错中间件 FTBus benchmark测试 应用软件 CORBA 计算机网络
在线阅读 下载PDF
基于ENDITS-2.1的CENDL-3.2临界基准检验 被引量:2
16
作者 吴海成 张环宇 《原子能科学技术》 EI CAS CSCD 北大核心 2024年第6期1271-1279,共9页
中国评价核数据库CENDL-3.2于2020年6月正式发布,并在ND2019上介绍了基于系统化宏观检验工具包ENDITS-1.0的临界基准检验结果。为更广泛测试新评价数据库的临界计算准确度并为将来的评价数据改进提供反馈,中国核数据中心发展了ENDITS-2... 中国评价核数据库CENDL-3.2于2020年6月正式发布,并在ND2019上介绍了基于系统化宏观检验工具包ENDITS-1.0的临界基准检验结果。为更广泛测试新评价数据库的临界计算准确度并为将来的评价数据改进提供反馈,中国核数据中心发展了ENDITS-2.1,并用其中2237个来自国际核临界安全手册ICSBEP2006的临界基准实验对国际最新版本的评价核数据库进行了临界基准检验。利用趋势分析方法和统计卡方对检验计算结果进行了分析,确定了获得改进的临界系统和评价数据,确认CENDL-3.2较CENDL-3.1有明显改进,临界计算准确度达国际领先水平。最后,结合对灵敏核素相关统计卡方的分析以及皮尔逊卡方检查,提出了CENDL-3.2库高优先级待改进核素清单,确定了CENDL库需要优先改进235,238U、239,240Pu、232Th等16种核素的核反应数据。 展开更多
关键词 评价核数据 临界基准检验 ENDITS-2.1 CENDL-3.2
在线阅读 下载PDF
基于正余弦的非线性哈里斯鹰优化算法 被引量:1
17
作者 夏小刚 彭嘉超 《河南科技大学学报(自然科学版)》 CAS 北大核心 2024年第5期93-104,M0008,共13页
针对哈里斯鹰优化算法(HHO)收敛精度低、易陷入局部最优等问题,提出了一种基于正余弦的非线性哈里斯鹰优化算法(SCNHHO)。首先,采用佳点集策略对种群进行初始化,使种群分布更均匀,提高算法收敛速度和精度;其次,在探索阶段引入正余弦策略... 针对哈里斯鹰优化算法(HHO)收敛精度低、易陷入局部最优等问题,提出了一种基于正余弦的非线性哈里斯鹰优化算法(SCNHHO)。首先,采用佳点集策略对种群进行初始化,使种群分布更均匀,提高算法收敛速度和精度;其次,在探索阶段引入正余弦策略,利用正余弦函数的震荡特性扩大搜索范围,寻求更多潜在的优质解;最后,在开发阶段引入非线性参数来平衡探索与开发,避免算法陷入局部最优。针对不同维度的基准测试函数进行性能测试,结合Wilcoxon秩和检验与Friedman检验的结果,将该算法与其他5个对比算法进行分析。结果表明,改进算法性能较原始HHO算法有较大提升,并且优于斑马优化算法(ZOA)、鲸鱼优化算法(WOA)和2种哈里斯鹰算法的变体(MHHO和IHHO),验证了改进策略的有效性。最后通过三杆桁架设计问题进一步验证了SCNHHO的实用性。 展开更多
关键词 哈里斯鹰优化算法 佳点集策略 正余弦函数 非线性参数 Wilcoxon秩和检验 基准测试函数
在线阅读 下载PDF
混合多策略改进的蜣螂优化算法 被引量:6
18
作者 娄革伟 郑永煌 +3 位作者 陈均 谌廷政 索相波 刘旭亮 《计算机工程与应用》 CSCD 北大核心 2024年第24期97-109,共13页
针对原始蜣螂优化算法全局探索能力不足、易陷入局部最优以及收敛精度不理想等问题,提出了一种混合多策略改进的蜣螂优化算法。采用混沌映射结合随机反向学习策略初始化种群提高多样性,扩大解空间搜索范围,增强全局寻优能力;通过黄金正... 针对原始蜣螂优化算法全局探索能力不足、易陷入局部最优以及收敛精度不理想等问题,提出了一种混合多策略改进的蜣螂优化算法。采用混沌映射结合随机反向学习策略初始化种群提高多样性,扩大解空间搜索范围,增强全局寻优能力;通过黄金正弦策略实现个体动态搜索,提高算法遍历性;引入竞争机制增强信息交互,平衡全局探索与局部开发,加快算法收敛速度;最后在迭代后期利用自适应t分布变异对个体进行扰动,避免算法陷入局部最优。在23个基准测试函数中,将该算法与其他优化算法进行对比测试,结果表明,改进后的算法具有更强的寻优性能、更高的收敛精度和更好的稳定性。在具体工程设计实例中的应用验证了该算法在处理实际优化问题上的有效性。 展开更多
关键词 蜣螂优化算法 随机反向学习 混沌映射 黄金正弦策略 竞争机制 t分布变异 基准测试函数 工程设计实例
在线阅读 下载PDF
基于鲲鹏和昇腾异构平台的单节点HPL-AI设计与优化 被引量:1
19
作者 吴昊天 任长青 +2 位作者 陆璐 徐鹏翔 杨凯 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期13-22,共10页
鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试... 鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试被提出,用于评估高性能系统的混合精度运算性能。针对该基准测试,本研究在鲲鹏和昇腾异构平台上设计并优化了单节点HPL-AI基准测试的实现。其主要通过循环任务分配的策略将任务均匀地分配给AI处理器以平衡AI处理器的负载;通过带间隔值的任务分配策略提高数据传输的连续性来减少CPU和AI处理器之间的数据传输时间;在不影响计算精度的情况下,通过取消数据缩放的策略来减少CPU侧的计算量。最终实验结果表明:当间隔值为8时,HPL-AI基准测试的混合精度浮点运算速度最快;同时,取消数据缩放不会对HPL-AI基准测试的结果精度产生影响;在鲲鹏和昇腾异构平台上,与非优化的HPL-AI基准测试方法相比,本研究提出的优化策略使混合精度浮点运算速度提升了29%左右,为单节点HPL-AI基准测试的进一步优化和部署多节点HPL-AI基准测试奠定了坚实的基础。 展开更多
关键词 鲲鹏 昇腾 异构平台 基准测试 高性能计算 混合精度
在线阅读 下载PDF
新型电力系统标准算例(一):功角稳定CSEE-RAS 被引量:4
20
作者 徐式蕴 李宗翰 +1 位作者 赵兵 孙华东 《中国电机工程学报》 EI CSCD 北大核心 2024年第15期5973-5984,I0011,共13页
含高比例新能源交直流混联电网的稳定特性已发生深刻变化,功角稳定依然是威胁系统安全运行的关键问题,相关研究对标准算例的真实性、合理性及代表性提出更高的要求。该文根据实际电网拓扑和数据,构建适用于功角稳定特性研究的功角稳定... 含高比例新能源交直流混联电网的稳定特性已发生深刻变化,功角稳定依然是威胁系统安全运行的关键问题,相关研究对标准算例的真实性、合理性及代表性提出更高的要求。该文根据实际电网拓扑和数据,构建适用于功角稳定特性研究的功角稳定机电暂态仿真算例(Chinese society for electricalengineering-rotoranglestability,CSEE-RAS),该系统以500kV为主网架,包含2个区域、1个交流通道、1个直流通道。提供2种运行方式,分别对应动态、暂态功角稳定场景,上述场景新能源出力占比均在50%以上。考虑新能源出力占比、机组接入位置和控制策略等因素,量化不同因素对稳定水平的影响。敏感性分析结果表明,该算例较为全面地反映了机电暂态尺度下的不同功角稳定特性,且具有灵活的拓展能力,可为功角稳定分析与控制的相关研究提供基础平台,有助于不同结论的横向比较和研究人员科研效率的提升。 展开更多
关键词 功角稳定 新能源 交直流混联 标准算例
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部