期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
上海交通大学高性能计算建设的理念与实践 被引量:11
1
作者 林新华 顾一众 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第B03期298-303,共6页
上海交通大学的高性能计算经历了"合久必分、分久必合"的10年后,于2012年初成立了校级高性能计算中心,为全校提供高性能计算的公共服务.本文着重介绍了该中心在建设过程中,应对4个挑战时所秉承的理念与实践情况,分别是:1)基... 上海交通大学的高性能计算经历了"合久必分、分久必合"的10年后,于2012年初成立了校级高性能计算中心,为全校提供高性能计算的公共服务.本文着重介绍了该中心在建设过程中,应对4个挑战时所秉承的理念与实践情况,分别是:1)基于异构计算,设计并建成了国内高校最快的超级计算机π;2)在国内率先提出开放运维的理念,采用类似美国能源部INCITE项目的方式分配机时资源,并在网上公开超级计算机π的实时利用率等信息;3)关注学生教育,注重兴趣培养,以研究促教学;4)与国外一流大学开展长期合作,提升国际影响. 展开更多
关键词 高性能计算 超级计算机 异构计算
在线阅读 下载PDF
高校计算中心建设的前景
2
作者 顾一众 王丽霞 《实验室研究与探索》 CAS 1996年第3期93-95,共3页
高校计算中心建设的前景上海交通大学计算中心顾一众,王丽霞“211工程”的实施,给我国高等教育的发展提出了新的要求,也使各高校的改革与发展面临了新的挑战和机遇。在力争进入“211工程”的高校中,一般都将教育基础工程建设... 高校计算中心建设的前景上海交通大学计算中心顾一众,王丽霞“211工程”的实施,给我国高等教育的发展提出了新的要求,也使各高校的改革与发展面临了新的挑战和机遇。在力争进入“211工程”的高校中,一般都将教育基础工程建设作为“211工程”建设的子项目,高... 展开更多
关键词 高校 计算中心建设 高等教育
在线阅读 下载PDF
汽车碰撞有限元仿真的并行计算及其性能研究 被引量:19
3
作者 亓文果 金先龙 +2 位作者 张晓云 李渊印 李根国 《系统仿真学报》 EI CAS CSCD 2004年第11期2428-2431,共4页
并行计算是提高汽车碰撞有限元仿真的计算速度和求解能力的有效途径。文章简要介绍了汽车碰撞有限元仿真并行计算的区域分解方法,给出了处理接触时的并行计算流程,分析了并行求解过程以及主要时间开销。在此基础上,研究了两种硬件体系... 并行计算是提高汽车碰撞有限元仿真的计算速度和求解能力的有效途径。文章简要介绍了汽车碰撞有限元仿真并行计算的区域分解方法,给出了处理接触时的并行计算流程,分析了并行求解过程以及主要时间开销。在此基础上,研究了两种硬件体系结构和不同处理器数目对计算效率的影响。最后研究了不同的区域分解策略对整车碰撞计算效率的影响。研究结果对最终用户选择合适的硬件平台和计算软件具有指导意义。 展开更多
关键词 并行计算 碰撞 有限元仿真 区域分解
在线阅读 下载PDF
处理器性能波动检测的计时方法及评价指标
4
作者 廖秋承 左思成 +1 位作者 王一超 林新华 《计算机学报》 EI CSCD 北大核心 2024年第2期456-472,共17页
超级计算机中的性能波动通常表现为软件在同一硬件上运行得忽快忽慢,或在配置相同的硬件上运行得快慢不一.在多种性能波动来源中,处理器性能波动隐蔽性强且危害巨大,可导致超级计算机整机性能急剧下降.然而,当前处理器性能波动研究面临... 超级计算机中的性能波动通常表现为软件在同一硬件上运行得忽快忽慢,或在配置相同的硬件上运行得快慢不一.在多种性能波动来源中,处理器性能波动隐蔽性强且危害巨大,可导致超级计算机整机性能急剧下降.然而,当前处理器性能波动研究面临两大难题.首先,现有工具难以检测微小的性能波动.为了准确检测纳秒级的处理器性能波动,计时方法需要具有很高的精度和灵敏度.然而,现有工具在真实应用中用于计时测量时,计时结果波动可达数万拍,难以检测处理器性能波动.其次,现有方法难以客观评价不同工具的性能波动检测能力,缺乏量化评价指标.一次性能波动检测包含大量计时结果,其分布可能受性能波动和计时波动的共同影响.然而,现有方法无法评价这些测量结果是否真实反映了性能波动的特征.为解决第一个问题,本文对PAPI在不同缓存状态下的计时波动进行了测量和原因分析.随后,基于x86和Armv8指令集的内存屏障和序列化指令,设计了序列化屏障计时方法,用以抑制计时波动.为解决第二个问题,本研究对计时波动进行建模,首次提出了跨平台的计时方法精度和灵敏度指标及评价方法,定量评估了计时方法对微小时间波动的测量能力,为性能波动的检测和判定提供了依据.实验表明,在英特尔Xeon 6248和华为鲲鹏920-6426处理器上,与PAPI相比,序列化屏障计时方法的精度提高了2.2~30.2倍,灵敏度提高了1.9~44.8倍,并且能够检测到纳秒级别的性能波动. 展开更多
关键词 高性能计算 处理器微架构 性能波动 性能分析 性能评测
在线阅读 下载PDF
冲击-接触问题有限元仿真的并行计算 被引量:25
5
作者 亓文果 金先龙 张晓云 《振动与冲击》 EI CSCD 北大核心 2006年第4期68-72,共5页
冲击-接触问题广泛存在于汽车碰撞等的模拟计算中。简单介绍了求解该类问题的显式有限元方法,对显式有限元方法的并行性进行了讨论。根据显式有限元和冲击-接触问题的计算特点,设计并实现了接触均衡的分区算法。算例计算结果表明:该并... 冲击-接触问题广泛存在于汽车碰撞等的模拟计算中。简单介绍了求解该类问题的显式有限元方法,对显式有限元方法的并行性进行了讨论。根据显式有限元和冲击-接触问题的计算特点,设计并实现了接触均衡的分区算法。算例计算结果表明:该并行算法具有较好的加速比和并行效率。 展开更多
关键词 冲击-接触 有限元 并行计算 区域分割
在线阅读 下载PDF
基于并行计算的盾构机刀盘三维切削仿真 被引量:5
6
作者 丁峻宏 金先龙 +2 位作者 李根国 吴建成 杨洪杰 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第23期5376-5379,5396,共5页
针对盾构机工作时刀盘切削土体的数值仿真,建立了细致分析模型,并利用任意拉格朗日欧拉(ALE)和流固耦合(FSI)理论及方法来解决传统有限元方法进行切削仿真时易引发的网格大变形问题;在国产曙光4000A超级计算机上利用LS-DYNA MPP 970完... 针对盾构机工作时刀盘切削土体的数值仿真,建立了细致分析模型,并利用任意拉格朗日欧拉(ALE)和流固耦合(FSI)理论及方法来解决传统有限元方法进行切削仿真时易引发的网格大变形问题;在国产曙光4000A超级计算机上利用LS-DYNA MPP 970完成了并行计算,采用了传统递归坐标对分、以及根据仿真模型特点提出的基于耦合均衡坐标对分等两种区域分解策略。结果表明,ALE-FSI方法能有效处理刀盘切割土体仿真时的网格大变形,仿真数据与试验数据对比也比较一致;通过促进负载均衡,在计算时CBCB法比RCB法体现出了更好的加速比和并行效率。 展开更多
关键词 盾构机 刀盘 大变形 流固耦合 并行计算 区域分解
在线阅读 下载PDF
流体-结构耦合问题的有限元并行计算研究 被引量:8
7
作者 李政 金先龙 亓文果 《计算力学学报》 EI CAS CSCD 北大核心 2007年第6期727-732,共6页
流体-结构耦合问题广泛存在于各种工程领域,本文采用ALE显式有限元法求解该类问题,并对该方法的并行性进行讨论。同时根据流体-结构耦合问题与ALE显式有限元的计算特点,在坐标递归分区方法的基础上设计并程序实现了基于流体-结构耦合均... 流体-结构耦合问题广泛存在于各种工程领域,本文采用ALE显式有限元法求解该类问题,并对该方法的并行性进行讨论。同时根据流体-结构耦合问题与ALE显式有限元的计算特点,在坐标递归分区方法的基础上设计并程序实现了基于流体-结构耦合均衡的分区算法。通过与坐标递归分区方法的计算结果相比较,对于流体-结构耦合问题的求解,耦合均衡并行分区方法具有更好的加速比和并行效率。 展开更多
关键词 流体-结构耦合 ALE有限元 显式计算 并行计算 区域分解
在线阅读 下载PDF
基于并行计算的盾构机过大堤三维数值模拟 被引量:7
8
作者 沈建奇 金先龙 王吉云 《上海交通大学学报》 EI CAS CSCD 北大核心 2008年第8期1296-1300,共5页
针对某越江隧道工程,基于刚度迁移法及自适应接触算法,建立了盾构机-土体-大堤三者相互作用的三维非线性有限元模型.通过对盾构机穿越大堤这一连续的复杂物理力学过程作等效力学离散,提出了盾构机机身坡度、盾构机超挖、注浆时空效应、... 针对某越江隧道工程,基于刚度迁移法及自适应接触算法,建立了盾构机-土体-大堤三者相互作用的三维非线性有限元模型.通过对盾构机穿越大堤这一连续的复杂物理力学过程作等效力学离散,提出了盾构机机身坡度、盾构机超挖、注浆时空效应、拖车作用等施工因素的数值模拟方法.通过将计算结果与试验段实测数据对比验证,预测了盾构机过大堤时对大堤的影响关系.同时,对该盾构法施工有限元模型在SMP与DMP并行计算平台下的并行计算效率、加速比进行对比分析,结果表明,迭代法并行计算效率远大于直接解法,DMP并行平台计算效率大于SMP并行平台. 展开更多
关键词 盾构 数值模拟 刚度迁移法 自适应接触 并行计算
在线阅读 下载PDF
爆炸流场与玻璃幕墙动力响应的仿真计算方法 被引量:11
9
作者 邓荣兵 金先龙 陈峻 《振动与冲击》 EI CSCD 北大核心 2011年第3期14-17,29,共5页
采用ALE有限元法进行了爆炸流场与复杂玻璃幕墙结构相互作用的三维动态仿真。针对数值仿真过程中计算效率过低的问题,根据显式有限元和距离爆炸冲击波试验问题的计算特点,利用高性能计算平台设计并实现了爆炸冲击波与玻璃幕墙动力响应... 采用ALE有限元法进行了爆炸流场与复杂玻璃幕墙结构相互作用的三维动态仿真。针对数值仿真过程中计算效率过低的问题,根据显式有限元和距离爆炸冲击波试验问题的计算特点,利用高性能计算平台设计并实现了爆炸冲击波与玻璃幕墙动力响应的分步流固耦合仿真计算方法。研究了爆炸冲击波作用下幕墙玻璃的动力响应情况,通过与试验结果相比较,证实了该仿真方法的可行性,为玻璃幕墙结构的抗爆设计与改进提供了参考依据。 展开更多
关键词 有限元法 流固耦合 爆炸 玻璃幕墙
在线阅读 下载PDF
整车-乘员集成系统正面碰撞的计算机仿真 被引量:6
10
作者 孙奕 金先龙 +1 位作者 张晓云 亓文果 《系统仿真学报》 CAS CSCD 2004年第9期2040-2043,共4页
某型国产小客车为对象建立了整车有限元模型,然后在此基础上集成了包括50百分位的HybridⅢ型假人,安全带和安全气囊系统的完整的乘员约束系统的有限元模型。按国家标准《正面碰撞乘员保护的设计规则》(CMVDR294)规定的试验条件,对整个... 某型国产小客车为对象建立了整车有限元模型,然后在此基础上集成了包括50百分位的HybridⅢ型假人,安全带和安全气囊系统的完整的乘员约束系统的有限元模型。按国家标准《正面碰撞乘员保护的设计规则》(CMVDR294)规定的试验条件,对整个集成系统进行了正面碰撞的数值模拟。仿真结果与试验结果吻合。之后本文对不同约束情况下的乘员安全性做出了比较与评价。 展开更多
关键词 乘员约束系统 汽车碰撞 计算机仿真 汽车被动安全
在线阅读 下载PDF
基于仿真计算的汽车发动机罩改进设计研究 被引量:5
11
作者 张晓云 金先龙 +1 位作者 孙奕 亓文果 《系统仿真学报》 CAS CSCD 2003年第11期1600-1602,1650,共4页
利用有限元方法对某车型在50km/h的速度下正面碰撞刚性墙的过程进行计算机仿真,结果发现发动机罩铰链发生断裂失效,试验结果与仿真结果一致,发动机罩铰链断裂将严重影响到驾驶员及乘员的安全,另一方面也降低了发动机罩变形吸能的能力。... 利用有限元方法对某车型在50km/h的速度下正面碰撞刚性墙的过程进行计算机仿真,结果发现发动机罩铰链发生断裂失效,试验结果与仿真结果一致,发动机罩铰链断裂将严重影响到驾驶员及乘员的安全,另一方面也降低了发动机罩变形吸能的能力。根据仿真计算结果,对发动机罩及铰链进行结构和材料两方面的改进设计,从而保证铰链在整车碰撞过程中不再发生断裂,同时也改善了发动机罩的变形吸能模式,进而有效地增强了车身的安全性能。 展开更多
关键词 碰撞安全性 发动机罩 有限元方法 仿真
在线阅读 下载PDF
基于并行计算的大跨度斜拉桥行车安全分析 被引量:4
12
作者 杜新光 金先龙 陈向东 《振动与冲击》 EI CSCD 北大核心 2010年第7期5-8,78,共5页
采用有限元分析方法对轻轨车辆在大跨度双层斜拉桥上的行车安全进行了评估。建立了斜拉桥与轻轨车辆耦合振动的精细三维有限元模型,其中桥梁模型包括主塔、过渡墩、辅助墩、支撑桩、土体、斜拉索以及桥面系统等;轻轨车辆模型包括车体、... 采用有限元分析方法对轻轨车辆在大跨度双层斜拉桥上的行车安全进行了评估。建立了斜拉桥与轻轨车辆耦合振动的精细三维有限元模型,其中桥梁模型包括主塔、过渡墩、辅助墩、支撑桩、土体、斜拉索以及桥面系统等;轻轨车辆模型包括车体、转向架、轮对及弹簧阻尼系统等,整体有限元模型的单元与节点数均超过百万。设计了基于接触均衡的并行分区算法,在上海超级计算中心的曙光4000A上完成了仿真计算,解决了模型庞大带来的求解困难。求得了轻轨车辆在大跨度斜拉桥上运行的轮轨横向和垂向接触力,通过计算最高车速下单车匀速、双线汇车两种工况的轮重减载率及脱轨系数,分析了桥梁的行车安全,结果为斜拉桥的安全设计提供了参考依据。 展开更多
关键词 大跨度斜拉桥 行车安全 并行计算 仿真分析
在线阅读 下载PDF
空间多点地震动模拟的并行计算方法及软件 被引量:3
13
作者 李丽君 金先龙 《系统仿真学报》 EI CAS CSCD 北大核心 2005年第5期1068-1071,共4页
在已有的空间相关多点地震动人工模拟方法的基础上,针对整个模拟过程提出对计算量大的部分进行并行计算,并采用Fortran90与MPI语言开发了多点地震动的并行模拟程序,能够有效提高多点地震动模拟的规模与效率;同时,通过对商业性前后处理... 在已有的空间相关多点地震动人工模拟方法的基础上,针对整个模拟过程提出对计算量大的部分进行并行计算,并采用Fortran90与MPI语言开发了多点地震动的并行模拟程序,能够有效提高多点地震动模拟的规模与效率;同时,通过对商业性前后处理有限元软件的二次开发,将多点地震动并行模拟程序作为模块嵌入原软件,使用户能够通过可视化界面方便快捷地应用人造地震动,使人造地震动与结构地震响应分析成为一个完整的流程。 展开更多
关键词 地震动 非平稳 并行 数据分布 加速比
在线阅读 下载PDF
德语词类计算机自动识别 被引量:1
14
作者 谢金宝 孙介铭 王践 《上海交通大学学报》 EI CAS CSCD 北大核心 1989年第1期70-76,共7页
词类识别是自然语言理解和分析的基础。本文应用SNOBOL 模式和模式匹配理论,根据德语词形的屈折变化,研究并实验了德语词类计算机识别的可能性.设计软件的识别正确率超过95%.
关键词 计算机应用 自动识别 德语词类
在线阅读 下载PDF
一个计算机动画系统 被引量:3
15
作者 蒋思杰 《上海交通大学学报》 EI CAS CSCD 北大核心 1992年第4期101-104,共4页
计算机动画可以在屏幕上准确而生动地模拟种种随时间变化的系统过程和物理现象.随着计算机软硬件技术的发展,尤其是 RISC 技术的视频显示的利用与控制的专用芯片的出现.使得计算机动画的技术水平突飞猛进.本文讨论的问题是在普通的
关键词 计算机动画 动画系统 三维
在线阅读 下载PDF
并行计时偏差评测指标及工具
16
作者 廖秋承 周洋 林新华 《计算机科学》 北大核心 2025年第5期41-49,共9页
在并行计算程序中插桩计时,是多核处理器中常用的性能测量和分析手段。然而,高精度并行计时的准确性受到计时方法、硬件配置和运行时环境等影响,测量结果不稳定,性能分析结论难以复现。近年来,高性能多核处理器的核心数量不断攀升,给多... 在并行计算程序中插桩计时,是多核处理器中常用的性能测量和分析手段。然而,高精度并行计时的准确性受到计时方法、硬件配置和运行时环境等影响,测量结果不稳定,性能分析结论难以复现。近年来,高性能多核处理器的核心数量不断攀升,给多核心并行计时的准确性带来了更大挑战。目前,在真实计算程序中,高精度并行计时技术面临两大问题:1)无法定量比较不同计时函数的准确性;2)无法定量分析多种因素影响下微秒、毫秒级并行计时分布的偏差幅度。针对上述问题,首先设计了用于定量评测计时结果统计学分布偏差的指标,并开发了支持X86和Armv8指令集的多核心计时结果偏差评测工具ParTES。ParTES可以模拟真实计算场景的缓存特征和计时间隔,定量评测不同计时函数的测量偏差。其次,在鲲鹏、飞腾和海光高性能处理器上开展了微秒和毫秒级并行计时稳定性量化分析。实验结果表明,计时方法、缓存命中率、计时函数邻近指令和服务器硬件配置等因素,均会对并行计时结果的准确性产生影响。在鲲鹏、飞腾和海光处理器上,计时结果偏差最小且偏差幅度变化最稳定的计时方法分别是PAPI的计时函数、POSIX的clock_gettime计时函数和C86指令集汇编计时指令RDTSC。 展开更多
关键词 高性能计算 并行计算 性能评测 性能分析 误差分析
在线阅读 下载PDF
基于Web的交通事故远程仿真系统
17
作者 喻学兵 金先龙 +1 位作者 申杰 张晓云 《上海交通大学学报》 EI CAS CSCD 北大核心 2006年第11期1864-1868,共5页
结合开发交通事故防范的数字化公共平台,根据基于Web的交通事故模拟分析系统的技术特征,设计了基于Web的交通事故模拟分析系统的框架.基于商业软件,提出适用于模拟法的交通事故场景自动生成技术,并初步建立了包括车辆、人体在内的全三... 结合开发交通事故防范的数字化公共平台,根据基于Web的交通事故模拟分析系统的技术特征,设计了基于Web的交通事故模拟分析系统的框架.基于商业软件,提出适用于模拟法的交通事故场景自动生成技术,并初步建立了包括车辆、人体在内的全三维参数化仿真模型数据库.通过实现远程交通事故模拟与分析,为交通事故的快速分析和处理提供有力的支持. 展开更多
关键词 交通事故模拟 参数化仿真模型 远程计算 资源共享
在线阅读 下载PDF
基于数据分布一致性的处理器硬件性能计数器复用估计方法 被引量:6
18
作者 林新华 王杰 +1 位作者 王一超 左思成 《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1192-1201,共10页
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,M... 同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%. 展开更多
关键词 处理器硬件性能计数器 复用技术 性能分析 高性能计算 估计方法
在线阅读 下载PDF
VLPL-S在Knights Landing上的优化与性能评估
19
作者 丁丹迪 文敏华 +2 位作者 周姗 陈民 林新华 《计算机科学与探索》 CSCD 北大核心 2018年第2期241-251,共11页
VLPL-S代码是基于Particle-in-Cell(PIC)算法开发的激光等离子体模拟程序,PIC算法是激光等离子模拟领域的常用主流算法之一。讲述了VLPL-S代码在Intel?新推出的Knights Landing平台上的早期移植及优化工作。通过采用在代码优化中常用的... VLPL-S代码是基于Particle-in-Cell(PIC)算法开发的激光等离子体模拟程序,PIC算法是激光等离子模拟领域的常用主流算法之一。讲述了VLPL-S代码在Intel?新推出的Knights Landing平台上的早期移植及优化工作。通过采用在代码优化中常用的优化方法,例如访存优化、多线程优化、向量化,为VLPL-S代码实现了1.68倍的加速比。对于优化以后的VLPL-S代码,其在Knights Landing 7210P单节点上的性能是其在双路Xeon E5-2697v4节点上性能的1.53倍。还对比了不同优化方法在Knights Landing及Xeon平台上所获得的性能提升。结果表明,对于VLPL-S代码,以往CPU代码优化工作中常用的优化方法在新的Knights Landing平台中同样有效。 展开更多
关键词 激光等离子体模拟 PARTICLE-IN-CELL Knights LANDING
在线阅读 下载PDF
使用GTC-P应用评估曙光E级原型机的性能 被引量:1
20
作者 王一超 胡航 +2 位作者 William Tang 王蓓 林新华 《计算机工程与科学》 CSCD 北大核心 2020年第1期1-7,共7页
曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,... 曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,对比了GTC-P在海光CPU和DCU与Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型机的多结点上进行了扩展性分析。性能评估工作反映了高性能计算应用在曙光E级原型机上的实际运行性能。 展开更多
关键词 曙光E级原型机 性能评测 质点网格法 ROCm HIP模型
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部