期刊文献+
共找到1,029篇文章
< 1 2 52 >
每页显示 20 50 100
微处理器性能分析与优化:基于SPEC CPU2017的对比研究
1
作者 徐晗 郭振江 肖俊华 《高技术通讯》 北大核心 2025年第3期241-249,共9页
运行标准测试程序是进行微处理器设计空间探索的基本手段。横向对比分析国内外主流处理器在标准测试程序场景下的各项性能指标,有助于识别国产处理器的性能瓶颈,为进一步的性能优化指明方向。本文基于SPEC CPU2017对3款微处理器进行同... 运行标准测试程序是进行微处理器设计空间探索的基本手段。横向对比分析国内外主流处理器在标准测试程序场景下的各项性能指标,有助于识别国产处理器的性能瓶颈,为进一步的性能优化指明方向。本文基于SPEC CPU2017对3款微处理器进行同频性能测试和对比分析,分别是龙芯LA464架构的3A5000微处理器、AMD ZEN1架构的R3-1200以及Intel Skylake架构的i3-9100f。根据测试结果,3A5000定点性能与R3-1200基本相同,比i3-9100f低10%左右;3A5000浮点性能相当于另2款微处理器的70%左右。本文从动态指令数和每周期指令数(instruction per cycle,IPC)2个角度对微处理器进行比较和分析。基于SPEC CPU2017的结果显示,3A5000定点动态指令数和浮点动态指令数分别比另2款微处理器多约10%和25%。在3A5000上使用激进的自动向量化编译优化策略、优化立即数乘法编译效率等手段可以将其性能提升10%左右。3A5000的定点IPC比另外2款微处理器高4%左右,浮点IPC低8%左右。发射宽度、执行单元数量、功能和延迟等微结构参数接近是3款微处理器IPC差别较小的主要原因。 展开更多
关键词 SPEC cpu2017 性能分析 龙芯3A5000 向量化 体系结构
在线阅读 下载PDF
基于CPU-GPU的超音速流场N-S方程数值模拟
2
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
基于云平台CPU与GPU协同处理的光学卫星遥感影像正射融合方法
3
作者 于潇 张一 +2 位作者 吕丽红 张强 王得成 《空间科学学报》 北大核心 2025年第5期1416-1424,共9页
系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号... 系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号卫星多光谱影像进行正射融合的试验,结果表明,该方法可很大程度提高光学卫星遥感影像正射融合效率,与传统X86架构CPU与GPU协同的正射融合算法相比,加速比为14.3倍以上,数据处理时间压缩至8.4 s内,其中GPU运算耗时仅1 s,可满足并优化大数据量的光学卫星遥感影像快速正射融合的要求. 展开更多
关键词 正射融合 国产云平台 cpu和GPU协同处理 数据流配置 存储访问优化
在线阅读 下载PDF
基于CPU-GPU协同的迭代物理光学并行算法研究
4
作者 曹倩 周远国 +1 位作者 任强 王焱 《电波科学学报》 北大核心 2025年第3期427-438,共12页
随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常... 随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常大。为解决该问题,本文引入参数空间技术优化IPO算法,提高了电大尺寸RCS的计算效率,并引入计算统一设备架构(compute unified device architecture,CUDA)技术,在中央处理器(central processing unit,CPU)与图形处理器(graphics processing unit,GPU)协同平台上实现了电大尺寸目标RCS的并行计算。与商业软件FEKO比对,在NVIDIA GeForce RTX 3050显卡上获得了224.35的加速比。实例结果展示了基于CPU-GPU协同的IPO算法并行计算的可行性与高效性,可以用来解决目前只能在高性能计算机或计算机集群上解决的电大尺寸目标散射问题。 展开更多
关键词 迭代物理光学法(IPO) 参数空间技术 cpu-GPU协同 并行加速 雷达散射截面(RCS)
在线阅读 下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:15
5
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 GPU/cpu协同计算 随机速度边界
在线阅读 下载PDF
嵌入式CPU软核综述 被引量:16
6
作者 孙恺 王田苗 +1 位作者 魏洪兴 陈友东 《计算机工程》 CAS CSCD 北大核心 2006年第7期6-9,共4页
随着FPGA和SoPC(SystemonProgrammableChip)技术的迅速发展,基于FPGA的嵌入式系统得到了广泛的研究和应用。该文针对目前比较有影响和特点的4款嵌入式CPU软核Nios/Nios2、MicroBlaze、Leon2/Leon3和OpenRISC1200进行了性能分析和对比,... 随着FPGA和SoPC(SystemonProgrammableChip)技术的迅速发展,基于FPGA的嵌入式系统得到了广泛的研究和应用。该文针对目前比较有影响和特点的4款嵌入式CPU软核Nios/Nios2、MicroBlaze、Leon2/Leon3和OpenRISC1200进行了性能分析和对比,最后分析了各个CPU软核的特点。 展开更多
关键词 嵌入式系统 cpu 软核 FPGA
在线阅读 下载PDF
基于CPU/GPU异构平台的全波形反演及其实用化分析 被引量:12
7
作者 张猛 王华忠 +3 位作者 任浩然 冯波 隋志强 王延光 《石油物探》 EI CSCD 北大核心 2014年第4期461-467,共7页
全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实... 全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实现流程。理论模型测试结果表明,该算法不仅对速度模型具有高精度刻画能力,而且计算效率比基于CPU集群的FWI算法大幅提升。对胜利探区某陆上区块实际地震资料进行全波形速度反演试处理,取得了初步的应用效果。在此基础上,讨论了FWI对实际地震资料质量的要求,就FWI在陆上地震资料的生产性应用提出了相应的策略。 展开更多
关键词 地震反问题 全波形反演 速度估计 cpu GPU异构平台 陆上地震资料
在线阅读 下载PDF
基于PMAC的并行双CPU开放式数控系统 被引量:23
8
作者 王春 温圣 +1 位作者 关慧贞 王永青 《制造技术与机床》 CSCD 北大核心 2001年第3期15-17,共3页
提出了一种以 PMAC运动控制器为控制系统核心、工业控制机为系统支撑单元的双 CPU开放式数控系统。介绍了该系统的功能、硬件和软件设计方法。实践证明,基于 PMAC的数控系统完全可以实现人机接口的定制和实时控制部件的参... 提出了一种以 PMAC运动控制器为控制系统核心、工业控制机为系统支撑单元的双 CPU开放式数控系统。介绍了该系统的功能、硬件和软件设计方法。实践证明,基于 PMAC的数控系统完全可以实现人机接口的定制和实时控制部件的参数化。 展开更多
关键词 PMAC cpu 数控系统 壁板铣床
在线阅读 下载PDF
CPU集成热管散热器试验研究及CFD辅助设计 被引量:6
9
作者 白敏丽 喜娜 +3 位作者 徐哲 李河 孙志君 杨洪武 《大连理工大学学报》 EI CAS CSCD 北大核心 2008年第2期178-184,共7页
为满足未来大功率台式电脑CPU的冷却要求,将平板热管和常规热管散热器结合提出了集成热管散热器的新概念;并用CFD数值模拟来代替试验研究,验证了用STAR-CD软件进行数值模拟的可靠性和可行性,并用数值模拟方法对散热翅片厚度、间距... 为满足未来大功率台式电脑CPU的冷却要求,将平板热管和常规热管散热器结合提出了集成热管散热器的新概念;并用CFD数值模拟来代替试验研究,验证了用STAR-CD软件进行数值模拟的可靠性和可行性,并用数值模拟方法对散热翅片厚度、间距以及气流速度对集成热管散热器的流动与传热特性影响进行了研究.针对未来CPU冷却要求和散热器的设计要求,设计了新结构的集成热管散热器,并进行了试验测试.测试结果表明在气流速度为2.75 m/s下,新结构的集成热管散热器的热阻在0.1-0.2℃/W,在200 W时模拟CPU的表面温度仅为53℃,完全满足了对CPU的冷却要求. 展开更多
关键词 cpu 热管 散热器 传热性能 数值模拟
在线阅读 下载PDF
CPU液体冷却器件及冷却液材料研究进展 被引量:11
10
作者 石育佳 王秀峰 +3 位作者 王彦青 赵童刚 门永 康文杰 《材料导报》 EI CAS CSCD 北大核心 2012年第21期56-60,共5页
综述了目前关于计算机CPU散热的3种液体冷却系统(大器件液冷循环系统、热管冷却系统和液体喷射冷却系统)及所采用的多种冷却液(水、液态金属和纳米流体)的研究进展;比较了3种液冷器件和3种冷却液的优缺点,指出热管冷却系统和纳米流体更... 综述了目前关于计算机CPU散热的3种液体冷却系统(大器件液冷循环系统、热管冷却系统和液体喷射冷却系统)及所采用的多种冷却液(水、液态金属和纳米流体)的研究进展;比较了3种液冷器件和3种冷却液的优缺点,指出热管冷却系统和纳米流体更加具有竞争优势;最后展望了CPU冷却器件和冷却液的发展前景。 展开更多
关键词 cpu散热器 芯片制冷 液体冷却 冷却液
在线阅读 下载PDF
多核CPU环境下的并行遗传算法的研究 被引量:7
11
作者 唐天兵 谢祥宏 +2 位作者 申文杰 韦凌云 严毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期546-550,共5页
多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行。遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设... 多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行。遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设计为适应多核CPU环境的并行计算形式,具有重要的现实意义。将遗传算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,从而对不同规模的TSP问题的求解结果来看,加速比与计算效率随着规模的增大而提高。 展开更多
关键词 多核cpu OPENMP 线程化 遗传算法
在线阅读 下载PDF
基于FPGA的开放式教学CPU的设计与测试系统 被引量:15
12
作者 李山山 汤志忠 周继群 《计算机工程与应用》 CSCD 北大核心 2005年第14期98-100,198,共4页
设计并实现了一个CPU设计与测试实验装置,适合于计算机原理和系统结构课程的综合实验。该实验装置采用EDA工具在FPGA上实现了CPU设计,应用M CU和上位机软件对所设计的CPU进行了监控和调试,保证了CPU在实验系统上能够运行起来。
关键词 cpu设计与测试 FPGA 计算机原理 系统结构 单片机
在线阅读 下载PDF
基于双CPU的电能质量监测系统设计与实现 被引量:18
13
作者 冯红岩 赵双喜 +1 位作者 张建成 李和明 《继电器》 CSCD 北大核心 2006年第7期61-64,共4页
介绍了电能质量监测技术的最新发展趋势,并以其作为出发点构建了基于TI公司32位浮点DSP芯片TMS320VC33和ATm ega128L单片机的双CPU结构电能质量监测装置。实验证明该设计方案不仅成功地满足了系统的高运算量,高实时性的要求,而且系统的... 介绍了电能质量监测技术的最新发展趋势,并以其作为出发点构建了基于TI公司32位浮点DSP芯片TMS320VC33和ATm ega128L单片机的双CPU结构电能质量监测装置。实验证明该设计方案不仅成功地满足了系统的高运算量,高实时性的要求,而且系统的改进和升级方便,易于功能扩展。 展开更多
关键词 电能质量 DSP 单片机 cpu 谐波 闪变
在线阅读 下载PDF
基于国产CPU/OS的信息系统性能测试方案研究 被引量:10
14
作者 熊婧 夏仲平 +1 位作者 林军 杨春晖 《计算机工程》 CAS CSCD 北大核心 2015年第12期82-85,90,共5页
为更准确地评价基于国产CPU/OS的信息系统性能,通过介绍国产基础软/硬件的背景,阐述信息系统性能测试原理及方法,针对商用性能测试工具LoadRunner不能真实反映用户体验时间,无法直接用于基于国产CPU/OS的信息系统的问题,考虑用户体验,... 为更准确地评价基于国产CPU/OS的信息系统性能,通过介绍国产基础软/硬件的背景,阐述信息系统性能测试原理及方法,针对商用性能测试工具LoadRunner不能真实反映用户体验时间,无法直接用于基于国产CPU/OS的信息系统的问题,考虑用户体验,分别提出基于LoadRunner和JMeter的国产信息系统性能测试方案。对2种改进方案进行实验,结果显示,JMeter测试方案的方差比LoadRunner测试方案小70.49%,表明JMeter方案的测试结果比LoadRunner方案更接近用户体验时间。 展开更多
关键词 国产基础软件 国产cpu 国产操作系统 信息系统 性能测试 LoadRunner测试工具 JMeter测试工具
在线阅读 下载PDF
基于PMAC的并行双CPU开放式数控系统的研究与开发 被引量:25
15
作者 孟璇 邢玉生 王春 《组合机床与自动化加工技术》 北大核心 2000年第10期28-30,37,共4页
介绍了基于PMAC的并行双CPU开放式数控系统的硬、软件结构 ,以及系统软件用户化开发的关键技术 ,包括 :CNC应用程序的编写、PLC程序的编写以及应用DLL实现应用程序与PMAC间的通讯等。
关键词 数控系统 PMAC cpu DPRAM通讯 运动控制器
在线阅读 下载PDF
基于CPU卡的大学门禁应用设计实施方案 被引量:11
16
作者 佟秋利 张慧琳 孙国光 《计算机工程与设计》 CSCD 北大核心 2011年第4期1453-1457,1473,共6页
为促进CPU卡在高校范围内的广泛应用,介绍了基于CPU卡的门禁控制原理,在分析了大学门禁应用特点的基础上,设计了一级管理和二级管理相结合的门禁管理方案,解决了多级门禁管理中的数据交换、实时控制和设备监控等问题,并以清华大学CPU卡... 为促进CPU卡在高校范围内的广泛应用,介绍了基于CPU卡的门禁控制原理,在分析了大学门禁应用特点的基础上,设计了一级管理和二级管理相结合的门禁管理方案,解决了多级门禁管理中的数据交换、实时控制和设备监控等问题,并以清华大学CPU卡门禁应用为例,表明了大学门禁升级切换工作中的注意事项,为各高校CPU卡的应用推广提供参考。 展开更多
关键词 校园卡 cpu 多级管理 门禁管理 门禁控制
在线阅读 下载PDF
多租户Web应用的CPU资源动态评估方法 被引量:5
17
作者 王伟 黄翔 +3 位作者 张文博 魏峻 钟华 黄涛 《计算机学报》 EI CSCD 北大核心 2011年第12期2292-2304,共13页
中间件共享是云计算模式中一种重要的资源共享方式.但是,这种方式容易导致宿主在同一中间件服务器上的多个租户间产生性能干扰.因此,需要为租户提供性能隔离的服务实例.在线度量租户对系统资源的使用情况是实现性能隔离的前提条件,但是... 中间件共享是云计算模式中一种重要的资源共享方式.但是,这种方式容易导致宿主在同一中间件服务器上的多个租户间产生性能干扰.因此,需要为租户提供性能隔离的服务实例.在线度量租户对系统资源的使用情况是实现性能隔离的前提条件,但是,在共享中间件服务器中直接度量CPU资源需要注入探针,将引起性能开销,并依赖于操作系统的支持.最近,一些工作利用回归分析进行资源使用情况的间接评估,但仍难以对动态Web系统的时变资源状态进行有效评估.文中针对普遍使用的Java中间件服务器,提出一种基于Kalman滤波的多租户Web应用CPU资源动态评估方法,并通过两个实验案例分析方法的评估效果、影响因素和面临的挑战.实验结果表明,通过适当的参数设置,该方法可动态适应持续变化的负载环境,并且与直接度量方法相比,具有可接受的评估误差.实验还表明该方法可用于检测侵占型租户,并避免共享中间件服务器CPU过载. 展开更多
关键词 cpu资源评估 性能隔离 KALMAN滤波 多租户
在线阅读 下载PDF
可测试性设计技术在一款通用CPU芯片中的应用 被引量:5
18
作者 李华伟 李晓维 +2 位作者 尹志刚 吕涛 何蓉晖 《计算机工程与应用》 CSCD 北大核心 2002年第16期191-194,共4页
可测试性设计(Design-For-Testability,简称DFT)是芯片设计的重要环节,它通过在芯片原始设计中插入各种用于提高芯片可测试性的硬件逻辑,从而使芯片变得容易测试,大幅度节省芯片测试的成本。文中介绍了在一款通用CPU芯片的设计过程中,... 可测试性设计(Design-For-Testability,简称DFT)是芯片设计的重要环节,它通过在芯片原始设计中插入各种用于提高芯片可测试性的硬件逻辑,从而使芯片变得容易测试,大幅度节省芯片测试的成本。文中介绍了在一款通用CPU芯片的设计过程中,为提高芯片的易测性而采取的各种可测试性设计技术,主要包括扫描设计(ScanDesign)、存储器内建自测试(Build-in-self-test,简称BIST)以及与IEEE1149.1标准兼容的边界扫描设计(BoundaryScanDesign,简称BSD)等技术。这些技术的使用为该芯片提供了方便可靠的测试方案。 展开更多
关键词 可测试性设计 cpu芯片 扫描设计 TEEE1149.1标准
在线阅读 下载PDF
一种CPU芯片硬件验证调试平台的设计与实现 被引量:11
19
作者 李文 王恒才 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2003年第6期884-888,共5页
给出了CPU芯片硬件验证调试平台的一种具体设计方案 该验证调试平台在设计方法上采用了程序性在线测试方法 该平台构建了CPU芯片的运行环境 ,能够控制CPU芯片输入脉冲单拍 /多拍或连续运行 ,并且在CPU芯片的运行过程中可以监测CPU芯片... 给出了CPU芯片硬件验证调试平台的一种具体设计方案 该验证调试平台在设计方法上采用了程序性在线测试方法 该平台构建了CPU芯片的运行环境 ,能够控制CPU芯片输入脉冲单拍 /多拍或连续运行 ,并且在CPU芯片的运行过程中可以监测CPU芯片内部寄存器的内容 该平台的实现不仅有益于CPU芯片的设计和调试 。 展开更多
关键词 cpu芯片 激励测试 边界扫描测试 程序性测试 FPGA
在线阅读 下载PDF
多CPU结构综合保护装置内部通信的实现 被引量:6
20
作者 张楠 黄益庄 +1 位作者 唐晓泉 李璇华 《电力自动化设备》 EI CSCD 北大核心 2001年第11期40-43,共4页
多CPU形式的硬件结构被广泛采用于新型综合保护装置中 ,其主要问题是如何简单、可靠地实现装置内部模块之间的数据传递。介绍了综合微机保护装置TH2 1 4采用当前流行的MOD BUS通信协议实现装置内部通信的方法。该方法在保留MODBUS协议... 多CPU形式的硬件结构被广泛采用于新型综合保护装置中 ,其主要问题是如何简单、可靠地实现装置内部模块之间的数据传递。介绍了综合微机保护装置TH2 1 4采用当前流行的MOD BUS通信协议实现装置内部通信的方法。该方法在保留MODBUS协议可靠性的同时 ,根据保护装置数据类型和数据传递特点 ,对其报文格式和通信方式加以简化和改进 ,使通信过程和调试方法简单易行 ,且经过简单改进和扩展就可应用到绝大多数综合自动化设备中 ,具有很好的实用价值。 展开更多
关键词 电力系统 微机保护 cpu 综合保护装置 通信
在线阅读 下载PDF
上一页 1 2 52 下一页 到第
使用帮助 返回顶部