期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
地震叠前逆时偏移算法的CPU/GPU实施对策 被引量:83
1
作者 李博 刘红伟 +4 位作者 刘国峰 佟小龙 刘洪 郭建 裴江云 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2938-2943,共6页
相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O... 相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O(输入/输出)量却是最大的.针对此问题,本文在分析现行逆时偏移的多种算法基础上,提出利用CPU/GPU(中央处理器/图形处理器)作为数值计算核心,建立随机边界模型,从而克服存储I/O难题和提高计算效率.在实际的数据测试中,本文的方法可以大幅度的提高计算效率和减少存储单元,从而促使其高效地应用于生产实际. 展开更多
关键词 逆时偏移 波动方程 随机边界 中央处理器 图形处理器
在线阅读 下载PDF
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 被引量:3
2
作者 王维平 余文广 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第11期2366-2373,共8页
多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CP... 多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 负载均衡
在线阅读 下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:4
3
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
在线阅读 下载PDF
独立翅片式液体自循环CPU散热器 被引量:2
4
作者 马国远 刘思光 彭珑 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第11期1203-1206,共4页
通过试验,分析了一种独立翅片式液体自循环CPU散热器分别使用不同工质时的散热性能以及充灌率等因素对其散热性能的影响,结果表明,该散热器具有良好的散热性能,CPU表面温度平稳,不出现大幅波动,在R123、R11、R113这3种载热介质中,R123... 通过试验,分析了一种独立翅片式液体自循环CPU散热器分别使用不同工质时的散热性能以及充灌率等因素对其散热性能的影响,结果表明,该散热器具有良好的散热性能,CPU表面温度平稳,不出现大幅波动,在R123、R11、R113这3种载热介质中,R123的散热性能最好且最佳充液率为80%~100%。 展开更多
关键词 散热器 液体自循环冷却 计算机中央处理器(cpu)
在线阅读 下载PDF
基于VHDL之CPU设计与实践 被引量:13
5
作者 徐爱萍 张玉萍 涂国庆 《实验室研究与探索》 CAS 北大核心 2014年第5期120-124,共5页
随着大规模可编程逻辑器件的发展,EDA技术已成为硬件系统电路设计的重要手段。基于EDA技术的计算机组成原理整机实习通常在Quartus II仿真平台上实现。早期均采用Block Diagram的设计方式,虽然设计过程直观,但仿真调试困难,难以完全调... 随着大规模可编程逻辑器件的发展,EDA技术已成为硬件系统电路设计的重要手段。基于EDA技术的计算机组成原理整机实习通常在Quartus II仿真平台上实现。早期均采用Block Diagram的设计方式,虽然设计过程直观,但仿真调试困难,难以完全调试成功。本文研究了基于VHDL的灵活方便的CPU设计过程,该设计由取指、指令译码、指令执行、存储器接口、通用寄存器组和寄存器输出六个组成部分,最后通过调试软件直接观察寄存器的值来验证了设计的准确性。本研究方法对改革该课程的整机实习,发挥学生的主动能动性,提高学生的自主创造能力具有很好的指导意义和实际参考价值。 展开更多
关键词 计算机组成原理 cpu设计 整机实习 VHDL
在线阅读 下载PDF
多核CPU和GPU加速分子动力学模拟 被引量:6
6
作者 林江宏 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了... 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。 展开更多
关键词 分子动力学 图形处理器 多核中央处理器 AMBER力场 计算统一设备架构 OPENMP
在线阅读 下载PDF
高性能CPU电源Droop检测优化设计实现 被引量:1
7
作者 杨丽琼 章隆兵 +1 位作者 肖俊华 王剑 《高技术通讯》 CAS 2022年第9期894-902,共9页
高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本... 高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本文提出了一种基于全数字快速高精度Droop Sensor的供电监测优化方法。该方法采用易于集成于处理器核数字域内的单数字供电Droop Sensor进行本地供电实时监测。当Droop Sensor检测到电压快速垂降时,实时指导所在处理器核的时钟域进行时钟降频,帮助处理器度过低压危险时期,待垂降结束后再恢复正常的时钟频率。实现了局部压降的针对性时钟优化,避免了整体功耗性能损失。本文采用12 nm数字工艺实现了Droop Sensor设计。仿真结果表明,该传感器可在100 ps内进行一阶Droop的快速响应,帮助CPU度过瞬间大幅度的压降期;高阶Droop响应的阈值调节精度可达3%,支持CPU的供电水平多阈值控制。 展开更多
关键词 高性能中央处理器(cpu) 供电检测 Droop Sensor
在线阅读 下载PDF
基于嵌入式CPU-GPU的高清鱼眼视频实时校正系统 被引量:4
8
作者 公维理 《计算机工程与应用》 CSCD 北大核心 2016年第14期172-179,201,共9页
在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问... 在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问题,提出了基于嵌入式平台STi H418的CPU-GPU高速通信协议和基于可编程着色器的嵌入式CPU-GPU内存共享方法,并利用GPU的纹理映射技术实现了全景高清鱼眼视频实时校正系统。实验结果表明,与相关校正系统相比,该系统很好地兼顾到算法效率、图像校正效果和完整性,可以完全满足360°×180°的全景高清(400万像素,2 048×2 048p30)鱼眼视频实时监控,而且与使用PC服务器相比嵌入式系统降低了系统整体成本,ARM CPU软件生成更新校正算法和可事时实时和事后的虚拟PTZ提高系统灵活性和稳定性,因此该系统具有很高的实用价值。 展开更多
关键词 全景高清鱼眼视频实时校正 嵌入式中央处理器-图形处理器(cpu-GPU) 线性等距球面透视投影 纹理映射
在线阅读 下载PDF
基于负载均衡的CPU-GPU异构计算平台任务调度策略 被引量:5
9
作者 方娟 章佳兴 《北京工业大学学报》 CAS CSCD 北大核心 2020年第7期782-787,共6页
针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计... 针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计算能力,将计算任务按照探测比例分配给CPU和GPU;将并行任务存入双向队列,以降低调度带来的额外开销.结果表明,使用该策略的基准测试程序系统性能平均提升了28.07%.总体而言,该调度策略能够缩短CPU与GPU完成各自计算任务后的等待时间,有效平衡系统CPU与GPU之间的负载,提升系统性能. 展开更多
关键词 中央处理单元-图形处理单元(central processing unit-graphics processing unit cpu-GPU) 异构计算 高性能计算 任务调度 负载均衡 负载感知
在线阅读 下载PDF
基于多核CPU的脑网络拓扑属性并行分析方法
10
作者 杨灿 郭浩 陈俊杰 《计算机工程与设计》 北大核心 2016年第12期3400-3404,共5页
针对脑网络研究中需计算的网络数目过多造成执行时间过长的问题,提出一种基于多核CPU(central processing unit)的并行计算方法。通过SPMD(single program multiple data)机制利用CPU的多核同时执行,实现并行计算多个网络的属性,利用循... 针对脑网络研究中需计算的网络数目过多造成执行时间过长的问题,提出一种基于多核CPU(central processing unit)的并行计算方法。通过SPMD(single program multiple data)机制利用CPU的多核同时执行,实现并行计算多个网络的属性,利用循环打包方法降低SPMD机制中循环控制的时间,得到并行计算多个网络指标的时间,同串行计算时间相比,可得到此方法的并行计算效果。与传统并行单个算法的策略相比,该方法利用不同脑网络之间计算的独立性,采取同时计算多个网络的策略。在一台多核CPU的主机上,分析CPU核数、网络节点规模这两个因素对网络指标计算并行效果影响。在利用12个CPU核并行计算网络节点规模为3000的指标时,加速比均达到2以上,其中效果最好的是网络同配系数的计算,加速比达到6倍以上。实验结果表明,基于SPMD机制和循环打包方法的并行计算架构对脑网络指标计算的并行效果显著,加速比随着CPU核数、网络节点规模的增长呈上升趋势。 展开更多
关键词 功能脑网络 拓扑属性 并行计算 多核中央处理器 单程序多数据机制
在线阅读 下载PDF
一种新型的CPU故障检测方法及其应用
11
作者 王明文 喻强 《南京邮电大学学报(自然科学版)》 北大核心 1989年第2期98-103,共6页
本文根据国产新型单路数字新闻传真系统的特点,采用一种新颖而有效的 CPU 故障诊断算法.此方法的故障覆盖率较高,在程序运行后,得到令人满意的效果.
关键词 故障检测 故障诊断 汇编程序 中央处理机
在线阅读 下载PDF
基于数据-模型混合驱动的电力系统机电暂态快速仿真方法 被引量:4
12
作者 王鑫 杨珂 +3 位作者 黄文琦 马云飞 耿光超 江全元 《中国电机工程学报》 EI CSCD 北大核心 2024年第8期2955-2964,I0002,共11页
数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-T... 数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-TDS)算法。算法中发电机状态变量与节点注入电流通过数据驱动模型推理计算,并通过网络方程完成节点电压计算,两者交替求解完成仿真。算法提出一种混合驱动范式下的网络代数方程组预处理方法,用以改善仿真的收敛性;算法设计一种中央处理器单元-神经网络处理器单元(central processing unit-neural network processing unit,CPU-NPU)异构计算框架以加速仿真,CPU进行机理模型的微分代数方程求解;NPU作协处理器完成数据驱动模型的前向推理。最后在IEEE-39和Polish-2383系统中将部分或全部发电机替换为数据驱动模型进行验证,仿真结果表明,所提出的仿真算法收敛性好,计算速度快,结果准确。 展开更多
关键词 机电暂态 时域仿真 数据-模型混合驱动 收敛性 cpu-NPU异构运算
在线阅读 下载PDF
大规模光伏储能系统组件级建模与细粒度仿真方法
13
作者 刘腾飞 赵浩然 +3 位作者 江艺宝 黄伟煌 冯俊杰 杨双飞 《广东电力》 北大核心 2024年第12期39-49,共11页
光储系统详细模型可完整反映系统的阻抗特性,但会大大增加电磁暂态仿真的规模。并行求解是提高仿真效率的重要方法,但需要设计符合高性能硬件架构的并行算法,以充分发挥其资源优势。为此,基于受控源解耦法与一步延迟解耦提出一种光储系... 光储系统详细模型可完整反映系统的阻抗特性,但会大大增加电磁暂态仿真的规模。并行求解是提高仿真效率的重要方法,但需要设计符合高性能硬件架构的并行算法,以充分发挥其资源优势。为此,基于受控源解耦法与一步延迟解耦提出一种光储系统细粒度分网仿真方案,实现光储系统的高效求解。同时,利用中央处理器(central processing unit,CPU)多线程优势并行求解解耦模型,大幅提高大规模光储系统的求解速度。将所提方法与在Simulink/MATLAB中搭建的详细模型进行比较,仿真结果表明该方法能够高效、准确仿真大型光储系统的电磁暂态特性。 展开更多
关键词 大规模光储系统 电磁暂态仿真 细粒度分网 精细化建模 中央处理器
在线阅读 下载PDF
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
14
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 OPENMP 临界区
在线阅读 下载PDF
A new approach for real time object detection and tracking on high resolution and multi-camera surveillance videos using GPU 被引量:4
15
作者 Mohammad Farukh Hashmi Ritu Pal +1 位作者 Rajat Saxena Avinash G.Keskar 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第1期130-144,共15页
High resolution cameras and multi camera systems are being used in areas of video surveillance like security of public places, traffic monitoring, and military and satellite imaging. This leads to a demand for computa... High resolution cameras and multi camera systems are being used in areas of video surveillance like security of public places, traffic monitoring, and military and satellite imaging. This leads to a demand for computational algorithms for real time processing of high resolution videos. Motion detection and background separation play a vital role in capturing the object of interest in surveillance videos, but as we move towards high resolution cameras, the time-complexity of the algorithm increases and thus fails to be a part of real time systems. Parallel architecture provides a surpass platform to work efficiently with complex algorithmic solutions. In this work, a method was proposed for identifying the moving objects perfectly in the videos using adaptive background making, motion detection and object estimation. The pre-processing part includes an adaptive block background making model and a dynamically adaptive thresholding technique to estimate the moving objects. The post processing includes a competent parallel connected component labelling algorithm to estimate perfectly the objects of interest. New parallel processing strategies are developed on each stage of the algorithm to reduce the time-complexity of the system. This algorithm has achieved a average speedup of 12.26 times for lower resolution video frames(320×240, 720×480, 1024×768) and 7.30 times for higher resolution video frames(1360×768, 1920×1080, 2560×1440) on GPU, which is superior to CPU processing. Also, this algorithm was tested by changing the number of threads in a thread block and the minimum execution time has been achieved for 16×16 thread block. And this algorithm was tested on a night sequence where the amount of light in the scene is very less and still the algorithm has given a significant speedup and accuracy in determining the object. 展开更多
关键词 central processing unit (cpu graphics processing unit (GPU) MORPHOLOGY connected component labelling (CCL)
在线阅读 下载PDF
wpa/wpa2-psk高速暴力破解器的设计和实现 被引量:13
16
作者 刘永磊 金志刚 +1 位作者 陈喆 刘京伟 《计算机工程》 CAS CSCD 北大核心 2011年第10期125-127,共3页
针对基于单核CPU的wpa/wpa2-psk暴力破解器破解速度慢的缺点,提出一种分布式多核CPU加GPU的高速暴力破解器。采用分布式技术将密钥列表合理地分配到各台机器上,在单机上利用多核CPU和GPU形成多个计算核心并行破解,利用GPU计算密集型并... 针对基于单核CPU的wpa/wpa2-psk暴力破解器破解速度慢的缺点,提出一种分布式多核CPU加GPU的高速暴力破解器。采用分布式技术将密钥列表合理地分配到各台机器上,在单机上利用多核CPU和GPU形成多个计算核心并行破解,利用GPU计算密集型并行任务强大的计算能力提高破解速度。实验结果证明,该暴力破解器的破解速度相比传统暴力破解器有明显提高。 展开更多
关键词 暴力破解 Wi-Fi联盟受限接入 预共享密钥 图形处理器 多核cpu
在线阅读 下载PDF
葡萄根和枝条抗寒性能测试仪的研制与试验 被引量:7
17
作者 侯加林 党园 +1 位作者 高振 翟衡 《农业工程学报》 EI CAS CSCD 北大核心 2012年第24期41-46,共6页
为了能方便准确的测定葡萄的抗寒特性,该文研制了一种在实验室内测定葡萄根和枝条抗寒性能的测试仪。该仪器利用测试箱持续降温的方法为试验提供测试环境,以STM32单片机为核心组成嵌入式控制平台,由温度传感器和热电模块采集温度信号、... 为了能方便准确的测定葡萄的抗寒特性,该文研制了一种在实验室内测定葡萄根和枝条抗寒性能的测试仪。该仪器利用测试箱持续降温的方法为试验提供测试环境,以STM32单片机为核心组成嵌入式控制平台,由温度传感器和热电模块采集温度信号、电压信号等试验结果,同时在上位机系统上显示试验结果和存储数据。试验结果表明,在试验的6个葡萄品种中光荣河岸和威代尔根系的抗寒性较强,光荣河岸枝条的抗寒性最强,且该仪器的精度达到0.96%,工作性能稳定可靠,可满足葡萄根和枝条抗寒性检测的要求。该文为培育新的抗寒品种提供了依据。 展开更多
关键词 设备 传感器 温度 单片机 葡萄 抗寒性 半致死温度
在线阅读 下载PDF
异构计算平台上列存储系统的并行连接优化策略 被引量:4
18
作者 丁祥武 陈金鑫 王梅 《计算机工程与应用》 CSCD 北大核心 2017年第5期73-80,共8页
GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进... GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进行连接的数据划分策略——ICMD(Improved CMD),利用GPU流处理器并行处理各个子空间上的连接,然后利用任务评估分配模型实现查询负载的动态分配,使得查询操作能在多核CPU、GPU上高效并行执行。同时利用片上全局同步机制、局部内存重用技术优化ICMD连接算法。最后采用SSB基准测试集测试,结果表明:Intel~?HD Graphics 4600平台上并行连接查询相比于CPU版本获得了35%的性能提升,较GPU查询引擎的Ocelot性能上提升了18%。 展开更多
关键词 多核中央处理器-图形处理器(cpu-GPU) 流处理器 异构编程 列存储 改进协调模块分布(ICMD) 任务动态评估分配
在线阅读 下载PDF
分布式同步相量测量装置的研制 被引量:6
19
作者 许勇 李刚 +1 位作者 熊敏 谢涛 《电网技术》 EI CSCD 北大核心 2008年第16期76-80,共5页
研制了一种新型分布式同步相量测量装置,介绍了其组成、功能及软硬件结构,分析了相量补偿算法、嵌入式实时操作系统、内存式实时数据库、恶劣条件下全球定位系统授时等多种新技术在该装置中的应用情况。该装置配置灵活、适应性强,已在... 研制了一种新型分布式同步相量测量装置,介绍了其组成、功能及软硬件结构,分析了相量补偿算法、嵌入式实时操作系统、内存式实时数据库、恶劣条件下全球定位系统授时等多种新技术在该装置中的应用情况。该装置配置灵活、适应性强,已在全国多个网省局安装使用,运行情况良好。 展开更多
关键词 分布式相量测量装置 数据集中处理单元 全球定位系统(GPS)授时单元
在线阅读 下载PDF
GPU通用计算平台上中心差分格式显式有限元并行计算 被引量:11
20
作者 蔡勇 李光耀 王琥 《计算机研究与发展》 EI CSCD 北大核心 2013年第2期412-419,共8页
显式有限元是解决平面非线性动态问题的有效方法.由于显式有限元算法的条件稳定性,对于大规模的有限元问题的求解需要很长的计算时间.图形处理器(GPU)作为一种高度并行化的通用计算处理器,可以很好解决大规模科学计算的速度问题.统一计... 显式有限元是解决平面非线性动态问题的有效方法.由于显式有限元算法的条件稳定性,对于大规模的有限元问题的求解需要很长的计算时间.图形处理器(GPU)作为一种高度并行化的通用计算处理器,可以很好解决大规模科学计算的速度问题.统一计算架构(CUDA)为实现GPU通用计算提供了高效、简便的方法.因此,建立了基于GPU通用计算平台的中心差分格式的显式有限元并行计算方法.该方法针对GPU计算的特点,对串行算法的流程进行了优化和调整,通过采用线程与单元或节点的一一映射策略,实现了迭代过程的完全并行化.通过数值算例表明,在保证计算精度一致的前提下,采用NVIDIA GTX460显卡,该方法能够大幅度提高计算效率,是求解平面非线性动态问题的一种高效简便的数值计算方法. 展开更多
关键词 图形处理器 CUDA 中心差分法 显式有限元 并行计算
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部