期刊文献+
共找到74篇文章
< 1 2 4 >
每页显示 20 50 100
舰船磁特征磁矩量法的图形处理单元加速计算研究 被引量:11
1
作者 郭成豹 刘大明 《兵工学报》 EI CAS CSCD 北大核心 2014年第10期1638-1643,共6页
磁矩量法(MMM)非常适合用于舰船等铁磁目标的磁场特征建模,因为这种方法不需要对空气等非铁磁区域进行网格划分,然而这种方法需要存储和处理稠密的满阵,计算时间很长,矩阵存储需要非常大的存储空间。联合采用MMM和多层自适应交叉近似(ML... 磁矩量法(MMM)非常适合用于舰船等铁磁目标的磁场特征建模,因为这种方法不需要对空气等非铁磁区域进行网格划分,然而这种方法需要存储和处理稠密的满阵,计算时间很长,矩阵存储需要非常大的存储空间。联合采用MMM和多层自适应交叉近似(MLACA)法虽然可以显著缩减内存需求和计算时间,但对于求解精细划分网格的问题,计算时间还是太长。将具有强大并行计算能力的图形处理单元(GPU)用于加速具有天然良好并行特性的MLACA法,并给出了相应的并行计算格式,实现了舰船磁特征MMM的大规模并行加速计算。典型算例结果表明,GPU并行计算的加速比超过120倍,对于精细划分为100 000薄壳单元的舰船壳体,其计算时间也仅有约4.3 min.采用该方法的计算结果与商业有限元软件相比差别小于1%,为舰船磁场的大规模建模提供了一种快速、精确、简便的数值计算工具。 展开更多
关键词 电磁学 舰船磁场 磁矩量法 多层自适应交叉近似 图形处理单元
在线阅读 下载PDF
ARM Mali-300:图形处理单元
2
《世界电子元器件》 2011年第1期31-31,共1页
ARM推出ARM Mall-300图形处理单元(GPU),支持Open GLES2.0,为入门级和中端消费电子设备带来高清(HD)图形性能,适合游戏和高清1080p用户界面。
关键词 图形处理单元 ARM OPEN 图形性能 电子设备 用户界面 入门级
在线阅读 下载PDF
基于GPU的图形电磁计算加速算法 被引量:14
3
作者 杨正龙 金林 李蔚清 《电子学报》 EI CAS CSCD 北大核心 2007年第6期1056-1060,共5页
本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散... 本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散射的计算,使得GRECO方法可以快速计算具有凹腔结构目标的电磁散射.本方法对于目标识别和逆合成孔径成像等方面的研究具有重要的应用价值. 展开更多
关键词 电磁散射 图形电磁计算 图形处理单元(GPU)
在线阅读 下载PDF
伊斯兰建筑中几何装饰图形的建构手法与特征研究 被引量:1
4
作者 刘燕宁 郑琰 《建筑与文化》 2017年第5期130-132,共3页
作为世界三大建筑体系之一的伊斯兰建筑,其建筑装饰中的几何装饰图形别具一格。伊斯兰建筑装饰艺术中的几何图形皆以圆为起点,始于对圆的第一次分割,基于在一个正方形里内切圆的方式,从而分化出具有一定比例的重复样式,继而形成诸如以... 作为世界三大建筑体系之一的伊斯兰建筑,其建筑装饰中的几何装饰图形别具一格。伊斯兰建筑装饰艺术中的几何图形皆以圆为起点,始于对圆的第一次分割,基于在一个正方形里内切圆的方式,从而分化出具有一定比例的重复样式,继而形成诸如以圆和正方形、六边形、双六边形等为"单元图形"的几何装饰图形。在一个特定的主题下,严格遵守构成规则,把无数复杂的五角星和交错的等边三角形、正方形以及正六边形形成的图形,勾勒成一个基本的"单元图形",然后将这种图形单独反复连续使用或加入藤蔓的造型。这些优美的图形能够自由地改变方向来扩展,通过折线组合,展现出无限的连续性和延展性。 展开更多
关键词 伊斯兰建筑 装饰艺术 单元图形 几何图形
在线阅读 下载PDF
图形处理器(GPU)加速时域有限元的二维辐射计算 被引量:5
5
作者 刘昆 王晓斌 廖成 《电波科学学报》 EI CSCD 北大核心 2008年第1期111-114,共4页
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的... 时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右。以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题。 展开更多
关键词 图形加速卡(GPU) 时域有限元(TD-FEM) 通用计算图形处理单元 (GPGPU)
在线阅读 下载PDF
三维不规则窦房结电生理模型的建立及其图形实现
6
作者 张虹 刘袁 +1 位作者 刘炀 金印彬 《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第5期43-47,共5页
针对窦房结三维电生理建模复杂、仿真运算量大等问题,提出了一种有效的解决方法。首先利用建模软件建立右心房三维不规则立体模型,再利用网格划分软件剖分为四面体网格,最后根据网格的位置赋予窦房结和心房细胞属性建立电生理模型。数... 针对窦房结三维电生理建模复杂、仿真运算量大等问题,提出了一种有效的解决方法。首先利用建模软件建立右心房三维不规则立体模型,再利用网格划分软件剖分为四面体网格,最后根据网格的位置赋予窦房结和心房细胞属性建立电生理模型。数值解算时采用算子分裂法和有限体积法,分别对反应-扩散方程和单纯描述电扩布的微分方程进行了处理,同时利用高性能图形处理单元(GPU)在CUDA(compute unified device architecture)编程环境下实现程序的并行加速。另外,从减少CPU和GPU间的数据交换频率、参量存储方式等多方面对程序加以优化。计算结果表明,所建模型无论是单细胞动作电位还是膜电位的传导均符合正常的电生理特征。通过与串行程序及基于4核8线程CPU编写的共享内存式OpenMP并行程序进行比较,基于GPU的CUDA程序可将运行耗时减少90%以上,CPU和GPU间的数据交换仅占总耗时的3%,且组织模型越大,网格划分越细致,GPU的加速效果愈显著。 展开更多
关键词 图形处理单元 并行计算 窦房结 有限体积法
在线阅读 下载PDF
基于YGV629的车载DVD图形化显示界面实现 被引量:3
7
作者 周海清 《电子设计工程》 2009年第3期52-53,56,共3页
介绍YGV629的基本结构和特性,论述实现图形视频叠加的基本原理,给出基于YGV629的车载DVD音影系统图形化用户界面的设计方案,并讨论关键元器件的选取及使用注意事项。该设计方案实现的车载音影系统操作界面友好,灵活性强。只需修改相应... 介绍YGV629的基本结构和特性,论述实现图形视频叠加的基本原理,给出基于YGV629的车载DVD音影系统图形化用户界面的设计方案,并讨论关键元器件的选取及使用注意事项。该设计方案实现的车载音影系统操作界面友好,灵活性强。只需修改相应的图形库即可应用于需要视频图形叠加的其他领域。 展开更多
关键词 YGV629 图形化界面 图形单元 屏幕视控系统(OSD) 图形
在线阅读 下载PDF
面向GPU的5G新型无线电的高吞吐率LDPC译码器 被引量:1
8
作者 李荣春 周鑫 +1 位作者 乔鹏 王庆林 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期141-148,共8页
提出了一种基于图形处理单元(graphic processing unit,GPU)的5G软件无线电准循环低密度奇偶校验(low density parity check,LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的... 提出了一种基于图形处理单元(graphic processing unit,GPU)的5G软件无线电准循环低密度奇偶校验(low density parity check,LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的利用率。实验基于Nvidia RTX 2080Ti GPU平台实现了高码率情况下的最小和近似译码算法的并行译码,通过分析GPU上的最优线程设置,将码率为5/6的(2080,1760)LDPC算法的译码吞吐率提升至1.38 Gbit/s,译码吞吐率性能优于现有其他基于GPU的LDPC译码器。 展开更多
关键词 低密度奇偶校验 5G 图形处理单元 软件无线电
在线阅读 下载PDF
基于GPU的椭圆曲线运算库及相关算法优化
9
作者 高钰洋 张健宁 +2 位作者 王刚 苏明 刘晓光 《信息安全学报》 CSCD 2024年第6期1-16,共16页
在区块链场景下,往往需要引入数字签名、零知识证明等密码学算法以保护数据安全性与用户隐私。但由于这些算法依赖于大量的大数与椭圆曲线运算,包括范围证明在内的许多密码学算法已经成为了区块链系统的性能瓶颈。而密码学算法的GPU优... 在区块链场景下,往往需要引入数字签名、零知识证明等密码学算法以保护数据安全性与用户隐私。但由于这些算法依赖于大量的大数与椭圆曲线运算,包括范围证明在内的许多密码学算法已经成为了区块链系统的性能瓶颈。而密码学算法的GPU优化也在近几年获得了广泛的关注与研究。本文充分利用GPU作为众核处理器的优势,设计了基于GPU的椭圆曲线运算库。在运算库中,本文在GPU上实现并优化了常用的椭圆曲线运算与大数运算,同时针对不同的需求设计了不同的实现与接口。本文对寄存器与常量内存等存储空间进行了合理分配,并通过利用预计算等优化手段减少了计算量,从而最大化了运算库的吞吐与性能。为了验证运算库的实用性与有效性,本文利用该运算库实现了代理重加密与Bulletproofs范围证明的验证算法,同时充分利用了算法的内部并行性进行优化。实验表明,本文实现的运算库在各个运算中都取得了远超于OpenSSL等常用CPU端运算库的性能。基于该运算库实现的代理重加密算法相比CPU实现能达到最高145倍左右的加速比,Bulletproofs范围证明验证算法相比于CPU端实现也能达到5.57倍左右的加速效果,平均证明验证时间在1 ms内,可以满足数字货币隐私保护场景下超过每秒2000笔交易的性能需求。可见该运算库能为区块链系统隐私保护等对密码学计算具有高吞吐需求的场景提供坚实支持。 展开更多
关键词 椭圆曲线 图形处理单元 统一计算架构 范围证明 代理重加密
在线阅读 下载PDF
基于GPU的LDPC译码器设计
10
作者 黄柯文 刘世刚 汪洋 《电子质量》 2024年第10期43-48,共6页
为了提高低密度奇偶校验码(LDPC)译码器的译码速度,提出了一种基于图形处理单元(GPU)加速的并行LDPC译码方案。该方案基于对数似然比(LLR-BP)译码算法进行设计,针对算法的可并行部分采用并行度更高的边并行译码方案,以降低译码延迟并提... 为了提高低密度奇偶校验码(LDPC)译码器的译码速度,提出了一种基于图形处理单元(GPU)加速的并行LDPC译码方案。该方案基于对数似然比(LLR-BP)译码算法进行设计,针对算法的可并行部分采用并行度更高的边并行译码方案,以降低译码延迟并提高了GPU的线程利用率。此外,通过优化线程分配策略,将变量节点更新的信息存储在访问成本更低的共享内存中,减少了消息传递过程中对全局内存的依赖。实验结果表明,所提方案的译码速度分别是传统的节点并行译码和边并行译码方案的2.8倍和1.2倍,满足高速通信系统的需求。 展开更多
关键词 图形处理单元 低密度奇偶校验码译码器 数据协调 并行计算
在线阅读 下载PDF
一种三维地面场景SAR回波仿真的快速实现方法 被引量:9
11
作者 景国彬 张云骥 +2 位作者 孙光才 邢孟道 保铮 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2017年第3期1-7,共7页
针对三维地面场景合成孔径雷达回波仿真中存在计算量巨大的问题,提出了一种基于图形处理单元的合成孔径雷达回波快速仿真方法.首先,采用分形布朗运动模型对数字高程模型数据进行分形插值处理;再对插值后的数据进行小面元剖分并计算了剖... 针对三维地面场景合成孔径雷达回波仿真中存在计算量巨大的问题,提出了一种基于图形处理单元的合成孔径雷达回波快速仿真方法.首先,采用分形布朗运动模型对数字高程模型数据进行分形插值处理;再对插值后的数据进行小面元剖分并计算了剖分后小面元的后向散射系数;接着利用改进的下视角比较法对三维场景的阴影遮挡进行快速判断;最后详细分析了回波仿真过程中的3个并行层次,设计了核函数,并利用线程外推和归约相加的计算方法,实现了图形处理单元编程架构下三维场景合成孔径雷达回波的快速仿真.利用这种方法对实测数字高程模型数据进行了回波仿真和成像处理,验证了该方法的正确性和高效性. 展开更多
关键词 三维地面 合成孔径雷达 分形布朗运动模型 阴影遮挡 图形处理单元
在线阅读 下载PDF
基于CUDA的GPS信号快速捕获 被引量:8
12
作者 程俊仁 刘光斌 张博 《宇航学报》 EI CAS CSCD 北大核心 2010年第10期2407-2410,共4页
为实现基于PC平台的GPS软件接收机C/A码信号快速搜索,提出了一种由GPU完成信号搜索计算的快速实现方法。该方法以基于FFT的码相位并行搜索算法为基础,通过CUDA编程,由GPU完成主要的计算任务,实现了信号搜索在GPU上的并行计算。最后,将... 为实现基于PC平台的GPS软件接收机C/A码信号快速搜索,提出了一种由GPU完成信号搜索计算的快速实现方法。该方法以基于FFT的码相位并行搜索算法为基础,通过CUDA编程,由GPU完成主要的计算任务,实现了信号搜索在GPU上的并行计算。最后,将该方法与在CPU上实现的捕获方法进行了比较测试,结果表明:新方法的捕获速度显著提高,冷启动条件下,搜索全部32颗卫星只需1.653秒,为GPS软件接收机的实时化提供了重要保证。 展开更多
关键词 GPS软件接收机 快速捕获 快速傅里叶变换 图形处理单元
在线阅读 下载PDF
采用向量内积的并行相关算法 被引量:2
13
作者 牟卫华 倪少杰 +2 位作者 白洋 孙广富 欧钢 《国防科技大学学报》 EI CAS CSCD 北大核心 2017年第5期50-55,共6页
针对软件接收机相关器计算的实时性问题,通过分析扩频信号的接收过程,建立一种基于向量内积的并行相关信号接收模型。利用图形处理单元中大量的浮点运算单元进行矩阵与向量运算,并行计算各通道相关值,提高了信号相关运算的实时性。仿真... 针对软件接收机相关器计算的实时性问题,通过分析扩频信号的接收过程,建立一种基于向量内积的并行相关信号接收模型。利用图形处理单元中大量的浮点运算单元进行矩阵与向量运算,并行计算各通道相关值,提高了信号相关运算的实时性。仿真验证结果表明,利用基于GPU的向量内积软件并行相关算法计算25 MHz采样率时长1 ms的信号相关值,25个通道共150个相关运算耗时967μs,与CPU上基于数学核心函数库的实现相比速度约提高了61.4倍,能够实现宽带扩频信号软件实时相关接收。 展开更多
关键词 相关器 向量内积 软件接收机 并行计算 图形处理单元
在线阅读 下载PDF
X射线动态数字图像降噪方法与快速实现 被引量:5
14
作者 王钢 杨民 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2010年第6期741-744,共4页
对于X射线动态数字成像系统,为了实现高帧频采集引起的数字摄影(DR,Digital Radiography)图像降质的恢复,采用Anscombe变换将NL-means降噪算法引入到DR图像的降噪中.为了解决NL-means降噪算法计算量大、运算速度慢的问题,利用可编程图... 对于X射线动态数字成像系统,为了实现高帧频采集引起的数字摄影(DR,Digital Radiography)图像降质的恢复,采用Anscombe变换将NL-means降噪算法引入到DR图像的降噪中.为了解决NL-means降噪算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU,Graphic Processing Unit)并行计算和高速浮点计算特性,将DR图像映射为GPU中的纹理,采用多线程并行计算,使得NL-means算法在GPU中加速执行.实验结果表明,NL-means能够有效抑制动态DR图像噪声.GPU加速方法可以在不损失图像信息的前提下,加速比可达2个数量级以上,满足了实时降噪的要求. 展开更多
关键词 数字摄影图像降噪 NL-means Anscombe变换 图形处理单元
在线阅读 下载PDF
基于对象的视频摘要算法的实现与加速 被引量:1
15
作者 林龙新 刘小丽 +1 位作者 全渝娟 林伟伟 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期92-99,共8页
现有基于对象的视频摘要算法较少考虑计算效率,导致其难以满足大规模安防监控领域的性能要求.为此,文中提出了改进的基于对象的视频摘要算法,通过降低帧率和分辨率、运动片段检测以及基于重心的对象跟踪等策略来提升算法效率.此外,为充... 现有基于对象的视频摘要算法较少考虑计算效率,导致其难以满足大规模安防监控领域的性能要求.为此,文中提出了改进的基于对象的视频摘要算法,通过降低帧率和分辨率、运动片段检测以及基于重心的对象跟踪等策略来提升算法效率.此外,为充分挖掘CPU和GPU的计算能力,设计了相应的多线程算法,并对关键步骤进行GPU优化,以进一步加速算法性能.实验结果表明,改进算法和加速策略可以大幅提升视频摘要的计算速度. 展开更多
关键词 视频摘要 图形处理单元 安防监控
在线阅读 下载PDF
膨胀节的计算机辅助设计及参数化绘图系统 被引量:2
16
作者 周强 李永生 《管道技术与设备》 CAS 2000年第6期4-7,10,共5页
针对机械产品CAD开发技术上的问题 ,对二维图形参数化技术进行了研究 ,提出了基于图形单元技术的装配图的参数化设计 ,并利用ActiveXAutomation技术顺利实现了结构设计与图形参数化设计的一体化。在此基础上 ,结合机械设计的专业知识 ,... 针对机械产品CAD开发技术上的问题 ,对二维图形参数化技术进行了研究 ,提出了基于图形单元技术的装配图的参数化设计 ,并利用ActiveXAutomation技术顺利实现了结构设计与图形参数化设计的一体化。在此基础上 ,结合机械设计的专业知识 ,开发了“膨胀节的计算机辅助设计及参数化绘图系统”CAD软件包。本文通过设计界面、建立数据库、编写算法等一系列工作进行了膨胀节的结构设计和优化设计 ,实现了膨胀节的计算机辅助设计 ;对零件图与装配图进行图形参数化设计 ,使得膨胀节的设计与绘图工作效率大大提高。 展开更多
关键词 膨胀节 CAD 图形单元技术 参数化设计
在线阅读 下载PDF
基于可编程显卡的信息化雷达终端显示系统 被引量:4
17
作者 张辉 孙立国 +1 位作者 李世丹 王德生 《信息与电子工程》 2010年第6期652-655,共4页
高速发展的可编程图形处理单元(GPU)为信息化、软件化雷达终端系统的发展提供了新的技术平台。本文应用GPU强大的并行处理能力和极高的计算效率,对原有雷达终端显示系统进行改进,大大降低了CPU的占用率,减轻了系统的负担,取得了可以与... 高速发展的可编程图形处理单元(GPU)为信息化、软件化雷达终端系统的发展提供了新的技术平台。本文应用GPU强大的并行处理能力和极高的计算效率,对原有雷达终端显示系统进行改进,大大降低了CPU的占用率,减轻了系统的负担,取得了可以与专用雷达图像显示硬件卡相媲美的显示效果。 展开更多
关键词 着色程序 雷达终端 图形处理单元
在线阅读 下载PDF
形状数理论及其在安全印刷中的应用 被引量:1
18
作者 亓文法 杨斌 李晓龙 《中国印刷与包装研究》 CAS 2009年第2期16-21,共6页
本文提出了一种基于防复印底纹的文档保护方法。其中,防复印底纹包括背景图案区域和标记图形单元区域,标记图形单元的形状和位置关系代表了安全标识信息。同时提出了一种快速的安全标识信息识别算法。实验表明,该算法效率较高,实现简单... 本文提出了一种基于防复印底纹的文档保护方法。其中,防复印底纹包括背景图案区域和标记图形单元区域,标记图形单元的形状和位置关系代表了安全标识信息。同时提出了一种快速的安全标识信息识别算法。实验表明,该算法效率较高,实现简单,占用资源较少,适于嵌入到图像复制设备的硬件芯片中,从而达到对安全文档实时保护的目的。 展开更多
关键词 防复印 安全印刷 形状数 图像处理 标记图形单元
在线阅读 下载PDF
基于GPU的二维离散小波变换快速计算 被引量:1
19
作者 马伯宁 王晨昊 +1 位作者 汤晓安 匡纲要 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第3期111-114,共4页
通过分析小波变换的多相表示和GPU通用计算模型,结合现代GPU的多纹理和多渲染目标特性,提出了一种基于GPU与多相表示的二维离散小波变换计算方法,该方法使小波变换的计算形式完全适合GPU的SIMD结构,同时大幅减少了纹理访问次数,充分利用... 通过分析小波变换的多相表示和GPU通用计算模型,结合现代GPU的多纹理和多渲染目标特性,提出了一种基于GPU与多相表示的二维离散小波变换计算方法,该方法使小波变换的计算形式完全适合GPU的SIMD结构,同时大幅减少了纹理访问次数,充分利用了GPU的矢量运算和二维寻址能力,实验表明该方法在处理速度上有大幅的提高。 展开更多
关键词 二维离散小波变换 多相表示 图形处理单元
在线阅读 下载PDF
GPU加速窦房结计算机仿真的实现及优化 被引量:1
20
作者 张虹 郑霄 赵丹 《西安交通大学学报》 EI CAS CSCD 北大核心 2014年第7期60-64,共5页
针对窦房结电生理计算机仿真运算量巨大、耗时长的问题,提出了基于高性能图形处理单元(GPU)实现并行计算及优化的方法。首先考虑窦房结细胞中央和边缘的差异,构建了一维非匀质窦房结组织模型;利用算子分裂方法使模型的解算任务具备并行... 针对窦房结电生理计算机仿真运算量巨大、耗时长的问题,提出了基于高性能图形处理单元(GPU)实现并行计算及优化的方法。首先考虑窦房结细胞中央和边缘的差异,构建了一维非匀质窦房结组织模型;利用算子分裂方法使模型的解算任务具备并行性。根据具体解算过程提出了三种并行化策略,并对其中耗时最短的策略从线程块设置、数据交换频率以及存储模式等方面进行了进一步优化。结果表明:对于500个细胞的仿真,CUDA程序较串行程序的执行时间下降了60%,进一步优化后,CUDA程序的执行时间可下降84%;窦房结组织越大,GPU的加速效果越明显。结果验证了GPU加速解算方法可显著提高窦房结模型的解算速度,降低实际执行时间。 展开更多
关键词 图形处理单元 并行计算 窦房结 计算机仿真
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部