期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
KYLIN V2.0程序图形处理器加速方法及LCT临界实验验证
1
作者 赵晨 张斌 +4 位作者 黄世恩 陈长 卢宗健 柴晓明 李庆 《哈尔滨工程大学学报》 CSCD 北大核心 2024年第12期2364-2368,2399,共6页
为了进一步提高组件程序KYLIN V2.0的计算速度,本文开展了图形处理器加速方法研究,分析了硬件架构。将特征线输运计算中的大量简单重复计算从中央处理器转移至图形处理器,建立了异构系统特征线扫描算法,并利用异构通信机制,对于组件基... 为了进一步提高组件程序KYLIN V2.0的计算速度,本文开展了图形处理器加速方法研究,分析了硬件架构。将特征线输运计算中的大量简单重复计算从中央处理器转移至图形处理器,建立了异构系统特征线扫描算法,并利用异构通信机制,对于组件基准题加速比最高可达到50倍。同时,为了进一步完善KYLIN V2.0程序验证确认矩阵,本文采用LCT临界实验装置开展了验证确认研究,验证算例包括了LCT003系列、LCT011系列共14个临界实验装置,最大特征值偏差8.05×10-3,与同类型程序具有相近的计算精度。本文研究验证了图形处理器具有良好的加速效果,实现了KYLIN V2.0程序的大幅加速,同时进一步补充了程序验证矩阵,支持了程序的工程应用。 展开更多
关键词 图形处理器 图形处理器加速方法 特征线方法 验证与确认 临界实验装置 LCT KYLIN V2.0 TORCH
在线阅读 下载PDF
基于图形处理器加速光线投射算法的多功能体绘制技术 被引量:2
2
作者 吕晓琪 张传亭 +1 位作者 侯贺 张宝华 《计算机应用》 CSCD 北大核心 2014年第1期135-138,178,共5页
为克服传统算法中体绘制交互速度不流畅、重建耗时长、绘制效果单一的不足,实现了基于图形处理器(GPU)的光线投射算法用于医学层析图像实时体绘制,并能快速切换不同组织器官的绘制效果。首先,读入医学层析图像到计算机内存,构造体素;然... 为克服传统算法中体绘制交互速度不流畅、重建耗时长、绘制效果单一的不足,实现了基于图形处理器(GPU)的光线投射算法用于医学层析图像实时体绘制,并能快速切换不同组织器官的绘制效果。首先,读入医学层析图像到计算机内存,构造体素;然后,设置相应体素属性(如插值方式、着色处理、光照参数)等,设计显示不同组织器官的颜色及不透明度传输函数;最后,GPU加载体素据并进行光线投射算法的计算。实验结果表明,在绘制速度上,GPU加速光线投射算法实现的多功能体绘制技术的绘制速度能达到每秒40帧以上,完全满足临床应用需求。在绘制质量上,用户交互中由于重采样而产生的锯齿现象明显低于CPU端实现的光线投射算法,GPU端与CPU端绘制时间的加速比在9倍左右。 展开更多
关键词 图形处理器加速 层析图像 光线投射 体绘制 传输函数
在线阅读 下载PDF
基于DSMI算法和GPU加速的大规模视频检索系统 被引量:1
3
作者 钟煜 朱敏 +1 位作者 陈雪 高宇 《计算机应用研究》 CSCD 北大核心 2011年第11期4373-4375,共3页
本视频检索系统围绕如何处理大规模数据和在线实时检索来展开研究。基于互信息量的镜头边界检测算法检索性能较好,但计算量较大,针对此问题,提出了一种基于动态滑动窗口算法与互信息量相结合的分割算法(DSMI算法),系统运用GPU的并行计... 本视频检索系统围绕如何处理大规模数据和在线实时检索来展开研究。基于互信息量的镜头边界检测算法检索性能较好,但计算量较大,针对此问题,提出了一种基于动态滑动窗口算法与互信息量相结合的分割算法(DSMI算法),系统运用GPU的并行计算能力来实现加速检索。实验结果表明,DSMI算法能够加快系统中镜头边界检测的运行效率;同时GPU加速使用户在线检索时间成功达到20倍加速比,满足了项目的实时性要求,具有较高的可扩展性。 展开更多
关键词 大规模视频检索 动态滑动窗口 互信息量 图形处理器加速
在线阅读 下载PDF
异构系统结构力学计算GPU加速性能分析与应用
4
作者 郭培卿 陈小龙 《计算机应用》 CSCD 北大核心 2014年第A01期78-81,共4页
高性能计算领域利用GPU加速计算已逐渐发展成为主流应用的普遍功能之一。主流结构力学应用ABAQUS支持GPU通用计算,充分发挥GPU的高性能浮点运算能力与访存带宽,提高软件求解效率。介绍了ABAQUS软件对GPU加速应用的发展历程,在上海超级... 高性能计算领域利用GPU加速计算已逐渐发展成为主流应用的普遍功能之一。主流结构力学应用ABAQUS支持GPU通用计算,充分发挥GPU的高性能浮点运算能力与访存带宽,提高软件求解效率。介绍了ABAQUS软件对GPU加速应用的发展历程,在上海超级计算中心三种不同的异构环境下,针对实际算例的GPU加速性能进行了测试,建立计算效率分析方法,分析GPU加速对求解时间、系统资源调用、软件并行效率的影响,并针对采用隐式方法求解百万量级自由度问题时资源的合理使用提出建议。 展开更多
关键词 计算机辅助工程 结构力学 ABAQUS 图形处理器加速 高性能计算
在线阅读 下载PDF
基于预处理共轭梯度迭代法的电力系统状态估计算法 被引量:7
5
作者 李建斌 王鹏程 +2 位作者 傅侃 方睿 董树锋 《电力系统自动化》 EI CSCD 北大核心 2021年第14期90-96,共7页
随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代... 随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代过程中矩阵乘法和线性方程组求解耗时较长的特点,根据Krylov子空间方法中共轭梯度法的思想,设计了一种基于预处理共轭梯度迭代法的电力系统状态估计算法。该方法采用不完全LU分解法对原始线性方程组进行预处理,并采用图形处理器(GPU)并行加速技术对矩阵乘法、线性方程预处理和共轭梯度法迭代进行加速。算例分析表明了文中方法加速效果明显,内存和显存占用较低,经过不完全LU分解法预处理的线性方程组迭代次数少,能够满足大规模电力系统状态估计的实时性要求。 展开更多
关键词 状态估计 共轭梯度法 不完全LU分解 图形处理器并行加速
在线阅读 下载PDF
基于GPU的芯片热分析方法研究 被引量:1
6
作者 马骏 徐宁 《计算机应用研究》 CSCD 北大核心 2018年第3期773-776,共4页
针对大规模IC芯片中局部高温热效应问题,提出基于网格的随机行走方法分析稳态温度分布。该算法只计算热源附近的点,从而大幅减少计算量。首先对金字塔型非规则热分析模型进行了研究,然后提出了一种预先保存概率表的加速策略;将随机行走... 针对大规模IC芯片中局部高温热效应问题,提出基于网格的随机行走方法分析稳态温度分布。该算法只计算热源附近的点,从而大幅减少计算量。首先对金字塔型非规则热分析模型进行了研究,然后提出了一种预先保存概率表的加速策略;将随机行走算法在CUDA上实现了并行,得出了最大限度使用GPU资源并保证最大加速比的最优配置。实验结果表明,提出的并行随机行走算法使总体计算性能提升了7~10倍。 展开更多
关键词 统一计算设备架构 图形处理器加速 随机行走 金字塔模型 IC 热分析
在线阅读 下载PDF
大规模输配一体化系统牛顿法潮流计算性能分析及改进方法 被引量:19
7
作者 唐坤杰 董树锋 +1 位作者 朱炳铨 宋永华 《电力系统自动化》 EI CSCD 北大核心 2019年第6期92-101,共10页
为满足输配电网一体化潮流计算精度和计算速度需求,提出了一种改进的牛顿法潮流计算方法。针对输配电网一体化牛顿法雅可比矩阵病态严重、收敛性能较差等问题,采用自适应Levenberg-Marquardt算法初始精度提升速度快的特征选取初值、不... 为满足输配电网一体化潮流计算精度和计算速度需求,提出了一种改进的牛顿法潮流计算方法。针对输配电网一体化牛顿法雅可比矩阵病态严重、收敛性能较差等问题,采用自适应Levenberg-Marquardt算法初始精度提升速度快的特征选取初值、不完全三角分解法预处理雅可比矩阵,有效地保证了数值稳定性,提高了牛顿法的收敛性能。针对输配电网一体化后规模庞大、计算效率低等问题,利用图形处理器并行加速技术对算法中的一些计算量密集的步骤,包括雅可比矩阵的生成、矩阵—向量运算等进行加速处理。算例测试表明,该算法能够显著提高大规模输配电网一体化潮流计算的速度和精度,对于多配电网区域、环网、分布式电源、病态系统等多种情形具有较强的普适性。 展开更多
关键词 输配电网一体化 牛顿法 潮流计算 收敛性能 图形处理器并行加速
在线阅读 下载PDF
基于二阶平滑先验的图像保边平滑快速算法
8
作者 王颢星 孟维亮 张晓鹏 《高技术通讯》 CAS CSCD 北大核心 2014年第7期732-738,共7页
研究了计算机图形处理与计算视觉处理中的图像保边平滑(保持图像边缘平滑)处理。考虑到基于优化方法的保边平滑算法多使用一阶平滑先验作为能量函数的正则项,但它会使平滑结果产生阶梯状的平滑效果,提出了一种基于二阶平滑先验的保边平... 研究了计算机图形处理与计算视觉处理中的图像保边平滑(保持图像边缘平滑)处理。考虑到基于优化方法的保边平滑算法多使用一阶平滑先验作为能量函数的正则项,但它会使平滑结果产生阶梯状的平滑效果,提出了一种基于二阶平滑先验的保边平滑算法,该算法能够避免一阶平滑先验存在的阶梯状平滑偏差,同时锋利地保持图像中显著的边缘。针对该算法的连续变量与0-1变量的混合优化问题,使用了一种快速的求解方法,该方法在使用图形处理器(GPU)并行加速的情况下能够快速获取平滑结果。通过实验验证了该算法在深度图保边平滑处理、JPEG卡通图像压缩瑕疵恢复以及边缘提取问题中的应用效果。 展开更多
关键词 二阶平滑先验 保边平滑 优化 图形处理器(GPU)加速 深度图处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部