检索结果-维普期刊中文期刊服务平台

基于CUDA的图像快速并行细化算法的研究与实现被引量：2: 1; 作者金汉均梅洪洋《电子测量技术》 2014年第8期75-79,共5页; 在图像处理和模式识别中,通过细化算法抽取图像的骨架是一项极有意义的工作。由于大多数传统细化算法都需要按照一定顺序对每个像素进行逐点扫描,执行效率不高,另外图像细化算法中数据之间的关联性不大,将传统的快速并行细化算法移植到C... 展开更多; 关键词细化算法 cuda平台并行处理; 在线阅读下载PDF 职称材料

CUDA分布式计算的取证应用被引量：1: 2; 作者刘佳佳何佳龙吴顺祥《计算机工程》 CAS CSCD 北大核心 2011年第13期257-258,共2页; 互联网时代犯罪分子多以即时通信软件为工具进行网络诈骗等违法活动。为此,以阿里旺旺为例,研究该工具的数据文件存储结构及其RC4和MD5加密算法,提出一种基于CUDA的分布式计算模型。对RC4和MD5加密算法采用穷举所有可能密钥的方法进行... 展开更多; 关键词电子商务 cuda平台分布式计算取证即时通信软件; 在线阅读下载PDF 职称材料

基于GPU的并行植物模拟生长算法被引量：6: 3; 作者杨磊龚学余《计算机工程与设计》北大核心 2016年第12期3271-3279,共9页; 为提高植物模拟生长算法求解性能,基于GPU SIMT执行模型对算法步骤进行详细并行化设计并绘制算法流程图。算法代码利用C++和CUDA实现,能够在CPU+GPU混合架构平台上运行;在此基础上,利用7个不同类型的基准测试函数对算法进行测试,与串行... 展开更多; 关键词植物模拟生长算法并行化图形处理器统一计算设备架构混合架构平台; 在线阅读下载PDF 职称材料

基于通用计算平台SM4-CTR算法并行实现与优化被引量：7: 4; 作者李晓东胡一鸣 +2 位作者池亚平钱榕张健毅《密码学报》 CSCD 2022年第4期663-676,共14页; 随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为... 展开更多; 关键词 SM4算法 CTR模式 cuda GPU加速并行算法通用计算机平台; 在线阅读下载PDF 职称材料

一种跨平台的并行编程框架设计与实现被引量：1: 5; 作者李婷徐云 +1 位作者聂鹏宇潘玮华《计算机工程》 CAS CSCD 2014年第8期43-47,共5页; 并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数... 展开更多; 关键词并行计算并行编程框架跨平台 OpenMP编程 MPI编程 cuda编程; 在线阅读下载PDF 职称材料

基于CPU-GPU异构平台的高层结构地震响应分析方法研究被引量：8: 6; 作者李红豫滕军李祚华《振动与冲击》 EI CSCD 北大核心 2014年第13期86-91,共6页; 为了解决传统的串行有限元分析方法计算耗时多精度低的问题,基于GPU并行计算能力在CUDA架构下建立了一套兼顾精度和效率的高层结构有限元分析的CPU-CPU的异构平台。基于CPU-GPU异构平台研究了高层结构地震响应算法,将整个时间步积分在GP... 展开更多; 关键词 GPU 异构平台有限元地震响应 cuda 加速比; 在线阅读下载PDF 职称材料

使用OpenCL技术的影像快速畸变纠正方法在异构平台上的应用分析被引量：1: 7; 作者韦博文李涛 +5 位作者李广宇汪致恒何沐师悦龄刘路遥张瑞《计算机科学》 CSCD 北大核心 2016年第S2期167-169,196,共4页; 针对海量遥感数据应用中日益显著的处理效率低下和计算瓶颈问题,基于通用计算机图形处理单元的编程开发使用OpenCL并行处理技术对遥感数据处理及其过程进行加速,旨在为遥感影像大数据处理提供一条更为高效的途径。在不同显卡平台上对影... 展开更多; 关键词 OPENCL cuda 并行处理异构平台通用性畸变纠正; 在线阅读下载PDF 职称材料

基于GPU的LCS算法加速机制研究与实现: 8; 作者张常志牟澄 +1 位作者黄小红马严《通信学报》 EI CSCD 北大核心 2013年第S2期9-13,共5页; 协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较大,那么运行的时间将会非常... 展开更多; 关键词协议特征识别 LCS算法 cuda平台 GPU加速; 在线阅读下载PDF 职称材料

Falcon后量子算法的密钥树生成部件GPU并行优化设计与实现被引量：1: 9; 作者张磊赵光岳 +1 位作者肖超恩王建新《计算机工程》 CAS CSCD 北大核心 2024年第9期208-215,共8页; 近年来,后量子密码算法因其具有抗量子攻击的特性成为安全领域的研究热点。基于格的Falcon数字签名算法是美国国家标准与技术研究所(NIST)公布的首批4个后量子密码标准算法之一。密钥树生成是Falcon算法的核心部件,在实际运算中占用较... 展开更多; 关键词后量子密码 Falcon算法图形处理器 cuda平台并行计算; 在线阅读下载PDF 职称材料

题名基于CUDA的图像快速并行细化算法的研究与实现被引量：2: 1; 作者金汉均梅洪洋; 机构华中师范大学计算机学院; 出处《电子测量技术》 2014年第8期75-79,共5页; 基金湖北省科技攻关(011EJB010) 湖北省科技支撑计划(2013BAA104)项目; 文摘在图像处理和模式识别中,通过细化算法抽取图像的骨架是一项极有意义的工作。由于大多数传统细化算法都需要按照一定顺序对每个像素进行逐点扫描,执行效率不高,另外图像细化算法中数据之间的关联性不大,将传统的快速并行细化算法移植到CUDA(compute unified device architecture)平台上,运用CUDA的并行处理优势对图像进行细化处理。实验表明,该方法在保证细化处理效果的前提下,还能将运算效率提高达到幂级数级。; 关键词细化算法 cuda平台并行处理; Keywords thinning algorithm cuda platform parallel processing; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名CUDA分布式计算的取证应用被引量：1: 2; 作者刘佳佳何佳龙吴顺祥; 机构厦门大学信息科学与技术学院; 出处《计算机工程》 CAS CSCD 北大核心 2011年第13期257-258,共2页; 基金国家自然科学基金资助项目(60704042) 国家"十一五"科技支撑计划基金资助项目(2007BAK34B04) +1 种基金厦门大学211信息创新平台基金资助项目(2009-2011); 文摘互联网时代犯罪分子多以即时通信软件为工具进行网络诈骗等违法活动。为此,以阿里旺旺为例,研究该工具的数据文件存储结构及其RC4和MD5加密算法,提出一种基于CUDA的分布式计算模型。对RC4和MD5加密算法采用穷举所有可能密钥的方法进行暴力破解。实验结果表明,该计算模型能准确快速地完成阿里旺旺加密文件的破解,从而为计算机调查取证工作提供技术支持。; 关键词电子商务 cuda平台分布式计算取证即时通信软件; Keywords E-commerce cuda platform distributed computing forensics instant messaging software; 分类号 N945 [自然科学总论—系统科学]; 在线阅读下载PDF 职称材料

题名基于GPU的并行植物模拟生长算法被引量：6: 3; 作者杨磊龚学余; 机构南华大学核科学技术学院烟台大学光电信息科学技术学院; 出处《计算机工程与设计》北大核心 2016年第12期3271-3279,共9页; 基金国家自然科学基金项目(11375085) 国家磁约束聚变能发展专项基金项目(2014GB108002); 文摘为提高植物模拟生长算法求解性能,基于GPU SIMT执行模型对算法步骤进行详细并行化设计并绘制算法流程图。算法代码利用C++和CUDA实现,能够在CPU+GPU混合架构平台上运行;在此基础上,利用7个不同类型的基准测试函数对算法进行测试,与串行算法代码进行对比。分析结果表明,在保证求解质量的前提下,相比串行算法,该并行算法将目标函数复杂的大规模问题的求解效率提升了十几倍到几百倍,其加速比较好,不同变量维数下的求解时间增加不明显,验证了当前工作的可行性和有效性。; 关键词植物模拟生长算法并行化图形处理器统一计算设备架构混合架构平台; Keywords plant growth simulation algorithm parallelization graphic processing unit（GPU） compute unified device architecture（cuda） hybrid architecture platform; 分类号 TP301.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于通用计算平台SM4-CTR算法并行实现与优化被引量：7: 4; 作者李晓东胡一鸣池亚平钱榕张健毅; 机构北京电子科技学院; 出处《密码学报》 CSCD 2022年第4期663-676,共14页; 基金国家重点研发计划(2018YFB1004100)。; 文摘随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为通用的、普及化的算力资源.本文基于通用的计算机平台,提出了利用其本地GPU进行CTR工作模式下SM4算法高速加解密的并行实现和优化方案.实验表明,本文提出的SM4-CTR并行加解密方案能够有效提高SM4算法的运行效率,在通用的计算机平台上,能够达到40倍加速比,加解密速率达到了14.192 Gbps.实验中还分析了线程块划分对GPU并行加速效果的影响,最优线程块大小为128到512,且必须为32的整倍数.最后,基于本文实验的结果与其他团队的优化SM4方案进行对比,包括传统工作模式下利用CPU、GPU优化的方案和利用软件快速实现的方案,对比结果显示即便之前团队的方案运行的平台硬件条件好于本文实验环境,文中提出的方案运行速率依然能做到大幅领先.因此,本文方案在安全性、运算速率提高的同时适用平台也更加广泛,在实际生活中针对大数据和个人数据的安全保护中必将发挥巨大的作用.; 关键词 SM4算法 CTR模式 cuda GPU加速并行算法通用计算机平台; Keywords SM4 algorithm CTR mode cuda GPU acceleration parallel algorithm general computer platform; 分类号 TP309.7 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名一种跨平台的并行编程框架设计与实现被引量：1: 5; 作者李婷徐云聂鹏宇潘玮华; 机构国家高性能计算中心(合肥) 中国科学技术大学计算机科学与技术学院; 出处《计算机工程》 CAS CSCD 2014年第8期43-47,共5页; 基金国家自然科学基金资助重点项目(61033009) 国家自然科学基金资助面上项目(60970085); 文摘并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数设计了统一的函数接口,使底层平台的变化对上层应用程序透明。根据底层函数库的开发,给出一种填充式的编程方法和任务调度系统。将OpenCH应用于遥感影像分类,实验结果证明,基于该框架开发的并行程序可运行于多种并行计算平台,并具有较高的并行加速比,编程框架本身造成的时间开销低于15%。; 关键词并行计算并行编程框架跨平台 OpenMP编程 MPI编程 cuda编程; Keywords parallel computing parallel programming framework cross-platform OpenMP programming MPI programming cuda programming; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于CPU-GPU异构平台的高层结构地震响应分析方法研究被引量：8: 6; 作者李红豫滕军李祚华; 机构哈尔滨工业大学深圳研究生院; 出处《振动与冲击》 EI CSCD 北大核心 2014年第13期86-91,共6页; 基金国家自然科学基金重大国际(中美)合作研究项目(51261120374) 国家自然科学基金面上项目(51278155) 国家自然科学基金青年基金项目(51008048); 文摘为了解决传统的串行有限元分析方法计算耗时多精度低的问题,基于GPU并行计算能力在CUDA架构下建立了一套兼顾精度和效率的高层结构有限元分析的CPU-CPU的异构平台。基于CPU-GPU异构平台研究了高层结构地震响应算法,将整个时间步积分在GPU中计算完成,每一时间步下利用基于GPU的预处理共轭梯度迭代法求解线性方程组获得该时刻的位移,最终实现了基于GPU的Newmark-β法。通过算例验证了本文所提方法的高精度、高效率。; 关键词 GPU 异构平台有限元地震响应 cuda 加速比; Keywords GPU heterogeneous platform finite element method earthquake responses cuda speed up; 分类号 TU311.3 [建筑科学—结构工程] O246 [理学—计算数学]; 在线阅读下载PDF 职称材料

题名使用OpenCL技术的影像快速畸变纠正方法在异构平台上的应用分析被引量：1: 7; 作者韦博文李涛李广宇汪致恒何沐师悦龄刘路遥张瑞; 机构西南交通大学地球科学与环境工程学院国家测绘地理信息局卫星测绘应用中心; 出处《计算机科学》 CSCD 北大核心 2016年第S2期167-169,196,共4页; 基金国家自然科学基金(41474003) 四川省应急测绘与防灾减灾工程技术研究中心开放基金(K2015B007)资助; 文摘针对海量遥感数据应用中日益显著的处理效率低下和计算瓶颈问题,基于通用计算机图形处理单元的编程开发使用OpenCL并行处理技术对遥感数据处理及其过程进行加速,旨在为遥感影像大数据处理提供一条更为高效的途径。在不同显卡平台上对影像畸变纠正实施并行处理,结果表明,OpenCL技术在提高影像畸变纠正的速度方面作用显著,可取得29.1倍的最高加速效果;与CUDA并行处理技术的交叉验证进一步凸显了OpenCL技术在异构平台上实施并行处理时所具有的通用性的优势。; 关键词 OPENCL cuda 并行处理异构平台通用性畸变纠正; Keywords OpenCL cuda Parallel processing Heterogeneous platform commonality Distortion calibration; 分类号 TP751 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名基于GPU的LCS算法加速机制研究与实现: 8; 作者张常志牟澄黄小红马严; 机构北京邮电大学网络技术研究院信息网络中心; 出处《通信学报》 EI CSCD 北大核心 2013年第S2期9-13,共5页; 基金国家自然科学基金资助项目(61003282) 国家CNGI专项基金资助项目:可演进的下一代高智能网络架构研究和实验基金资助项目~~; 文摘协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较大,那么运行的时间将会非常长,为此不得不控制输入数据分组的大小和数量,这严重限制了所采用样本集的大小。提出了基于GPU对LCS运算实现加速的方法。在此基础上搭建和配置了CUDA平台,在此平台下研究并实现了LCS算法的并行性。通过对LCS算法在CUDA下并行性的研究,有效地加快了LCS算法的运行速度。实验结果表明,GPU下LCS算法的运行效率比CPU有了显著的提高。; 关键词协议特征识别 LCS算法 cuda平台 GPU加速; Keywords protocol feature recognition LCS algorithm cuda platform GPU acceleration; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名Falcon后量子算法的密钥树生成部件GPU并行优化设计与实现被引量：1: 9; 作者张磊赵光岳肖超恩王建新; 机构北京电子科技学院电子与通信工程系北京电子科技学院网络空间安全系; 出处《计算机工程》 CAS CSCD 北大核心 2024年第9期208-215,共8页; 基金国家重点研发计划(2017YFB0801803) 中央高校基本科研业务费资金(328202278,328202261,3282023005) +1 种基金北京电子科技学院一流学科建设项目(20210064Z0401)。; 文摘近年来,后量子密码算法因其具有抗量子攻击的特性成为安全领域的研究热点。基于格的Falcon数字签名算法是美国国家标准与技术研究所(NIST)公布的首批4个后量子密码标准算法之一。密钥树生成是Falcon算法的核心部件,在实际运算中占用较多的时间和消耗较多的资源。为此,提出一种基于图形处理器(GPU)的Falcon密钥树并行生成方案。该方案使用奇偶线程联合控制的单指令多线程(SIMT)并行模式和无中间变量的直接计算模式,达到了提升速度和减少资源占用的目的。基于Python的CUDA平台进行了实验,验证结果的正确性。实验结果表明,Falcon密钥树生成在RTX 3060 Laptop的延迟为6 ms,吞吐量为167次/s,在计算单个Falcon密钥树生成部件时相对于CPU实现了1.17倍的加速比,在同时并行1024个Falcon密钥树生成部件时,GPU相对于CPU的加速比达到了约56倍,在嵌入式Jetson Xavier NX平台上的吞吐量为32次/s。; 关键词后量子密码 Falcon算法图形处理器 cuda平台并行计算; Keywords post-quantum cryptography Falcon algorithm Graphics Processing Unit(GPU) cuda platform parallel computing; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于CUDA的图像快速并行细化算法的研究与实现	金汉均梅洪洋	《电子测量技术》	2014	2	在线阅读下载PDF 职称材料
2	CUDA分布式计算的取证应用	刘佳佳何佳龙吴顺祥	《计算机工程》 CAS CSCD 北大核心	2011	1	在线阅读下载PDF 职称材料
3	基于GPU的并行植物模拟生长算法	杨磊龚学余	《计算机工程与设计》北大核心	2016	6	在线阅读下载PDF 职称材料
4	基于通用计算平台SM4-CTR算法并行实现与优化	李晓东胡一鸣池亚平钱榕张健毅	《密码学报》 CSCD	2022	7	在线阅读下载PDF 职称材料
5	一种跨平台的并行编程框架设计与实现	李婷徐云聂鹏宇潘玮华	《计算机工程》 CAS CSCD	2014	1	在线阅读下载PDF 职称材料
6	基于CPU-GPU异构平台的高层结构地震响应分析方法研究	李红豫滕军李祚华	《振动与冲击》 EI CSCD 北大核心	2014	8	在线阅读下载PDF 职称材料
7	使用OpenCL技术的影像快速畸变纠正方法在异构平台上的应用分析	韦博文李涛李广宇汪致恒何沐师悦龄刘路遥张瑞	《计算机科学》 CSCD 北大核心	2016	1	在线阅读下载PDF 职称材料
8	基于GPU的LCS算法加速机制研究与实现	张常志牟澄黄小红马严	《通信学报》 EI CSCD 北大核心	2013	0	在线阅读下载PDF 职称材料
9	Falcon后量子算法的密钥树生成部件GPU并行优化设计与实现	张磊赵光岳肖超恩王建新	《计算机工程》 CAS CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料