期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
基于模板保留的快速并行细化算法 被引量:11
1
作者 贺继刚 杨晓伟 +1 位作者 吴广潮 郝志峰 《计算机应用与软件》 CSCD 北大核心 2007年第12期26-28,103,共4页
快速并行算法(FPA)是经典算法中比较好的一种细化算法,但其存在固有缺陷,可能产生信息丢失。为了克服这个缺点,首先验证了FPA映像算法,在此基础上,提出了FPA重合算法,最后为了减少计算时间和冗余信息,提出了基于模板保留的FPA算法。实... 快速并行算法(FPA)是经典算法中比较好的一种细化算法,但其存在固有缺陷,可能产生信息丢失。为了克服这个缺点,首先验证了FPA映像算法,在此基础上,提出了FPA重合算法,最后为了减少计算时间和冗余信息,提出了基于模板保留的FPA算法。实验结果表明,基于模板保留的FPA算法运行速度快,对手写体汉字能很好地得到中心骨架,没有断点,较好地保持了原图像的拓扑结构,且细化为只有一个像素宽的图像。 展开更多
关键词 细化 快速并行算法 FPA映像算法 FPA重合算法 模板保留
在线阅读 下载PDF
一种三维快速傅里叶变换并行算法 被引量:9
2
作者 方维 孙广中 +1 位作者 吴超 陈国良 《计算机研究与发展》 EI CSCD 北大核心 2011年第3期440-446,共7页
三维快速傅里叶变换在物理计算领域中被广泛地使用.传统并行算法所使用的面划分和块划分方法并不适合稀疏三维向量的傅里叶变换.提出了一种新三维快速傅里叶变换的并行算法,针对稀疏三维向量的傅里叶变换,新算法通过重新调整x,y,z三个... 三维快速傅里叶变换在物理计算领域中被广泛地使用.传统并行算法所使用的面划分和块划分方法并不适合稀疏三维向量的傅里叶变换.提出了一种新三维快速傅里叶变换的并行算法,针对稀疏三维向量的傅里叶变换,新算法通过重新调整x,y,z三个方向的计算顺序,能最大限度地减少计算量以及进程间的通信量,从而减少计算时间,提高并行加速比.详尽的理论分析以及多个高性能计算平台上的实验结果证明:在对稀疏三维向量作傅里叶变换时,新算法优于传统算法. 展开更多
关键词 三维快速傅里叶变换 并行算法 并行计算 加速比
在线阅读 下载PDF
自适应多层快速多极子算法及其并行算法 被引量:7
3
作者 袁军 邱扬 +2 位作者 刘其中 郭景丽 谢拥军 《电波科学学报》 EI CSCD 北大核心 2008年第3期455-459,共5页
在多层快速多极子算法的基础上提出了一种改进的电大问题电磁散射快速算法及其并行算法。算法中将基函数和权函数分别用不同空间位置上的点源函数展开,使各部分的积分计算得到大大简化,所有转移过程可由快速傅里叶变换计算完成,同时还... 在多层快速多极子算法的基础上提出了一种改进的电大问题电磁散射快速算法及其并行算法。算法中将基函数和权函数分别用不同空间位置上的点源函数展开,使各部分的积分计算得到大大简化,所有转移过程可由快速傅里叶变换计算完成,同时还给出了该算法的并行化算法。数值结果说明了算法的有效性。 展开更多
关键词 多层快速多极子 自适应 电磁散射 并行算法
在线阅读 下载PDF
并行多层快速多极子算法的最细层处理改进 被引量:5
4
作者 刘战合 姬金祖 +1 位作者 蒋胜矩 李洁 《系统工程与电子技术》 EI CSCD 北大核心 2011年第3期482-485,489,共5页
基于消息传递平台(message passing interface,MPI),从多层快速多极子算法(multilevel fast multipole algorithm,MLFMA)实施过程出发,实现了飞行器雷达散射截面(radar cross section,RCS)的并行计算,提出一种新的并行设计方案。改进了... 基于消息传递平台(message passing interface,MPI),从多层快速多极子算法(multilevel fast multipole algorithm,MLFMA)实施过程出发,实现了飞行器雷达散射截面(radar cross section,RCS)的并行计算,提出一种新的并行设计方案。改进了基于立方体组的并行处理技术,减少了最细层计算的通信量;考虑到内存的主要组成部分,为提高算法并行效率,采用一种用于积分方程中近组作用矩阵的并行处理方法,对其采用按行平均分配到各计算结点的方法组建相关矩阵元素,使该部分通信量为零,各节点可独立计算并节省内存;同时优化了其他物理量的内存分配。算例说明,所提方法可明显提高计算效率,并具有精度好、负载均衡优良的特点。 展开更多
关键词 多层快速多极子算法 并行 雷达散射截面 飞行器
在线阅读 下载PDF
GPS姿态测量并行遗传算法快速搜索技术 被引量:4
5
作者 许江宁 万德钧 +1 位作者 王庆 田华明 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第3期500-505,共6页
提出了一种基于并行遗传算法细粒度模型和模糊度函数法的GPS姿态测量快速搜索技术 (ambiguityfunctionparallelgeneticalgorithms,AFPGA) ,它能够避开整周模糊度的求解而直接解算载体的航向和姿态 .AFPGA采用个体邻域间的进化 ,既具备... 提出了一种基于并行遗传算法细粒度模型和模糊度函数法的GPS姿态测量快速搜索技术 (ambiguityfunctionparallelgeneticalgorithms,AFPGA) ,它能够避开整周模糊度的求解而直接解算载体的航向和姿态 .AFPGA采用个体邻域间的进化 ,既具备了较强的全局搜索能力 ,又减小了各处理器之间的数据通信量 ,从而保证在获得全局最优解的前提下加快姿态解算速度 ,并易于算法的硬件实现 .运用AFPGA对一组GPS实测数据进行了 1 0 0次独立搜索 ,得到 :航向角搜索方差为 0 .2 4°,俯仰角搜索方差为 0 .1 5°;平均搜索时间为 0 .6s,成功率为 1 0 0 % ,搜索空间为模糊度函数法的 0 .0 5 % .通过对AFPGA不同的模型进行分析 ,并与SGA(simplegeneticalgo rithm) ,AFGA(ambiguityfunctiongeneticalgorithm)进行对比 。 展开更多
关键词 快速搜索技术 遗传算法 并行遗传算法 GPS 姿态测量 全球定位系统 惯性导航
在线阅读 下载PDF
一种高性能并行多层快速多极子算法 被引量:8
6
作者 潘小敏 盛新庆 《电子学报》 EI CAS CSCD 北大核心 2010年第3期580-584,共5页
针对主流并行计算机架构以及电特大目标的特点,提出并实现一种高性能并行多层快速多极子算法.采用由粗到细、多层次渐进展开的表述形式,并配以算例,具体分析算法每个环节的数值性能,充分研究、展示算法的效率和精度.使用本文算法,成功... 针对主流并行计算机架构以及电特大目标的特点,提出并实现一种高性能并行多层快速多极子算法.采用由粗到细、多层次渐进展开的表述形式,并配以算例,具体分析算法每个环节的数值性能,充分研究、展示算法的效率和精度.使用本文算法,成功计算了未知数超过3亿1千万,电尺寸达到2000个波长的电特大目标的电磁散射. 展开更多
关键词 多层快速多极子算法 并行 散射
在线阅读 下载PDF
Level set函数快速步进重构并行算法的改进 被引量:4
7
作者 黄筱云 董国海 +1 位作者 常佳夫 蒋学炼 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第6期836-842,共7页
为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模... 为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模型,实现了圆球、圆环管和哑铃等值面并行重构。并行重构数值结果表明:只要子区域均分初始表面边界,level set函数全局或局部并行重构均具有良好加速比,8线程的最大加速比可接近6。 展开更多
关键词 LEVEL set函数 快速步进法 重构 并行算法 多线程技术 OpenMP多线程技术
在线阅读 下载PDF
一种基于矢量有限元与多层快速多极子技术的电磁散射快速并行算法 被引量:2
8
作者 袁军 刘其中 郭景丽 《电子学报》 EI CAS CSCD 北大核心 2008年第3期520-526,共7页
在混合矢量有限元/多层快速多极子算法的基础上提出了一种快速算法及其并行算法,该算法中,其有限元部分的计算可在单元级上完成,无须生成总体系数矩阵,因此可大大节省内存及计算时间;对多层快速多极子部分,将基函数和权函数分别用不同... 在混合矢量有限元/多层快速多极子算法的基础上提出了一种快速算法及其并行算法,该算法中,其有限元部分的计算可在单元级上完成,无须生成总体系数矩阵,因此可大大节省内存及计算时间;对多层快速多极子部分,将基函数和权函数分别用不同空间位置上的点源函数展开,使阻抗积分计算得到大大简化,所有转移过程可由快速傅立叶变换计算完成,同时还给出了一些其他的改进措施.数值结果说明了算法的有效性. 展开更多
关键词 矢量有限元 多层快速多极子 电磁散射 并行算法
在线阅读 下载PDF
一种快速并行关联规则算法研究及仿真 被引量:2
9
作者 王华秋 曹长修 王越 《计算机应用研究》 CSCD 北大核心 2005年第7期223-225,共3页
在比较了当前几种并行关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,为了解决其性能和效率方面存在的问题,提出了一种快速挖掘策略的并行处理算法(FPARM),并对这种快速并行关联规则算法的性能作了比较分析。经过... 在比较了当前几种并行关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,为了解决其性能和效率方面存在的问题,提出了一种快速挖掘策略的并行处理算法(FPARM),并对这种快速并行关联规则算法的性能作了比较分析。经过计算机仿真实验的性能比较,采用快速并行算法的性能和效率提高了,达到了算法优化的目的。 展开更多
关键词 快速并行关联规则算法 同步次数 扫描次数 计算机仿真
在线阅读 下载PDF
求对称方阵特征值的一种快速并行算法 被引量:1
10
作者 陈崚 周解 殷新春 《计算机工程与应用》 CSCD 北大核心 2002年第15期83-85,109,共4页
该文针对经典雅可比算法求对称矩阵特征值不但要选主元素,而且还要同时进行行、列旋转变换、数据相关关系复杂、额外计算开销大、不易并行的缺点,提出了一种基于矩阵单侧旋转的算法并对此算法进行分析。最后通过该算法在PC机和分布式存... 该文针对经典雅可比算法求对称矩阵特征值不但要选主元素,而且还要同时进行行、列旋转变换、数据相关关系复杂、额外计算开销大、不易并行的缺点,提出了一种基于矩阵单侧旋转的算法并对此算法进行分析。最后通过该算法在PC机和分布式存储的大规模并行处理机曙光1000上的实验数据对比验证了该算法的性能较雅可比算法优越。 展开更多
关键词 对称方阵特征值 快速并行算法 雅可比算法 单侧旋转算法 计算机
在线阅读 下载PDF
高效2^n并行快速FIR算法及其实现方法 被引量:1
11
作者 胡剑浩 曾维棋 +1 位作者 费超 陈杰男 《电子科技大学学报》 EI CAS CSCD 北大核心 2020年第2期182-186,共5页
快速有限脉冲响应(FIR)算法(FFA)突破了传统并行FIR滤波器复杂度随并行度线性增加的局限性,效率大幅提高。然而目前缺少对高并行FFA通用算法和实现架构的研究。该文提出了高效2^n并行FFA,并给出了其通用算法形式与实现架构;同时讨论了... 快速有限脉冲响应(FIR)算法(FFA)突破了传统并行FIR滤波器复杂度随并行度线性增加的局限性,效率大幅提高。然而目前缺少对高并行FFA通用算法和实现架构的研究。该文提出了高效2^n并行FFA,并给出了其通用算法形式与实现架构;同时讨论了对于非2^n并行FFA的实现架构。通过算法分析和硬件效率评估,本文算法及其实现架构在相同的并行度和性能条件下,比传统并行算法有显著改善,且随着并行度的增加,这种优势更加明显。该算法在高并行FIR滤波器的应用中有很大优势。 展开更多
关键词 2^n并行 快速FIR算法 FIR滤波器 硬件效率
在线阅读 下载PDF
面向像素的并行快速后向投影算法 被引量:1
12
作者 李传中 邓钰栋 +3 位作者 苏卫民 顾红 马超 陈金立 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第5期651-657,共7页
针对后向投影算法运算量大和实时性差的问题,该文在图形处理器的并行处理架构下,结合时域快速后向投影算法,提出了面向像素的并行快速后向投影算法。该方法距离向根据分辨率要求进行划分并分配并行线程,方位向聚焦则通过多级子孔径合并... 针对后向投影算法运算量大和实时性差的问题,该文在图形处理器的并行处理架构下,结合时域快速后向投影算法,提出了面向像素的并行快速后向投影算法。该方法距离向根据分辨率要求进行划分并分配并行线程,方位向聚焦则通过多级子孔径合并与图像分裂技术来降低运算量。通过比较该文算法、全局后向投影算法和距离多普勒算法的理论计算量、成像时间和加速比可以看出,该文算法的运算速度比后向投影算法大大提高。三种算法针对实测数据成像时间与成像效果的对比验证了该文算法的有效性和工程实用价值。 展开更多
关键词 合成孔径雷达 图形处理器 面向像素 并行快速后向投影算法
在线阅读 下载PDF
GPU上高光谱快速ICA降维并行算法 被引量:1
13
作者 方民权 周海芳 +1 位作者 张卫民 申小龙 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第4期65-70,共6页
高光谱影像降维快速独立成分分析过程包含大规模矩阵运算和大量迭代计算。通过分析算法热点,设计协方差矩阵计算、白化处理、ICA迭代和Ic变换等关键热点的图像处理单元映射方案,提出并实现一种G-FastICA并行算法,并基于GPU架构研究... 高光谱影像降维快速独立成分分析过程包含大规模矩阵运算和大量迭代计算。通过分析算法热点,设计协方差矩阵计算、白化处理、ICA迭代和Ic变换等关键热点的图像处理单元映射方案,提出并实现一种G-FastICA并行算法,并基于GPU架构研究算法优化策略。实验结果显示:在处理高光谱影像降维时,CPU/GPU异构系统能获得比CPU更高效的性能,G—FastICA算法比串行最高可获得72倍加速比,比16核CPU并行处理快4~6.5倍。 展开更多
关键词 图像处理单元 高光谱影像降维 快速独立成分分析 并行算法 性能优化
在线阅读 下载PDF
基于Java的按位拆分快速排序并行算法 被引量:1
14
作者 庹清 宋耀虎 《计算机应用》 CSCD 北大核心 2012年第9期2455-2457,共3页
针对大数据量排序算法优化问题,提出一种基于Java的按位拆分的排序新算法。该排序算法按照位拆分数据,并结合Java的多线程对拆分的数据进行并行处理。数据实验结果表明,对于大数据量排序,该算法性能明显优于快速排序算法,而且算法具有... 针对大数据量排序算法优化问题,提出一种基于Java的按位拆分的排序新算法。该排序算法按照位拆分数据,并结合Java的多线程对拆分的数据进行并行处理。数据实验结果表明,对于大数据量排序,该算法性能明显优于快速排序算法,而且算法具有很好的并行效率。 展开更多
关键词 按位拆分 快速排序 并行算法 数据实验 算法分析
在线阅读 下载PDF
并行化快速评估算法初步研究 被引量:1
15
作者 丰彪 余世舟 《自然灾害学报》 CSCD 北大核心 2019年第5期105-112,共8页
本文针对传统应急评估软件计算速度偏慢、评估时间过长的问题,利用GPU加速计算技术,开展应急快速评估算法的并行化研究。在分析串行评估算法性能瓶颈的基础上,运用计算任务并行化和数据处理并行化的方法,提出了基于CPU-GPU混合架构的并... 本文针对传统应急评估软件计算速度偏慢、评估时间过长的问题,利用GPU加速计算技术,开展应急快速评估算法的并行化研究。在分析串行评估算法性能瓶颈的基础上,运用计算任务并行化和数据处理并行化的方法,提出了基于CPU-GPU混合架构的并行化评估模型,给出了分区和分层的数据并行处理方案。与传统的串行评估模型相比,并行评估模型可以充分发挥当前主流计算机的计算能力,计算速度更快,数据处理能力更强,更适合震后应急救援工作的实际需求。该模型经软件优化后,可大大缩短震后快速评估所需的时间,为震后早期决策提供更为及时有效的支持。 展开更多
关键词 地震应急 快速评估 评估算法 并行计算 CPU-GPU
在线阅读 下载PDF
运用可变模板进行并行图像处理的一种快速算法
16
作者 董育宁 《计算机学报》 EI CSCD 北大核心 2003年第3期332-339,共8页
提出了一种在并行机上有效地计算 (空间 )可变模板的方法 .论证了利用一个在图像网格点处计算多项式的优化算法 ,可以大大减少可变模板的运算量 .对于包含非多项式函数的可变模板 ,可以用函数的泰勒级数展开实现在像素点上的递推运算 .... 提出了一种在并行机上有效地计算 (空间 )可变模板的方法 .论证了利用一个在图像网格点处计算多项式的优化算法 ,可以大大减少可变模板的运算量 .对于包含非多项式函数的可变模板 ,可以用函数的泰勒级数展开实现在像素点上的递推运算 .详细分析了可变模板中若干常用函数的泰勒展开用于实现模板运算的合理性、准确性和有效性 .关于硬件的影响以及该方法的适用范围 ,也做了讨论 . 展开更多
关键词 可变模板 并行图像处理 快速算法 非多项式函数 计算机
在线阅读 下载PDF
面向飞腾处理器平台的快速卷积算法优化
17
作者 赵亚飞 杨耀功 +1 位作者 王永刚 魏继增 《上海理工大学学报》 CAS CSCD 北大核心 2024年第6期610-619,共10页
为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中... 为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中的访存效率。配合分块方案设计实现高性能的矩阵乘法微内核,使用向量外积运算更新数据,提高计算访存比,实现最大程度掩盖访存指令的延迟。最终实验结果表明,FastInfer在FT-2000/4处理器上的峰值计算性能达到99.56 GFLOPS。在不同输入规模的通用矩阵乘法测试中,FastInfer性能是OpenBLAS算法的1.07倍和1.52倍。在卷积测试中,FastInfer性能是ARM Compute Library算法的1.32倍,实现了在FT-2000/4多核处理器上的高性能卷积计算。 展开更多
关键词 深度学习 快速卷积算法 并行计算 通用矩阵乘法
在线阅读 下载PDF
并行多层快速多极子算法最细层数据的建立 被引量:1
18
作者 郭海林 胡悦 +1 位作者 童维勤 支小莉 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期421-425,共5页
分布树最细层数据的建立是并行多层快速多极子算法(MLFMA)的基础.最细层数据分布均匀与否,会影响到后续整个算法的负载平衡及其并行效率.研究了最细层数据的建立方法,提出采用并行正则采样排序算法来代替众多文献所推荐的并行桶排序算法... 分布树最细层数据的建立是并行多层快速多极子算法(MLFMA)的基础.最细层数据分布均匀与否,会影响到后续整个算法的负载平衡及其并行效率.研究了最细层数据的建立方法,提出采用并行正则采样排序算法来代替众多文献所推荐的并行桶排序算法,以此来建立分布树的最细层数据.针对多种常见的散射体在不同处理器数下的实验结果表明,在大多数情况下,改进后的算法较原算法性能有较为明显的提高. 展开更多
关键词 多层快速多极子算法 分布树 并行正则采样排序 并行桶排序 消息传递接口
在线阅读 下载PDF
分组密码uBlock算法快速软件实现 被引量:1
19
作者 高莹 汪龙昕 +4 位作者 田蕾 胡洋 张宇鹏 严宇 伍前红 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第6期96-106,共11页
为对国产分组密码算法uBlock进行软件优化,选择支持256 bit数据位宽的AVX2指令集,提高编译器自动优化等级,优化函数的调用过程,优化数据存储结构,综合使用高位并行、低延迟指令逻辑优化等方法实现单线程并行计算。通过使用这种有效的组... 为对国产分组密码算法uBlock进行软件优化,选择支持256 bit数据位宽的AVX2指令集,提高编译器自动优化等级,优化函数的调用过程,优化数据存储结构,综合使用高位并行、低延迟指令逻辑优化等方法实现单线程并行计算。通过使用这种有效的组合方法,uBlock-128/128算法、uBlock-128/256算法和uBlock-256/256算法单密钥短消息加密的速度较原代码分别提升269%、182%和49%。基于这些优化方法,uBlock-128/128、uBlock-128/256和uBlock-256/256三个算法版本均实现了单密钥场景与多密钥场景。 展开更多
关键词 uBlock算法 AVX2指令集 并行运算 低延迟 快速软件实现
在线阅读 下载PDF
并行多层快速多极子算法中近场计算的负载均衡
20
作者 汤华宁 童维勤 +1 位作者 王辛刚 倪维立 《计算机应用与软件》 CSCD 2010年第4期274-275,共2页
指出多层快速多极子算法(MLFMA)近场计算部分负载均衡的核心在于近邻阻抗矩阵的划分。阐述按组对划分近邻阻抗矩阵的方案,辅以正方形扩展算法增加组对分布的聚集性,克服了传统的基于并行分布树最细层几何信息所产生的近邻阻抗矩阵划分... 指出多层快速多极子算法(MLFMA)近场计算部分负载均衡的核心在于近邻阻抗矩阵的划分。阐述按组对划分近邻阻抗矩阵的方案,辅以正方形扩展算法增加组对分布的聚集性,克服了传统的基于并行分布树最细层几何信息所产生的近邻阻抗矩阵划分的负载不均衡性。实验结果表明改进后算法的效率有明显提高。 展开更多
关键词 雷达散射截面 多层快速多极子算法 并行化计算 近邻阻抗矩阵 负载均衡
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部