期刊文献+
共找到1,831篇文章
< 1 2 92 >
每页显示 20 50 100
地形分析中坡度坡向算法并行化方法研究 被引量:10
1
作者 江岭 刘学军 +1 位作者 汤国安 宋效东 《计算机工程与科学》 CSCD 北大核心 2013年第4期18-23,共6页
数字地形分析(DTA)是在DEM上进行地形属性计算和特征提取的数字信息处理技术,广泛应用于各行各业。在分析地形分析中坡度坡向串行算法特征的基础上,对坡度坡向算法的并行化进行了深入研究。从数据并行的角度,对算法的数据拆分、结果融合... 数字地形分析(DTA)是在DEM上进行地形属性计算和特征提取的数字信息处理技术,广泛应用于各行各业。在分析地形分析中坡度坡向串行算法特征的基础上,对坡度坡向算法的并行化进行了深入研究。从数据并行的角度,对算法的数据拆分、结果融合及I/O策略进行了分析,构建了坡度坡向算法并行化方法。实验结果表明,本文提出的并行化方法可以有效对坡度坡向串行算法进行并行化改造,大幅度提高了算法的执行效率,具有较好的并行性能。方法的提出和实现亦可为类似矩阵型数据算法的并行化提供参考。 展开更多
关键词 数字地形分析 数字高程模型 坡度坡向 算法并行
在线阅读 下载PDF
基于MapReduce的Apriori算法并行化 被引量:13
2
作者 林长方 吴扬扬 +1 位作者 黄仲开 曾少俊 《江南大学学报(自然科学版)》 CAS 2014年第4期411-415,共5页
Apriori是挖掘关联规则最经典的算法之一,针对该算法存在的瓶颈问题研究了基于MapReduce编程框架的简单Apriori并行算法;并在简单Apriori并行算法的基础上提出一种采用固定多阶段结合挖掘策略的改进算法——多阶段并行算法。实验结果表... Apriori是挖掘关联规则最经典的算法之一,针对该算法存在的瓶颈问题研究了基于MapReduce编程框架的简单Apriori并行算法;并在简单Apriori并行算法的基础上提出一种采用固定多阶段结合挖掘策略的改进算法——多阶段并行算法。实验结果表明,改进算法能缩短挖掘时间,提高执行的效率。 展开更多
关键词 云计算 多阶段并行算法 APRIORI算法
在线阅读 下载PDF
面向流数据的决策树分类算法并行化 被引量:16
3
作者 季一木 张永潘 +2 位作者 郎贤波 张殿超 王汝传 《计算机研究与发展》 EI CSCD 北大核心 2017年第9期1945-1957,共13页
随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了... 随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了适应大数据环境下流数据分类算法的要求,必须对传统的静态离线数据分类算法进行改进,提出基于分布式计算平台Storm的P-HT并行化算法.算法在满足Storm流处理平台要求基础上,通过滑动窗口机制、替代子树机制和并行化处理,提高了算法的灵活性和通用性,并且能良好地适应数据流的概念漂移.最后通过实验验证该算法的有效性和高效性,结果表明在与传统C4.5算法相比精度没有降低的情况下,改进的P-HT算法具有更大的吞吐量和更快的处理速度. 展开更多
关键词 流数据 分类算法 Storm平台 滑动窗口 C4.5算法 并行算法
在线阅读 下载PDF
基于通用计算平台SM4-CTR算法并行实现与优化 被引量:6
4
作者 李晓东 胡一鸣 +2 位作者 池亚平 钱榕 张健毅 《密码学报》 CSCD 2022年第4期663-676,共14页
随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为... 随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为通用的、普及化的算力资源.本文基于通用的计算机平台,提出了利用其本地GPU进行CTR工作模式下SM4算法高速加解密的并行实现和优化方案.实验表明,本文提出的SM4-CTR并行加解密方案能够有效提高SM4算法的运行效率,在通用的计算机平台上,能够达到40倍加速比,加解密速率达到了14.192 Gbps.实验中还分析了线程块划分对GPU并行加速效果的影响,最优线程块大小为128到512,且必须为32的整倍数.最后,基于本文实验的结果与其他团队的优化SM4方案进行对比,包括传统工作模式下利用CPU、GPU优化的方案和利用软件快速实现的方案,对比结果显示即便之前团队的方案运行的平台硬件条件好于本文实验环境,文中提出的方案运行速率依然能做到大幅领先.因此,本文方案在安全性、运算速率提高的同时适用平台也更加广泛,在实际生活中针对大数据和个人数据的安全保护中必将发挥巨大的作用. 展开更多
关键词 SM4算法 CTR模式 CUDA GPU加速 并行算法 通用计算机平台
在线阅读 下载PDF
CPU+GPU异构平台的一致性图像配准算法并行实现 被引量:1
5
作者 易见兵 陈国良 杨烜 《小型微型计算机系统》 CSCD 北大核心 2014年第1期114-120,共7页
针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算法中的弹性变换求解及逆函数求解的并行实现,在CPU上实现变量初始化以及迭代更新等过程,充分利用异构平台... 针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算法中的弹性变换求解及逆函数求解的并行实现,在CPU上实现变量初始化以及迭代更新等过程,充分利用异构平台优势,提高该算法的运行效率。实验结果表明该并行实现方法可以获得较高的加速比. 展开更多
关键词 GPU 加速比 图像配准 并行算法
在线阅读 下载PDF
分批处理的K-means算法并行实现 被引量:2
6
作者 兰远东 刘宇芳 徐涛 《计算机工程》 CAS CSCD 2012年第13期145-147,151,共4页
为解决K-means算法计算量大、收敛缓慢、运算耗时长等问题,给出一种新的K-means算法的并行实现方法。在通用计算图形处理器架构上,使用统一计算设备架构(CUDA)加速K-means算法。采用分批原则,更合理地运用CUDA提供的各种存储器,避免访... 为解决K-means算法计算量大、收敛缓慢、运算耗时长等问题,给出一种新的K-means算法的并行实现方法。在通用计算图形处理器架构上,使用统一计算设备架构(CUDA)加速K-means算法。采用分批原则,更合理地运用CUDA提供的各种存储器,避免访问冲突,同时减少对数据集的访问次数,以提高算法效率。在大规模数据集中的实验结果表明,该算法具有较快的聚类速度。 展开更多
关键词 数据挖掘 K-MEANS算法 统一计算设备架构 并行算法 聚类分析 图形处理器
在线阅读 下载PDF
动态环拓扑多机系统上DBP学习算法并行计算模型的构造与实现
7
作者 管惠维 《软件学报》 EI CSCD 北大核心 1996年第2期111-118,共8页
人工神经网络模型的软件模拟,其并行算法的设计、实现及性能评价对于神经网络计算机和各种专用神经网络VLSI芯片的研制具有十分重要的意义.本文首先构造了一个分布式存储器、信息传递方式的多机系统作为软件模拟人工神经网络的平... 人工神经网络模型的软件模拟,其并行算法的设计、实现及性能评价对于神经网络计算机和各种专用神经网络VLSI芯片的研制具有十分重要的意义.本文首先构造了一个分布式存储器、信息传递方式的多机系统作为软件模拟人工神经网络的平台,并用一个环拓扑结构的多Transputer网络予以实现.接着提出并实现了一个适用于动态环拓扑形式的DBP并行计算模型,它主要包括神经元的划分和映射策略;DBP中活性值、误差反向传播及权值修改的多机并行算法.然后讨论该DBP算法的时间复杂度和加速比. 展开更多
关键词 神经网络 学习算法 并行算法 环拓扑 多机系统
在线阅读 下载PDF
融合遗传和蚁群算法并行求解最短公共超串
8
作者 伍世刚 钟诚 《计算机应用》 CSCD 北大核心 2014年第7期1857-1861,1866,共6页
依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之间的传输开销,在CPU与GPU之间采取异步传送和不完全传送数据、GPU多个内核函数异步执行多个流的方法,设置G... 依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之间的传输开销,在CPU与GPU之间采取异步传送和不完全传送数据、GPU多个内核函数异步执行多个流的方法,设置GPU block线程数量为16的倍数、GPU共享存储器划分大小为32倍的bank,使用GPU常量存储器存储交叉概率、变异概率等需频繁访问的只读参数,将输入串矩阵和重叠部分长度矩阵只读大数据结构绑定到GPU纹理存储器,设计实现了一种多核CPU和GPU协同求解最短公共超串问题的计算、存储和通信高效的并行算法。求解多种规模的最短公共超串问题的实验结果表明,多核CPU与GPU协同并行算法比串行算法快70倍以上。 展开更多
关键词 最短公共超串 并行算法 GPU计算 遗传算法 蚁群算法
在线阅读 下载PDF
基于ABWO的并行DCNN优化算法 被引量:1
9
作者 毛伊敏 刘映兴 《计算机工程与设计》 北大核心 2025年第2期353-359,共7页
针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异... 针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异性较大的特征;设计一种ResNet-CBAMDW模型,提升模型性能;提出一种基于自适应黑寡妇优化算法的并行训练策略PT-ABWO优化初始参数,加快参数更新速度;提出一种基于大数据基准测试的动态负载均衡策略DLB-BDB,合理分配任务负载,提升集群并行效率。实验结果表明,该算法能够有效提升DCNN在大数据环境下的训练效率。 展开更多
关键词 大数据 并行深度卷积神经网络算法 密度峰值聚类 自适应黑寡妇优化算法 并行训练 基准测试 负载均衡
在线阅读 下载PDF
三维抛物方程模型海底边界处理与并行算法研究
10
作者 瞿宇轩 程兴华 +1 位作者 周晓兰 邹劭芬 《声学技术》 北大核心 2025年第2期181-188,共8页
构建一种迅速而准确的三维声场模型以满足实际海洋条件,始终是当前科学研究的重点目标。作为一种步进求解的手段,抛物方程近似的方法在已知初始地的声场后以间距为单位步进,最终能得到整个波导中的声场,这对于处理声场三维变化和声道水... 构建一种迅速而准确的三维声场模型以满足实际海洋条件,始终是当前科学研究的重点目标。作为一种步进求解的手段,抛物方程近似的方法在已知初始地的声场后以间距为单位步进,最终能得到整个波导中的声场,这对于处理声场三维变化和声道水平变化相关的场景是十分方便的。但相对地,三维空间中的计算复杂度和计算范围要远大于二维空间,这就严重制约了模型的计算精度和速度。为了提高现有抛物方程模型的计算精度和运算速度,文章对同时考虑距离、深度和水平方位角的水下声传播模型,即三维抛物方程模型进行了推导并分析其数学特性。同时通过在海底边界插入完全匹配层的方法,对模型进行了改进,提出一种计算精度更高的抛物方程模型。此外,为了减小三维声场计算的时间,文章研究改进了模型的可并行性,在FOR3D串行算法的基础上基于多线程的共享内存技术OpenMP开发了三维抛物方程模型的并行算法,并与普通吸收层在不同线程数下的运行时间进行对比。结果表明,基于完全匹配层模型的并行算法与原模型相比,无论是在加速比还是运算速度上都有很大的提高,具有重要的工程意义。 展开更多
关键词 三维抛物方程 人工吸收层 完全匹配层 并行算法
在线阅读 下载PDF
基于压缩感知稀疏域模型并行坐标下降算法的DOA估计方法
11
作者 王宏妍 白艳萍 +2 位作者 郑文康 王立府 续婷 《吉林大学学报(理学版)》 北大核心 2025年第3期924-933,共10页
针对现有的波达方向(direction of arrival,DOA)估计方法在低信噪比、小快拍、多信源条件下估计精度较低的问题,提出一种基于并行坐标下降算法的DOA估计方法.首先,对空域等角度均匀划分,构造超完备冗余字典;其次,采用并行坐标下降算法... 针对现有的波达方向(direction of arrival,DOA)估计方法在低信噪比、小快拍、多信源条件下估计精度较低的问题,提出一种基于并行坐标下降算法的DOA估计方法.首先,对空域等角度均匀划分,构造超完备冗余字典;其次,采用并行坐标下降算法的思想对稀疏信号进行重构,得到信号在空域的稀疏系数矩阵;最后,将稀疏矩阵行向量的l2-范数映射到空域网格上,得到准确的DOA估计值.仿真实验结果表明:在低信噪比、小快拍、多信源条件下,该方法优于子空间类算法、贪婪类算法以及凸优化类算法,具有更低的均方根误差(RMSE)、更高的DOA估计精度和运行效率. 展开更多
关键词 波达方向估计 压缩感知 并行坐标下降算法 矢量水听器阵列信号
在线阅读 下载PDF
面向高速列车控制数据的推测并行检测算法
12
作者 马强 《计算机工程与设计》 北大核心 2025年第3期762-769,共8页
针对传统检测方法难以高效处理轨道交通中海量列控数据的问题,设计一种面向高速列车控制数据的推测并行检测算法。分析高速列车控制数据的结构,进行尝试性的数据划分,消解数据内部依赖;利用推测技术,对传统的检测算法展开并行化改造,规... 针对传统检测方法难以高效处理轨道交通中海量列控数据的问题,设计一种面向高速列车控制数据的推测并行检测算法。分析高速列车控制数据的结构,进行尝试性的数据划分,消解数据内部依赖;利用推测技术,对传统的检测算法展开并行化改造,规避传统方法中内联关系对检测顺序的影响;在分布式平台上使用并行化的算法对划分数据展开检测,借助推测并行技术和分布式平台,提高面向列车控制数据的检测效率。基于西安铁路局的列控数据进行实验,其结果表明,与传统检测方法和其它并行检测方法相比,所提并行算法具有更好的检测效率、良好的可扩展,能够对海量的高速列车控制数据展开及时有效的检测。 展开更多
关键词 轨道交通 高速列车 列控数据 异常检测 分布式计算 推测并行 并行算法
在线阅读 下载PDF
基于并行球形译码算法的PMSM多步预测控制
13
作者 刘涛 娄瀚文 +1 位作者 李跃华 李博 《组合机床与自动化加工技术》 北大核心 2025年第4期102-106,共5页
模型预测控制在近几十年成为永磁同步电机控制领域的研究热点,其中多步预测算法相比传统的单步预测算法,具有更优的动稳态性能。但其寻优过程复杂且计算量大,限制了其在电机驱动领域的应用。为此,针对永磁同步电机驱动系统进行研究,提... 模型预测控制在近几十年成为永磁同步电机控制领域的研究热点,其中多步预测算法相比传统的单步预测算法,具有更优的动稳态性能。但其寻优过程复杂且计算量大,限制了其在电机驱动领域的应用。为此,针对永磁同步电机驱动系统进行研究,提出了一种基于并行球形译码算法的多步预测控制策略。相比于传统的多步预测,所提控制策略将多步预测过程转化为最小二乘问题,采用并行球形译码寻优策略实现多个分支同时探索。在此基础上,设计了基于FPGA的并行计算方法,有效优化了寻优效率。实验结果表明,所提策略大大减少了多步预测算法的计算时间,进而实现更高的预测步数,有效降低了永磁同步电机的电流谐波失真与转矩脉动。 展开更多
关键词 永磁同步电机 多步预测控制 并行球形译码算法 并行计算
在线阅读 下载PDF
并行化的多目标优化海缆路由规划算法研究
14
作者 蒋佳芮 赵赞善 +1 位作者 段茂生 高冠军 《光通信研究》 北大核心 2025年第2期105-109,共5页
【目的】文章为了解决传统蚁群优化(ACO)算法更新同一张地图导致无法并行规划的缺陷,提出了一种并行多目标优化海缆路由规划算法,实现了局部区域的精细规划。【方法】文章采用分治思想将目标海域的栅格地图分割成多个栅格子图,建立了并... 【目的】文章为了解决传统蚁群优化(ACO)算法更新同一张地图导致无法并行规划的缺陷,提出了一种并行多目标优化海缆路由规划算法,实现了局部区域的精细规划。【方法】文章采用分治思想将目标海域的栅格地图分割成多个栅格子图,建立了并行化多目标优化海缆路由规划算法模型,并对模型关键参数进行优化,然后在最佳模型参数下,利用并行化蚁群优化(PACO)算法进行海底光缆路由规划,统计了Pareto前沿解下的海底光缆路由方案。【结果】仿真结果表明,并行多目标优化算法模型在分块数量为6,蚁群规模大小为150时,获得最佳的搜索能力和效率。PACO算法规划的海底光缆路由与传统ACO算法相比在相同风险条件下节省了33.9%的成本,且路由成本均小于传统ACO算法,路由最大成本与传统ACO算法的最小成本相比还降低了20.6%,同时相应的风险降低了65.8%。【结论】在多目标海底光缆路由规划中,与传统ACO算法相比,PACO算法不仅在规划结果上更优,而且运算时间效率提高至少8倍。 展开更多
关键词 海缆路由规划 并行蚁群优化算法 多目标优化
在线阅读 下载PDF
基于Spark和NRSCA策略的并行深度森林算法
15
作者 毛伊敏 刘绍芬 《计算机应用研究》 CSCD 北大核心 2024年第1期126-133,共8页
针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher ... 针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher score的特征选择策略(FS-NRS),通过衡量特征的相关性和冗余度,对特征进行过滤,有效减少了冗余及无关特征的数量;其次,提出了一种随机选择和等距提取的扫描策略(S-RSEE),保证了所有特征能够同概率被利用,解决了多粒度扫描两端特征利用率低的问题;最后,结合Spark框架,实现级联森林并行化训练,提出了基于重要性指数的特征筛选机制(FFM-II),筛选出非关键性特征,平衡增强类向量与原始类向量维度,从而加快模型收敛速度,同时设计了基于SCA的任务调度机制(TSM-SCA),将任务重新分配,保证集群负载均衡,解决了级联森林并行效率低的问题。实验表明,PDF-SNRSCA算法能有效提高深度森林的分类效果,且对深度森林并行化训练的效率也有大幅提升。 展开更多
关键词 并行深度森林算法 Spark框架 邻域粗糙集 正弦余弦算法 多粒度扫描
在线阅读 下载PDF
约束并行自适应代理模型优化算法及在弧形闸门优化设计中的应用 被引量:1
16
作者 王金涛 徐平 +1 位作者 铁瑛 张钰奇 《计算机集成制造系统》 EI CSCD 北大核心 2024年第10期3502-3513,共12页
针对并行仿真技术下复杂大型工程结构的优化设计问题,将自适应代理模型优化和计算机并行计算技术相结合,提出一种基于约束并行自适应采样的代理模型优化算法。算法的采样方法由局部最小模型预测单加点策略和全局双目标约束多加点策略构... 针对并行仿真技术下复杂大型工程结构的优化设计问题,将自适应代理模型优化和计算机并行计算技术相结合,提出一种基于约束并行自适应采样的代理模型优化算法。算法的采样方法由局部最小模型预测单加点策略和全局双目标约束多加点策略构成,通过构造约束期望提高函数和样本空间稀疏度函数对样本点进行筛选,使所获得的新样本点兼顾搜索目标函数局部最优区域和开发全局可行边界。通过对比分析测试算例与已有算法表明,该算法具有更好的优化效率、优化精度和稳定性。最后将算法运用于大型钢结构弧形闸门结构的多参数优化,分别采用3种自适应代理模型优化算法与基于静态代理模型的遗传算法进行求解,验证了所提算法的优越性。 展开更多
关键词 自适应代理模型 并行优化算法 多加点策略 约束优化 弧形闸门优化
在线阅读 下载PDF
面向区块链的协同业务建模及其并行优化算法
17
作者 上官子卓 李东鹤 杨清宇 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第12期131-140,共10页
针对供应链管理面临的协同高效性、信息可追溯性和信任危机等问题,提出了一个解决区块链多要素矛盾问题的并行计算模型PNSGA-Ⅲ。首先,深入挖掘区块链、链主企业和链上企业的制约关系,将链主企业成本、服务积分,链上企业参与数量以及区... 针对供应链管理面临的协同高效性、信息可追溯性和信任危机等问题,提出了一个解决区块链多要素矛盾问题的并行计算模型PNSGA-Ⅲ。首先,深入挖掘区块链、链主企业和链上企业的制约关系,将链主企业成本、服务积分,链上企业参与数量以及区块链稳定性等参数具象为多级多业务协同模型;其次,从提高遗传算法产生子代缓存区的效率角度出发,将交叉变异部分并行化处理,极大缩短模型求解时间;此外,为了解决帕累托解不能相互支配的问题,采用TOPSIS计算欧氏距离并决策理想解;最后,通过10组仿真实验验证了所提模型的有效性。结果表明:PNSGA-Ⅲ的计算时间比非并行算法节约了16.37%;区块链的矛盾制约机制提供了更广泛的选择范围,增强了其适应复杂需求的能力;在动态任务流程下,经过优化的S8场景的服务积分比未优化的场景高出45%。研究为供应链管理提供了新的视角和工具。 展开更多
关键词 区块链 协同业务 并行优化算法 多准则决策
在线阅读 下载PDF
基于deluxeFETI-DP并行算法的矩形太阳翼展开动力学高效仿真
18
作者 兰靖杰 张世雄 +1 位作者 荣吉利 刘铖 《宇航学报》 CSCD 北大核心 2024年第12期1897-1909,共13页
随着柔性太阳翼等可展开空间结构向轻量化和大型化方向发展,其展开过程常面临大转动和大变形等非线性动力学问题。通常采用柔性多体系统动力学方法构建高维非线性模型,以精确预测此类复杂动力学行为。然而,计算效率低下已成为限制该数... 随着柔性太阳翼等可展开空间结构向轻量化和大型化方向发展,其展开过程常面临大转动和大变形等非线性动力学问题。通常采用柔性多体系统动力学方法构建高维非线性模型,以精确预测此类复杂动力学行为。然而,计算效率低下已成为限制该数值模拟方法的主要瓶颈。为解决这一问题,基于有限元撕裂与连接-对偶原始(FETI-DP)并行算法,引入deluxe缩放方法用于柔性多体系统动力学仿真。该方法通过耦合子域界面的刚度矩阵,利用矩阵组合构造加权因子,平衡材料系数差异导致的刚度矩阵量级不均,从而优化界面方程的条件数,减少迭代次数。最后,基于deluxe FETI-DP并行算法对矩形太阳翼展开动力学进行高效仿真,并与串行算法及传统FETI-DP算法进行对比研究。数值结果表明,deluxe FETI-DP算法的仿真计算效率较串行算法提高了70.98%,较传统FETI-DP算法提高了64.16%。上述并行算法研究为大型矩形太阳翼展开动力学的高效仿真提供了理论参考。 展开更多
关键词 deluxe FETI-DP 并行算法 矩形太阳翼 展开动力学
在线阅读 下载PDF
北斗卫星船载导航信号并行捕获算法
19
作者 石默然 许承东 《舰船科学技术》 北大核心 2024年第2期134-138,共5页
信号捕获作为实现北斗卫星船载导航的第一阶段,也是最重要的一环,为此研究基于北斗卫星船载导航信号并行捕获算法,在短时间内捕获卫星信号,为船舶提供高精度的定位和导航服务。建立北斗卫星导航信号模型,依据模型生成的北斗卫星导航信号... 信号捕获作为实现北斗卫星船载导航的第一阶段,也是最重要的一环,为此研究基于北斗卫星船载导航信号并行捕获算法,在短时间内捕获卫星信号,为船舶提供高精度的定位和导航服务。建立北斗卫星导航信号模型,依据模型生成的北斗卫星导航信号,采用傅里叶变换(Fast Fourier Transformation,FFT)算法以及快速傅里叶逆变换(Inverse Fast Fourier Transform,IFFT)算法,通过并行频率搜索和并行码相位搜索分别将伪随机码相位、载波频移的二维搜索变成一维进行并行搜索,获取北斗卫星信号的伪随机码和载波频移,实现北斗卫星船载导航信号并行捕获。实验结果表明,该算法可以成功地捕获船载导航信号,并且捕获耗时短;对船载导航信号的载波频率估计误差小。 展开更多
关键词 北斗卫星 信号导航模型 伪随机码 船载导航信号 FFT算法 并行捕获算法
在线阅读 下载PDF
面向离散粒子多尺度分析CPU/GPU架构的并行近邻搜索算法
20
作者 代长威 孔瑞林 季哲 《计算机工程与科学》 CSCD 北大核心 2024年第8期1349-1360,共12页
离散粒子法在解决前沿科学和工程领域中的复杂多尺度问题中具有广泛的应用。针对离散粒子大规模多尺度计算中相邻粒子对搜索过程计算复杂度显著增加和并发度下降的问题,提出了一种适用于众核架构(CPU/GPU)的高并发、低内存占用并行近邻... 离散粒子法在解决前沿科学和工程领域中的复杂多尺度问题中具有广泛的应用。针对离散粒子大规模多尺度计算中相邻粒子对搜索过程计算复杂度显著增加和并发度下降的问题,提出了一种适用于众核架构(CPU/GPU)的高并发、低内存占用并行近邻搜索算法。通过提出一种基于多层嵌套网格概念的层间相互作用方法,解决了不同层级间粒子对相互搜索时的数据竞争问题;通过引入非对称映射方法,避免了粒子在多级链表上的全映射,降低了内存消耗。一系列数值实验表明,该算法可有效处理108量级粒子体积跨度变化的多尺度问题,相较于传统算法可取得2~8倍的加速效果和更低的内存消耗特性,基于GPU的算法实现可达到当前领先的计算效率。 展开更多
关键词 离散粒子法 多尺度分析 近邻搜索 并行算法
在线阅读 下载PDF
上一页 1 2 92 下一页 到第
使用帮助 返回顶部