期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
对称正定矩阵的并行LDL^T分解算法实现 被引量:3
1
作者 张健飞 姜弘道 《计算机工程与设计》 CSCD 2003年第10期75-77,共3页
基于网络机群这一新的并行环境和消息传递界面MPI给出了两种不带平方根的Cholesky并行分解算法, 算法采用行卷帘存储方案和提前发送策略,从而减少了负载的不平衡,增加了计算通信的重叠,减少了通信时 间。理论分析和数值试验均表明,算法... 基于网络机群这一新的并行环境和消息传递界面MPI给出了两种不带平方根的Cholesky并行分解算法, 算法采用行卷帘存储方案和提前发送策略,从而减少了负载的不平衡,增加了计算通信的重叠,减少了通信时 间。理论分析和数值试验均表明,算法具有较高的并行加速比和效率。 展开更多
关键词 对称正定矩阵 串行算法 计算复杂度 并行LDL^T分解算法 并行计算机
在线阅读 下载PDF
基于归一分解的并行多目标Dividing Rectangles算法
2
作者 李晨 陈逸东 +3 位作者 陆忠华 杨雪莹 王子田 迟学斌 《计算机研究与发展》 EI CSCD 北大核心 2024年第11期3909-3922,共14页
多目标优化问题普遍存在且难以解决,目前多采用多目标进化算法进行求解.然而,这些方法通常在种群初始化阶段和进化过程中包含随机操作以保持多样性,导致了其结果不可复现且缺乏全局收敛的理论保证.鉴于此,提出了一种基于归一分解的多目... 多目标优化问题普遍存在且难以解决,目前多采用多目标进化算法进行求解.然而,这些方法通常在种群初始化阶段和进化过程中包含随机操作以保持多样性,导致了其结果不可复现且缺乏全局收敛的理论保证.鉴于此,提出了一种基于归一分解的多目标Dividing Rectangles(DIRECT)算法,首先通过一种可较好捕捉复杂前沿的归一分解方法将原问题分解为一系列子问题,以降低问题计算复杂度;其次,采用Dividing Rectangles算法同时优化分解得到的子问题,并在优化过程中基于全局关联机制将生成的候选解分配给相应的子问题,以更好地保留优秀候选解并提高算法搜索效率;最后,证明了算法的收敛性.此外,为了进一步提高计算效率,提出了一种基于自适应关联迁移策略的多层次多粒度并行方案,并基于该方案对所提出的算法进行了并行化.将所提算法应用于多个基准优化问题,实验结果表明,相比于NSGA-II,所提串行算法能够产生收敛性、多样性更为优越的帕累托最优解集,并行算法可在大规模缩短问题求解时间的同时,进一步提升帕累托前沿近似精度. 展开更多
关键词 多目标优化 目标空间分解 Dividing Rectangles算法 并行计算 全局优化
在线阅读 下载PDF
基于区域分解技术的并行四面体网格生成算法 被引量:6
3
作者 徐权 崔涛 +1 位作者 刘青凯 曹小林 《计算机工程与设计》 CSCD 北大核心 2014年第1期153-157,共5页
面向三维复杂几何模型,提出了一种基于区域分解技术的并行四面体网格生成算法。该算法采用分而治之的策略,将复杂的三维几何区域分解成若干个子区域,将子区域分发到每个处理器上,在各个子区域上采用约束Delaunay三角化算法,并利用迭代... 面向三维复杂几何模型,提出了一种基于区域分解技术的并行四面体网格生成算法。该算法采用分而治之的策略,将复杂的三维几何区域分解成若干个子区域,将子区域分发到每个处理器上,在各个子区域上采用约束Delaunay三角化算法,并利用迭代的技术并行地生成四面体网格。数值实验结果表明,该算法具有良好的可扩展性和稳定性,与传统方法相比,不仅大大降低了网格生成的时间,同时保证了子区域之间交界面上网格的一致性和协调性,生成了高质量的四面体网格。 展开更多
关键词 网格生成 约束DELAUNAY三角化 并行四面体网格生成 区域分解 并行算法
在线阅读 下载PDF
交直流并联系统可靠性与概率动态安全分析(Ⅱ)——模拟的时序结构及并行分解算法 被引量:4
4
作者 任震 冉立 李正然 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第6期6-11,共6页
描述了用MonteCarlo模拟法评估交直流并联输电系统可靠性和概率动态安全性指标时的模拟时序结构。提出并证明了随机模拟的并行分解定理,建立了并行分解算法。最后通过算例说明了本文方法应用的可行性。
关键词 交直流系统 可靠性 概率动态安全分析 MONTE Carlo法 并行分解算法
在线阅读 下载PDF
定常Stokes方程一种基于完全区域分解的有限元并行算法 被引量:7
5
作者 尚月强 何银年 《应用数学和力学》 CSCD 北大核心 2010年第5期609-617,共9页
基于完全区域分解技巧,提出了一种求解定常Stokes方程的有限元并行算法.该算法中,所有子问题都是定义在整个求解区域上,但绝大部分自由度来自其所负责的子区域,从而使得算法稍加修改现有的串行程序即可实现相应的并行计算,实现简单,通... 基于完全区域分解技巧,提出了一种求解定常Stokes方程的有限元并行算法.该算法中,所有子问题都是定义在整个求解区域上,但绝大部分自由度来自其所负责的子区域,从而使得算法稍加修改现有的串行程序即可实现相应的并行计算,实现简单,通信需求少.数值结果验证了算法的高效性. 展开更多
关键词 STOKES方程 有限元方法 并行算法 完全区域分解
在线阅读 下载PDF
网络并行计算中矩阵QR分解的并行算法 被引量:4
6
作者 张艳 孙世新 《计算机应用》 CSCD 2000年第10期29-32,共4页
随着高速网络技术 (如ATM)的出现 ,网络并行计算系统 (NOW )已成为并行处理的主要平台 ,由于它的高通信延迟 ,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行。为此 ,有必要对算法重新进行任务划分 ,研究它在网络环境中的... 随着高速网络技术 (如ATM)的出现 ,网络并行计算系统 (NOW )已成为并行处理的主要平台 ,由于它的高通信延迟 ,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行。为此 ,有必要对算法重新进行任务划分 ,研究它在网络环境中的并行实现。基于这一点 ,本文对矩阵的QR分解提出了一种新的任务划分策略 ,并由此得到了它的一种粗粒度并行算法。实验结果表明 ,设计的并行算法在网络并行计算环境中具有较高的加速比。 展开更多
关键词 QR分解 并行算法 网络并行计算 矩阵
在线阅读 下载PDF
机群系统中矩阵的并行QR分解算法 被引量:1
7
作者 陈一鸣 杨爱民 +3 位作者 肖晓丹 陈杰 李霞 孙红霞 《燕山大学学报》 CAS 2007年第3期225-228,共4页
随着高速网络技术的快速发展,机群系统已经成为并行计算的主要平台,由于它的高通信延迟,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行,为此有必要研究它们在机群系统中的并行实现。基于这一点,本文对矩阵的QR分解提出了... 随着高速网络技术的快速发展,机群系统已经成为并行计算的主要平台,由于它的高通信延迟,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行,为此有必要研究它们在机群系统中的并行实现。基于这一点,本文对矩阵的QR分解提出了一种新的任务划分策略,并由此得到了它的一种粗粒度并行算法。实验结果表明,设计的并行算法在机群系统中具有较高的加速比。 展开更多
关键词 机群 QR分解 并行算法 加速比
在线阅读 下载PDF
基于MPI和OpenMP混合编程的非负矩阵分解并行算法 被引量:8
8
作者 唐兵 Laurent BOBELIN 贺海武 《计算机科学》 CSCD 北大核心 2017年第3期51-54,共4页
非负矩阵分解(NMF)作为一种数据降维和特征提取的有效工具,已经在文本聚类、推荐系统等多个领域得到应用,但是其计算过程比较复杂。对此,提出一种基于MPI+OpenMP的混合层次化并行NMF方法,其充分利用基于MPI的消息传递模型和基于OpenMP... 非负矩阵分解(NMF)作为一种数据降维和特征提取的有效工具,已经在文本聚类、推荐系统等多个领域得到应用,但是其计算过程比较复杂。对此,提出一种基于MPI+OpenMP的混合层次化并行NMF方法,其充分利用基于MPI的消息传递模型和基于OpenMP的共享存储模型各自的优势,并基于多核节点集群进行测试。实验结果表明,所设计的并行NMF算法达到了较高的加速比,能有效处理高阶矩阵的非负分解,极大地提高了计算的效率。 展开更多
关键词 非负矩阵分解 并行算法 MPI OpenMPI 可扩展
在线阅读 下载PDF
基于MPI的二维经验模分解并行算法 被引量:1
9
作者 庄展鹏 袁业立 +1 位作者 张杰 杨俊钢 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第12期1236-1242,共7页
针对二维经验模分解(BEMD)处理大尺寸图像耗时较长的问题,提出了一种基于MPI技术的BEMD并行算法.对BEMD串行程序中极值点选取、平面三角剖分、三角域内数值插值等几个主要部分的运行时间进行了统计,结果表明三角域内数值插值是耗时的主... 针对二维经验模分解(BEMD)处理大尺寸图像耗时较长的问题,提出了一种基于MPI技术的BEMD并行算法.对BEMD串行程序中极值点选取、平面三角剖分、三角域内数值插值等几个主要部分的运行时间进行了统计,结果表明三角域内数值插值是耗时的主要部分,也是并行化的重点处理部分;随后在高性能计算平台上构建并行环境,基于MPI技术对BEMD算法的包络面生成部分实现了并行化,具体方法是先将剖分后的三角形序列按照进程数均匀划分,使整个图像分割为若干子区域并分配给相应进程,然后各进程拟合出对应子区域的上下Bezier曲面并由0进程进行合并,进而生成上下包络面;最后通过加速比等指标对该算法进行测评.结果表明,算法在30核并行执行时加速比可达20.139 6,利用率为64.97%,运行效率的提升较为明显.在数据量达到原始数据的25倍时可扩展性指标为1.397 5,表明该算法对大数据量的任务有很好的适应性. 展开更多
关键词 二维经验模分解 MPI并行算法 大尺寸图像 分而治之法 Bernstein-Bezier插值
在线阅读 下载PDF
非定常Stokes方程一种基于完全重叠型区域分解的有限元并行算法 被引量:1
10
作者 尚月强 何银年 《工程数学学报》 CSCD 北大核心 2010年第2期233-241,共9页
基于完全重叠型区域分解技巧,本文提出了一种求解非定常Stokes方程的有限元并行算法。该算法的基本思想是首先对空间施行完全重叠型区域分解,然后各个处理器使用向后Euler格式独立并行求解关于时间t的常微分方程;在整个关于时间的迭代... 基于完全重叠型区域分解技巧,本文提出了一种求解非定常Stokes方程的有限元并行算法。该算法的基本思想是首先对空间施行完全重叠型区域分解,然后各个处理器使用向后Euler格式独立并行求解关于时间t的常微分方程;在整个关于时间的迭代过程中,无需处理器间的通信,具有良好的并行性能。该算法中每个处理器所负责的子问题是一个全局问题,它定义在整个求解区域上,但绝大部分自由度来自其所负责的子区域,从而使得该算法稍加修改现有的串行程序即可实现相应的并行计算,实现简单,具有重要的使用价值。同时通过数值算例,在曙光集群并行机上编程实现了上述算法,验证了其有效性。 展开更多
关键词 STOKES方程 有限元方法 重叠型区域分解 并行算法
在线阅读 下载PDF
矩阵的LU并行递归分解算法的设计研究 被引量:1
11
作者 黄丽嫦 《科学技术与工程》 北大核心 2012年第15期3626-3629,3635,共5页
分析了矩阵的LU分解原理,并在双核微机上设计实现了一种矩阵的LU并行递归分解算法.该算法的特点是引入分块矩阵把LU分解形成迭代递归的形式,进而较好地发挥了新型微机的并行运算和高速缓冲存储器的功能.实验结果表明该算法是可行和有效的。
关键词 矩阵 LU分解 并行递归算法
在线阅读 下载PDF
基于MPI电力系统潮流P-Q分解法的并行算法 被引量:2
12
作者 朱金凤 江全元 曹一家 《江南大学学报(自然科学版)》 CAS 2008年第2期157-161,共5页
为了更快更有效地提高大规模电力系统潮流计算的速度,引入并行处理技术,文中提出了一种基于MPI的电力系统潮流P-Q分解法的并行算法,将潮流计算问题分解为多个子任务在基于MPI消息传递模式的多处理机中同时进行计算.运用该并行算法,针对... 为了更快更有效地提高大规模电力系统潮流计算的速度,引入并行处理技术,文中提出了一种基于MPI的电力系统潮流P-Q分解法的并行算法,将潮流计算问题分解为多个子任务在基于MPI消息传递模式的多处理机中同时进行计算.运用该并行算法,针对不同规模的网络进行潮流计算,结果表明,该并行算法能有效地提高电力系统计算的速度,具有广阔的应用前景. 展开更多
关键词 P-Q分解 系数矩阵 因子表 高斯消去并行算法
在线阅读 下载PDF
一个基于QR分解的并行原-对偶内点算法 被引量:2
13
作者 陈政洪 郁松年 《应用科学学报》 CAS CSCD 2004年第4期549-552,共4页
首先介绍了原-对偶内点算法的主要计算步骤,阐明哪一步上可以进行并行化处理.接着介绍QR分解的理论,及如何利用QR分解并行求解线性方程组.最后提出了一种基于QR分解的并行内点算法,并给出了实验结果.
关键词 内点算法 QR分解 线性方程组 对偶 求解 计算步骤 并行
在线阅读 下载PDF
基于LDL^T分解求实对称矩阵特征值的递归算法 被引量:1
14
作者 张鹍 张有志 《计算机工程与应用》 CSCD 北大核心 2008年第3期78-80,共3页
基于线性代数与矩阵理论,给出利用LDLT分解计算实对称矩阵特征值的递归算法。该算法可求出实对称矩阵在给定区间内的特征值的个数,并可计算满足精度要求的特征值。理论分析和实际测试证明该算法是有效的。
关键词 LDL^T分解 实对称矩阵 特征值 递归算法
在线阅读 下载PDF
基于消息传递的时域分解并行算法研究
15
作者 李永刚 欧阳洁 《计算机工程与应用》 CSCD 北大核心 2006年第18期32-36,共5页
将Parareal算法中的预估校正格式加以改进,提出时域分解并行算法。基于主从模式和消息传递,具体考察了群体通信和非阻塞通信模式,并设计出通用而简便的并行化模型。在集群系统下对热传导方程和对流扩散方程的数值模拟结果表明:算法具有... 将Parareal算法中的预估校正格式加以改进,提出时域分解并行算法。基于主从模式和消息传递,具体考察了群体通信和非阻塞通信模式,并设计出通用而简便的并行化模型。在集群系统下对热传导方程和对流扩散方程的数值模拟结果表明:算法具有较高的加速性能以及良好的可扩展性,体现了时域分解的独特优势。 展开更多
关键词 时域分解 主从模式 消息传递 并行算法
在线阅读 下载PDF
基于参考曲线模型和并行非线性最小二乘算法的HPLC-DAD数据分解
16
作者 崔立志 凌志浩 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第5期686-692,共7页
HPLC-DAD数据分解问题是化学计量学领域的一个重要课题,也是很多其他研究领域的前提和基础。本文基于参考曲线模型,构造了一种三参数的色谱峰参考曲线,并提出了并行非线性最小二乘算法对参考曲线模型(RCM)进行求解。通过仿真实验和HPLC-... HPLC-DAD数据分解问题是化学计量学领域的一个重要课题,也是很多其他研究领域的前提和基础。本文基于参考曲线模型,构造了一种三参数的色谱峰参考曲线,并提出了并行非线性最小二乘算法对参考曲线模型(RCM)进行求解。通过仿真实验和HPLC-DAD数据实验,验证了本文提出的方法具有分辨率高、收敛速度快、参数易控制等特点。 展开更多
关键词 HPLC-DAD数据分解 参考曲线模型 并行非线性最小二乘算法
在线阅读 下载PDF
基于改进VNDS算法的并行机批量流调度
17
作者 杨振宏 何兴昌 +2 位作者 廖清亮 李晓刚 苏沛悦 《计算机集成制造系统》 EI CSCD 北大核心 2024年第12期4420-4434,共15页
为解决有限运算时间下的并行机批量流问题,提出基于订单拆分策略改进的变邻域分解搜索(VNDS)算法。该算法采用实数编码,在每次迭代前,按照固定规模将编码分解为多个小的编码块,相邻编码块之间相差固定步长的编码;每次迭代中利用交换、... 为解决有限运算时间下的并行机批量流问题,提出基于订单拆分策略改进的变邻域分解搜索(VNDS)算法。该算法采用实数编码,在每次迭代前,按照固定规模将编码分解为多个小的编码块,相邻编码块之间相差固定步长的编码;每次迭代中利用交换、插入邻域对各个编码块依次进行邻域搜索。利用循环转移理论设计算法的扰动邻域。为适应订单和子批可拆分的特点,利用两种拆分策略对VNDS算法进行改进,分别在算法两次相邻迭代之间和算法迭代过程终止后对订单或子批进行拆分,优化拖期和完工时间。实验结果表明,相比变邻域搜索算法、模拟退火算法和人工蜂群算法、改进后的VNDS算法在有限的时间内可以得到更好的解。将所提算法应用于卷烟厂的实际生产,可有效提高生产计划的制定效率。 展开更多
关键词 不相关并行 批量流 订单拆分 变邻域分解搜索算法
在线阅读 下载PDF
基于CPBOA的并行DCNN优化算法
18
作者 温占卿 毛伊敏 彭喆 《计算机工程与设计》 北大核心 2024年第11期3296-3303,共8页
针对大数据环境下并行DCNN算法存在的冗余特征图过多、卷积运算效率低下以及节点负载不均衡等问题,提出一种基于Spark和CPBOA的并行DCNN优化算法PDCNN-SCPBOA。提出一种基于奇异值分解与JS散度的特征压缩策略对特征图进行分组压缩,消除... 针对大数据环境下并行DCNN算法存在的冗余特征图过多、卷积运算效率低下以及节点负载不均衡等问题,提出一种基于Spark和CPBOA的并行DCNN优化算法PDCNN-SCPBOA。提出一种基于奇异值分解与JS散度的特征压缩策略对特征图进行分组压缩,消除过多的冗余特征图;结合Spark提出一种基于蝴蝶优化算法的并行CP分解策略,利用分解后的卷积核并行训练,提高卷积运算效率;提出一种基于簇分割的负载均衡策略,对中间数据簇进行均匀分配后再进行处理,平衡节点负载。实验结果表明,所提算法具有良好的训练效果,适用于大规模图像数据的分类。 展开更多
关键词 深度卷积神经网络算法 并行计算 分布式框架 特征压缩 张量分解 蝴蝶优化算法 负载均衡
在线阅读 下载PDF
面向语音分离的深层转导式非负矩阵分解并行算法
19
作者 李雨蓉 刘杰 +2 位作者 刘亚林 龚春叶 王勇 《计算机科学》 CSCD 北大核心 2020年第8期49-55,共7页
非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算... 非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算问题,文中提出深层转导式非负矩阵分解并行算法,综合考虑迭代更新过程的数据关联性,设计了一种任务间和任务内多级并行算法。该并行算法在任务级将分解训练语音得到对应基矩阵的过程作为两个独立的任务进行并行计算;在任务内部进程级把矩阵按行列划分,主进程把矩阵块分发到从进程,从进程接收当前矩阵块并计算结果矩阵子块,然后将当前进程矩阵块发送到下一进程,实现第二个矩阵中每一个矩阵块在所有进程的遍历,并计算结果矩阵对应子块的乘积,最后由主进程收集从进程数据块;在线程级子矩阵乘法运算的过程中,采取生成多线程,通过共享内存交换数据计算子矩阵块的加速策略。该算法为首个实现深层转导式非负矩阵分解的并行算法。在天河二号平台上的测试结果表明,在分离多说话人混合语音信号时,相比串行程序,所提出的并行算法能在不改变分离效果的前提下,使得预训练过程中使用64个进程的加速比为18,分离过程使用64个进程的对应加速比为24。相较于串行及MPI模型分离,混合模型分离时间大大缩短,从而证明了设计的并行算法可有效提高语音分离的效率。 展开更多
关键词 深层转导式非负矩阵分解并行算法 乘性迭代更新规则加速算法 消息传递接口 共享存储并行编程 语音分离
在线阅读 下载PDF
一种分块并行Cholesky分解动态调度算法 被引量:1
20
作者 吴荣腾 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2018年第5期845-850,共6页
为解决分块并行Cholesky分解过程中各处理器间的负载平衡问题,分析了算法的下三角矩阵特性以及各轮循环和循环内部各步骤基本计算任务之间存在的依赖关系,以各步骤的矩阵块基本计算任务为顶点,任务间的依赖关系为有向边,构造有向无环图... 为解决分块并行Cholesky分解过程中各处理器间的负载平衡问题,分析了算法的下三角矩阵特性以及各轮循环和循环内部各步骤基本计算任务之间存在的依赖关系,以各步骤的矩阵块基本计算任务为顶点,任务间的依赖关系为有向边,构造有向无环图,并根据有向无环图的性质建立二级队列,然后利用该队列对就绪任务进行排队,实现任务的动态调度.研究结果表明:在矩阵块数不是非常大的情况下,该算法在时间性能上比传统的分块并行Cholesky分解算法具有明显的优势. 展开更多
关键词 CHOLESKY分解 有向无环图 动态调度 负载平衡 排队算法 并行计算
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部