期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
对角线稀疏矩阵的SpMV自适应性能优化 被引量:6
1
作者 孙相征 张云泉 +2 位作者 王婷 李焱 袁良 《计算机研究与发展》 EI CSCD 北大核心 2013年第3期648-656,共9页
稀疏矩阵向量乘(SpMV)是科学计算中常用的内核之一,其运行速率跟非零元分布相关.针对对角线稀疏矩阵,提出了压缩行片段对角(compressed row segment diagonal,CRSD)存储格式.它利用"对角线格式"有效描述矩阵的对角线分布,区... 稀疏矩阵向量乘(SpMV)是科学计算中常用的内核之一,其运行速率跟非零元分布相关.针对对角线稀疏矩阵,提出了压缩行片段对角(compressed row segment diagonal,CRSD)存储格式.它利用"对角线格式"有效描述矩阵的对角线分布,区别于以往通用的计算方法,CRSD通过对给定应用的对角线稀疏矩阵采样再进行特定的优化.并且在软件安装阶段,通过自适应的方法选取适合具体运行平台的最优SpMV实现.在CPU端进行多线程并行化实现时,自适应调优过程中收集的信息还被用于线程间任务划分,以实现负载平衡.同时完成CRSD存储格式在GPU端的实现,并根据GPU端计算与访存的特点进行优化.实验结果表明:在Intel和AMD的多核平台使用相同线程数的情况下,与DIA相比,使用CRSD的加速比可以达到2.37X(平均1.7X);与CSR相比,可以达到4.6X(平均2.1X). 展开更多
关键词 CRSD 自适应性能优化spmv 对角线格式 对角线稀疏矩阵 GPU 科学应用
在线阅读 下载PDF
一种改进的自适应粒子群优化算法 被引量:28
2
作者 徐刚 瞿金平 杨智韬 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第9期6-10,共5页
针对粒子群优化算法中出现的对大规模问题的搜索失败,分析了粒子群优化算法的收敛性,指出了粒子速度与搜索失败的关系,提出了一种根据速度信息自适应调整参数的粒子群优化算法.在满足收敛性的条件下,该算法能使粒子根据理想速度自适应... 针对粒子群优化算法中出现的对大规模问题的搜索失败,分析了粒子群优化算法的收敛性,指出了粒子速度与搜索失败的关系,提出了一种根据速度信息自适应调整参数的粒子群优化算法.在满足收敛性的条件下,该算法能使粒子根据理想速度自适应调整参数进行搜索.实验结果表明,该算法能解决基本粒子群算法在求解高维、多峰等复杂非线性优化问题时出现的易陷入局部最优和不收敛等搜索失败问题. 展开更多
关键词 粒子群优化算法 自适应性 平均速度
在线阅读 下载PDF
面向国产申威26010众核处理器的SpMV实现与优化 被引量:13
3
作者 刘芳芳 杨超 +2 位作者 袁欣辉 吴长茂 敖玉龙 《软件学报》 EI CSCD 北大核心 2018年第12期3921-3932,共12页
世界首台峰值性能超过100P的超级计算机——神威太湖之光已经研制完成,该超级计算机采用了国产申威异构众核处理器,该处理器不同于现有的纯CPU,CPU-MIC,CPU-GPU架构,采用了主-从核架构,单处理器峰值计算能力为3TFlops/s,访存带宽为130GB... 世界首台峰值性能超过100P的超级计算机——神威太湖之光已经研制完成,该超级计算机采用了国产申威异构众核处理器,该处理器不同于现有的纯CPU,CPU-MIC,CPU-GPU架构,采用了主-从核架构,单处理器峰值计算能力为3TFlops/s,访存带宽为130GB/s.稀疏矩阵向量乘SpMV(sparse matrix-vector multiplication)是科学与工程计算中的一个非常重要的核心函数,众所周知,其是带宽受限型的,且存在间接访存操作.国产申威处理器给稀疏矩阵向量乘的高效实现带来了很大的挑战.针对申威处理器提出了一种CSR格式SpMV操作的通用异构众核并行算法,该算法从任务划分、LDM空间划分方面进行精细设计,提出了一套动静态buffer的缓存机制以提升向量x的访存命中率,提出了一套动静态的任务调度方法以实现负载均衡.另外还分析了该算法中影响SpMV性能的几个关键因素,并开展了自适应优化,进一步提升了性能.采用Matrix Market矩阵集中具有代表性的16个稀疏矩阵进行了测试,相比主核版最高有10倍左右的加速,平均加速比为6.51.通过采用主核版CSR格式SpMV的访存量进行分析,测试矩阵最高可达该处理器实测带宽的86%,平均可达到47%. 展开更多
关键词 稀疏矩阵向量乘 spmv 申威26010处理器 异构众核并行 自适优化
在线阅读 下载PDF
SpMV的自动性能优化实现技术及其应用研究 被引量:16
4
作者 袁娥 张云泉 +1 位作者 刘芳芳 孙相征 《计算机研究与发展》 EI CSCD 北大核心 2009年第7期1117-1126,共10页
在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大... 在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48. 展开更多
关键词 稀疏矩阵向量乘 启发式算法 自适应性能优化 存储访问模式 寄存器分块
在线阅读 下载PDF
基于自适应CEEMD方法的电能质量扰动检测与分析 被引量:12
5
作者 胡明 郭健鹏 +1 位作者 李富强 刘建华 《电力系统保护与控制》 EI CSCD 北大核心 2018年第21期103-110,共8页
针对现有时频分析方法处理非线性、非稳态信号自适应性的不足,提出了一种自适应互补集总经验模态分解(ACEEMD)方法。该方法通过对加噪辅助分解方法噪声准则的研究,引入相关均方根误差与信噪比两个参数作为加噪评价指标,自适应确定最优... 针对现有时频分析方法处理非线性、非稳态信号自适应性的不足,提出了一种自适应互补集总经验模态分解(ACEEMD)方法。该方法通过对加噪辅助分解方法噪声准则的研究,引入相关均方根误差与信噪比两个参数作为加噪评价指标,自适应确定最优加噪幅值和集总分解次数。且加入的噪声以正负成对的形式加到目标信号中,克服了原始分解方法存在的模态混叠问题、端点效应以及残余噪声大的缺点。最后将改进的方法与Hilbert变换相结合运用在电能质量扰动检测中,通过仿真实验验证所提方法既可以有效提取扰动的频率、幅值等特征参数,也可以准确定位扰动的时间,为电能质量检测与分析提供了一种新思路。 展开更多
关键词 电能质量扰动 互补集总经验模态分解 加噪参数优化 自适应性 特征提取
在线阅读 下载PDF
基于信息熵的自适应遗传算法 被引量:11
6
作者 郝翔 李人厚 《西安建筑科技大学学报(自然科学版)》 EI CSCD 1997年第1期34-38,共5页
现有自适应遗传算法陷入局部极小点后很难跳出,本文提出一种改进算法,用信息熵来估计系统分散度,使变异率随系统的分散度而变化。试验结果验证了该方法不仅速度快,而且几乎不陷入局部极小点。
关键词 遗传算法 优化算法 自适应性
在线阅读 下载PDF
异构平台上性能自适应FFT框架 被引量:9
7
作者 李焱 张云泉 《计算机研究与发展》 EI CSCD 北大核心 2014年第3期637-649,共13页
快速傅里叶变换(fast Fourier transform,FFT)在科学和工程界中具有着广泛的应用,尤其是在信号处理、图像处理以及求解偏微分方程领域.基于图形处理器(graphic processing unit,GPU)和加速处理器(accelerated processing unit,APU)的异... 快速傅里叶变换(fast Fourier transform,FFT)在科学和工程界中具有着广泛的应用,尤其是在信号处理、图像处理以及求解偏微分方程领域.基于图形处理器(graphic processing unit,GPU)和加速处理器(accelerated processing unit,APU)的异构平台,提出了自适应性能优化的大规模并行FFT(massively parallel FFT,MPFFT)框架.MPFFT框架采用了安装时和运行时2层自适应策略.安装时借助代码产生器可以生成被GPU程序内核(kernel)调用的任意长度的代码模板库(codelet);运行时根据自动调优技术使代码产生器生成高度优化的GPU计算代码.实验结果表明:MPFFT在APU平台上,一维、二维以及三维FFT相对于AMD clAmdFft 1.6取得的平均加速比分别为3.45,15.20以及4.47,在AMD HD7970GPU上平均加速比分别为1.75,3.01和1.69.在NVIDIA Tesla C2050GPU上取得的整体性能都达到了CUFFT 4.1的93%,最大加速比能够达到1.28. 展开更多
关键词 快速傅里叶变换 自适应性能优化 加速处理器 图形处理器 异构
在线阅读 下载PDF
面向异构计算平台的SpMV划分优化算法研究 被引量:2
8
作者 谈兆年 计卫星 +3 位作者 Akrem Benatia 高建花 李安民 王一拙 《计算机工程与科学》 CSCD 北大核心 2019年第4期590-597,共8页
稀疏矩阵向量乘SpMV在科学计算和工程问题中有着广泛的应用。稀疏矩阵的非零元素分布会极大地影响SpMV的计算效率,针对不同的数据分布模式使用特定算法进行加速可以获得显著的性能提升。CPU的控制能力强,适用于通用计算,而GPU的计算核心... 稀疏矩阵向量乘SpMV在科学计算和工程问题中有着广泛的应用。稀疏矩阵的非零元素分布会极大地影响SpMV的计算效率,针对不同的数据分布模式使用特定算法进行加速可以获得显著的性能提升。CPU的控制能力强,适用于通用计算,而GPU的计算核心多,并行度高,适用于数据密集型计算。根据CPU和GPU的不同特点,充分发挥二者的优势,可以使SpMV获得更大的性能提升。研究CPU-GPU混合架构上SpMV的任务划分与优化方法,针对2种主要的稀疏矩阵数据分布模式:Quasi-diagonal和Tetris,提出了一种基于SVR的任务二次分配算法。研究的2种稀疏矩阵模式具有很好的代表性,在实际科学工程应用中占比达到66%。实验评测结果表明,采用本文的算法之后,与GPU相比,异构平台上Quasi-diagonal和Tetris的加速比平均值分别达到1.74×和2.15×。 展开更多
关键词 异构计算 矩阵划分 协同优化 SVR spmv
在线阅读 下载PDF
被动式升沉补偿技术研究进展及趋势
9
作者 衣柏霖 展勇 徐建安 《哈尔滨工程大学学报》 北大核心 2025年第9期1838-1850,共13页
被动式升沉补偿技术是拓宽深海采矿和海上钻井等海上作业窗口期的有效解决方案,在面向重型载荷和对补偿精度需求相对较低的海工装备操作中具有不可替代的作用。本文在介绍升沉补偿技术基本原理的基础上,归纳分析被动式升沉补偿技术在物... 被动式升沉补偿技术是拓宽深海采矿和海上钻井等海上作业窗口期的有效解决方案,在面向重型载荷和对补偿精度需求相对较低的海工装备操作中具有不可替代的作用。本文在介绍升沉补偿技术基本原理的基础上,归纳分析被动式升沉补偿技术在物理模型、影响机制、参数优化与系统改进方面的研究进展,并提出该技术在多物理场耦合建模及验证、多学科协同高效设计优化和多工况自适应性装备开发方面的发展趋势,旨在为我国被动式升沉补偿技术的发展提供参考。 展开更多
关键词 被动式升沉补偿 升沉补偿 物理模型 影响机制 参数优化 多物理场耦合 协同优化 工况自适应性
在线阅读 下载PDF
引导交叉——一种新的遗传交叉策略 被引量:2
10
作者 李望移 郑金华 《计算机工程与应用》 CSCD 北大核心 2008年第29期40-43,共4页
介绍了遗传算法的优化方法,在已经存在的交叉算子上提出了一种新的交叉算子——引导交叉,它结合了异位交叉和等位交叉的特点,并加入个体反码表示形式,在执行交叉操作前有一个自适应的选择交叉方式的判断,给出了5组不同的测试函数的仿真... 介绍了遗传算法的优化方法,在已经存在的交叉算子上提出了一种新的交叉算子——引导交叉,它结合了异位交叉和等位交叉的特点,并加入个体反码表示形式,在执行交叉操作前有一个自适应的选择交叉方式的判断,给出了5组不同的测试函数的仿真实验。实验结果表明,引导交叉算子可比其他交叉算子更有效地提高遗传算法的收敛性,且易于找到全局最优解。 展开更多
关键词 引导交叉 自适应性 收敛性 函数优化 全局最优解
在线阅读 下载PDF
基于强化学习的热连轧智能PID厚度控制 被引量:1
11
作者 崔桂梅 朱佳童 《现代电子技术》 2022年第13期78-82,共5页
针对某钢厂2250热连轧产线是一个变时滞、强耦合的非线性系统,传统的PID控制在处理此类非线性系统时存在着抗干扰性差以及实时控制能力不足等问题,为了提高轧制成品质量,提出一种基于强化学习优化PID控制器参数的设计办法,并在钢铁热连... 针对某钢厂2250热连轧产线是一个变时滞、强耦合的非线性系统,传统的PID控制在处理此类非线性系统时存在着抗干扰性差以及实时控制能力不足等问题,为了提高轧制成品质量,提出一种基于强化学习优化PID控制器参数的设计办法,并在钢铁热连轧领域首次应用。该控制器通过强化学习与PID控制相结合,应用基于执行器⁃评价器结构以及径向基网络的自适应PID控制器在线优化PID控制器参数。实验结果表明,在外部存在干扰的情况下,该控制器能快速回到稳态,且在存在变时延的情况下响应迅速,能快速地作出反应,具有良好的动态性能。通过该控制器的设计结果证明,该智能优化控制器与传统PID控制器相比具有超调量小、响应时间短的优点,具有良好的鲁棒性以及自适应性。 展开更多
关键词 轧制过程 强化学习 偏差控制 径向基网络 智能体 板厚控制 时延 自适应性 参数优化
在线阅读 下载PDF
Grid平台上的NGS编译技术
12
作者 丛杨 王雷 +1 位作者 朱凯佳 刘又诚 《计算机工程与应用》 CSCD 北大核心 2003年第24期85-87,142,共4页
随着网络技术的发展,在异构平台上使用共同的计算和信息资源将很快成为可能。Grid(网格)就是这样一种提供资源共享的新兴平台,而在其之上的下一代软件程序(NGS)则对编译器提出了新的挑战犤1犦。未来Grid平台上的编译系统将是能够进行动... 随着网络技术的发展,在异构平台上使用共同的计算和信息资源将很快成为可能。Grid(网格)就是这样一种提供资源共享的新兴平台,而在其之上的下一代软件程序(NGS)则对编译器提出了新的挑战犤1犦。未来Grid平台上的编译系统将是能够进行动态编译和优化,根据实时系统以及网络的性能不断进行自我调整的软件模型,同时它还能为具有自适应性的应用程序提供编译支持。 展开更多
关键词 网格 下一代软件程序 自适应性 应用程序 动态编译 动态优化
在线阅读 下载PDF
ITIE:一种改进的域间出口选择算法
13
作者 曾志文 《计算机工程》 CAS CSCD 北大核心 2008年第10期114-116,共3页
一般的域间出口选择算法,如经典的热土豆算法只是根据域内事件来调整路由,故少量网络拓扑事件的变化就可导致BGP路由的大量变化;虽然TIE算法改进了对域内事件的敏感性,使其能对域间出口的选择进行调节,减轻路由的动荡性,但未给出阈值参... 一般的域间出口选择算法,如经典的热土豆算法只是根据域内事件来调整路由,故少量网络拓扑事件的变化就可导致BGP路由的大量变化;虽然TIE算法改进了对域内事件的敏感性,使其能对域间出口的选择进行调节,减轻路由的动荡性,但未给出阈值参数T的计算方法,且T也不能随负载的变化而变化。域间邻居事件的影响也对域间出口的选择产生重要影响。该文提出一种自适应的可调域间出口选择算法——ITIE算法,能够针对TIE算法的不足,通过对参数的动态自调整来适应当前网络负载和域间通信能力的改变,更好地满足流量工程和网络健壮性要求。模拟实验表明,ITIE算法能够在域间协同性以及随负载变化的流量自适应性上达到合理的折中。 展开更多
关键词 出口选择 网络流量工程 路由优化 域间通信 自适应性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部