期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
引入加速算子的遗传算法
1
作者 张站立 李祖枢 +2 位作者 但远宏 谭智 郝艳伟 《重庆理工大学学报(自然科学)》 CAS 2011年第5期82-89,共8页
在传统的遗传算法中引入加速算子,使搜索效率得到了很大的提高,能够迅速找到全局最优解。加速算子借鉴折半查找算法的思想,将其与相应的变步长策略相结合而得到。将具有较强的局部搜索能力加速协同算子与全局搜索能力较强的交叉和变异... 在传统的遗传算法中引入加速算子,使搜索效率得到了很大的提高,能够迅速找到全局最优解。加速算子借鉴折半查找算法的思想,将其与相应的变步长策略相结合而得到。将具有较强的局部搜索能力加速协同算子与全局搜索能力较强的交叉和变异操作相结合,构成了一种新的进化遗传算法。对多个测试函数进行优化计算,结果证明了新算法的快速性和有效性。 展开更多
关键词 遗传算法 加速算子 梯度 折半查找
在线阅读 下载PDF
Winograd异构采样窗口卷积加速算子
2
作者 彭允 王玉冰 +7 位作者 梁磊 宋悦 邱橙 雷宇鑫 贾鹏 缪国庆 秦莉 王立军 《计算机工程》 2025年第9期71-79,共9页
近年来,人工智能在大模型、自动驾驶、机器人等领域得到广泛应用。神经网络作为人工智能的核心,具备大数据处理、学习适应复杂模式和完成各种任务的功能。神经网络通常利用卷积运算提取输入数据的局部特征,帮助其学习并理解图像、声音... 近年来,人工智能在大模型、自动驾驶、机器人等领域得到广泛应用。神经网络作为人工智能的核心,具备大数据处理、学习适应复杂模式和完成各种任务的功能。神经网络通常利用卷积运算提取输入数据的局部特征,帮助其学习并理解图像、声音等数据的结构和模式。然而,在一次卷积运算过程中涉及密集的乘累加运算,占据了绝大部分的卷积运算时间,成为了神经网络实时部署的技术瓶颈。从硬件层面加速卷积运算,提出一种Winograd异构采样窗口卷积加速算子,采用异构4×2采样窗口提升数据利用率,采用流水线、定点化等手段设计Winograd硬件加速模块,提出基于池化融合的ReLU模块。在现场可编辑逻辑门阵列(FPGA)上进行原型验证实验,实验结果表明,所提算子对比单路原始滑窗卷积共获得86.4倍的加速比,对比三路滑窗卷积获得28.8倍的加速比,读写数据量减少为原来的11.07%,资源消耗比同类型Winograd卷积加速算子低,对比快速傅里叶变换(FFT)有明显优势,具备大规模集成和构建卷积神经网络的能力。 展开更多
关键词 Winograd 卷积加速算子 硬件加速 异构采样 现场可编辑逻辑门阵列
在线阅读 下载PDF
基于国产众核处理器的深度神经网络算子加速库优化 被引量:7
3
作者 高捷 刘沙 +3 位作者 黄则强 郑天宇 刘鑫 漆锋滨 《计算机科学》 CSCD 北大核心 2022年第5期355-362,共8页
基于不同硬件设备的算子加速库已经成为深度学习框架不可或缺的一部分,能够为大规模训练或者推理任务提供数倍的性能加速。当前的主流算子库都是基于GPU架构开发的,与其他异构设计并不兼容;SWDNN算子库是基于申威26010开发的,无法充分... 基于不同硬件设备的算子加速库已经成为深度学习框架不可或缺的一部分,能够为大规模训练或者推理任务提供数倍的性能加速。当前的主流算子库都是基于GPU架构开发的,与其他异构设计并不兼容;SWDNN算子库是基于申威26010开发的,无法充分发挥升级后的申威26010 pro处理器的性能,也不能满足当前GPT-3等大型神经网络模型对大容量内存和高访存带宽的需求。文中面向申威26010 pro处理器体系结构的特点和大型神经网络模型的训练需求,提出了基于多核组的三级并行和神经网络算子任务调度方案,在满足大型模型训练内存需求的同时,提高了并行效率和整体计算性能;提出了三级异步流水机制和计算访存重叠的访存优化方法,显著缓解了神经网络算子的访存性能瓶颈。基于以上方法,文中构建了基于申威26010 pro处理器的SWTensor多核组算子加速库,在自然语言处理模型GPT-2上进行了实验,结果表明,其典型计算密集型算子和访存密集型算子在单精度浮点计算性能和访存带宽上分别达到了理论峰值的90.4%和88.7%。 展开更多
关键词 深度神经网络 算子加速 负载均衡 异步流水 双缓冲
在线阅读 下载PDF
改进差分进化算法及其在发酵优化中的应用 被引量:4
4
作者 牛大鹏 王福利 +1 位作者 何大阔 贾明兴 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期469-472,共4页
针对发酵过程的补料优化问题,提出一种改进的差分进化算法.为了克服基本差分进化算法在全局最优点附近搜索速度较慢、精度较低的缺点,引入单纯形加速算子以提高算法收敛速度,而针对算法易过早收敛的缺点引入混沌迁移算子,以提高算法种... 针对发酵过程的补料优化问题,提出一种改进的差分进化算法.为了克服基本差分进化算法在全局最优点附近搜索速度较慢、精度较低的缺点,引入单纯形加速算子以提高算法收敛速度,而针对算法易过早收敛的缺点引入混沌迁移算子,以提高算法种群多样度,增强算法跳出局部最优解的能力.对于有约束优化问题,利用3个准则进行选择操作,使求得的最优解满足约束条件.将改进的算法用于某一类补料分批发酵过程,提高了发酵最终产物产量,表明了该算法的有效性. 展开更多
关键词 发酵 补料优化 差分进化 单纯形加速算子 混沌迁移算子
在线阅读 下载PDF
改进多目标粒子群算法及其在电弧炉供电优化中的应用 被引量:4
5
作者 冯琳 毛志忠 袁平 《控制理论与应用》 EI CAS CSCD 北大核心 2011年第10期1455-1460,共6页
针对炼钢过程的供电优化问题,提出了一种改进的多目标粒子群算法(CRMOPSO).文中利用约束条件满意度函数并加权求和的策略将约束条件转化为一个待优化目标;同时为了克服基本多目标粒子群算法在求解复杂优化顺题时、搜索速度较慢,精度较... 针对炼钢过程的供电优化问题,提出了一种改进的多目标粒子群算法(CRMOPSO).文中利用约束条件满意度函数并加权求和的策略将约束条件转化为一个待优化目标;同时为了克服基本多目标粒子群算法在求解复杂优化顺题时、搜索速度较慢,精度较低的缺点,引入变区域加速算子以提高算法收敛速度和精度;针对算法易于早熟收敛的问题,引入混沌算子以提高算法局部搜索能力;进化过程中采用受约束的竞争选择机制(RCS)小生境技术保证种群多样性.建立了新的供电多目标优化模型并将CRMOPSO算法用于该模型优化电弧炉供电过程,达到了减少电量消耗,缩短冶炼时间,延长炉衬使用寿命的目的,表明了该算法的有效性. 展开更多
关键词 粒子群算法 多目标优化 供电曲线优化 变区域加速算子 混沌算子
在线阅读 下载PDF
改进的迭代收缩阈值算法及其在量子状态估计中的应用 被引量:2
6
作者 丛爽 丁娇 张坤 《控制理论与应用》 EI CAS CSCD 北大核心 2020年第7期1667-1672,共6页
本文将含有稀疏干扰的量子状态估计问题,转化为考虑量子状态的约束条件下,分别求解密度矩阵的核范数,以及稀疏干扰l1范数的两个子问题的优化问题.针对迭代收缩阈值算法(ISTA)所存在的收敛速度慢的问题,通过在两个子问题的迭代估计中,引... 本文将含有稀疏干扰的量子状态估计问题,转化为考虑量子状态的约束条件下,分别求解密度矩阵的核范数,以及稀疏干扰l1范数的两个子问题的优化问题.针对迭代收缩阈值算法(ISTA)所存在的收敛速度慢的问题,通过在两个子问题的迭代估计中,引入一个加速算子,对当前值与前一次值之差进行进一步的补偿,来提高算法的迭代速度(FISTA).并将FISTA算法应用于求解含有稀疏干扰的量子状态估计中.针对5个量子位的状态估计的仿真实验,将FISTA分别与ISTA、交替方向乘子法(ADMM)、不动点方程的ADMM算法(FP-ADMM),以及非精确的ADMM算法(I-ADMM)4种优化算法进行性能对比.实验结果表明,FISTA算法具有更加优越的收敛速度,并且能够得到更小的量子状态估计误差. 展开更多
关键词 量子状态估计 迭代收缩阈值算法 加速算子 优化算法
在线阅读 下载PDF
NN-EdgeBuilder:面向边缘端设备的高性能神经网络推理框架
7
作者 张萌 张雨 +2 位作者 张经纬 曹新野 李鹤 《电子与信息学报》 EI CSCD 北大核心 2023年第9期3132-3140,共9页
飞速发展的神经网络已经在目标检测等领域取得了巨大的成功,通过神经网络推理框架将网络模型高效地自动部署在各类边缘端设备上是目前重要的研究方向。针对以上问题,该文设计一个针对边缘端FPGA的神经网络推理框架NN-EdgeBuilder,能够... 飞速发展的神经网络已经在目标检测等领域取得了巨大的成功,通过神经网络推理框架将网络模型高效地自动部署在各类边缘端设备上是目前重要的研究方向。针对以上问题,该文设计一个针对边缘端FPGA的神经网络推理框架NN-EdgeBuilder,能够利用基于多目标贝叶斯优化的设计空间探索算法充分探索网络每层的并行度因子和量化位宽,接着调用高性能且通用的硬件加速算子来生成低延迟、低功耗的神经网络加速器。该文使用NN-EdgeBuilder在Ultra96-V2 FPGA上部署了UltraNet和VGG网络,生成的UltraNet-P1加速器与最先进的Ul-traNet定制加速器相比,功耗和能效比表现分别提升了17.71%和21.54%。与主流的推理框架相比,NN-Edge-Builder生成的VGG加速器能效比提升了4.40倍,数字信号处理器(DSP)的计算效率提升了50.65%。 展开更多
关键词 神经网络推理框架 设计空间探索 多目标贝叶斯优化 硬件加速算子
在线阅读 下载PDF
二层线性规划问题的遗传算法求解 被引量:14
8
作者 刘树安 尹新 +1 位作者 郑秉霖 王梦光 《系统工程学报》 CSCD 1999年第3期280-285,共6页
对下层具有多个决策者的二层线性规划问题,提出采用遗传算法结合线性规划方法进行求解的思想,并根据二层线性规划问题的具体特点,对遗传算法在编码、约束处理、下层问题无解处理、变异算子等方面进行了改进,最后以实例验证了算法的... 对下层具有多个决策者的二层线性规划问题,提出采用遗传算法结合线性规划方法进行求解的思想,并根据二层线性规划问题的具体特点,对遗传算法在编码、约束处理、下层问题无解处理、变异算子等方面进行了改进,最后以实例验证了算法的有效性. 展开更多
关键词 二层线性规划 遗传算法 惩罚函数 加速变异算子
在线阅读 下载PDF
基于 GAs 求解整数规划问题的算法设计 被引量:8
9
作者 刘树安 郑秉霖 王梦光 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 1998年第2期198-200,共3页
对于遗传算法(GAs)求解整数规划问题,提出一种新的位串编码结构,采用一种新的加速变异算子,可明显改善寻优的收敛速度,并为保持种群多样性引入分散型淘汰法.
关键词 组合优化 遗传算法 整数规则 加速变异算子
在线阅读 下载PDF
基于改进迭代收缩阈值算法的微观3D重建方法
10
作者 伍秋玉 张明新 +1 位作者 刘永俊 郑金龙 《计算机应用》 CSCD 北大核心 2018年第8期2398-2404,共7页
迭代收缩阈值算法(ISTA)求解离焦深度恢复动态优化问题时,采用固定迭代步长,导致算法收敛效率不佳,使得重建的微观3D形貌精度不高。为此,提出一种基于加速算子梯度估计和割线线性搜索的方法优化ISTA——FL-ISTA。首先,在每一次迭代中,... 迭代收缩阈值算法(ISTA)求解离焦深度恢复动态优化问题时,采用固定迭代步长,导致算法收敛效率不佳,使得重建的微观3D形貌精度不高。为此,提出一种基于加速算子梯度估计和割线线性搜索的方法优化ISTA——FL-ISTA。首先,在每一次迭代中,由当前点和前一个点的线性组合构成加速算子重新进行梯度估计,更新迭代点;其次,为了改变迭代步长固定的限制,引入割线线性搜索,动态确定每次最优迭代步长;最后,将改进的迭代收缩阈值算法用于求解离焦深度恢复动态优化问题,加快算法的收敛速度、提高微观3D形貌重建的精度。在对标准500 nm尺度栅格的深度信息重建实验中,与ISTA、快速ISTA(FISTA)和单调快速ISTA(MFISTA)相比,FL-ISTA收敛速度均有所提升,重建的深度信息值下降了10个百分点,更接近标准500 nm栅格尺度;与ISTA相比,FL-ISTA重建的微观3D形貌均方差(MSE)和平均误差分别下降了18个百分点和40个百分点。实验结果表明,FL-ISTA有效提升了求解离焦深度恢复动态优化问题的收敛速度,提高了微观3D形貌重建的精度。 展开更多
关键词 微观3D重建 离焦深度恢复 迭代收缩阈值算法 加速算子梯度估计 割线线性搜索
在线阅读 下载PDF
快速自适应鲁棒性尺度不变的特征检测子 被引量:9
11
作者 张岩 李建增 +1 位作者 李德良 杜玉龙 《系统工程与电子技术》 EI CSCD 北大核心 2017年第6期1406-1413,共8页
为提高特征检测的可靠性与实时性,提出了一种快速自适应鲁棒性尺度不变的特征检测子(fast adaptive robust invariant scalable feature detector,FARISFD)。首先提出尺度空间组数自适应选取方法改善了检测子针对不同图像的鲁棒性,然后... 为提高特征检测的可靠性与实时性,提出了一种快速自适应鲁棒性尺度不变的特征检测子(fast adaptive robust invariant scalable feature detector,FARISFD)。首先提出尺度空间组数自适应选取方法改善了检测子针对不同图像的鲁棒性,然后提出基于过渡层的尺度空间构建方法加强了尺度空间的鲁棒性,最后利用基于加速段的特征检测子(features from accelerated segment test,FAST)计算特征分数,并通过简化传统亚像素级矫正方法,提高了特征分数的计算与亚像素级矫正速度。通过复现率与耗时实验进行了验证,与5种使用广泛的检测子对比结果表明,FARISFD的鲁棒性与速度较高。 展开更多
关键词 特征匹配 特征检测 快速自适应鲁棒性尺度不变的特征检测子 加速的风式特征算子 基于加速段的特征检测子
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部