检索结果-维普期刊中文期刊服务平台

基于修补粒子群算法的动态网格数据流优化被引量：2: 1; 作者孙凌周琳《实验室研究与探索》 CAS 北大核心 2011年第6期208-212,共5页; 针对粒子群优化算法存在的早熟收敛问题,提出了一种既保持粒子活性又保证粒子快速收敛于全局极值点的修补粒子群算法。在修补更新方程中设置参数以限制粒子在搜索区域内、采用减弱速度更新的策略减少速度更新的次,如果种群多样性逐步减... 展开更多; 关键词禁忌约束粒子群算法数据流优化; 在线阅读下载PDF 职称材料

面向YOLO神经网络的数据流架构优化研究被引量：2: 2; 作者穆宇栋李文明 +5 位作者范志华吴萌吴海彬安学军叶笑春范东睿《计算机学报》北大核心 2025年第1期82-99,共18页; YOLO目标检测算法具有速度快、精度高、结构简单、性能稳定等优点,因此在多种对实时性要求较高的场景中得到广泛应用。传统的控制流架构在执行YOLO神经网络时面临计算部件利用率低、功耗高、能效较低等挑战。相较而言,数据流架构的执行... 展开更多; 关键词 YOLO算法数据流架构数据流图优化卷积神经网络神经网络加速; 在线阅读下载PDF 职称材料

支持数据流分发的组合服务协调框架被引量：1: 3; 作者翟岩龙宿红毅 +1 位作者肖玮战守义《北京理工大学学报》 EI CAS CSCD 北大核心 2009年第12期1091-1095,1109,共6页; 针对集中式Web服务组合的性能缺陷以及完全分布式Web服务组合中组件服务重用性差等问题,提出一种基于集中控制流分散数据流模式的Web服务组合协调框架.描述了框架中运行的协调协议的形式化定义、模型和语法结构.采用数据流分析方法优化... 展开更多; 关键词 WEB服务组合协调框架协调协议数据流优化; 在线阅读下载PDF 职称材料

基于FPGA的CNN图像识别加速与优化被引量：9: 4; 作者齐延荣周夏冰 +1 位作者李斌周清雷《计算机科学》 CSCD 北大核心 2021年第4期205-212,共8页; 目前,CNN已广泛应用于许多应用场景中,包括图像分类、语音识别、视频分析、文档分析等。由于CNN计算密集,常以GPU进行加速,但GPU功耗高,不适用于CNN推理阶段。基于此,文中研究了基于FPGA的CNN图像识别加速与优化的应用方法,利用Intel F... 展开更多; 关键词 CNN FPGA 图像识别 OPENCL 模块划分数据流优化; 在线阅读下载PDF 职称材料

题名基于修补粒子群算法的动态网格数据流优化被引量：2: 1; 作者孙凌周琳; 机构河南商业高等专科学校; 出处《实验室研究与探索》 CAS 北大核心 2011年第6期208-212,共5页; 文摘针对粒子群优化算法存在的早熟收敛问题,提出了一种既保持粒子活性又保证粒子快速收敛于全局极值点的修补粒子群算法。在修补更新方程中设置参数以限制粒子在搜索区域内、采用减弱速度更新的策略减少速度更新的次,如果种群多样性逐步减小下限时,种群纷纷远离该最优位置,而当种群多样性逐步增大超出上限时,种群又开始向整体最优位置靠拢,从而保持了粒子的多样性。数值实验结果表明,算法在解决问题上表现出了良好的性能。; 关键词禁忌约束粒子群算法数据流优化; Keywords taboos constraints partide swarm algorithm data stream optimization; 分类号 TP312 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名面向YOLO神经网络的数据流架构优化研究被引量：2: 2; 作者穆宇栋李文明范志华吴萌吴海彬安学军叶笑春范东睿; 机构处理器芯片全国重点实验室(中国科学院计算技术研究所) 中国科学院大学计算机科学与技术学院; 出处《计算机学报》北大核心 2025年第1期82-99,共18页; 基金北京市科技新星计划资助(20220484054,20230484420) 北京市自然科学基金-昌平创新联合基金资助项目(L234078) 中国科学院青年创新促进会资助。; 文摘 YOLO目标检测算法具有速度快、精度高、结构简单、性能稳定等优点,因此在多种对实时性要求较高的场景中得到广泛应用。传统的控制流架构在执行YOLO神经网络时面临计算部件利用率低、功耗高、能效较低等挑战。相较而言,数据流架构的执行模式与神经网络算法匹配度高,更能充分挖掘其中的数据并行性。然而,在数据流架构上部署YOLO神经网络时面临三个问题:(1)数据流架构的数据流图映射并不能结合YOLO神经网络中卷积层卷积核较小的特点,造成卷积运算数据复用率过低的问题,并进一步降低计算部件利用率;(2)数据流架构在算子调度时无法利用算子间结构高度耦合的特点,导致大量数据重复读取;(3)数据流架构上的数据存取与执行高度耦合、串序执行,导致数据存取延迟过高。为解决这些问题,本文设计了面向YOLO神经网络的数据流加速器DFU-Y。首先,结合卷积嵌套循环的执行模式,本文分析了小卷积核卷积运算的数据复用特征,并提出了更有利于执行单元内部数据复用的数据流图映射算法,从而整体提升卷积运行效率;然后,为充分利用结构耦合的算子间的数据复用,DFU-Y提出数据流图层次上的算子融合调度机制以减少数据存取次数、提升神经网络运行效率;最后,DFU-Y通过双缓存解耦合数据存取与执行,从而并行执行数据存取与运算,掩盖了程序间的数据传输延迟,提高了计算部件利用率。实验表明,相较数据流架构(DFU)和GPU(NVIDIA Xavier NX),DFU-Y分别获得2.527倍、1.334倍的性能提升和2.658倍、3.464倍的能效提升;同时,相较YOLO专用加速器(Arria-YOLO),DFU-Y在保持较好通用性的同时,达到了其性能的72.97%、能效的87.41%。; 关键词 YOLO算法数据流架构数据流图优化卷积神经网络神经网络加速; Keywords YOLO algorithm dataflow architecture optimization of data flow graph convolutional neural network neural network acceleration; 分类号 TP301 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名支持数据流分发的组合服务协调框架被引量：1: 3; 作者翟岩龙宿红毅肖玮战守义; 机构北京理工大学计算机科学技术学院特种机电研究所(北京); 出处《北京理工大学学报》 EI CAS CSCD 北大核心 2009年第12期1091-1095,1109,共6页; 基金国家部委预研项目(513040102); 文摘针对集中式Web服务组合的性能缺陷以及完全分布式Web服务组合中组件服务重用性差等问题,提出一种基于集中控制流分散数据流模式的Web服务组合协调框架.描述了框架中运行的协调协议的形式化定义、模型和语法结构.采用数据流分析方法优化组合服务.提出从BPEL到协调协议的转换算法.实验结果表明,采用此协调框架的组合服务不仅保持了组件服务的可重用性,而且在响应时间和事务处理能力等方面性能有显著提高.; 关键词 WEB服务组合协调框架协调协议数据流优化; Keywords Web services composition coordination framework coordination protocol data flow optimization; 分类号 TP393.0 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于FPGA的CNN图像识别加速与优化被引量：9: 4; 作者齐延荣周夏冰李斌周清雷; 机构郑州大学信息工程学院苏州大学计算机科学与技术学院; 出处《计算机科学》 CSCD 北大核心 2021年第4期205-212,共8页; 基金国家重点研发计划“公共安全风险防控与应急技术装配”重点专项(2018XXXXXXX01) 国家自然科学基金(61702518)。; 文摘目前,CNN已广泛应用于许多应用场景中,包括图像分类、语音识别、视频分析、文档分析等。由于CNN计算密集,常以GPU进行加速,但GPU功耗高,不适用于CNN推理阶段。基于此,文中研究了基于FPGA的CNN图像识别加速与优化的应用方法,利用Intel FPGA提供的OpenCL SDK,在FPGA板卡上设计并优化了CNN前向模型。首先,针对计算量问题,通过功能模块划分,充分发挥FPGA的高计算效能优势。其次,优化核心算法,提高运行速度;分析特征图处理操作,利用参数共享策略降低数据存储量;采用通道传输数据,减少访问片外存储次数。最后,对数据缓存、数据流、循环进行优化设计,缓解了FPGA片上的资源限制;通过量化参数降低FPGA内存资源占用量。实验结果表明,FPGA具有较低的功耗,CPU的功耗是其2.1倍,而GPU的功耗是其6.5倍;与近年来相关领域文献中提出的方法相比,所提方法具有较高的吞吐量和计算性能。; 关键词 CNN FPGA 图像识别 OPENCL 模块划分数据流优化; Keywords CNN FPGA Image recognition OpenCL Module division Data flow optimization; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于修补粒子群算法的动态网格数据流优化	孙凌周琳	《实验室研究与探索》 CAS 北大核心	2011	2	在线阅读下载PDF 职称材料
2	面向YOLO神经网络的数据流架构优化研究	穆宇栋李文明范志华吴萌吴海彬安学军叶笑春范东睿	《计算机学报》北大核心	2025	2	在线阅读下载PDF 职称材料
3	支持数据流分发的组合服务协调框架	翟岩龙宿红毅肖玮战守义	《北京理工大学学报》 EI CAS CSCD 北大核心	2009	1	在线阅读下载PDF 职称材料
4	基于FPGA的CNN图像识别加速与优化	齐延荣周夏冰李斌周清雷	《计算机科学》 CSCD 北大核心	2021	9	在线阅读下载PDF 职称材料