期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
分布内存系统中节点间软流水优化技术
1
作者 陈莉 张兆庆 冯晓兵 《计算机科学》 CSCD 北大核心 2002年第11期24-28,共5页
Maximize parallelism and minimize communication overheads are important issues for distributed memory systems. Communication and data redistribution cannot be avoided even when considering global optimization of data ... Maximize parallelism and minimize communication overheads are important issues for distributed memory systems. Communication and data redistribution cannot be avoided even when considering global optimization of data distribution and computation decomposition. A new approach based on loop fusion is presented exploiting pipelining parallelism, thus communication overhead can be hidden and data redistribution can be avoided. This technique exploits pipelining from complex loop structures, which distinguishes itself from traditional pipelining techniques. Ex-periments show that the technique is superior to other optimizations. 展开更多
关键词 分布内存系统 流水优化技术 数据存储 计算机 数据重分布
在线阅读 下载PDF
基于运行时间与资源消耗的流水线优化方法 被引量:6
2
作者 李钊 郑红 李业德 《仪器仪表学报》 EI CAS CSCD 北大核心 2014年第9期2137-2143,共7页
流水线性能的评估标准包括:运行时间和资源消耗,二者随着流水线级数的变化是相互矛盾的。为了实现流水线级数与运行时间和资源消耗之间的平衡,提出了基于运行时间与资源消耗的流水线优化方法,该方法通过分析运行时间与资源消耗随流水线... 流水线性能的评估标准包括:运行时间和资源消耗,二者随着流水线级数的变化是相互矛盾的。为了实现流水线级数与运行时间和资源消耗之间的平衡,提出了基于运行时间与资源消耗的流水线优化方法,该方法通过分析运行时间与资源消耗随流水线级数变化的规律,建立基于运行时间和资源消耗的优化目标函数,从而实现运行时间与资源消耗的优化。利用提出的流水线优化方法对遥感图像云检测算法中分形维数的计算进行优化,并与采用关键路径内部并行和计算延时均衡等方法进行优化后的流水线进行对比,运行时间最高缩短了20.9倍,运行时间与资源消耗的综合对比仅为通用流水线方法的0.33倍。实验结果表明,本文提出的流水线优化方法实现了运行时间与资源消耗的优化。 展开更多
关键词 流水线优化 运行时间 资源消耗 分形维数
在线阅读 下载PDF
基于RISC-V的FFmpeg多媒体算法库优化策略 被引量:4
3
作者 张桢 梁军 +2 位作者 贾海鹏 张云泉 李青 《计算机工程》 CAS CSCD 北大核心 2023年第4期159-165,173,共8页
RISC-V处理器的广泛应用使得FFmpeg多媒体算法库在RISC-V平台上的高性能实现日益重要。提出一种基于RISC-V架构的系列优化策略,针对开源音视频多媒体FFmpeg算法库中不同特征和计算密度的算法,利用RISC-V指令集的扩展性对算法库中某些耗... RISC-V处理器的广泛应用使得FFmpeg多媒体算法库在RISC-V平台上的高性能实现日益重要。提出一种基于RISC-V架构的系列优化策略,针对开源音视频多媒体FFmpeg算法库中不同特征和计算密度的算法,利用RISC-V指令集的扩展性对算法库中某些耗时的算法进行指令加速和并行优化。在深入研究RISC-V开源架构的基础上,构建一个基于RISC-V开源架构的高性能FFmpeg算法库。针对不连续访存类算法、数据依赖类算法、数据快速转换类算法,从向量单元配置、向量化访存、汇编优化、指令流水优化4个方面出发,大幅提升FFmpeg算法库在RISC-V处理器上的性能。实验结果表明,采用以上优化策略后的FFmpeg算法库在基于RISC-V架构的XT-910芯片上的性能得到明显提升,其中的不连续访存类算法、数据依赖类算法、数据快速转换类算法的加速比分别为8.20、3.67、3.62。 展开更多
关键词 开源指令集架构 FFmpeg多媒体算法库 向量化访存 汇编优化 指令流水优化
在线阅读 下载PDF
计算流体力学程序单核指令级优化方法
4
作者 刘闯 何峰 +2 位作者 肖兮 董小社 张兴军 《西安交通大学学报》 EI CAS CSCD 北大核心 2018年第12期77-83,共7页
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程... 针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先分析程序的性能指标存在潜在的性能不足,根据分析结果进行优化;依据容器的存储特性和系统的访存特性,对程序的存储结构和访存顺序进行调整,以优化空间开销和访存性能;对CPU的流水机制进行分析,在循环和分支中消除指令的控制相关和数据相关从而达到减少流水中断率的目的;分析编译器对高级语言的处理特点并结合系统中的运行时栈在指令级作出分析,优化指令结构从而减少指令冗余和降低指令复杂度。实验结果表明,在TIANHE-1A超级计算机系统上进行测试,与优化前程序相比,优化后的程序执行时间约减少68.34%,空间消耗约减少55.43%。通过对程序性能各项指标进行分析的结果表明,程序在流水中断率、缓存命中率及机器指令数等性能指标上均有大幅地提升,该方法优化覆盖范围多于目前其他优化方法,有较好的优化效果,在计算流体力学程序优化研究中具有一定的借鉴价值。 展开更多
关键词 流体力学程序 指令级优化 访存优化 流水优化
在线阅读 下载PDF
解同步电路中的功耗优化方法 被引量:1
5
作者 石伟 沈立 +2 位作者 任洪广 苏博 王志英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第12期2155-2161,共7页
针对解同步方法设计的异步电路存在冗余功耗的问题,提出一种功耗优化的解同步异步电路设计方法.首先以迭代结构乘法器为例分析操作数及电路操作行为对异步流水线功耗的影响;然后将窄数据特性及操作行为特性引入到解同步设计方法中,其中... 针对解同步方法设计的异步电路存在冗余功耗的问题,提出一种功耗优化的解同步异步电路设计方法.首先以迭代结构乘法器为例分析操作数及电路操作行为对异步流水线功耗的影响;然后将窄数据特性及操作行为特性引入到解同步设计方法中,其中窄数据特性用于优化数据通路,操作行为特性用于优化控制通路;最后采用该方法对异步传输触发体系结构(TTA)微处理器计算内核进行功耗优化设计.实验结果表明,结构优化后的异步TTA微处理器内核功耗明显减少,约为解同步异步内核功耗的60%. 展开更多
关键词 解同步电路 功耗优化 流水线结构优化 操作数分析 设计流程
在线阅读 下载PDF
焊轨基地生产线瓶颈分析与优化 被引量:2
6
作者 郭军锋 《铁道工程学报》 EI 北大核心 2017年第7期42-46,90,共6页
研究目的:为满足全国路网建设需要,原铁道部在全国布局11个百米钢轨焊轨基地,焊轨基地的焊轨作业流水线的效率是管理人员重点关注的问题。以郑州局小李庄焊轨基地焊轨生产线中"母材进轨线"至"热线"段生产流水线为例... 研究目的:为满足全国路网建设需要,原铁道部在全国布局11个百米钢轨焊轨基地,焊轨基地的焊轨作业流水线的效率是管理人员重点关注的问题。以郑州局小李庄焊轨基地焊轨生产线中"母材进轨线"至"热线"段生产流水线为例,我们发现目前实际运行的生产节拍与原定设计存在较大差距,部分工序瓶颈效应明显。同时,在双线并行的流水线系统中,调度和协调也会影响整个系统的作业效率。基于此,本文旨在通过调研、建模以及仿真试验,对焊轨生产线进行效率评估,并分析整个双线生产线中的瓶颈效应,进而对瓶颈部分提出针对性的优化方案,最后再次用仿真试验分析和验证优化方案的结果。研究结论:(1)通过调研、建模和仿真试验,发现了吊运阶段是整个"外勤-热线"段生产线的显著瓶颈;(2)针对吊运瓶颈,本研究提出了在既有7片横梁上添加一组电动葫芦解决吊运阶段的瓶颈问题;(3)提升吊运阶段效率后,"热线"段将会成为系统的瓶颈,因此提出了将"热线"段利用率最高的焊接工位的焊后检查工序调至利用率最低的粗磨工位,以提高"热线"段的线平衡和效率;(4)提出通过提升辊道的行进速度来提升"热线"段的效率;(5)通过仿真试验发现,优化方案对整个"外勤-热线"段确有优化效果,效率可提升30%~40%;(6)本研究成果可应用于既有焊轨基地针对生产效率的提升改造,也可应用于新建焊轨基地时设计参考。 展开更多
关键词 工程材料 流水线优化 试验研究 基地焊接 离散事件系统仿真
在线阅读 下载PDF
基于SIMD架构的相干累加运算优化方法
7
作者 陈源 王元钦 董绪荣 《计算机工程》 CAS CSCD 北大核心 2011年第20期268-270,共3页
针对软件GPS接收机在处理高数据流时存在的实时性问题,提出一种基于单指令多数据流(SIMD)架构的相干运算优化方法。分析跟踪环路结构、SIMD指令与相干积分累加运算量,使用多媒体扩展指令集对流水线进行优化。实验结果表明,完成1 s数据... 针对软件GPS接收机在处理高数据流时存在的实时性问题,提出一种基于单指令多数据流(SIMD)架构的相干运算优化方法。分析跟踪环路结构、SIMD指令与相干积分累加运算量,使用多媒体扩展指令集对流水线进行优化。实验结果表明,完成1 s数据的相干积分累加计算时间为0.7 s,该运算量仅为使用普通单指令多数据流指令的6.5%,具有较高的实时性。 展开更多
关键词 单指令多数据流技术 GPS软件 相干积分 流水线优化
在线阅读 下载PDF
基于SIMD扩展部件的长向量超越函数实现方法 被引量:2
8
作者 刘聃 郭绍忠 +1 位作者 郝江伟 许瑾晨 《计算机科学》 CSCD 北大核心 2021年第6期26-33,共8页
基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能。为了有效解决此问题,实现了申威平台基于SIMD扩展部... 基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能。为了有效解决此问题,实现了申威平台基于SIMD扩展部件底层优化的长向量超越函数,提出了浮点计算融合算法,解决了两分支结构算法难以向量化的问题;提出了基于Estrin算法动态分组的大阶数多项式实现方法,提高了多项式汇编计算的流水性能。这是在国产申威平台上首次实现长向量超越函数库,提供的函数接口包含三角函数、反三角函数、对数函数、指数函数等。实验结果表明,双精度版本最大误差控制在3.5ULP(unit in the last place)以下,单精度版本最大误差控制在0.5ULP以下,该性能与申威平台直接循环调用系统标量函数相比有显著提高,平均加速比为3.71。 展开更多
关键词 基础数学库 向量超越函数 国产平台 流水优化 浮点计算
在线阅读 下载PDF
一种低功耗异步乘法器的研究与实现
9
作者 石伟 苏博 +1 位作者 任洪广 王志英 《计算机工程与科学》 CSCD 北大核心 2012年第5期73-77,共5页
同步电路由全局时钟信号周期性地驱动计算,而异步电路只在需要的时候才进行运算,因此异步电路具有天然的低功耗优势。当前的解同步异步电路设计方法仅根据同步电路的物理拓扑结构进行异步设计,而没有考虑同步电路的本身功能行为及所处... 同步电路由全局时钟信号周期性地驱动计算,而异步电路只在需要的时候才进行运算,因此异步电路具有天然的低功耗优势。当前的解同步异步电路设计方法仅根据同步电路的物理拓扑结构进行异步设计,而没有考虑同步电路的本身功能行为及所处理数据的特点。本文首先分析了物理拓扑结构、电路功能行为及处理数据对低功耗设计的影响,然后设计实现了一款低功耗异步乘法器。实验表明,实现的乘法器相对于传统解同步异步乘法器具有更低的功耗与更高的性能。 展开更多
关键词 异步 流水线结构优化 操作数检测 低功耗 乘法器
在线阅读 下载PDF
基于功能和数据划分的H.264并行解码算法 被引量:2
10
作者 陈剑骏 陈耀武 《计算机工程》 CAS CSCD 2012年第12期214-217,共4页
针对H.264视频解码算法的并行模块选择、划分及解码速度优化等问题,面向TilePro64多核平台,提出一种可扩展的H.264并行解码算法。对该算法的内部功能模块进行整合和划分,根据核间数据的依赖关系,动态分配功能模块及优化算法并行效率。... 针对H.264视频解码算法的并行模块选择、划分及解码速度优化等问题,面向TilePro64多核平台,提出一种可扩展的H.264并行解码算法。对该算法的内部功能模块进行整合和划分,根据核间数据的依赖关系,动态分配功能模块及优化算法并行效率。实验结果表明,该算法在解码效率、多核并行程度、解码时延等方面均有较好性能,相比传统并行解码算法,其并行加速比提高约25%。 展开更多
关键词 多核 并行解码 H.264标准 TilePro64多核平台 流水线优化 功能模块
在线阅读 下载PDF
A novel hybrid estimation of distribution algorithm for solving hybrid flowshop scheduling problem with unrelated parallel machine 被引量:10
11
作者 孙泽文 顾幸生 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第8期1779-1788,共10页
The hybrid flow shop scheduling problem with unrelated parallel machine is a typical NP-hard combinatorial optimization problem, and it exists widely in chemical, manufacturing and pharmaceutical industry. In this wor... The hybrid flow shop scheduling problem with unrelated parallel machine is a typical NP-hard combinatorial optimization problem, and it exists widely in chemical, manufacturing and pharmaceutical industry. In this work, a novel mathematic model for the hybrid flow shop scheduling problem with unrelated parallel machine(HFSPUPM) was proposed. Additionally, an effective hybrid estimation of distribution algorithm was proposed to solve the HFSPUPM, taking advantage of the features in the mathematic model. In the optimization algorithm, a new individual representation method was adopted. The(EDA) structure was used for global search while the teaching learning based optimization(TLBO) strategy was used for local search. Based on the structure of the HFSPUPM, this work presents a series of discrete operations. Simulation results show the effectiveness of the proposed hybrid algorithm compared with other algorithms. 展开更多
关键词 hybrid estimation of distribution algorithm teaching learning based optimization strategy hybrid flow shop unrelated parallel machine scheduling
在线阅读 下载PDF
Analysis and optimization of heat loss for water-cooled furnace roller 被引量:1
12
作者 李勇 李家栋 +3 位作者 刘宇佳 侯帅 王昭东 王国栋 《Journal of Central South University》 SCIE EI CAS 2013年第8期2158-2164,共7页
A heat transfer model of furnace roller cooling process was established based on analysis of furnace roller's structure. The complicated model was solved with iteration planning algorithm based on Newton search. The ... A heat transfer model of furnace roller cooling process was established based on analysis of furnace roller's structure. The complicated model was solved with iteration planning algorithm based on Newton search. The model is proved logical and credible by comparing calculated results and measured data. Then, the relationship between water flow velocity, inlet water temperature, furnace temperature and roller cross section temperature, outlet water temperature, water temperature rise, cooling water heat absorption was studied. The conclusions and recommendations are mainly as follows: l) Cooling water temperature rise decreases with the increase of water flow velocity, but it has small relationship with inlet water temperature; 2) In order to get little water scale, inlet water temperature should be controlled below 30 ℃. 3) The cooling water flow velocity should be greater than critical velocity. The critical velocity is 0.07 m/s and water flow velocity should be controlled within 0.4-0.8 m/s. Within this velocity range, water cooling efficiency is high and water temperature rise is little. If cooling water velocity increases again, heat loss will increase, leading to energy wasting. 展开更多
关键词 furnace roller water-cooled furnace heat loss OPTIMIZATION CONTROL
在线阅读 下载PDF
Process optimization for treatment of methyltin mercaptide effluents using modified semi-coke 被引量:1
13
作者 王欣 C.Srinivasakannan +4 位作者 曲雯雯 彭金辉 张利波 段昕辉 卢帅丹 《Journal of Central South University》 SCIE EI CAS 2013年第12期3633-3640,共8页
The central composite process optimization was performed by response surface methodology technique using a design for the treatment of methyltin mercaptide with modified semi-coke. The semi-coke from the coal industry... The central composite process optimization was performed by response surface methodology technique using a design for the treatment of methyltin mercaptide with modified semi-coke. The semi-coke from the coal industry was suitably modified by treating it with phosphoric acid, with a thermal activation process. The objective of the process optimization is to reduce the chemical oxygen demand (COD) and NH4+-N in the methyltin mercaptide industrial effluent. The process variables considered for process optimization are the semi-coke dosage, adsorption time and effluent pH. The optimized process conditions are identified to be a semi-coke dosage of 80 g/L, adsorption time of 90 min and a pH value of 8.34. The ANOVA results indicate that the adsorbent dosage and pH are the significant parameters, while the adsorption time is insignificant, possibly owing to the large range of adsorption time chosen. The textural characteristics of modified semi-coke were analyzed using scanning electron microscopy and nitrogen adsorption isotherm. The average BET surface area of modified semi-coke is estimated to be 915 mE/g, with the average pore volume of 0.71 cm3/g and a average pore diameter of 3.09 nm, with micropore volume contributing to 52.36%. 展开更多
关键词 modified semi-coke SEMI-COKE optimization water treatment chemical oxygen demand (COD) NH4+-N
在线阅读 下载PDF
Optimum control strategy for all-variable speed chiller plant 被引量:3
14
作者 蒋小强 龙惟定 李敏 《Journal of Central South University》 SCIE EI CAS 2011年第2期573-579,共7页
The optimum control strategy and the saving potential of all variable chiller plant under the conditions of changing building cooling load and cooling water supply temperature were investigated. Based on a simulation ... The optimum control strategy and the saving potential of all variable chiller plant under the conditions of changing building cooling load and cooling water supply temperature were investigated. Based on a simulation model of water source chiller plant established in dynamic transient simulation program (TRNSYS),the four-variable quadratic orthogonal regression experiments were carried out by taking cooling load,cooling water supply temperature,cooling water flow rate and chilled water flow rate as variables,and the fitting formulas expressing the relationships between the total energy consumption of chiller plant with the four selected parameters was obtained. With the SAS statistical software and MATHEMATICA mathematical software,the optimal chilled water flow rate and cooling water flow rate which result in the minimum total energy consumption were determined under continuously varying cooling load and cooling water supply temperature. With regard to a chiller plant serving an office building in Shanghai,the total energy consumptions under different control strategies were computed in terms of the forecasting function of cooling load and water source temperature. The results show that applying the optimal control strategy to the chiller plant can bring a saving of 23.27% in power compared with the corresponding conventional variable speed plant,indicating that the optimal control strategy can improve the energy efficiency of chiller plant. 展开更多
关键词 chiller plant control strategy variable speed cooling water flow rate chilled water flow rate
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部