期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
一种支持细粒度并行的SDN虚拟化编程框架 被引量:15
1
作者 宋平 刘轶 +3 位作者 刘驰 张晶晶 钱德沛 郝沁汾 《软件学报》 EI CSCD 北大核心 2014年第10期2220-2234,共15页
软件定义网络(software defined network,简称SDN)通过集中式的控制器提高了网络的可编程性,成为近年来网络领域非常热门的话题.以Openflow网络为代表的软件定义网络将逻辑控制与数据转发相隔离,为网络虚拟化技术提供了良好的平台.集中... 软件定义网络(software defined network,简称SDN)通过集中式的控制器提高了网络的可编程性,成为近年来网络领域非常热门的话题.以Openflow网络为代表的软件定义网络将逻辑控制与数据转发相隔离,为网络虚拟化技术提供了良好的平台.集中式的抽象与控制使得SDN虚拟化框架的处理效率成为主要瓶颈.现有的SDN虚拟化框架由于缺乏对细粒度并行的支持,为编程人员充分利用多核/众核资源、控制更大规模的网络带来了极大的挑战.为了提高SDN虚拟化框架的处理效率,提出一种新的SDN虚拟化编程框架,通过新颖的API和运行时,在框架内部支持细粒度的并行处理.该框架通过对网络中流和网络资源进行抽象,使开发人员可以直接通过划分流空间来定义不同的虚拟网络,利用无锁的编程方式对共享的网络资源和流进行操作.实验结果表明,该框架在逻辑控制的执行效率方面具有良好的可扩展性,可以创建出更大规模的虚拟网络,并对其进行更为复杂的控制. 展开更多
关键词 SDN虚拟化 事件编程 细粒度并行 众核处理器
在线阅读 下载PDF
无锁同步的细粒度并行介度中心算法 被引量:7
2
作者 涂登彪 谭光明 孙凝晖 《软件学报》 EI CSCD 北大核心 2011年第5期986-995,共10页
通过结合体系结构和算法进行研究发现,基于锁的同步机制是细粒度并行介度中心(betweenness centrality,简称BC)算法在现有多核平台上高效执行的主要瓶颈.提出了一种消除锁同步的数据驱动(data-centric)并行算法,在AMD 32核SMP和Intel8核... 通过结合体系结构和算法进行研究发现,基于锁的同步机制是细粒度并行介度中心(betweenness centrality,简称BC)算法在现有多核平台上高效执行的主要瓶颈.提出了一种消除锁同步的数据驱动(data-centric)并行算法,在AMD 32核SMP和Intel8核SMP两个平台上获得了2倍左右的加速比. 展开更多
关键词 介度中心 锁同步 细粒度并行 数据驱动 多核
在线阅读 下载PDF
基于FPGA的存储优化的细粒度并行Zuker算法加速器研究 被引量:4
3
作者 夏飞 窦勇 +1 位作者 徐佳庆 张阳 《计算机研究与发展》 EI CSCD 北大核心 2011年第4期709-719,共11页
RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一.基于FPGA平台实现了一种细粒度的并行Zuker算法,采用按矩阵列循环划分的任务分配策略实现了处理单元间的负载平... RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一.基于FPGA平台实现了一种细粒度的并行Zuker算法,采用按矩阵列循环划分的任务分配策略实现了处理单元间的负载平衡;采用数据预取、滑动窗口和数据传递流水线实现了处理单元间的数据重用;采用曲线拟合、离散点赋值和地址空间压缩编码等策略减少了约85%的自由能参数存储需求.在单片FPGA上集成了由20个PE构成的主从多PE线性阵列,实验结果表明与运行在AMD四核9650处理器上的ViennaRNA-1.6.5程序相比,可获得超过18倍的加速效果,并且FPGA加速器功耗仅为通用微处理器平均功耗的1/5. 展开更多
关键词 生物信息学 RNA二级结构预测 最小自由能模型 细粒度并行算法 FPGA
在线阅读 下载PDF
Cholesky分解细粒度并行算法 被引量:6
4
作者 邬贵明 窦勇 王淼 《计算机工程与科学》 CSCD 北大核心 2010年第9期102-106,164,共6页
本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16... 本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。 展开更多
关键词 CHOLESKY分解 细粒度并行 FPGA
在线阅读 下载PDF
基于空间划分的细粒度并行演化算法 被引量:2
5
作者 黄樟灿 陈思多 《计算机应用研究》 CSCD 2000年第8期4-5,共2页
引入(μ+1)选择策略;提出在群体形成的最小凸集中随机均匀地生成新个体的空间划分选择策 略,并将其引入细粒度并行演化模型中;提出了应用于此模型的新算法。给出了并行运算求解的仿真 实例,并分析了新算法在防止早熟收敛方面的... 引入(μ+1)选择策略;提出在群体形成的最小凸集中随机均匀地生成新个体的空间划分选择策 略,并将其引入细粒度并行演化模型中;提出了应用于此模型的新算法。给出了并行运算求解的仿真 实例,并分析了新算法在防止早熟收敛方面的特性. 展开更多
关键词 空间划分 最小凸集 细粒度并行演化算法
在线阅读 下载PDF
基于FPGA的Cholesky分解细粒度并行结构与实现 被引量:4
6
作者 郭磊 唐玉华 +1 位作者 周杰 董亚卓 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期258-265,共8页
基于FPGA平台研究大规模矩阵Cholesky分解的细粒度并行结构与实现.首先在数据依赖关系分析的基础上,提出了Cholesky分解细粒度并行算法,然后提出了可扩展的一维线性阵列结构实现该并行算法.最后在设计的开发板上实现了单精度浮点Cholesk... 基于FPGA平台研究大规模矩阵Cholesky分解的细粒度并行结构与实现.首先在数据依赖关系分析的基础上,提出了Cholesky分解细粒度并行算法,然后提出了可扩展的一维线性阵列结构实现该并行算法.最后在设计的开发板上实现了单精度浮点Cholesky分解阵列处理器.综合结果表明,单个Xilinx Virtex5 XC5VLX330FF1760 FPGA芯片可集成32个处理单元.与运行在2.50GHz Pentium微处理器上的串行C代码相比,该阵列处理器取得最大104.413倍和平均78.789倍的性能加速. 展开更多
关键词 CHOLESKY分解 FPGA 细粒度并行 线性阵列处理器 单精浮点
在线阅读 下载PDF
基于分块延迟插入法的三相输电网络细粒度并行化电磁暂态仿真 被引量:4
7
作者 陈蔚然 徐晋 +2 位作者 汪可友 李国杰 王啟国 《中国电机工程学报》 EI CSCD 北大核心 2022年第7期2577-2587,共11页
随着电力系统规模增大,为了适应电力系统电磁暂态仿真对计算速度与准确性的要求,提出一种基于分块延迟插入法的输电网络细粒度并行化电磁暂态仿真方法。该算法充分考虑了输电网络中耦合器件的特性,并对节点电压,支路电流的更新操作采用... 随着电力系统规模增大,为了适应电力系统电磁暂态仿真对计算速度与准确性的要求,提出一种基于分块延迟插入法的输电网络细粒度并行化电磁暂态仿真方法。该算法充分考虑了输电网络中耦合器件的特性,并对节点电压,支路电流的更新操作采用全盘细粒度并行化处理,使其单步循环的节点电压、支路电流更新的算法时间复杂度降为了常数级,从算法层面上大幅度提高了仿真速度,并结合其细粒度并行性在图形处理器上实现。该文通过与PSCAD在IEEE算例的仿真结果进行对比,验证了算法的准确性。此外,相比节点分析法,该算法有效提升了大规模系统的仿真效率。 展开更多
关键词 分块延迟插入法 电磁暂态仿真 图形处理器 全局细粒度并行
在线阅读 下载PDF
支持细粒度并行性开发的多核DSP快速核间通信机制 被引量:2
8
作者 方兴 陈书明 《计算机工程与科学》 CSCD 北大核心 2009年第4期130-133,共4页
一些数字信号处理程序存在强数据相关性,在将这些数字信号处理程序划分到多核DSP上时,需要开发细粒度并行性,而细粒度并行性的开发需要快速的核间通信机制支持。本文提出了一种新的面向多核DSP的快速核间通信机制:标记式共享寄存器文件T... 一些数字信号处理程序存在强数据相关性,在将这些数字信号处理程序划分到多核DSP上时,需要开发细粒度并行性,而细粒度并行性的开发需要快速的核间通信机制支持。本文提出了一种新的面向多核DSP的快速核间通信机制:标记式共享寄存器文件TSRF,TSRF由所有的DSP核共享,寄存器文件中的每个寄存器同一个有效标记位关联,该标记位提供了核间通信同步支持。本文构建了集成TSRF机制的多核DSP原型的周期精确模拟器,该多核DSP原型包含的处理器核数目为4个。通过详细模拟,我们使用数据相关性较强的数字信号处理算法:IIR滤波和ADPCM编解码,对TSRF机制的性能进行了测试,与单核DSP相比,TSDB机制性能提升分别为1.8、1.2和1.9左右。 展开更多
关键词 多核DSP 核间通信机制 细粒度并行
在线阅读 下载PDF
细粒度并行与多线程计算 被引量:2
9
作者 洪功冰 《计算机研究与发展》 EI CSCD 北大核心 1996年第6期473-480,共8页
为实现高性能有必要采用细粒度的并行,但必须解决其中增大的通信开销问题。多线程计算不仅用来实现细粒度的并行,合理的调度策略还有助于隐藏通信延迟。但其中存在着线程切换开销的问题。
关键词 细粒度并行 通信开销 多线程 并行计算机
在线阅读 下载PDF
细粒度显式并行体系结构微处理器设计 被引量:1
10
作者 王昭顺 王俊宇 王新辉 《计算机工程与应用》 CSCD 北大核心 2001年第11期36-38,共3页
文章在分析微处理器体系结构发展的基础上,利用文献[1]提出的显式硬件单元控制EHCC技术,设计了一个细粒度显式并行计算微处理器模型。仿真结果表明细粒度显式并行计算将是微处理器体系结构发展的理想方向。
关键词 微处理器 体系结构 细粒度并行计算 指令 硬件单元控制
在线阅读 下载PDF
基于平均化理论的PWM变流器电磁暂态快速仿真方法 (三)适用于图像处理器的改进EMTP并行仿真算法 被引量:10
11
作者 高海翔 陈颖 +2 位作者 于智同 许寅 陈来军 《电力系统自动化》 EI CSCD 北大核心 2014年第6期43-48,79,共7页
智能电网技术的发展需要快速电磁暂态程序(EMTP),而日益广泛应用的图像处理器(GPU)为电磁暂态仿真提供了高效的仿真环境和平台。文中首先提出了细粒度并行算法的运算级并行策略,即基于单指令多数据流(SIMD)的运算级并行策略和基于共享... 智能电网技术的发展需要快速电磁暂态程序(EMTP),而日益广泛应用的图像处理器(GPU)为电磁暂态仿真提供了高效的仿真环境和平台。文中首先提出了细粒度并行算法的运算级并行策略,即基于单指令多数据流(SIMD)的运算级并行策略和基于共享内存的运算级并行策略。随后,设计了应用这两种并行策略的改进电磁暂态细粒度并行算法。三相脉宽调制(PWM)变流器仿真测试表明,适用于GPU的细粒度并行算法能够在保证仿真正确性的同时,显著提高仿真效率,从而验证了基于GPU的细粒度并行仿真算法适用于带有开关过程和复杂控制的大规模电力系统快速电磁暂态仿真应用的可行性。 展开更多
关键词 脉宽调制变流器 电磁暂态 细粒度并行 图像处理器(GPU)
在线阅读 下载PDF
基于GPU的大规模配电网电磁暂态并行仿真技术 被引量:17
12
作者 陈颖 宋炎侃 +2 位作者 黄少伟 于智同 魏巍 《电力系统自动化》 EI CSCD 北大核心 2017年第19期82-88,共7页
随着分布式电源等复杂设备的接入,针对配电网暂态过程的分析逐步依赖详细建模和电磁暂态仿真。图形处理器(GPU)等细粒度并行计算设备可显著提升配电网的电磁暂态仿真效率。提出了一种基于GPU的并行仿真技术,在GPU中加速了对大规模配电... 随着分布式电源等复杂设备的接入,针对配电网暂态过程的分析逐步依赖详细建模和电磁暂态仿真。图形处理器(GPU)等细粒度并行计算设备可显著提升配电网的电磁暂态仿真效率。提出了一种基于GPU的并行仿真技术,在GPU中加速了对大规模配电网系统的电磁暂态仿真。首先,将配电网电磁暂态仿真的计算过程分为异构计算、同构计算和网络求解三部分,并分别建立了细粒度并行计算模型。其次,针对上述三种计算模型,分别设计了基于分层有向图的异构计算核函数,基于积和熔加计算的同构计算核函数以及基于矩阵运算的网络求解核函数,最终实现了完全基于GPU的配电网电磁暂态仿真。对大规模配电网算例的仿真结果表明,所提出的细粒度计算模型和仿真算法可在保证仿真精度的前提下,提升在GPU中进行大规模配电网仿真的效率。 展开更多
关键词 配电网 电磁暂态仿真 细粒度并行 图形处理器
在线阅读 下载PDF
一种面向微电网实时仿真的分块分层并行算法 被引量:4
13
作者 王潇 张炳达 乔平 《电工技术学报》 EI CSCD 北大核心 2017年第7期104-111,共8页
微电网含有大量的高频功率开关和非线性元件,对电力系统实时仿真技术提出了很高的要求。为减轻逆矩阵法的存储压力,将整个网络分解成多个子网络,仅存储计算子网络状态变量和输出变量的各种参数。为降低子网络间约束方程的计算成本,利用... 微电网含有大量的高频功率开关和非线性元件,对电力系统实时仿真技术提出了很高的要求。为减轻逆矩阵法的存储压力,将整个网络分解成多个子网络,仅存储计算子网络状态变量和输出变量的各种参数。为降低子网络间约束方程的计算成本,利用其稀疏性的特点,提出了一种子网络分层合并的多端口等效方法。考虑FPGA硬件资源有限,设计了一种实现细粒度并行的专用运算组件。以2μs仿真步长在5SGSMD5芯片上实时仿真了一个低压微网系统,其仿真结果与商业离线仿真软件PSCAD结果一致,验证了所提方法的可行性和准确性。 展开更多
关键词 微电网 实时仿真 多端口网络 分层合并 细粒度并行
在线阅读 下载PDF
基于OpenCL的尺度不变特征变换算法的并行设计与实现 被引量:3
14
作者 许川佩 王光 《计算机应用》 CSCD 北大核心 2016年第7期1801-1806,共6页
针对尺度不变特征变换(SIFT)算法实时性差的问题,提出了利用开放式计算语言(Open CL)并行优化的SIFT算法。首先,通过对原算法各步骤进行组合拆分、重构特征点在内存中的数据索引等方式对原算法进行并行化重构,使得算法的中间计算结... 针对尺度不变特征变换(SIFT)算法实时性差的问题,提出了利用开放式计算语言(Open CL)并行优化的SIFT算法。首先,通过对原算法各步骤进行组合拆分、重构特征点在内存中的数据索引等方式对原算法进行并行化重构,使得算法的中间计算结果能够完全在显存中完成交互;然后,采用复用全局内存对象、共享局部内存、优化内存读取等策略对原算法各步骤进行并行设计,提高数据读取效率,降低传输延时;最后,利用Open CL语言在图形处理单元(GPU)上实现了SIFT算法的细粒度并行加速,并在中央处理器(CPU)上完成了移植。与原SIFT算法配准效果相近时,并行化的算法在GPU和CPU平台上特征提取速度分别提升了10.51~19.33和2.34~4.74倍。实验结果表明,利用Open CL并行加速的SIFT算法能够有效提高图像配准的实时性,并能克服统一计算设备架构(CUDA)因移植困难而不能充分利用异构系统中多种计算核心的缺点。 展开更多
关键词 尺度不变特征变换算法 开放式计算语言 复用内存对象 细粒度并行 异构系统
在线阅读 下载PDF
应用有向图分层的控制系统暂态仿真并行算法及其GPU实现 被引量:9
15
作者 宋炎侃 黄少伟 +3 位作者 陈颖 于智同 李春来 李正曦 《电力系统自动化》 EI CSCD 北大核心 2016年第12期137-143,共7页
随着基于变流器的电气接口和交直流混联技术的广泛使用,电网电磁暂态仿真中需对大规模复杂控制系统进行建模。采用细粒度并行方法可加速控制系统计算,提升电网电磁暂态仿真整体效率。文中提出了一种控制系统细粒度并行仿真算法,加速了... 随着基于变流器的电气接口和交直流混联技术的广泛使用,电网电磁暂态仿真中需对大规模复杂控制系统进行建模。采用细粒度并行方法可加速控制系统计算,提升电网电磁暂态仿真整体效率。文中提出了一种控制系统细粒度并行仿真算法,加速了图形处理器(GPU)计算平台上大规模控制系统仿真。首先,为构造面向GPU的多线程细粒度并行计算,将控制系统建模为由大量基本控制元件构成的有向图。进一步,对控制系统有向图进行分层,生成控制元件求解顺序,以利用GPU的分组细粒度并行实现控制元件的分层计算。最后,结合GPU的三层并行结构,通过优化线程结构和配置共享内存,将计算线程映射到GPU中的计算资源,最大化控制系统仿真的并行度。对分布式电源接入IEEE 13节点系统的仿真结果对比表明,所提出算法在保证电网电磁暂态仿真正确性的同时,可显著提高GPU计算平台上大规模、复杂控制系统的仿真速度,在硬件资源充足时,不存在仿真规模限制。 展开更多
关键词 控制系统仿真 细粒度并行 计算资源分配 图形处理器
在线阅读 下载PDF
基于改进并行遗传算法的蜂窝网络信道分配 被引量:3
16
作者 冯志强 许国军 +3 位作者 邓磊 夏晓燕 贾振红 覃锡忠 《计算机工程与应用》 CSCD 2014年第3期89-92,共4页
在蜂窝移动通信中,用户需求的不断增长使可用的频谱资源日益紧缺,采用较优的优化算法进行信道分配就显得非常重要。针对这一问题,首次提出了细粒度主从式并行遗传算法,其特点是在进化的过程中动态改变邻域单元,来维持进化过程中的种群... 在蜂窝移动通信中,用户需求的不断增长使可用的频谱资源日益紧缺,采用较优的优化算法进行信道分配就显得非常重要。针对这一问题,首次提出了细粒度主从式并行遗传算法,其特点是在进化的过程中动态改变邻域单元,来维持进化过程中的种群多样性,防止算法进入局部最优而过早收敛,增强算法的全局搜索能力。实验仿真表明,该算法对信道分配问题有很强的最优解搜索能力,收敛速度也较快,具有一定的实用价值。 展开更多
关键词 蜂窝网络 信道分配 细粒度并行遗传算法
在线阅读 下载PDF
H.265帧内模式判决并行计算方法研究与实现 被引量:2
17
作者 李申 柴志雷 +2 位作者 严伟 夏珺 赵建斌 《小型微型计算机系统》 CSCD 北大核心 2018年第11期2523-2527,共5页
针对H.265帧内编码算法编码速度慢的问题,基于现场可编程逻辑门阵列(FPGA)设计了一种并行帧内模式判决架构.首先通过理论推导,证明可以将多层次多尺度编码块的模式判决问题转化为单一层次多个小尺度编码块模式判决的叠加问题;其次,在编... 针对H.265帧内编码算法编码速度慢的问题,基于现场可编程逻辑门阵列(FPGA)设计了一种并行帧内模式判决架构.首先通过理论推导,证明可以将多层次多尺度编码块的模式判决问题转化为单一层次多个小尺度编码块模式判决的叠加问题;其次,在编码块内部通过细粒度并行实现快速模式判决,在编码块之间通过窗口流水方式实现快速处理;最终在FPGA上设计并实现了该帧内快速模式判决架构.实验结果表明,本文算法最高可达到93.6x的加速比,且编码后的视频质量损失较小(PSNR平均降低0.71dB). 展开更多
关键词 视频编码 FPGA 模式判决 编码块叠加 细粒度并行
在线阅读 下载PDF
面向流体机械仿真的层次化并行计算模型 被引量:1
18
作者 肖兮 刘闯 +3 位作者 何锋 张琼 张兴军 董小社 《西安交通大学学报》 EI CAS CSCD 北大核心 2019年第2期121-127,共7页
随着流体机械基础并行算法的发展,传统的单核处理器已经不能很好地满足先进流体机械研发的技术需求,为此本文深入研究了流体机械的物理模型以及高性能计算机架构特点,设计并实现了能够充分表达物理模型并行性的高效的面向流体机械仿真... 随着流体机械基础并行算法的发展,传统的单核处理器已经不能很好地满足先进流体机械研发的技术需求,为此本文深入研究了流体机械的物理模型以及高性能计算机架构特点,设计并实现了能够充分表达物理模型并行性的高效的面向流体机械仿真的层次化并行计算模型(HP2H)。HP2H模型充分考虑流体机械的多层几何结构以及高性能计算机的多层逻辑架构,深入挖掘计算平台、计算模型以及物理模型的并行性,实现从物理模型到计算资源的高效任务映射。依据具体的轴流压气机转子数值模拟的实际应用背景,结合粗粒度并行和细粒度并行对模型进行实现。对HP2H计算模型进行了功能测试和性能测试,当计算核心从36核提升到432核时,计算性能提升约12倍,并行效率达到了100%。实验结果表明,HP2H计算模型不但在正确地对流体机械进行数值模拟的前提下实现了较好的计算性能,并且由于HP2H计算模型结合了粗粒度并行与细粒度并行,因而可以在不同的计算平台上运行,还可以便捷地实现计算规模的扩展,具有良好的可移植性与可扩展性。 展开更多
关键词 流体机械 粒度并行 细粒度并行 并行计算模型
在线阅读 下载PDF
LDLT分解协处理器的并行结构研究
19
作者 郭磊 唐玉华 +1 位作者 周杰 董亚卓 《计算机工程》 CAS CSCD 北大核心 2011年第21期241-243,254,共4页
为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结... 为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结果表明,与运行在2.50 GHz Pentium微处理器上的C代码相比,该协处理器可获得32.03倍~43.25倍的性能提升。 展开更多
关键词 LDLT分解 现场可编程门阵列 细粒度并行 协处理器
在线阅读 下载PDF
基于SSE2的Smith-Waterman算法 被引量:2
20
作者 戴正华 张庆丹 +2 位作者 徐琳 谭光明 冯圣中 《计算机工程与应用》 CSCD 北大核心 2006年第11期85-87,共3页
Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Sm... Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。 展开更多
关键词 Smith-Waterman 算法 细粒度并行算法 SIMD SSE2
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部