期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
大数据文件和混合文件的多线程并行下载 被引量:8
1
作者 韦兴柳 钟诚 +2 位作者 李智 蔡德霞 陈清媛 《计算机工程与应用》 CSCD 2012年第14期84-89,共6页
在应用计算机模拟病例训练与考试系统的过程中,客户端时常需要在线下载许多大数据文件、音频和视频混合文件,系统响应速度是一个关键问题。研究了在RIA中实现多线程的技术方案,提出在多核计算机上有效实现多线程并行下载大数据文件、音... 在应用计算机模拟病例训练与考试系统的过程中,客户端时常需要在线下载许多大数据文件、音频和视频混合文件,系统响应速度是一个关键问题。研究了在RIA中实现多线程的技术方案,提出在多核计算机上有效实现多线程并行下载大数据文件、音频和视频混合文件的优化方法。算法分析与实验结果表明,提出的多线程并行下载技术能够加速计算机模拟病例系统模块的在线下载,显著优化了系统运行性能。 展开更多
关键词 线程下载 性能优化 富互联网应用(RIA) 多核计算机 线程级并行
在线阅读 下载PDF
面向线程级前瞻的线程划分方法浅析 被引量:1
2
作者 鲁建壮 王志英 张春元 《计算机科学》 CSCD 北大核心 2006年第5期270-272,281,共4页
正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并结合一典型自... 正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并结合一典型自动线程划分算法进行了具体分析,提出了线程划分需要进一步研究的问题。 展开更多
关键词 线程级并行 线程划分 线程前瞻
在线阅读 下载PDF
多核多线程并行求解线性方程组 被引量:2
3
作者 冯佩 钟诚 韦伟 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第2期237-240,250,共5页
线性方程组求解在科学与工程计算领域具有广泛的应用。文章依据多核计算机共享二级缓存和私有一级缓存的容量,采取将线性方程组的增广矩阵按行划分并合理地分布存储到各级缓存中,各个处理核以多线程方式并行计算矩阵行的方法,给出了一... 线性方程组求解在科学与工程计算领域具有广泛的应用。文章依据多核计算机共享二级缓存和私有一级缓存的容量,采取将线性方程组的增广矩阵按行划分并合理地分布存储到各级缓存中,各个处理核以多线程方式并行计算矩阵行的方法,给出了一种在多核计算机上实现的线程级并行求解n阶线性方程组的算法。实验结果表明,与原Gauss-Seidel并行算法相比,文中所提出的算法具有较好的加速比和可扩展性。 展开更多
关键词 线性方程组求解 Gauss-Seidel算法 多核计算 线程级并行 缓存
在线阅读 下载PDF
HL-TLS:支持热点的线程级猜测编译实现
4
作者 金跃 李春强 +1 位作者 尚云海 卢永江 《计算机工程》 CAS CSCD 北大核心 2015年第11期77-83,共7页
猜测并行化编译,即线程级猜测(TLS)编译,可将原来顺序运行的程序并行化。但由于猜测数据的不确定性引起的数据管理开销过大,以及猜测线程失败引起的线程回滚开销,使得并行后的执行性能较低。针对上述问题,提出一种HL-TLS并行化编译优化... 猜测并行化编译,即线程级猜测(TLS)编译,可将原来顺序运行的程序并行化。但由于猜测数据的不确定性引起的数据管理开销过大,以及猜测线程失败引起的线程回滚开销,使得并行后的执行性能较低。针对上述问题,提出一种HL-TLS并行化编译优化框架。HL-TLS能有效地标记并行化的循环体为热点循环体,采用对最高层次热点循环体进行更激进的并行化的方式提高性能,而对非热点循环体采用保守的顺序执行以减少开销。实验结果表明,使用HL-TLS编译优化框架,实验程序的执行效率可以提高20%。 展开更多
关键词 并行计算 线程 猜测执行 线程猜测并行 热点循环 动态转换执行机制
在线阅读 下载PDF
萤火虫2:一种多态并行机的硬件体系结构 被引量:16
5
作者 李涛 杨婷 +5 位作者 易学渊 蒲林 钱博文 黄光新 黄虎才 韩俊刚 《计算机工程与科学》 CSCD 北大核心 2014年第2期191-200,共10页
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机... 提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。 展开更多
关键词 阵列机 多态处理器 计算机图形 图像处理 信号处理 数据并行 线程级并行
在线阅读 下载PDF
一种基于路径优化的推测多线程划分算法 被引量:1
6
作者 李远成 赵银亮 +1 位作者 李美蓉 杜延宁 《软件学报》 EI CSCD 北大核心 2012年第8期1950-1964,共15页
推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划... 推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划分算法中存在的一个重要问题是,在对划分路径进行选取时只考虑了控制依赖影响却不能有效地综合考虑数据依赖的影响,进而导致不能选取最佳的划分路径.因此,针对传统方法中这种依赖评估方法效率低下的问题,设计并实现了一种基于路径优化的线程划分算法.该算法通过引入基于程序切片技术的预计算方法,建立一种路径评估方法来评估程序间的控制和数据依赖.同时,引入控制线程体大小的启发式规则,以便有效地解决负载不平衡的问题.基于Olden测试集的测试结果表明,所提出的算法可以有效地对非规则程序进行划分,其平均加速比可以达到1.83. 展开更多
关键词 推测多线程 线程级并行 线程划分 路径优化 自动并行
在线阅读 下载PDF
GPGPU上基于运行时特征的动态并行度调度算法
7
作者 于玉龙 王宇新 郭禾 《小型微型计算机系统》 CSCD 北大核心 2015年第12期2798-2802,共5页
调度算法对于保障GPGPU内大规模并发线程的高效运行至关重要.调度器需要根据程序的计算特征和GPGPU内各种逻辑单元的设置情况选择合理的线程并行度.然而现有调度算法或采用静态固化并行度、或调整粒度过粗,均无法在动态调整的同时保持... 调度算法对于保障GPGPU内大规模并发线程的高效运行至关重要.调度器需要根据程序的计算特征和GPGPU内各种逻辑单元的设置情况选择合理的线程并行度.然而现有调度算法或采用静态固化并行度、或调整粒度过粗,均无法在动态调整的同时保持合理的并行度参数.基于两层次调度算法TL,通过对GPGPU运行时特征的动态监测,针对细粒度Warp调度提出了结合运行时资源使用特征和指令特征的动态并行度调度算法DTL和D2TL.在性能模拟器GPGPU-Sim上的仿真实验证明,相对传统TL调度算法,DTL和D2TL分别达到平均14.4%和19.6%的性能加速. 展开更多
关键词 GPGPU 两层次调度 线程级并行 动态并行
在线阅读 下载PDF
多核计算机上的快速傅里叶变换并行算法 被引量:8
8
作者 王刚强 钟诚 柯琦 《计算机工程》 CAS CSCD 北大核心 2011年第16期57-59,共3页
针对现有多核结构上快速傅里叶变换(FFT)并行算法没有利用多级缓存和线程级并行等多核特性问题,通过运用多核多级存储特性合理划分数据,采取子序列FFT计算和多线程并行逐对计算FFT相结合的方法,给出一个N点、一维、有序和基数为2的多核... 针对现有多核结构上快速傅里叶变换(FFT)并行算法没有利用多级缓存和线程级并行等多核特性问题,通过运用多核多级存储特性合理划分数据,采取子序列FFT计算和多线程并行逐对计算FFT相结合的方法,给出一个N点、一维、有序和基数为2的多核多线程并行计算FFT非递归算法。理论分析和实验结果表明,该算法实用、高效,能获得较好的加速比和可扩展性。 展开更多
关键词 快速傅里叶变换 多核计算机 线程级并行 缓存 非递归
在线阅读 下载PDF
支持推测多线程的扩展多核模拟器Prophet+ 被引量:3
9
作者 宋少龙 赵银亮 +3 位作者 冯博琴 韦远科 王旭昊 赵恒星 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第10期13-17,35,共6页
推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种... 推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种支持推测并行执行模式的超标量流水线结构和一种基于独立栈的运行时内存空间管理方法.通过对Prophet模拟器扩展实现,并经Olden基准程序测试表明,扩展后的Prophet+在保持Prophet模拟器性能的前提下,提高了模拟器的精度和灵活性. 展开更多
关键词 线程级并行 推测多线程 片上多处理器 流水线 模拟器
在线阅读 下载PDF
Prophet推测多线程系统设计与实现 被引量:2
10
作者 李钟 赵银亮 杜延宁 《计算机科学》 CSCD 北大核心 2011年第2期296-301,共6页
推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执... 推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执行模型。重点描述了Prophet执行模型针对执行模型设计的关键问题的解决方案,包括Prophet的线程状态控制和多版本的Cache系统,Prophet的多版本Cache系统提供了推测数据缓存功能,并使用基于总线监听的Cache协议实现了数据依赖违规检测。还给出了使用Olden基准程序对Prophet执行模型进行功能和性能测试的结果,并分析说明了Prophet系统可以有效地开发应用程序的线程级并行性。 展开更多
关键词 推测多线程 线程级并行 推测多线程执行模型 推测多线程体系结构
在线阅读 下载PDF
动态图上的最短路径距离并行算法 被引量:4
11
作者 韩硕 邹磊 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期112-122,共11页
设计动态图上最短路径距离查询的并行计算框架。通过构建增量图的方法,实现一个批次内的多个查询在不同数据图版本的多线程并发执行。对于每个查询,使用双向宽度优先搜索算法来减少搜索空间,并提出搜索过程中扩展方向的决策函数。利用BS... 设计动态图上最短路径距离查询的并行计算框架。通过构建增量图的方法,实现一个批次内的多个查询在不同数据图版本的多线程并发执行。对于每个查询,使用双向宽度优先搜索算法来减少搜索空间,并提出搜索过程中扩展方向的决策函数。利用BSR对数据图邻接表进行编码,结合SIMD指令和图顶点重标号算法,进一步提升数据级并行度。在真实图数据集下的大量实验验证了所提方法的高效性。 展开更多
关键词 动态图 最短路径距离 增量图 线程级并行 数据并行 双向宽度优先搜索 SIMD
在线阅读 下载PDF
EDGE结构上一种通过超块重组加速单线程应用的方法
12
作者 魏学超 安虹 毛梦捷 《小型微型计算机系统》 CSCD 北大核心 2012年第10期2249-2254,共6页
Explicit Data Graph Execution(EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构.相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock)而不是单个指令作为其执行单位,在超块内部实现数据流执行... Explicit Data Graph Execution(EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构.相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock)而不是单个指令作为其执行单位,在超块内部实现数据流执行,超块之间按照推测序保持控制流执行,有利于挖掘指令级并行性.但是,EDGE编译器按照程序的串行执行顺序组织超块,超块间和超块内部受限于数据依赖,削弱了整个程序运行时的潜在数据级并行性和线程级并行性,不利于发挥EDGE分片式结构的优势.本文通过分析EDGE编译器超块组织的特点,结合EDGE结构特有的执行模型,提出一种普适性的超块组织框架来模拟EDGE结构上多线程运行的效果,进一步挖掘EDGE结构运行串行单线程程序时的指令级并行性.本文选用TRIPS微处理器作为EDGE结构的实例处理器,利用矩阵乘法等三个实验验证了我们所提出的框架的可行性,实验结果表明这些应用在TRIPS上获得了较好的性能提升. 展开更多
关键词 众核处理器 EDGE 线程级并行 超块 TRIPS
在线阅读 下载PDF
申威同时多线程功能模拟器实现与应用 被引量:2
13
作者 陈伟健 郭勇 尹飞 《计算机工程》 CAS CSCD 北大核心 2016年第6期55-59,67,共6页
同时多线程(SMT)技术允许来自多个线程的不相关指令同时执行,实现线程级并行与指令级并行相结合,提升处理器的性能。在SMT设计中,运用体系结构模拟器进行实现性分析与正确性验证。以申威多核功能模拟器为基础,提出申威SMT功能模拟器设... 同时多线程(SMT)技术允许来自多个线程的不相关指令同时执行,实现线程级并行与指令级并行相结合,提升处理器的性能。在SMT设计中,运用体系结构模拟器进行实现性分析与正确性验证。以申威多核功能模拟器为基础,提出申威SMT功能模拟器设计方法,并实现申威SMT功能模拟器。模拟结果表明了申威SMT功能模拟器设计实现的正确性,并基于申威SMT功能模拟器构建RTL级实时验证平台,在处理器设计验证领域具有较高的应用价值。 展开更多
关键词 申威处理器 功能模拟器 体系结构模拟器 同时多线程 线程级并行
在线阅读 下载PDF
单片多处理器的研究 被引量:7
14
作者 史莉雯 樊晓桠 张盛兵 《计算机应用研究》 CSCD 北大核心 2007年第9期46-49,共4页
单片多处理器结构支持较高线程级的并行,能显著提高性能。介绍了单片多处理器的结构,对一些结构模型和实际的商用处理器进行举例,并对关键技术进行了研究分析。
关键词 单片多处理器 线程级并行 存储层次 核间互连 多核任务调度
在线阅读 下载PDF
一种基于综合历史信息的SMT结构分支预测算法
15
作者 王晶 樊晓桠 叶曾 《计算机科学》 CSCD 北大核心 2008年第2期259-262,共4页
在SMT结构中,可以同时从多个线程中取指。当可取指线程个数较少时,分支预测的重要性与在超标量处理器中的相比有增无减,因为SMT结构中转移误预测的代价更大了。影响分支预测准确率的关键因素是历史信息的组织方式和更新方式。本文仿真... 在SMT结构中,可以同时从多个线程中取指。当可取指线程个数较少时,分支预测的重要性与在超标量处理器中的相比有增无减,因为SMT结构中转移误预测的代价更大了。影响分支预测准确率的关键因素是历史信息的组织方式和更新方式。本文仿真分析了这些因素对分支预测准确率的影响,提出了一种基于综合历史信息的分支预测算法——IHBP,把全局信息和局部信息结合在一起预测转移,解决了SMT结构中分支预测信息过时、混乱等问题,使得预测的准确率更具备鲁棒性。仿真结果表明:在8线程结构中,该算法与目前国际普遍采用的Gshare算法和Pag算法相比,分支预测准确率分别提高了8.5%和2.3%。 展开更多
关键词 线程级并行 同时多线程 分支预测
在线阅读 下载PDF
浮点与整数资源区别分配的SMT处理器取指策略
16
作者 蒋生健 胡向东 杨剑新 《计算机工程》 CAS CSCD 北大核心 2017年第4期46-51,共6页
在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与IC... 在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与ICOUNT,STALL等策略相比,该策略在算术平均IPC和调和平均IPC方面均取得一定的性能提升,同时其在处理浮点和整数混合型程序时也具有优势。 展开更多
关键词 同时多线程 取指策略 资源分配 线程级并行 浮点 整数
在线阅读 下载PDF
支持SMT的微结构模拟器实现与应用
17
作者 陈伟健 郭勇 +1 位作者 朱英 尹飞 《计算机工程》 CAS CSCD 北大核心 2016年第12期60-65,72,共7页
某国产处理器微结构模拟器(MASim)无法支持同时多线程(SMT)技术,难以满足研究与工程需求。为此,提出一种新的微结构模拟器。将MASim和SMT技术相结合,从架构模拟、仿真速度、仿真精度与灵活可控等方面采用模块化和队列优化等技术进行设... 某国产处理器微结构模拟器(MASim)无法支持同时多线程(SMT)技术,难以满足研究与工程需求。为此,提出一种新的微结构模拟器。将MASim和SMT技术相结合,从架构模拟、仿真速度、仿真精度与灵活可控等方面采用模块化和队列优化等技术进行设计与实现。实验结果表明,该模拟器的仿真精度、仿真速度与原有的单线程微结构模拟器基本相当,SMT技术对该系列国产处理器具有性能提升作用,每时钟周期执行指令数平均提升29.61%。 展开更多
关键词 国产处理器 结构模拟器 处理器微结构 处理器验证 同时多线程 线程级并行
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部