期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向多核集群的数据流程序层次流水线并行优化方法
被引量:
8
1
作者
于俊清
张维维
+2 位作者
陈文斌
涂浩
何云峰
《计算机学报》
EI
CSCD
北大核心
2014年第10期2071-2083,共13页
数据流编程语言是一种面向领域的编程语言,它能够将计算与通信分离,暴露应用程序的并行性.多核集群中计算、存储和通信等底层资源的复杂性对数据流程序的性能提出了新的挑战.针对数据流程序在多核集群上执行存在资源利用低和扩展性差等...
数据流编程语言是一种面向领域的编程语言,它能够将计算与通信分离,暴露应用程序的并行性.多核集群中计算、存储和通信等底层资源的复杂性对数据流程序的性能提出了新的挑战.针对数据流程序在多核集群上执行存在资源利用低和扩展性差等问题,利用同步数据流图作为中间表示,文中提出并实现了面向多核集群的层次性流水线并行优化方法.方法包含任务划分与调度、层次流水线调度和数据局部性优化,经过编译优化后生成基于MPI的可并行执行的目标代码.其中任务划分与调度是利用程序中数据和任务并行性将任务映射到计算核上,实现负载均衡和低通信同步开销;层次性流水线调度是利用程序中的并行性构造低延迟流水线调度;数据局部性优化是针对数据访问存在的Cache伪共享做面向存储的优化.实验以X86架构多核处理器组成的集群为平台,选取媒体处理领域的典型应用算法作为测试程序,对层次流水线优化进行实验分析.实验结果表明了优化方法的有效性.
展开更多
关键词
多核集群
数据流编程
编译
流水线
COStream
在线阅读
下载PDF
职称材料
一种面向众核架构的数据流编译框架
被引量:
2
2
作者
魏海涛
秦明康
+1 位作者
于俊清
范东睿
《计算机学报》
EI
CSCD
北大核心
2014年第7期1560-1569,共10页
数据流编程模型将程序设计与媒体处理相结合,已大量应用到各个领域.众核处理器已经成为主流和工业标准,如何利用众核架构的特性来提高流应用执行性能已成为目前研究工作的一大难点.文中提出了一个高效的流编译框架来优化流应用的执行,...
数据流编程模型将程序设计与媒体处理相结合,已大量应用到各个领域.众核处理器已经成为主流和工业标准,如何利用众核架构的特性来提高流应用执行性能已成为目前研究工作的一大难点.文中提出了一个高效的流编译框架来优化流应用的执行,该框架包含3个优化策略:设计一个最优的软件流水调度方法;提出一个高效的数据存储分配算法;并采用合理的众核间的映射策略,减小通信以及同步的开销.文中在Godson-T上实现了该编译器框架,实验结果表明,该方法比优化前有较大性能改进.
展开更多
关键词
编译框架
数据流程序
众核处理器
软件流水
并行
在线阅读
下载PDF
职称材料
面向Storm的数据流编程模型与编译优化方法研究
被引量:
3
3
作者
杨秋吉
于俊清
+1 位作者
莫斌生
何云峰
《计算机工程与科学》
CSCD
北大核心
2016年第12期2409-2418,共10页
数据流编程模型将程序的计算与通信分离,暴露了应用程序潜在的并行性并简化了编程难度。分布式计算框架利用廉价PC构建多核集群解决了大规模并行计算问题,但多核集群层次性存储结构和处理单元对数据流程序的性能提出了新的挑战。针对数...
数据流编程模型将程序的计算与通信分离,暴露了应用程序潜在的并行性并简化了编程难度。分布式计算框架利用廉价PC构建多核集群解决了大规模并行计算问题,但多核集群层次性存储结构和处理单元对数据流程序的性能提出了新的挑战。针对数据流程序在分布式架构下所面临的问题,设计并实现了数据流编程模型和分布式计算框架的结合——在COStream的基础上提出了面向Storm的编译优化框架。框架包括两个模块:面向Storm的层次性任务划分与调度,以及面向Storm的层次性软件流水与代码生成。层次性任务划分利用Storm的任务调度机制将程序所有子任务分配到Storm集群节点内的多核上。层次性软件流水与代码生成将子任务构造成集群节点间的软件流水和节点内多核间的软件流水,并生成相应的目标代码。实验以多核集群为目标平台,在集群上搭建Storm分布式架构,选取数字媒体处理领域典型程序作为测试程序,对面向Storm的编译优化后的程序进行实验分析。实验结果表明了结合方法的有效性。
展开更多
关键词
多核集群
数据流编程
编译
流水线
COStream
在线阅读
下载PDF
职称材料
利用U模变换增加并行粒度与改善数据访问局部性的方法
被引量:
4
4
作者
马国凯
王欣孃
+2 位作者
王鹏
臧斌宇
朱传琪
《计算机学报》
EI
CSCD
北大核心
2004年第4期516-523,共8页
提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循...
提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折叠迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 .
展开更多
关键词
循环变换
并行化编译
U模变换
迭代空间折叠
数据访问局部性
wavefront方法
在线阅读
下载PDF
职称材料
面向X10的数据流程序编译优化算法
被引量:
1
5
作者
刘小宪
魏海涛
于俊清
《小型微型计算机系统》
CSCD
北大核心
2013年第10期2239-2245,共7页
数据流编程作为一种编程模式已被广泛应用到各个领域.然而,多核体系结构的不同使得数据流程序在不同平台上移植困难.X10作为一种新型并行编程语言,为不同的多核体系结构提供了统一的并行计算环境.如何利用X10语言的特性来提高数据流程...
数据流编程作为一种编程模式已被广泛应用到各个领域.然而,多核体系结构的不同使得数据流程序在不同平台上移植困难.X10作为一种新型并行编程语言,为不同的多核体系结构提供了统一的并行计算环境.如何利用X10语言的特性来提高数据流程序的效率已成为目前研究工作的一大难点.本文设计并实现了一个面向X10的编译优化系统,该系统确立了三种优化算法:针对X10语言的代码生成优化减少了生成的X10代码量;针对同步数据流图的任务划分优化在负载均衡的基础上,避免了死锁的产生,同时减少了通信开销;针对底层硬件资源的通信优化在机器间通信、机器内部线程间通信、线程内部通信方面进行了区分和优化,减少了通信开销.实验结果表明,设计的三种编译优化算法都获得了较大的性能提升.
展开更多
关键词
X10
数据流程序
编译优化
并行计算
在线阅读
下载PDF
职称材料
题名
面向多核集群的数据流程序层次流水线并行优化方法
被引量:
8
1
作者
于俊清
张维维
陈文斌
涂浩
何云峰
机构
华中科技大学计算机科学与技术学院
华中科技大学网络与计算中心
出处
《计算机学报》
EI
CSCD
北大核心
2014年第10期2071-2083,共13页
基金
国家"八六三"高技术研究发展计划重点项目基金(2012AA010902)
高等学校博士学科点专项科研基金(20120142110089)资助
文摘
数据流编程语言是一种面向领域的编程语言,它能够将计算与通信分离,暴露应用程序的并行性.多核集群中计算、存储和通信等底层资源的复杂性对数据流程序的性能提出了新的挑战.针对数据流程序在多核集群上执行存在资源利用低和扩展性差等问题,利用同步数据流图作为中间表示,文中提出并实现了面向多核集群的层次性流水线并行优化方法.方法包含任务划分与调度、层次流水线调度和数据局部性优化,经过编译优化后生成基于MPI的可并行执行的目标代码.其中任务划分与调度是利用程序中数据和任务并行性将任务映射到计算核上,实现负载均衡和低通信同步开销;层次性流水线调度是利用程序中的并行性构造低延迟流水线调度;数据局部性优化是针对数据访问存在的Cache伪共享做面向存储的优化.实验以X86架构多核处理器组成的集群为平台,选取媒体处理领域的典型应用算法作为测试程序,对层次流水线优化进行实验分析.实验结果表明了优化方法的有效性.
关键词
多核集群
数据流编程
编译
流水线
COStream
Keywords
multi-core cluster
data
flow
programs
compilation
pipeline
COStream
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种面向众核架构的数据流编译框架
被引量:
2
2
作者
魏海涛
秦明康
于俊清
范东睿
机构
华中科技大学计算机科学与技术学院
华中科技大学网络与计算中心
中国科学院计算技术研究所计算机体系结构国家重点实验室
出处
《计算机学报》
EI
CSCD
北大核心
2014年第7期1560-1569,共10页
基金
国家"八六三"高技术研究发展计划重点项目(2012AA010902)
高等学校博士学科点专项科研基金(20120142110089)
+1 种基金
中国科学院计算技术研究所国家重点实验室开放基金
IBM X10 Innovation基金资助~~
文摘
数据流编程模型将程序设计与媒体处理相结合,已大量应用到各个领域.众核处理器已经成为主流和工业标准,如何利用众核架构的特性来提高流应用执行性能已成为目前研究工作的一大难点.文中提出了一个高效的流编译框架来优化流应用的执行,该框架包含3个优化策略:设计一个最优的软件流水调度方法;提出一个高效的数据存储分配算法;并采用合理的众核间的映射策略,减小通信以及同步的开销.文中在Godson-T上实现了该编译器框架,实验结果表明,该方法比优化前有较大性能改进.
关键词
编译框架
数据流程序
众核处理器
软件流水
并行
Keywords
compilation framework; data flow programs
many-core processor
software pipelining
parallelism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向Storm的数据流编程模型与编译优化方法研究
被引量:
3
3
作者
杨秋吉
于俊清
莫斌生
何云峰
机构
华中科技大学网络与计算中心
出处
《计算机工程与科学》
CSCD
北大核心
2016年第12期2409-2418,共10页
基金
国家重点研发计划(2016YFB1000204)
国家自然科学基金(61572211)
文摘
数据流编程模型将程序的计算与通信分离,暴露了应用程序潜在的并行性并简化了编程难度。分布式计算框架利用廉价PC构建多核集群解决了大规模并行计算问题,但多核集群层次性存储结构和处理单元对数据流程序的性能提出了新的挑战。针对数据流程序在分布式架构下所面临的问题,设计并实现了数据流编程模型和分布式计算框架的结合——在COStream的基础上提出了面向Storm的编译优化框架。框架包括两个模块:面向Storm的层次性任务划分与调度,以及面向Storm的层次性软件流水与代码生成。层次性任务划分利用Storm的任务调度机制将程序所有子任务分配到Storm集群节点内的多核上。层次性软件流水与代码生成将子任务构造成集群节点间的软件流水和节点内多核间的软件流水,并生成相应的目标代码。实验以多核集群为目标平台,在集群上搭建Storm分布式架构,选取数字媒体处理领域典型程序作为测试程序,对面向Storm的编译优化后的程序进行实验分析。实验结果表明了结合方法的有效性。
关键词
多核集群
数据流编程
编译
流水线
COStream
Keywords
muti-core cluster
data
flow
program
ming
compil
er
pipeline
COStream
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
利用U模变换增加并行粒度与改善数据访问局部性的方法
被引量:
4
4
作者
马国凯
王欣孃
王鹏
臧斌宇
朱传琪
机构
复旦大学并行处理研究所
出处
《计算机学报》
EI
CSCD
北大核心
2004年第4期516-523,共8页
基金
到国家自然科学基金 ( 60 2 73 0 46)
上海市科学技术委员会重点基础项目基金( 0 2JC14 0 13 )资助
文摘
提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折叠迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 .
关键词
循环变换
并行化编译
U模变换
迭代空间折叠
数据访问局部性
wavefront方法
Keywords
data
flow
analysis
program
compil
ers
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
面向X10的数据流程序编译优化算法
被引量:
1
5
作者
刘小宪
魏海涛
于俊清
机构
华中科技大学计算机科学与技术学院
华中科技大学网络与计算中心
出处
《小型微型计算机系统》
CSCD
北大核心
2013年第10期2239-2245,共7页
基金
高等学校博士学科点专项科研基金项目(20120142110089)资助
国家"八六三"高技术研究发展计划项目(2012AA010902)资助
文摘
数据流编程作为一种编程模式已被广泛应用到各个领域.然而,多核体系结构的不同使得数据流程序在不同平台上移植困难.X10作为一种新型并行编程语言,为不同的多核体系结构提供了统一的并行计算环境.如何利用X10语言的特性来提高数据流程序的效率已成为目前研究工作的一大难点.本文设计并实现了一个面向X10的编译优化系统,该系统确立了三种优化算法:针对X10语言的代码生成优化减少了生成的X10代码量;针对同步数据流图的任务划分优化在负载均衡的基础上,避免了死锁的产生,同时减少了通信开销;针对底层硬件资源的通信优化在机器间通信、机器内部线程间通信、线程内部通信方面进行了区分和优化,减少了通信开销.实验结果表明,设计的三种编译优化算法都获得了较大的性能提升.
关键词
X10
数据流程序
编译优化
并行计算
Keywords
X10
data
flow
programs
compil
er optimization
parallel computing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向多核集群的数据流程序层次流水线并行优化方法
于俊清
张维维
陈文斌
涂浩
何云峰
《计算机学报》
EI
CSCD
北大核心
2014
8
在线阅读
下载PDF
职称材料
2
一种面向众核架构的数据流编译框架
魏海涛
秦明康
于俊清
范东睿
《计算机学报》
EI
CSCD
北大核心
2014
2
在线阅读
下载PDF
职称材料
3
面向Storm的数据流编程模型与编译优化方法研究
杨秋吉
于俊清
莫斌生
何云峰
《计算机工程与科学》
CSCD
北大核心
2016
3
在线阅读
下载PDF
职称材料
4
利用U模变换增加并行粒度与改善数据访问局部性的方法
马国凯
王欣孃
王鹏
臧斌宇
朱传琪
《计算机学报》
EI
CSCD
北大核心
2004
4
在线阅读
下载PDF
职称材料
5
面向X10的数据流程序编译优化算法
刘小宪
魏海涛
于俊清
《小型微型计算机系统》
CSCD
北大核心
2013
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部