期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
众核体系结构对Cilk语言的硬件支持及评测研究 被引量:7
1
作者 龙国平 张军超 范东睿 《计算机学报》 EI CSCD 北大核心 2008年第11期1975-1985,共11页
如何编程众核体系结构是当前一个亟待解决的问题.研究可扩展的硬件机制支持Cilk编程模型的目的是在良好的编程性和可扩展硬件实现之间达到平衡.Cilk语言是C的精简扩展,程序员编写Cilk程序时和串行编程近似,且不需关心调度、负载均衡和... 如何编程众核体系结构是当前一个亟待解决的问题.研究可扩展的硬件机制支持Cilk编程模型的目的是在良好的编程性和可扩展硬件实现之间达到平衡.Cilk语言是C的精简扩展,程序员编写Cilk程序时和串行编程近似,且不需关心调度、负载均衡和局部性等系统底层相关的问题.文中以域一致性存储模型为基础,主要工作包括两方面:首先针对域一致性模型编程性不好的缺点提出一种以数据为中心维护高速缓存一致性的方法;其次提出实现DAG Consistency的缓存一致性协议,并在此基础上支持Cilk编程模型.实验结果表明,当处理器核数目较少(<16)时所有测试程序都能获得比较好的性能加速,并且指出了众核情况下(>16)难以获得理想加速效果的两个根本原因:静态路由导致片上网络带宽利用不均衡以及有限的访存带宽. 展开更多
关键词 众核体系结构 cilk 域一致性 编程模型 存储模型
在线阅读 下载PDF
基于TBB和Cilk++的并行蚁群算法在路径寻优中的应用 被引量:7
2
作者 王磊 曹菡 《计算机应用》 CSCD 北大核心 2010年第10期2781-2784,共4页
针对实际道路路网的一类路径寻优问题,提出了带回退机制的蚁群搜索算法,求解在实际道路路网中完成遍历所有规定节点的一条较优路径。为解决大规模实际道路路网数据量大、蚁群算法收敛速度慢的问题,分别采用Intel Threading Building Blo... 针对实际道路路网的一类路径寻优问题,提出了带回退机制的蚁群搜索算法,求解在实际道路路网中完成遍历所有规定节点的一条较优路径。为解决大规模实际道路路网数据量大、蚁群算法收敛速度慢的问题,分别采用Intel Threading Building Blocks(TBB)和Cilk++并行编程模型实现了并行蚁群搜索。与基于WinAPI函数的多线程蚁群算法相比,这两种模型均避免了手动启动线程及识别临界区资源等复杂操作,开发难度降低;在运行效率方面,基于TBB的并行蚁群算法和基于WinAPI的并行蚁群算法效率接近,而基于Cilk++的并行蚁群算法在双核环境下,运行效率和加速比都超过了基于WinAPI的并行蚁群算法。 展开更多
关键词 TBB cilk++ 并行蚁群算法 多核
在线阅读 下载PDF
Cilk++与OpenMP并行模型性能比较
3
作者 王磊 《现代电子技术》 2012年第12期110-113,共4页
构造了两种并行蚁群算法模型,在单机多核下实现了Cilk++并行蚁群算法及OpenMP并行蚁群算法,并应用于真实路网车辆路径问题(Vehicle Routing Problem,VRP)对两者进行了实验对比。实验结果表明,OpenMP模型的并行性能与问题规模有较大关系,... 构造了两种并行蚁群算法模型,在单机多核下实现了Cilk++并行蚁群算法及OpenMP并行蚁群算法,并应用于真实路网车辆路径问题(Vehicle Routing Problem,VRP)对两者进行了实验对比。实验结果表明,OpenMP模型的并行性能与问题规模有较大关系,OpenMP并行蚁群算法与基于winapi多线程的并行蚁群算法相比效率相近。Cilk++模型在双核下性能优于OpenMP模型,四核下不及OpenMP模型。 展开更多
关键词 蚁群算法 TBB cilk++ OPENMP
在线阅读 下载PDF
基于分治法求解对称三对角矩阵特征问题的MPI/Cilk混合并行算法 被引量:4
4
作者 朱京乔 赵永华 《郑州大学学报(理学版)》 CAS 北大核心 2020年第1期33-38,共6页
对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进... 对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进程内多线程任务并行的方法,实现了对分而治之算法中分治阶段和合并阶段的多任务划分和动态调度。进程内利用Cilk任务执行的有向无环图模型,解决了线程级并行的数据依赖和饥饿等待等问题,提高了程序的并行性;进程间通过粗粒度计算任务的划分,优化了MPI部分的数据通信流程和负载均衡问题。数值实验表明,混合并行算法在计算性能和可扩展性方面都要优于纯MPI并行算法。 展开更多
关键词 三对角矩阵 对称特征问题 并行计算 分治算法 cilk MPI
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部