期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向多核程序确定性重演的内存竞争记录机制研究 被引量:3
1
作者 朱素霞 季振洲 +2 位作者 刘涛 王庆 张浩 《电子学报》 EI CAS CSCD 北大核心 2011年第12期2748-2754,共7页
内存竞争记录是实现多核程序确定性重演的关键技术.针对现有内存竞争记录算法存在消耗资源多、记录日志大、重演速度受限等问题,本文提出了一种硬件结构支持的、基于分段技术的、高效的点对点内存竞争记录算法,该算法用一种更严格的间... 内存竞争记录是实现多核程序确定性重演的关键技术.针对现有内存竞争记录算法存在消耗资源多、记录日志大、重演速度受限等问题,本文提出了一种硬件结构支持的、基于分段技术的、高效的点对点内存竞争记录算法,该算法用一种更严格的间接发生序表示内存竞争,采用分段的可推导约减算法减少记录内存竞争的次数,同时使用最大近似时戳法近似已被替换出cache的内存块的时戳,能够在引入较少硬件资源的前提下记录较小的内存竞争日志,且简单易实现,重演速度快. 展开更多
关键词 多核程序 确定性重演 内存竞争记录
在线阅读 下载PDF
基于滑动窗口的多核程序数据竞争硬件检测算法 被引量:1
2
作者 朱素霞 陈德运 +1 位作者 季振洲 孙广路 《通信学报》 EI CSCD 北大核心 2016年第9期10-19,共10页
数据竞争是引起多核程序发生并发错误的主要原因。针对现有基于硬件的happens-before数据竞争检测方法硬件开销大的问题,提出了一种轻量级的内存竞争硬件检测算法,该算法利用滑动窗口技术动态检测程序执行过程中发生的距离较近、更易引... 数据竞争是引起多核程序发生并发错误的主要原因。针对现有基于硬件的happens-before数据竞争检测方法硬件开销大的问题,提出了一种轻量级的内存竞争硬件检测算法,该算法利用滑动窗口技术动态检测程序执行过程中发生的距离较近、更易引发并发错误的数据竞争。考虑竞争距离的大小,将并发线程片段细分为加锁并发竞争域和包含线程近期执行序列的未加锁并发竞争域,用一对交替移动的可重写滑动窗口保存未加锁并发竞争域内的内存操作指令,用一个大小可变的可重写滑动窗口保存加锁并发竞争域内的内存操作指令,当来自远程的共享访问与窗口内的内存访问发生冲突时,检测到数据竞争。在硬件实现结构中,仅为每个处理器核添加3对较小尺寸的硬件签名寄存器来保存并发竞争域内的数据地址,无需更改原有的cache一致性协议,带来的带宽开销低,能够快速地检测多核程序并发执行过程中发生的动态数据竞争,为多核程序开发和生产运行阶段的并发错误诊断提供有效的指导信息。 展开更多
关键词 数据竞争 滑动窗口 硬件签名 并发错误 多核程序
在线阅读 下载PDF
基于OpenMP的电磁场FDTD多核并行程序设计 被引量:2
3
作者 吕忠亭 张玉强 崔巍 《现代电子技术》 2013年第23期168-170,共3页
探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+细粒度并行的方... 探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+细粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD程序中进行了验证。该并行算法取得了较其他并行FDTD算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常好的加速比和效率。 展开更多
关键词 OPENMP 时域有限差分法 多核并行程序 程序设计
在线阅读 下载PDF
基于逐步细化快照序列的多核并行程序调试
4
作者 王博弘 刘轶 +1 位作者 张国振 钱德沛 《计算机研究与发展》 EI CSCD 北大核心 2017年第4期821-831,共11页
多核并行程序的调试是一个公认的困难问题,困难主要来自于程序执行的不确定性.可重现调试(replay debug)提供了消除程序中不确定性的能力,但是现有的可重现调试解决方案都无法应用于商用的软硬件平台中,且进行调试所带来的性能损失会随... 多核并行程序的调试是一个公认的困难问题,困难主要来自于程序执行的不确定性.可重现调试(replay debug)提供了消除程序中不确定性的能力,但是现有的可重现调试解决方案都无法应用于商用的软硬件平台中,且进行调试所带来的性能损失会随着并发度的增加而超线性地增长.提出了一种基于运行快照的新型并行程序调试方法SDT(snapshot debug tool).该方法以离线的断点设置、运行快照捕捉和运行快照细化为基础,提出了一套可以指导用户由粗到细发现错误的调试过程,并在通用的软硬件平台上进行了实现.实验结果显示,在8线程的并发条件下,使用SDT调试所带来的时间性能损耗平均为51.88%;同时当线程数增长4倍时,使用SDT所带来的额外时间消耗最多增长1倍,具有很好的可扩展性.记录快照的数据量是影响SDT性能的重要挑战,实验证明通过使用增量式的快照记录方式可以有效地降低需要记录的数据量,减少记录快照花费的时间,提高SDT的整体性能. 展开更多
关键词 可重现调试 运行快照 确定性 多核并行程序调试 多线程
在线阅读 下载PDF
多核处理器架构下面向监控的软件运行时验证方法研究 被引量:3
5
作者 张剑 胡军 郭丽娟 《小型微型计算机系统》 CSCD 北大核心 2012年第1期102-109,共8页
面向监控的软件运行时验证(Monitor-oriented Runtime Verification:MRV)方法可以有效的提高系统可靠性,但是在传统基于单核处理器架构的嵌入式系统中采用MRV方法会给目标系统性能造成较大的影响.本文对基于多核处理器架构的MRV方法进... 面向监控的软件运行时验证(Monitor-oriented Runtime Verification:MRV)方法可以有效的提高系统可靠性,但是在传统基于单核处理器架构的嵌入式系统中采用MRV方法会给目标系统性能造成较大的影响.本文对基于多核处理器架构的MRV方法进行了初步研究,分析并设计了在线验证、离线验证以及单监视器设计与多监视器设计等多种模式的MRV方法,给出了相应的MRV实现方案,并在几个开源项目中进行了MRV实例应用.实验数据分析表明,在不同模式下,基于多核处理器架构的MRV方法能够从不同程度上有效提高系统运行时验证的性能.本文工作为进一步设计有效的多核架构下MRV方法提供了基础. 展开更多
关键词 面向监控的运行时验证 嵌入式软件 多核程序设计 软件分析与验证
在线阅读 下载PDF
基于TMS320C6678的多核Bootloader设计与实现 被引量:9
6
作者 薛志远 王春雷 《航空兵器》 2017年第4期80-83,共4页
针对TMS320C6678多核处理器的特性,提出一种基于多核Bootloader的设计方法。阐述了TMS320C6678 Bootloader的原理和工作机制,并给出一种多核用户程序镜像文件的生成方法,实现了TMS320C6678的多核程序加载以及上电自启动。经验证,TMS320C... 针对TMS320C6678多核处理器的特性,提出一种基于多核Bootloader的设计方法。阐述了TMS320C6678 Bootloader的原理和工作机制,并给出一种多核用户程序镜像文件的生成方法,实现了TMS320C6678的多核程序加载以及上电自启动。经验证,TMS320C6678在该设计方法下能够稳定运行。 展开更多
关键词 弹载计算机 TMS320C6678 BOOTLOADER 多核程序加载 EMIF16
在线阅读 下载PDF
基于硬件签名的循环式内存竞争记录算法 被引量:2
7
作者 朱素霞 季振洲 +1 位作者 李东 张浩 《计算机研究与发展》 EI CSCD 北大核心 2014年第5期1149-1157,共9页
多核程序的执行存在不确定性,内存竞争记录是实现多核程序确定性重演的关键技术.针对现有内存竞争记录机制记录日志较大、重演速度受限等问题,提出了一种新型的循环式点到点内存竞争记录算法.该算法用当前发生序表示内存冲突,用硬件签... 多核程序的执行存在不确定性,内存竞争记录是实现多核程序确定性重演的关键技术.针对现有内存竞争记录机制记录日志较大、重演速度受限等问题,提出了一种新型的循环式点到点内存竞争记录算法.该算法用当前发生序表示内存冲突,用硬件签名实现冲突检测,无需修改原有的cache结构;引入冲突方向检测机制,约减连续同向的当前发生序,记录循环发生序到内存竞争日志.该算法中,内存竞争日志中所记录的任意两线程间的内存竞争呈循环状,大大减少了冗余,并用增量计数器优化循环发生序,更大程度上减小了内存竞争日志.仿真结果表明该算法能够在引入较少硬件资源的前提下有效地减小内存竞争日志.同时,内存竞争日志也具有较好的可扩展性. 展开更多
关键词 片上多核处理器 多核程序 确定性重演 内存竞争记录 冲突检测 硬件签名
在线阅读 下载PDF
面向监听一致性协议的并发内存竞争记录算法
8
作者 朱素霞 陈德运 +2 位作者 季振洲 孙广路 张浩 《计算机研究与发展》 EI CSCD 北大核心 2016年第6期1238-1248,共11页
内存竞争记录是解决多核程序执行不确定性的关键技术,然而现有点到点的内存竞争记录机制带来的硬件开销大,难以应用到实际的片上多核处理器系统中.以降低点到点内存竞争记录方式的硬件开销为出发点,为采用监听一致性协议的片上多核处理... 内存竞争记录是解决多核程序执行不确定性的关键技术,然而现有点到点的内存竞争记录机制带来的硬件开销大,难以应用到实际的片上多核处理器系统中.以降低点到点内存竞争记录方式的硬件开销为出发点,为采用监听一致性协议的片上多核处理器(chip multiprocessor,CMP)系统设计了基于并发记录策略的点到点内存竞争记录算法.该记录算法将两两线程间点到点的内存竞争关系扩展到所有线程,采用分布式记录方法为每个线程记录一个由内存竞争关系的一方构成的内存竞争日志;重演时采用简化的生产者消费者模型,确保了确定性重演的实现,有效降低了硬件消耗和带宽开销.在8核处理器系统中的仿真结果表明,该并发式点到点内存竞争记录算法为每个处理器核添加硬件资源约171B,每千条内存操作指令记录日志大小约2.3B,记录和重演阶段均添加不到1.5%的带宽开销. 展开更多
关键词 片上多核处理器 多核程序 确定性重演 内存竞争记录 内存冲突检测 监听一致性协议
在线阅读 下载PDF
Multi-core optimization for conjugate gradient benchmark on heterogeneous processors
9
作者 邓林 窦勇 《Journal of Central South University》 SCIE EI CAS 2011年第2期490-498,共9页
Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at t... Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at this problem,a parallelization approach was proposed with six memory optimization schemes for CG,four schemes of them aiming at all kinds of sparse matrix-vector multiplication (SPMV) operation. Conducted on IBM QS20,the parallelization approach can reach up to 21 and 133 times speedups with size A and B,respectively,compared with single power processor element. Finally,the conclusion is drawn that the peak bandwidth of memory access on Cell BE can be obtained in SPMV,simple computation is more efficient on heterogeneous processors and loop-unrolling can hide local storage access latency while executing scalar operation on SIMD cores. 展开更多
关键词 multi-core processor NAS parallelization CG memory optimization
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部