期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
确定性多线程编程模型的可编程性及其实现性能的探索 被引量:2
1
作者 曹慧芳 张昱 《小型微型计算机系统》 CSCD 北大核心 2016年第6期1126-1131,共6页
传统的多线程程序存在许多不确定性,导致编程困难,易出错.确定性并行编程模型是保证并行程序确定执行的有效途径之一.针对所提出的确定性消息传递多线程编程模型Det MP及它在确定性生产-消费虚拟内存模型SPMC上的实现,本文探索Det MP的... 传统的多线程程序存在许多不确定性,导致编程困难,易出错.确定性并行编程模型是保证并行程序确定执行的有效途径之一.针对所提出的确定性消息传递多线程编程模型Det MP及它在确定性生产-消费虚拟内存模型SPMC上的实现,本文探索Det MP的可编程性和实现机制对性能的影响.包括:总结了用Det MP改写现有Pthreads多线程程序的方法,并在32核计算机上用7个MapReduce应用程序和1个流水线并行程序dedup对比改写前后的性能.实验表明用Det MP改写后的程序在多数情况下比原来的Pthreads程序有好的性能.为了分析这种性能差异是否因使用了SPMC虚拟内存模型而引起,本文进一步基于传统Pthreads共享内存来实现Det MP应用编程接口,并用所改写的应用程序集评测它们在Det MP的两种实现上运行的性能.实验表明,当CPU核数为16和32时,基于SPMC的Det MP实现在除Matrix Multiply和String Match外的6个程序上有更好的性能,最高甚至比基于Pthreads的实现快9.5倍;而在Matrix Multiply和String Match上或者核数低于16时,两种实现的性能相当. 展开更多
关键词 确定性多线程编程模型 虚拟内存模型 性能 可扩展性
在线阅读 下载PDF
支持动态可重构的软/硬件统一多线程编程模型 被引量:3
2
作者 王颖 周学功 +1 位作者 游红俊 彭澄廉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第6期736-745,共10页
针对可重构系统中的数据流驱动应用,提出支持动态可重构的软/硬件统一多线程编程模型SHUMDR及其层次化实现.通过硬件线程接口设计、操作系统内核扩展,便于设计人员以统一的线程视图描述应用的软硬件划分.以数据加密/解密为例进行测试的... 针对可重构系统中的数据流驱动应用,提出支持动态可重构的软/硬件统一多线程编程模型SHUMDR及其层次化实现.通过硬件线程接口设计、操作系统内核扩展,便于设计人员以统一的线程视图描述应用的软硬件划分.以数据加密/解密为例进行测试的结果表明,统一线程抽象带来的时间开销和空间资源占用率较小,该模型在探索编程灵活性的同时,能够有效地兼顾硬件的效率. 展开更多
关键词 动态部分可重构 软/硬件统一多线程编程模型 硬件线程接口 线程
在线阅读 下载PDF
某电站大型地下洞室群主变洞确定性块体稳定性评价 被引量:13
3
作者 崔银祥 聂德新 陈强 《工程地质学报》 CSCD 2005年第2期212-217,共6页
以黄河上游某大型电站地下洞室群主变洞为例,通过在AutoCAD软件中建立洞室与结构面的三维实体模型,借助自编程序切割,展示这些结构面在主变洞边墙及拱顶的出露情况,在此基础上检索出组合块体21个,最后对这21个块体进行了确定性块体稳定... 以黄河上游某大型电站地下洞室群主变洞为例,通过在AutoCAD软件中建立洞室与结构面的三维实体模型,借助自编程序切割,展示这些结构面在主变洞边墙及拱顶的出露情况,在此基础上检索出组合块体21个,最后对这21个块体进行了确定性块体稳定性评价,给出其在主变洞上下游边墙及拱顶的块体组合情况、滑动方式、出露桩号和高度、出露面积、分布深度、体积、稳定性系数等。 展开更多
关键词 定性评价 地下洞室群 确定性 块体 主变 AutoCAD软件 三维实体模型 定性系数 大型电站 黄河上游 编程 结构面 拱顶 边墙 组合 滑动
在线阅读 下载PDF
libpcap-MT:一种多线程的通用数据包捕获库 被引量:8
4
作者 温曙光 谢高岗 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期756-764,共9页
libpcap数据包捕获函数库提供数据包捕获、过滤等上层API,目前广泛被网络协议分析、入侵检测等数据包处理系统使用.多核、多CPU通用计算平台为数据包的高速处理提供可能,但libpcap提供的单线程机制难以充分利用多核、多CPU平台的并行计... libpcap数据包捕获函数库提供数据包捕获、过滤等上层API,目前广泛被网络协议分析、入侵检测等数据包处理系统使用.多核、多CPU通用计算平台为数据包的高速处理提供可能,但libpcap提供的单线程机制难以充分利用多核、多CPU平台的并行计算能力.设计并实现了一种支持多线程的libpcap:libpcap-MT.libpcap-MT在内核态进行高效的数据包分发,采用无锁的多缓存队列允许多线程同时读取数据包,提供灵活的数据包分发策略,接口与libpcap保持兼容.实验结果表明,使用libpcap-MT能够快速地将现有的系统多线程化,并且具有更好的性能和可扩展性. 展开更多
关键词 数据包捕获 多线程程序模型 多核 并行优化 应用编程接口
在线阅读 下载PDF
基于硬件多线程网络处理器功耗可控无线局域网MAC协议实现
5
作者 王磊 张晓彤 +1 位作者 张艳丽 王沁 《计算机应用研究》 CSCD 北大核心 2012年第7期2624-2628,共5页
针对在如何在提高网络吞吐率并满足实时性需求的同时消耗更少的功耗的问题,以硬件多线程网络处理为平台,以IEEE 802.11MAC层协议为例,通过对MAC层数据流的模式、数据流上的操作行为以及时间约束进行建模并测试分析,提出一种多线程化网... 针对在如何在提高网络吞吐率并满足实时性需求的同时消耗更少的功耗的问题,以硬件多线程网络处理为平台,以IEEE 802.11MAC层协议为例,通过对MAC层数据流的模式、数据流上的操作行为以及时间约束进行建模并测试分析,提出一种多线程化网络协议的软件实现方法;配合动态功耗可控的多线程网络处理器能够根据流量和实时性自适应地调整系统的性能。实验结果证明,异构多线程结构程序在实时性任务时五个软件线程需四个硬件线程支持,而无实时性任务只需两个硬件线程支持。提出的多线程MAC层协议编程模型能够达到根据网络负载特征动态控制处理器性能的目的。 展开更多
关键词 无线局域网 编程模型 实时性 低功耗 多线程
在线阅读 下载PDF
FlexTSN:一种灵活的TSN交换实现模型
6
作者 杨翔瑞 严锦立 +4 位作者 陈波 彭锦涛 李军帅 全巍 孙志刚 《计算机研究与发展》 EI CSCD 北大核心 2021年第1期153-163,共11页
时间敏感网络(time-sensitive networking,TSN)的核心是为标准以太网赋予关键流量的确定性转发服务,同时能够实现混合优先级业务流量的一体化传输,从而成为业界和学术界备受关注的新兴技术.相比于标准以太网交换,TSN交换通过引入高精度... 时间敏感网络(time-sensitive networking,TSN)的核心是为标准以太网赋予关键流量的确定性转发服务,同时能够实现混合优先级业务流量的一体化传输,从而成为业界和学术界备受关注的新兴技术.相比于标准以太网交换,TSN交换通过引入高精度的时间同步特性提供门控机制和时间感知的分组调度等服务,使得以太网有能力提供确定性延迟的转发服务.目前,IEEE 802.1 TSN工作组从时间同步、流管理、流控制以及可靠性等方面对TSN的设计实现提供较为完善的标准.而现有的工作难以加快TSN技术的实现和应用,其难点在于目前缺少一种面向TSN的通用交换实现模型进行快速的原型系统搭建和关键技术的验证.为此提出一种灵活的TSN交换的实现模型FlexTSN.FlexTSN基于模块化与功能松耦合的思想,将TSN交换节点解耦为通用处理模块和时间感知模块,支持TSN交换机的快速重构.此外,FlexTSN通过扩展PTP同步协议提供一种轻量级高可靠的网络管理机制用于进行细粒度集中式的状态收集和配置.然后基于该模型在可编程的FPGA平台上实现了一种支持简化的循环队列转发模型(cyclical queuing and forwarding,CQF)的TSN原型系统.通过从资源开销和服务质量等方面进行测试评估,实验结果证明FlexTSN能够实现敏捷的原型系统组网及TSN关键技术的快速验证. 展开更多
关键词 现场可编程逻辑门阵列 时间敏感网络 模型与实现 确定性转发 同步
在线阅读 下载PDF
一种基于线网划分的并行FPGA布线算法 被引量:1
7
作者 朱春 来金梅 《计算机工程》 CAS CSCD 2014年第3期287-293,共7页
针对在现场可编程门阵列(FPGA)软件系统中大规模电路设计布线时间较长的问题,提出一种基于线网引脚位置划分且具有平台独立性的多线程FPGA布线算法。对高扇出线网采用将单根线网拆分成子线网并同时布线的方法,对低扇出线网采用选择若干... 针对在现场可编程门阵列(FPGA)软件系统中大规模电路设计布线时间较长的问题,提出一种基于线网引脚位置划分且具有平台独立性的多线程FPGA布线算法。对高扇出线网采用将单根线网拆分成子线网并同时布线的方法,对低扇出线网采用选择若干位置不相交叠的线网进行同时布线的方法,给出线网边界框图的数据结构来缩短选择若干低扇出线网的时间,采取负载平衡机制和同步措施,分别提高布线效率和保证布线结果的确定性。实验结果证明,在Intel 4核处理器平台上,与单线程VPR算法相比,该并行算法的平均布线效率提高了90%,平均布线质量下降不超过2.3%,并能够得到确定的布线结果,在EDA方面具有重要的理论与实用价值。 展开更多
关键词 现场可编程门阵列 多线程 布线 高扇出线网 低扇出线网 边界框图 确定性
在线阅读 下载PDF
并发多播队列的实现框架及其多种实现的性能分析
8
作者 张其良 张昱 《小型微型计算机系统》 CSCD 北大核心 2017年第6期1237-1242,共6页
开发易用且高效的并发数据结构对降低并行编程的难度和有效利用并行资源非常重要.针对所提出的易于编程的确定性消息传递多线程编程模型DetMP,除可以基于所提出的单生产多播共享虚拟内存模型(SPMC)实现以外,还可以基于传统的多线程共享... 开发易用且高效的并发数据结构对降低并行编程的难度和有效利用并行资源非常重要.针对所提出的易于编程的确定性消息传递多线程编程模型DetMP,除可以基于所提出的单生产多播共享虚拟内存模型(SPMC)实现以外,还可以基于传统的多线程共享虚拟内存模型来实现.为了分析消息通道的实现机制(如数据的存储组织、并发访问的同步控制)对DetMP程序性能的影响,提出一个并发多播队列的框架CMQue,并基于Pthreads实现了6种并发多播队列.我们评估了6种并发多播队列和SPMC通道,结果表明消息通道的实现机制对程序性能影响很大,SPMC通道在CPU核资源充足时具有很好的可伸缩性. 展开更多
关键词 多播队列 并发数据结构 同步控制 多线程编程模型 生产-消费
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部