期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于数据分布一致性的处理器硬件性能计数器复用估计方法 被引量:6
1
作者 林新华 王杰 +1 位作者 王一超 左思成 《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1192-1201,共10页
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,M... 同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%. 展开更多
关键词 处理器硬件性能计数器 复用技术 性能分析 性能计算 估计方法
在线阅读 下载PDF
基于硬件性能计数器的勒索软件检测技术研究与实现
2
作者 赵文宇 党晨曦 +1 位作者 杜振华 张健 《信息网络安全》 北大核心 2025年第9期1397-1406,共10页
针对当前勒索软件广泛采用代码混淆、动态加解密及进程拆分等对抗性技术以规避检测并隐藏自身特征,导致传统基于软件行为分析的方法难以有效识别此类复杂恶意样本、检测性能显著下降的问题,文章提出一种基于硬件性能计数器HPCs与Transfo... 针对当前勒索软件广泛采用代码混淆、动态加解密及进程拆分等对抗性技术以规避检测并隐藏自身特征,导致传统基于软件行为分析的方法难以有效识别此类复杂恶意样本、检测性能显著下降的问题,文章提出一种基于硬件性能计数器HPCs与Transformer架构的勒索软件检测方法。该方法首先在KVM虚拟化环境中采集样本运行过程中的HPCs时序数据,提取其微架构层面的运行特征;然后,利用多头注意力机制对HPCs序列进行分层建模,并结合位置嵌入机制增强时序依赖建模能力,有效克服传统方法在动态行为分析中的局限性。实验采集9900个勒索软件样本与9900个良性软件样本,经过特征筛选,最终选取5个与勒索行为高度相关的HPCs事件作为输入。实验结果表明,该方法在500 ms时间窗口内的检测准确率达到99.36%,为勒索软件的高效识别与防御提供了有力支持。 展开更多
关键词 硬件性能计数器 Transformer架构 勒索软件检测 时序特征提取
在线阅读 下载PDF
一种基于硬件计数器的虚拟机性能干扰估算方法 被引量:7
3
作者 王卅 张文博 +4 位作者 吴恒 宋云奎 魏峻 钟华 黄涛 《软件学报》 EI CSCD 北大核心 2015年第8期2074-2090,共17页
虚拟化技术已成为云计算平台中的关键性支撑技术.它极大地提高了数据中心的资源利用率,降低了管理成本和能源消耗,但同时也为数据中心带来了新的问题——性能干扰.同一平台上的多虚拟机过度竞争某一底层硬件资源(如CPU,Cache等),会造成... 虚拟化技术已成为云计算平台中的关键性支撑技术.它极大地提高了数据中心的资源利用率,降低了管理成本和能源消耗,但同时也为数据中心带来了新的问题——性能干扰.同一平台上的多虚拟机过度竞争某一底层硬件资源(如CPU,Cache等),会造成虚拟机性能严重下降;而出于安全性和可移植性的考虑,底层平台管理者需要尽量避免侵入式监测上层虚拟机,因而,如何透明而有效地从底层估算虚拟机性能干扰,成为虚拟化平台管理者必须面临的一个挑战.为应对以上挑战,提出了一种基于硬件计数器的虚拟机性能干扰估算方法.硬件计数器是程序运行期间产生的硬件事件信息(如CPU时间片、缓存失效次数等),已有工作主要利用大规模分布式系统任务相似性查找产生异常硬件计数器数据的节点,而没有探究硬件事件变化与性能干扰之间的直接关系.通过实验研究发现,硬件计数器(last level cache misses rates,简称LLC misses rates)与不同资源需求的应用性能干扰存在不同的关联关系;以此建立虚拟机性能干扰估算模型,估算虚拟机性能.实验结果表明:该方法可以有效地预测CPU密集型应用和网络密集型应用的性能干扰大小,并仅为系统带来小于10%的开销. 展开更多
关键词 云计算 虚拟化 性能干扰 硬件计数器 性能建模
在线阅读 下载PDF
性能不对称多核处理器负载均衡调度研究 被引量:3
4
作者 徐远超 谭旭 +2 位作者 范灵俊 孙卫真 张志敏 《计算机工程与科学》 CSCD 北大核心 2013年第11期80-86,共7页
同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载... 同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载均衡优先原则,无需定义阈值区分程序类别。测试结果表明,该算法既能做到负载均衡,又能实现异构感知。 展开更多
关键词 调度 异构多核处理器 负载均衡 程序行为分析 硬件性能计数器
在线阅读 下载PDF
一个基于硬件计数器的程序性能测试与分析工具 被引量:3
5
作者 车永刚 王正华 李晓梅 《计算机科学》 CSCD 北大核心 2004年第1期170-174,共5页
在IntelP6系列处理器与Microsoft Windows NT平台上开发了一个工具软件PTracker,它利用处理器中的硬件性能计数器来获取程序性能数据,并结合机器体系结构参数对数据进行分析。它无需用户编程,与应用程序所使用的编程语言无关,使用很方... 在IntelP6系列处理器与Microsoft Windows NT平台上开发了一个工具软件PTracker,它利用处理器中的硬件性能计数器来获取程序性能数据,并结合机器体系结构参数对数据进行分析。它无需用户编程,与应用程序所使用的编程语言无关,使用很方便。它不仅能够通过性能计数器获得精确的性能参数,而且还能通过对测试得到的性能数据的分析,揭示程序高层次的性能特征,对程序性能评价与优化具有一定的指导作用。本文介绍了PTracker的技术背景、设计与系统实现,并给出了一个应用实例。 展开更多
关键词 硬件计数器 处理器 程序性能 性能测试 数据分析
在线阅读 下载PDF
基于硬件性能计数器的软件性能数据采集与分析研究 被引量:3
6
作者 程克非 张聪 +1 位作者 汪林林 张勤 《计算机应用》 CSCD 北大核心 2005年第10期2431-2433,共3页
引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非... 引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非常有效的分析数据,同时也在一定程度上对编译器的性能优化给出了相关参考数据。 展开更多
关键词 数据采集 硬件性能计数器 性能分析
在线阅读 下载PDF
ROPDetector:一种基于硬件性能计数器的ROP攻击实时检测方法 被引量:7
7
作者 牛伟纳 赵成洋 +3 位作者 张小松 黄晓祥 蒋廉 张钶旋 《计算机学报》 EI CAS CSCD 北大核心 2021年第4期761-772,共12页
面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器... 面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器支持)和二进制重写的情况下,利用现代CPU中的硬件性能计数器监控目标程序执行过程,提取ROP攻击发生时底层硬件事件特征来实时检测ROP攻击.然后,在32位Linux实验环境下实现了原型系统ROPDetector,使用真实的ROP攻击与漏洞进行实验,并与同类方法进行了对比实验,最后评估了系统的性能消耗.实验结果表明,该方法能有效地检测真实的ROP攻击,在分别以6次和9次错误预测返回指令为检测周期时,系统性能消耗仅有5.05%和5.25%,磁盘I/O性能消耗仅有0.94%和2%,网络I/O性能消耗仅有0.06%和0.78%. 展开更多
关键词 面向返回编程 硬件事件 实时检测 硬件性能计数器 错误预测返回指令
在线阅读 下载PDF
乱序超标量处理器核的性能分析与优化 被引量:2
8
作者 孙彩霞 隋兵才 +4 位作者 王蕾 王永文 黄立波 李文哲 王俊辉 《国防科技大学学报》 EI CAS CSCD 北大核心 2016年第5期14-19,共6页
随着处理器微体系结构日益复杂,性能分析在处理器研制过程中的作用越来越重要。常用的性能分析方法是建立性能模型,该方法主要用于研制初期的设计空间探索,如果用于微体系结构级的分析和优化,速度和精度都会成为限制因素。因此,提出一... 随着处理器微体系结构日益复杂,性能分析在处理器研制过程中的作用越来越重要。常用的性能分析方法是建立性能模型,该方法主要用于研制初期的设计空间探索,如果用于微体系结构级的分析和优化,速度和精度都会成为限制因素。因此,提出一种基于计数器的性能分析方法,该方法以项目组已经完成的一款处理器核的硬件实现代码为基础,在处理器核外部添加一个专用性能监测单元,收集微体系结构分析和优化需要的各种事件,并通过结果分析器对统计的事件进行分析,得到微体系结构实现的性能受限因素。采用此方法,在现场可编程门阵列原型系统上对SPEC CPU2000测试程序运行时的性能受限因素进行分析,并根据分析结果采取相应的优化措施,优化后的处理器核性能得到了明显提升。 展开更多
关键词 性能分析 计数器 处理器 微体系结构
在线阅读 下载PDF
基于图形处理器(GPU)的通用计算 被引量:228
9
作者 吴恩华 柳有权 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第5期601-612,共12页
伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年... 伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年来 ,随着图形处理器 (GPU)性能的大幅度提高以及可编程特性的发展 ,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移 除了计算机图形学本身的应用 ,涉及到其他领域的计算 ,以至于通用计算近 2~ 3年来成为GPU的应用之一 ,并成为研究热点 文中从若干图形硬件发展的历史开始 ,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况 。 展开更多
关键词 图形处理器 通用计算 GPU 图形硬件 可编程性 代数运算 性能分析
在线阅读 下载PDF
通用图形处理器功耗估算模型 被引量:2
10
作者 王吉军 程华 《计算机工程》 CAS CSCD 北大核心 2017年第2期92-97,104,共7页
为精准快速地获得GPU功耗数据,提出一种基于硬件性能计数事件的通用图形处理器(GPGPU)功耗估算方法。通过分析GPGPU程序运行时的功耗分布情况,选择一组与应用程序运行功耗密切相关的硬件性能计数事件集合,使用反向传播人工神经网络分析... 为精准快速地获得GPU功耗数据,提出一种基于硬件性能计数事件的通用图形处理器(GPGPU)功耗估算方法。通过分析GPGPU程序运行时的功耗分布情况,选择一组与应用程序运行功耗密切相关的硬件性能计数事件集合,使用反向传播人工神经网络分析硬件性能计数事件与实时功耗间的关系,最终建立GPGPU功耗估算模型。实验结果表明,与多元线性回归的功耗估算模型相比,该模型具有更高的估算准确性和通用性。 展开更多
关键词 通用图形处理器 硬件性能计数事件 反向传播人工神经网络 交叉验证 功耗估算
在线阅读 下载PDF
基于MIPS处理器的外围接口应用实验设计 被引量:1
11
作者 傅翠娇 曹庆华 《实验技术与管理》 CAS 北大核心 2013年第10期108-113,共6页
该实验设计集中了计算机组成原理、接口技术等在内的多种硬件知识,对学生理解和掌握计算机硬件基础知识并建立计算机整机概念非常有帮助。介绍了MIPS处理器、可编程并行接口芯片8255和定时器/计数器接口芯片8253的工作原理,介绍了实验... 该实验设计集中了计算机组成原理、接口技术等在内的多种硬件知识,对学生理解和掌握计算机硬件基础知识并建立计算机整机概念非常有帮助。介绍了MIPS处理器、可编程并行接口芯片8255和定时器/计数器接口芯片8253的工作原理,介绍了实验设计的基本思路,介绍了使用Verilog硬件描述语言设计该实验的详细过程,同时给出了该实验在QuartusⅡ7.2软件环境下的仿真波形,并在Altera公司的FPGA芯片EP2C35F672C6和DE2教学开发板上进行了下载验证。实践证明:该设计能够稳定、可靠的工作。 展开更多
关键词 实验设计 MIPS处理器 可编程并行接口8255A 定时器 计数器8253 VERILOG硬件描述语言
在线阅读 下载PDF
面向多核处理器系统的Cache感知调度算法
12
作者 徐远超 沈岩 +2 位作者 谭旭 万虎 张志敏 《小型微型计算机系统》 CSCD 北大核心 2013年第2期365-369,共5页
Cache空间的不公平使用和争用直接影响系统的整体性能,现有Linux操作系统的默认调度算法不能感知程序的行为,包括访问cache的失效次数,不了解线程之间访存模式和频度上可能存在的差异,因而无法做出更加合理的调度.本文提出并在Linux环... Cache空间的不公平使用和争用直接影响系统的整体性能,现有Linux操作系统的默认调度算法不能感知程序的行为,包括访问cache的失效次数,不了解线程之间访存模式和频度上可能存在的差异,因而无法做出更加合理的调度.本文提出并在Linux环境下实现了一种Cache感知的调度算法CAS,通过监测每个任务每千条指令的共享cache失效次数,把cache失效次数相近的任务聚合到同一个核上,使得cache失效次数差异较大的任务运行在不同的核上,避免了cache失效次数都很大的任务在不同的核上同时运行,从而减小了cache空间的不公平使用和争用.实验表明,CAS算法在大多数情况下,减少了整个负载的共享cache失效次数,提高系统的平均吞吐量约5%左右. 展开更多
关键词 任务调度 多核处理器 Cache感知 硬件性能计数器
在线阅读 下载PDF
利用深度学习的硬件计数器复用估计算法 被引量:1
13
作者 王一超 王鎏振 林新华 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第5期114-123,共10页
利用深度学习方法,为硬件计数器复用(multiplexing,MPX)提供结果精度更高的估计模型。通过对MPX估计得到的结果与实际采集的真实数据进行相似性分析,证明相同程序多次运行之间得到的硬件计数值是线性相关的。采用神经网络多层感知器(mul... 利用深度学习方法,为硬件计数器复用(multiplexing,MPX)提供结果精度更高的估计模型。通过对MPX估计得到的结果与实际采集的真实数据进行相似性分析,证明相同程序多次运行之间得到的硬件计数值是线性相关的。采用神经网络多层感知器(multilayer perceptron,MLP)和双向门控神经网络(bidirectional gated recurrent unit,Bi-GRU)这2种深度学习模型,对MPX数据进行拟合。基于动态时间规整(dynamic time warping,DTW),提出一个全新的评估MPX数据精度的指标DTW-cost。实验结果表明,同时收集15个硬件事件数据时,MLP方法拟合得到的13个高性能计算应用平均准确率比现有使用最广的固定插值法高出10.53%,最多可提升19.8%;而在MLP表现较差的事件上,Bi-GRU方法得到的平均准确率提升了28.8%。 展开更多
关键词 硬件计数器 硬件性能事件 复用技术 深度学习
在线阅读 下载PDF
基于采样的并行程序性能测量分析工具研究
14
作者 胡家瑞 石京燕 郭超奇 《计算机工程与应用》 CSCD 北大核心 2024年第21期286-296,共11页
在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行... 在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行程序性能分析工具有助于解决上述问题。相比于插桩技术,基于异步采样的性能工具可以更好地控制测量开销和测量数据大小。着重研究了三种典型的基于采样的性能分析工具:VTune Profiler、HPCToolkit和Nsight Systems,分析了其原理和功能,并且结合VASP等实际应用程序对工具的软硬件分析能力和并行编程分析能力进行了详细的探究和对比。根据这些工具在不同的应用场景下表现出的不同适用性和分析效果,提出了综合运用多种工具进行性能分析的方案,为开发者和程序员提供有益的参考。 展开更多
关键词 性能分析工具 异步采样 硬件性能计数器 并行程序 程序调优
在线阅读 下载PDF
OpenMP并行程序的性能数据采集 被引量:1
15
作者 富弘毅 周海芳 杨学军 《计算机工程》 EI CAS CSCD 北大核心 2005年第19期67-69,78,共4页
目前,随着大规模并行计算的高速发展,并行程序性能分析与建模的地位日益重要,而并行程序性能数据的采集是进行性能分析的基础。硬件计数器的使用使人们能够更加便利地在程序执行过程中采集性能数据。文章讨论了OpenMP并行程序的性能数... 目前,随着大规模并行计算的高速发展,并行程序性能分析与建模的地位日益重要,而并行程序性能数据的采集是进行性能分析的基础。硬件计数器的使用使人们能够更加便利地在程序执行过程中采集性能数据。文章讨论了OpenMP并行程序的性能数据采集技术,并介绍一种利用PAPI进行数据采集的实现方法。 展开更多
关键词 性能数据 硬件计数器 并行程序
在线阅读 下载PDF
基于动态指令编译的软件性能分析方法
16
作者 程克非 张聪 +1 位作者 张勤 汪林林 《计算机科学》 CSCD 北大核心 2006年第4期292-294,F0003,共4页
进行精确的软件性能分析,需要在代码中插入测量和控制代码,并根据具体运行状态动态的检查多个不同的参数。但是,用静态类型的程序语言,如 C 语言等书写的代码,一经编译和链接,其处理逻辑即不可更改。因此,在无法获取源代码或者重新编译... 进行精确的软件性能分析,需要在代码中插入测量和控制代码,并根据具体运行状态动态的检查多个不同的参数。但是,用静态类型的程序语言,如 C 语言等书写的代码,一经编译和链接,其处理逻辑即不可更改。因此,在无法获取源代码或者重新编译和重新启动代价较高的应用中,对软件进行动态性能分析非常困难。本文将介绍一种在软件运行时刻动态插入监控点的动态指令编译技术对软件进行监控,从而在上述情况下达到对软件的监控目的。这种方法是基于 DynInst API 和 PAPI 技术的。实验表明,这种方法在去掉了对源代码的依赖的情况下,仍然与在源代码级插入监控点的方法具有同等的采集效率,在很大程度上增强了基于硬件性能计数器方法的软件监控技术的应用范围,达到了较好的性能分析效果。 展开更多
关键词 动态指令编译 性能分析 Dyninst API PAPI 硬件性能计数器
在线阅读 下载PDF
智能网卡驱动程序的性能评价 被引量:4
17
作者 刘勇 杨卫兵 +1 位作者 陈曜 孙凝晖 《计算机工程》 EI CAS CSCD 北大核心 2005年第14期42-44,47,共4页
通信网络对机群系统的性能影响很大,建立高效的通信网络依赖快速网络硬件支持。智能网卡用于机群的快速接入,提高了Internet应用的性能,其中驱动程序是发挥智能网卡能力的关键,因而对驱动程序的性能评价很有必要。性能评价利用智能网卡... 通信网络对机群系统的性能影响很大,建立高效的通信网络依赖快速网络硬件支持。智能网卡用于机群的快速接入,提高了Internet应用的性能,其中驱动程序是发挥智能网卡能力的关键,因而对驱动程序的性能评价很有必要。性能评价利用智能网卡提供的硬件性能计数器,采用性能测试法对智能网卡驱动程序进行性能分析。结果表明智能网卡驱动程序的性能瓶颈在于驱动程序较大的数据相关性。 展开更多
关键词 智能网卡 性能评价 硬件性能计数器
在线阅读 下载PDF
Pview:一种基于PMU的支持并行程序性能分析的新方法 被引量:4
18
作者 闫洁 徐恒阳 +2 位作者 安虹 刘玉 王耀彬 《计算机科学》 CSCD 北大核心 2011年第2期288-292,共5页
近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对... 近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对目标程序的干扰的情况下对程序进行性能监测成为可能。Pview(Performance View)是一种在系统级支持对并行程序尤其是多线程程序进行性能监测与分析的工具,它同时支持全系统和针对特定进程(线程组)的性能事件直接计数或者抽样的分析方法。Pview在Linux操作系统平台上通过扩展内核2.6.30,实现了一个新的系统调用Pview来提供性能监测服务;同时与以模块方式实现的数据收集引擎协作,可以实现抽样并将大规模样本数据传输到用户空间供进一步分析。 展开更多
关键词 硬件性能计数器 性能监测 多线程程序分析
在线阅读 下载PDF
面向流处理结构的Barrier同步实现 被引量:1
19
作者 黄万荣 唐玉华 易晓东 《计算机研究与发展》 EI CSCD 北大核心 2014年第S1期245-250,共6页
Barrier同步操作是能够直接影响处理器性能的一类操作.针对流处理器体系结构,提出并实现了2种软件同步机制和1种硬件同步机制,即基于互斥计数器的Barrier同步、基于共享状态寄存器的Lock-free Barrier同步和基于专用硬件管理单元的Barr... Barrier同步操作是能够直接影响处理器性能的一类操作.针对流处理器体系结构,提出并实现了2种软件同步机制和1种硬件同步机制,即基于互斥计数器的Barrier同步、基于共享状态寄存器的Lock-free Barrier同步和基于专用硬件管理单元的Barrier同步;在一款流处理器原型系统中测试并分析了在不同负载规模、不同负载分布、典型应用情况下3种同步机制的性能.结果表明,基于专用硬件管理单元的Barrier同步机制性能更优. 展开更多
关键词 Barrier同步 处理器 软件方法 硬件机制 性能评估
在线阅读 下载PDF
TMS 32020快速图象处理微机系统
20
作者 李秋平 景中起 《电信科学》 1988年第12期21-26,共6页
本文描述了一个基于TMS 32020的快速微机图象处理系统。该系统由硬件系统和软件系统组成。TMS 32020快速微机图象处理系统是由一台PC-XT微机,一块TMS 32020高速数字信号处理模板和一块PC-VISION帧存储板构成的多处理器系统。其中PC机是... 本文描述了一个基于TMS 32020的快速微机图象处理系统。该系统由硬件系统和软件系统组成。TMS 32020快速微机图象处理系统是由一台PC-XT微机,一块TMS 32020高速数字信号处理模板和一块PC-VISION帧存储板构成的多处理器系统。其中PC机是主机,TMS 32020为从机。在此硬件环境支持下,我们还开发了相应的软件系统——快速图象处理通用软件包。借助于TMS 32020的高速处理性能,加上合理设计的硬件、软件系统,使本系统的处理速度比一般微机图象系统速度提高10~1000倍,达到可以与目前国内已引进的大型专用图象处理系统VAX11/750+Model 75相比拟的处理速度。而加上该处理板后的微机图象系统的价格仅为上述引进系统的1/20。 展开更多
关键词 图象处理 TMS 32020 软件系统 处理器系统 存储板 微机系统 处理 处理性能 硬件系统 直方图均衡
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部