期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于硬件性能计数器的软件性能数据采集与分析研究 被引量:3
1
作者 程克非 张聪 +1 位作者 汪林林 张勤 《计算机应用》 CSCD 北大核心 2005年第10期2431-2433,共3页
引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非... 引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非常有效的分析数据,同时也在一定程度上对编译器的性能优化给出了相关参考数据。 展开更多
关键词 数据采集 硬件性能计数器 性能分析
在线阅读 下载PDF
ROPDetector:一种基于硬件性能计数器的ROP攻击实时检测方法 被引量:6
2
作者 牛伟纳 赵成洋 +3 位作者 张小松 黄晓祥 蒋廉 张钶旋 《计算机学报》 EI CAS CSCD 北大核心 2021年第4期761-772,共12页
面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器... 面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器支持)和二进制重写的情况下,利用现代CPU中的硬件性能计数器监控目标程序执行过程,提取ROP攻击发生时底层硬件事件特征来实时检测ROP攻击.然后,在32位Linux实验环境下实现了原型系统ROPDetector,使用真实的ROP攻击与漏洞进行实验,并与同类方法进行了对比实验,最后评估了系统的性能消耗.实验结果表明,该方法能有效地检测真实的ROP攻击,在分别以6次和9次错误预测返回指令为检测周期时,系统性能消耗仅有5.05%和5.25%,磁盘I/O性能消耗仅有0.94%和2%,网络I/O性能消耗仅有0.06%和0.78%. 展开更多
关键词 面向返回编程 硬件事件 实时检测 硬件性能计数器 错误预测返回指令
在线阅读 下载PDF
基于数据分布一致性的处理器硬件性能计数器复用估计方法 被引量:4
3
作者 林新华 王杰 +1 位作者 王一超 左思成 《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1192-1201,共10页
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,M... 同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%. 展开更多
关键词 处理器硬件性能计数器 复用技术 性能分析 性能计算 估计方法
在线阅读 下载PDF
基于硬件性能计数器的勒索软件检测技术研究与实现
4
作者 赵文宇 党晨曦 +1 位作者 杜振华 张健 《信息网络安全》 2025年第9期1397-1406,共10页
针对当前勒索软件广泛采用代码混淆、动态加解密及进程拆分等对抗性技术以规避检测并隐藏自身特征,导致传统基于软件行为分析的方法难以有效识别此类复杂恶意样本、检测性能显著下降的问题,文章提出一种基于硬件性能计数器HPCs与Transfo... 针对当前勒索软件广泛采用代码混淆、动态加解密及进程拆分等对抗性技术以规避检测并隐藏自身特征,导致传统基于软件行为分析的方法难以有效识别此类复杂恶意样本、检测性能显著下降的问题,文章提出一种基于硬件性能计数器HPCs与Transformer架构的勒索软件检测方法。该方法首先在KVM虚拟化环境中采集样本运行过程中的HPCs时序数据,提取其微架构层面的运行特征;然后,利用多头注意力机制对HPCs序列进行分层建模,并结合位置嵌入机制增强时序依赖建模能力,有效克服传统方法在动态行为分析中的局限性。实验采集9900个勒索软件样本与9900个良性软件样本,经过特征筛选,最终选取5个与勒索行为高度相关的HPCs事件作为输入。实验结果表明,该方法在500 ms时间窗口内的检测准确率达到99.36%,为勒索软件的高效识别与防御提供了有力支持。 展开更多
关键词 硬件性能计数器 Transformer架构 勒索软件检测 时序特征提取
在线阅读 下载PDF
基于采样的并行程序性能测量分析工具研究
5
作者 胡家瑞 石京燕 郭超奇 《计算机工程与应用》 CSCD 北大核心 2024年第21期286-296,共11页
在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行... 在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行程序性能分析工具有助于解决上述问题。相比于插桩技术,基于异步采样的性能工具可以更好地控制测量开销和测量数据大小。着重研究了三种典型的基于采样的性能分析工具:VTune Profiler、HPCToolkit和Nsight Systems,分析了其原理和功能,并且结合VASP等实际应用程序对工具的软硬件分析能力和并行编程分析能力进行了详细的探究和对比。根据这些工具在不同的应用场景下表现出的不同适用性和分析效果,提出了综合运用多种工具进行性能分析的方案,为开发者和程序员提供有益的参考。 展开更多
关键词 性能分析工具 异步采样 硬件性能计数器 并行程序 程序调优
在线阅读 下载PDF
性能不对称多核处理器负载均衡调度研究 被引量:3
6
作者 徐远超 谭旭 +2 位作者 范灵俊 孙卫真 张志敏 《计算机工程与科学》 CSCD 北大核心 2013年第11期80-86,共7页
同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载... 同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载均衡优先原则,无需定义阈值区分程序类别。测试结果表明,该算法既能做到负载均衡,又能实现异构感知。 展开更多
关键词 调度 异构多核处理器 负载均衡 程序行为分析 硬件性能计数器
在线阅读 下载PDF
基于动态指令编译的软件性能分析方法
7
作者 程克非 张聪 +1 位作者 张勤 汪林林 《计算机科学》 CSCD 北大核心 2006年第4期292-294,F0003,共4页
进行精确的软件性能分析,需要在代码中插入测量和控制代码,并根据具体运行状态动态的检查多个不同的参数。但是,用静态类型的程序语言,如 C 语言等书写的代码,一经编译和链接,其处理逻辑即不可更改。因此,在无法获取源代码或者重新编译... 进行精确的软件性能分析,需要在代码中插入测量和控制代码,并根据具体运行状态动态的检查多个不同的参数。但是,用静态类型的程序语言,如 C 语言等书写的代码,一经编译和链接,其处理逻辑即不可更改。因此,在无法获取源代码或者重新编译和重新启动代价较高的应用中,对软件进行动态性能分析非常困难。本文将介绍一种在软件运行时刻动态插入监控点的动态指令编译技术对软件进行监控,从而在上述情况下达到对软件的监控目的。这种方法是基于 DynInst API 和 PAPI 技术的。实验表明,这种方法在去掉了对源代码的依赖的情况下,仍然与在源代码级插入监控点的方法具有同等的采集效率,在很大程度上增强了基于硬件性能计数器方法的软件监控技术的应用范围,达到了较好的性能分析效果。 展开更多
关键词 动态指令编译 性能分析 Dyninst API PAPI 硬件性能计数器
在线阅读 下载PDF
Pview:一种基于PMU的支持并行程序性能分析的新方法 被引量:4
8
作者 闫洁 徐恒阳 +2 位作者 安虹 刘玉 王耀彬 《计算机科学》 CSCD 北大核心 2011年第2期288-292,共5页
近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对... 近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对目标程序的干扰的情况下对程序进行性能监测成为可能。Pview(Performance View)是一种在系统级支持对并行程序尤其是多线程程序进行性能监测与分析的工具,它同时支持全系统和针对特定进程(线程组)的性能事件直接计数或者抽样的分析方法。Pview在Linux操作系统平台上通过扩展内核2.6.30,实现了一个新的系统调用Pview来提供性能监测服务;同时与以模块方式实现的数据收集引擎协作,可以实现抽样并将大规模样本数据传输到用户空间供进一步分析。 展开更多
关键词 硬件性能计数器 性能监测 多线程程序分析
在线阅读 下载PDF
智能网卡驱动程序的性能评价 被引量:4
9
作者 刘勇 杨卫兵 +1 位作者 陈曜 孙凝晖 《计算机工程》 EI CAS CSCD 北大核心 2005年第14期42-44,47,共4页
通信网络对机群系统的性能影响很大,建立高效的通信网络依赖快速网络硬件支持。智能网卡用于机群的快速接入,提高了Internet应用的性能,其中驱动程序是发挥智能网卡能力的关键,因而对驱动程序的性能评价很有必要。性能评价利用智能网卡... 通信网络对机群系统的性能影响很大,建立高效的通信网络依赖快速网络硬件支持。智能网卡用于机群的快速接入,提高了Internet应用的性能,其中驱动程序是发挥智能网卡能力的关键,因而对驱动程序的性能评价很有必要。性能评价利用智能网卡提供的硬件性能计数器,采用性能测试法对智能网卡驱动程序进行性能分析。结果表明智能网卡驱动程序的性能瓶颈在于驱动程序较大的数据相关性。 展开更多
关键词 智能网卡 性能评价 硬件性能计数器
在线阅读 下载PDF
基于机器学习的多目标缓存侧信道攻击检测模型 被引量:2
10
作者 姚梓豪 栗远明 +2 位作者 马自强 李扬 魏良根 《计算机应用》 CSCD 北大核心 2024年第6期1862-1871,共10页
当前缓存侧信道攻击检测技术主要针对单一攻击模式,对2~3种攻击的检测方法有限,无法全面覆盖;此外,尽管对单一攻击的检测精度高,但随着攻击数增加,精度下降,容易产生误报。为了有效检测缓存侧信道攻击,利用硬件性能计数器(HPC)采集不同... 当前缓存侧信道攻击检测技术主要针对单一攻击模式,对2~3种攻击的检测方法有限,无法全面覆盖;此外,尽管对单一攻击的检测精度高,但随着攻击数增加,精度下降,容易产生误报。为了有效检测缓存侧信道攻击,利用硬件性能计数器(HPC)采集不同的缓存侧信道攻击特征,结合机器学习算法,提出一种基于机器学习的多目标缓存侧信道攻击检测模型。首先,分析不同缓存侧信道攻击方式的相关特征,精选关键特征并收集数据集;其次,进行独立的训练,建立针对每种攻击方式的检测模型;最后,在检测时将测试数据并行送入多个模型中,根据检测结果判断是否存在某种缓存侧信道攻击。实验结果显示,所提模型在检测Flush+Reload、Flush+Flush和Prime+Probe这3种缓存侧信道攻击时,分别达到99.91%、98.69%和99.54%的高准确率,即使在同时存在多种攻击的情况下,也能准确识别各种攻击方式。 展开更多
关键词 缓存侧信道攻击 缓存侧信道攻击检测 硬件性能计数器 特征分析 机器学习
在线阅读 下载PDF
面向多核处理器系统的Cache感知调度算法
11
作者 徐远超 沈岩 +2 位作者 谭旭 万虎 张志敏 《小型微型计算机系统》 CSCD 北大核心 2013年第2期365-369,共5页
Cache空间的不公平使用和争用直接影响系统的整体性能,现有Linux操作系统的默认调度算法不能感知程序的行为,包括访问cache的失效次数,不了解线程之间访存模式和频度上可能存在的差异,因而无法做出更加合理的调度.本文提出并在Linux环... Cache空间的不公平使用和争用直接影响系统的整体性能,现有Linux操作系统的默认调度算法不能感知程序的行为,包括访问cache的失效次数,不了解线程之间访存模式和频度上可能存在的差异,因而无法做出更加合理的调度.本文提出并在Linux环境下实现了一种Cache感知的调度算法CAS,通过监测每个任务每千条指令的共享cache失效次数,把cache失效次数相近的任务聚合到同一个核上,使得cache失效次数差异较大的任务运行在不同的核上,避免了cache失效次数都很大的任务在不同的核上同时运行,从而减小了cache空间的不公平使用和争用.实验表明,CAS算法在大多数情况下,减少了整个负载的共享cache失效次数,提高系统的平均吞吐量约5%左右. 展开更多
关键词 任务调度 多核处理器 Cache感知 硬件性能计数器
在线阅读 下载PDF
基于HPC的虚拟化平台异常检测技术研究与实现 被引量:4
12
作者 邢凌凯 张健 《信息网络安全》 CSCD 北大核心 2023年第10期64-69,共6页
文章针对虚拟化平台异常行为检测问题提出一种基于硬件性能计数器(Hardware Performance Counter,HPC)和集成学习的动态检测方法。该方法基于KVM虚拟化平台,采集平台运行样本时的HPC值,按照随机森林(Random Forest,RF)学习时产生的特征... 文章针对虚拟化平台异常行为检测问题提出一种基于硬件性能计数器(Hardware Performance Counter,HPC)和集成学习的动态检测方法。该方法基于KVM虚拟化平台,采集平台运行样本时的HPC值,按照随机森林(Random Forest,RF)学习时产生的特征重要性分数进行特征筛选,提高RF分类模型的准确率,实现异常检测。文章在平台上采集了1040个良性程序样本和1040个恶意程序样本,在特征筛选阶段选取8个判断恶意样本的重要HPC事件。实验结果表明,特征筛选后的RF分类模型在测试集上可以达到95.38%的准确率,相较于特征筛选前的同类模型和其他传统机器学习模型具有更高的准确性和稳定性。 展开更多
关键词 异常行为检测 虚拟化 硬件性能计数器 集成学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部