期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种缓解多线程访存干扰的VRB内存机制
1
作者 高珂 范东睿 刘志勇 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2577-2588,共12页
目前处理器通过持续增加核数和同时执行的线程数来提高系统性能.但是,增加共享内存的处理器核数和线程数会使得存储器中的行缓存(row-buffer,RB)命中率下降,造成存储器访问功耗增加和访存延迟增加.设计并开发了一种细粒度的victim row-b... 目前处理器通过持续增加核数和同时执行的线程数来提高系统性能.但是,增加共享内存的处理器核数和线程数会使得存储器中的行缓存(row-buffer,RB)命中率下降,造成存储器访问功耗增加和访存延迟增加.设计并开发了一种细粒度的victim row-buffer(VRB)内存机制系统来解决此问题.VRB机制提供附加的行缓存(VRB),暂时缓存由于行缓存(RB)冲突而从行缓存(RB)逐出的数据,以备后续可能的访问.这种机制缓解了多线程冲突,增加了DRAM中行缓存数据的重用率,避免了不必要的内存数据阵列的访问、行激活和预充电、数据传输等电路动作,可以通过少量的硬件代价提高内存系统的性能,并节约系统的功耗消耗.通过时序精确的全系统模拟器实验,对比8核的Intel Xeon处理器,所提出的VRB机制可以达到最高17.6%(平均8.7%)的系统级吞吐率改善、最高142.9%(平均51.4%)的行缓存命中率改善以及最高17.6%(平均9.2%)的系统功耗改善. 展开更多
关键词 DRAM结构设计 行缓存 功耗消耗 多线程 VRB机制
在线阅读 下载PDF
新的保持边缘的图像放大算法
2
作者 袁野 田中旭 《计算机应用》 CSCD 北大核心 2012年第11期3182-3184,共3页
为了适应视频后处理芯片低成本的需求,提出一种仅需用两行缓存的新的保持边缘的图像放大算法。该方法寻找代表点代替插值点来确定相关方向。找到相关方向后,对应方向上寻找四个邻域点及其对应位置,进行插值。实验结果表明该算法能实现... 为了适应视频后处理芯片低成本的需求,提出一种仅需用两行缓存的新的保持边缘的图像放大算法。该方法寻找代表点代替插值点来确定相关方向。找到相关方向后,对应方向上寻找四个邻域点及其对应位置,进行插值。实验结果表明该算法能实现图像的放大,并能消除图像边缘模糊和锯齿效应,可应用于低成本的数字视频后处理芯片中。 展开更多
关键词 图像放大 保持边缘 内插算法 行缓存
在线阅读 下载PDF
基于动态场景估计的自适应图像增强算法 被引量:2
3
作者 张超 杨晶晶 +1 位作者 王盛 陈更生 《计算机工程》 CAS CSCD 2013年第5期34-41,共8页
为快速、高效地增强因环境等因素导致质量退化的视频图像,提出一种基于动态场景估计的自适应图像增强算法。该算法采用拉普拉斯算子锐化图像的细节纹理,利用灰度统计的方法判据图像的场景,构建不同场景下的灰度映射函数,并根据动态场景... 为快速、高效地增强因环境等因素导致质量退化的视频图像,提出一种基于动态场景估计的自适应图像增强算法。该算法采用拉普拉斯算子锐化图像的细节纹理,利用灰度统计的方法判据图像的场景,构建不同场景下的灰度映射函数,并根据动态场景估计的结果自适应地调整图像灰度的动态范围,以提升图像对比度。采用流水线处理技术和数据流行缓存技术完成硬件实现,执行效率高、占用资源少,可满足高清视频流的实时处理。实验结果表明,该算法在避免失真、保留原始语义的同时,能在各种场景下实现高质量的图像增强。 展开更多
关键词 动态场景估计 自适应图像增强 锐化 行缓存 流水线
在线阅读 下载PDF
基于Zynq的SDI视频图像分割系统 被引量:5
4
作者 王炜琛 涂海洋 +1 位作者 王伟明 赵晓博 《计算机工程与科学》 CSCD 北大核心 2021年第10期1796-1802,共7页
为弥补传统视频图像分割器抗干扰能力弱、帧率低、设计复杂等缺点,选取XILINX Zynq XC7Z035 FPGA异构平台,并与SDI技术相融合,采用高清数字串行解码芯片TW6874对4路数字视频图像进行同步采集,输出BT.1120数据至FPGA,以实现4路视频分开... 为弥补传统视频图像分割器抗干扰能力弱、帧率低、设计复杂等缺点,选取XILINX Zynq XC7Z035 FPGA异构平台,并与SDI技术相融合,采用高清数字串行解码芯片TW6874对4路数字视频图像进行同步采集,输出BT.1120数据至FPGA,以实现4路视频分开显示。为满足视频图像的分辨率和帧率要求,首先对视频图像数据进行像素抽样,其次利用AXI4-Stream Data FIFO进行行输入缓存,处理数据灵活,便于拓展,为进一步集成算法提供了基础。AXI4-Stream Data FIFO每行960个数据产生s_axi_s2mm_tlast信号与AXI DMA进行握手,将数据缓存至DDR3 SDRAM中,缓存540行之后进行下一个缓冲区地址的切换,AXI DMA每路视频图像均有3个缓冲区,从而完成三缓存设计,保证视频图像无撕裂现象。最后将缓存数据输出至SMPTE SDI IP核进行显示。实验结果表明:该系统实现了4路SDI视频图像分割,系统资源占用少,且视频图像帧率高,层次明显,无撕裂、无失真现象。 展开更多
关键词 Zynq SDI BT.1120 AXI DMA 行缓存 DDR3 SDRAM 缓存
在线阅读 下载PDF
图像二值化处理硬件加速引擎的设计 被引量:3
5
作者 阳欣 魏可 +1 位作者 宋宇鲲 张多利 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第11期1495-1499,1517,共6页
针对图像二值化处理耗时长、内存消耗大等缺点,文章在Box Filter算法的基础上提出了一种图像二值化处理硬件加速架构。基于该架构的硬件电路只需(图像宽度×阈值窗口宽度)字节图像缓存,在150 MHz时钟频率下,每秒能处理240张640×... 针对图像二值化处理耗时长、内存消耗大等缺点,文章在Box Filter算法的基础上提出了一种图像二值化处理硬件加速架构。基于该架构的硬件电路只需(图像宽度×阈值窗口宽度)字节图像缓存,在150 MHz时钟频率下,每秒能处理240张640×480分辨率的图片,具有电路面积小、加速效率高等优点。经过FPGA原型验证后,该电路被集成于QR码识别系统中,并已在SMIC 110 nm工艺下流片。芯片的测试结果表明,图像二值化处理加速电路功能正确,且取得了良好的实时性处理效果。 展开更多
关键词 图像二值化处理 图像加速 行缓存 流水线处理
在线阅读 下载PDF
一种面向持久化内存的热点变量快速写入算法 被引量:2
6
作者 燕保跃 姜博 《小型微型计算机系统》 CSCD 北大核心 2022年第11期2442-2448,共7页
近年来出现的持久化内存硬件(NVM)因其容量大、延迟低、可字节寻址、掉电非易失等诸多特性,为数据的存储与管理带来新的契机.然而,现有的持久化内存需要进行显式且昂贵的缓存刷新操作以确保数据持久化,且针对同一个缓存行的刷新操作比... 近年来出现的持久化内存硬件(NVM)因其容量大、延迟低、可字节寻址、掉电非易失等诸多特性,为数据的存储与管理带来新的契机.然而,现有的持久化内存需要进行显式且昂贵的缓存刷新操作以确保数据持久化,且针对同一个缓存行的刷新操作比不同缓存行开销显著增大.这对于热点变量(dancing variables)的持久化带来较大挑战.为提升热点变量的更新效率,提出了PDV算法,设置多个位于不同缓存行的影子变量,并且为每个影子变量添加一个固定大小的标签.在每次更新热点变量时,PDV采用轮询策略选择不同的影子变量以确保每次写入不同的缓存行,同时根据当前的状态更新其对应的标签,以确保在系统恢复时能正确的解析出最近更新的影子变量.对于任意数量的影子变量,证明了仅需要2比特大小的标签即可确保PDV总能正确的恢复.实验结果显示,PDV算法对于热点变量的写入速度提升高达1.9倍. 展开更多
关键词 持久化内存 热点变量 缓存 快速写入
在线阅读 下载PDF
非易失性内存友好的线性哈希索引——NVM-LH
7
作者 汤晨 黄国锐 金培权 《计算机应用》 CSCD 北大核心 2021年第3期623-629,共7页
非易失性内存(NVM)因其大容量、持久化、按位存取和读延迟低等特性而受到人们的关注,但它同时也具有写次数有限、读写速度不均衡等缺点。针对传统线性哈希索引直接在NVM上实现时会导致大量的随机写操作这一问题,提出了一种新的NVM友好... 非易失性内存(NVM)因其大容量、持久化、按位存取和读延迟低等特性而受到人们的关注,但它同时也具有写次数有限、读写速度不均衡等缺点。针对传统线性哈希索引直接在NVM上实现时会导致大量的随机写操作这一问题,提出了一种新的NVM友好的线性哈希索引NVM-LH。NVM-LH通过存储数据时的缓存行对齐实现了缓存友好性,同时提出了无日志的数据一致性保证策略。此外,NVM-LH还通过优化分裂和删除操作来减少NVM写操作。实验结果表明,NVM-LH在空间利用率上比CCEH高30%,在NVM写次数上比CCEH减少了15%左右,表现了更好的NVM友好性。 展开更多
关键词 非易失性内存 动态哈希 线性哈希 缓存友好性 数据一致性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部