期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种支持向量无冲突访问的质数存储器系统设计方案
1
作者 孙彤 方滨兴 李晓明 《计算机研究与发展》 EI CSCD 北大核心 1995年第5期63-65,F004,共4页
SIMD体系结构步入低谷的原因之一是还没有一个很好的存储器无冲突访问算法。从访问模式的覆盖面来说,无疑质数模式是最理想的。早在七十年代末的BSP[1]并行计算机上就采用了质数存储器[2]的方法,但由于其它一些问题没有... SIMD体系结构步入低谷的原因之一是还没有一个很好的存储器无冲突访问算法。从访问模式的覆盖面来说,无疑质数模式是最理想的。早在七十年代末的BSP[1]并行计算机上就采用了质数存储器[2]的方法,但由于其它一些问题没有解决,因而带来一些弊端,包括采用交叉开关的实现技术,浪费存储空间的访存方式,存储器个数与处理器个数不同等。本文采用了新的实现方式,因而不再存在上述三个问题。 展开更多
关键词 质数存储器 无冲突访问 系统设计 存储器
在线阅读 下载PDF
可重构存储器无地址冲突的访问机理及“比特标识”方法研究
2
作者 杨金林 杨海钢 《电子与信息学报》 EI CSCD 北大核心 2011年第3期723-728,共6页
该文着重分析了可重构双端口存储器读写冲突产生的机理,揭示了存储器在可重构条件下地址冲突的依存关系、数据读出映射和路由关系。为实现可重构存储器在无地址冲突下的高性能自由访问,提出了"比特标识"方法,在发生冲突时缓... 该文着重分析了可重构双端口存储器读写冲突产生的机理,揭示了存储器在可重构条件下地址冲突的依存关系、数据读出映射和路由关系。为实现可重构存储器在无地址冲突下的高性能自由访问,提出了"比特标识"方法,在发生冲突时缓存一个写入操作,并对数据位的每一比特增加标识位,标识位控制缓存数据向存储核的写入和向存储器外的读出。在0.13μm和0.18μm主流工艺下的实验结果表明,和其它设计方法比较,面积下降约11%,度提升约21%。采用该方法实现的可重构存储器嵌入到国产百万门级FPGA器件,经测试,达到了无冲突的效果。 展开更多
关键词 FPGA 可重构存储器 无冲突访问 比特标识
在线阅读 下载PDF
面向多兴趣区域图像处理应用的高效无冲突并行访问存储模型 被引量:1
3
作者 徐金波 窦勇 《计算机学报》 EI CSCD 北大核心 2008年第11期2015-2025,共11页
针对不规则数据访问模式图像处理应用提出了一种通用的高效无冲突并行访问存储模型.在主存储器与处理器之间构建了一种多体存储结构,并将大部分的不规则数据访问模式归类为对图像中多个局部矩形兴趣区域内的任意位置固定大小矩形数据块... 针对不规则数据访问模式图像处理应用提出了一种通用的高效无冲突并行访问存储模型.在主存储器与处理器之间构建了一种多体存储结构,并将大部分的不规则数据访问模式归类为对图像中多个局部矩形兴趣区域内的任意位置固定大小矩形数据块的无冲突并行访问.为了提高访问效率,只将兴趣区域内的数据缓存在多体存储器中,且不同兴趣区域的重叠数据可以重用.多体存储器的寻址机制是基于提出的地址映射表结构进行动态寻址,而不是采用传统的固定寻址函数,既保证了对任意数据读写操作的编址一致性,又提高了数据重用性.每处理一个新兴趣区域就对地址映射表内容进行一次更新,提出的双表结构与数据块动态调度机制保证了更新过程与计算过程的并行执行.基于提出的存储模型构建了硬件体系结构,并在FPGA上实现,测试结果表明,与直接访问主存储器相比在访存速度上提高了几倍到上百倍. 展开更多
关键词 无冲突并行访问 数据重用 多体存储 图像处理 FPGA
在线阅读 下载PDF
零拷贝报文捕获平台的研究与实现 被引量:67
4
作者 王佰玲 方滨兴 云晓春 《计算机学报》 EI CSCD 北大核心 2005年第1期46-52,共7页
根据零拷贝思想 ,实现了一种高性能的报文捕获平台 (High PerformancePacketCapturePlatform ,HPPCP) .通过实现网络接口设备直接将数据报文以DMA方式存储到应用程序可以访问的地址空间 ,避免数据报文在内核态里传输时的内存操作 ,缩短... 根据零拷贝思想 ,实现了一种高性能的报文捕获平台 (High PerformancePacketCapturePlatform ,HPPCP) .通过实现网络接口设备直接将数据报文以DMA方式存储到应用程序可以访问的地址空间 ,避免数据报文在内核态里传输时的内存操作 ,缩短了数据报文的行走路径 ;通过环策略管理数据报文缓冲区 ,实现了网卡和应用程序能够无冲突访问共享资源 .这两点有效地降低了网络通信的延迟 ,极大地节省了CPU的开销 .通过性能的分析比较表明 ,接收 6 4Byte与 15 0 0Byte的报文时吞吐量分别达到 90万pps (439Mbps)和 8.2万pps (938Mbps) ,与传统的报文传输机制相比 ,报文捕获能力有了较为显著的提高 . 展开更多
关键词 零拷贝 高速网络接口 内存映射 地址翻译 无冲突访问
在线阅读 下载PDF
一种基于矢量基2×2的二维FFT高效结构
5
作者 禹霁阳 李阳 +1 位作者 黄丹 龙腾 《北京理工大学学报》 EI CAS CSCD 北大核心 2011年第8期962-965,1004,共5页
提出了一种基于时间抽取原位计算的高效并行的二维矢量基2×2快速傅里叶变换的硬件实现结构.该算法结构将N×N点数据分解为4个独立存储的部分来实现矢量基2×2蝶形计算单元4个操作数的并行访问,仅用一个二维分裂基蝶形运算... 提出了一种基于时间抽取原位计算的高效并行的二维矢量基2×2快速傅里叶变换的硬件实现结构.该算法结构将N×N点数据分解为4个独立存储的部分来实现矢量基2×2蝶形计算单元4个操作数的并行访问,仅用一个二维分裂基蝶形运算单元对这4块数据进行二维矢量基快速傅里叶变换,利用无冲突访问方法完成对存储器的并行访问.推导出了该算法硬件实现结构下的各存储器数据地址存取公式和旋转因子的产生方法,并利用CORDIC算法实现旋转因子的产生来减少存储器的使用.该算法对N×N点数据进行二维离散傅里叶变换处理的时间仅为(N2/2)(lb N-1)个时钟周期,与以往算法计算时间的比较结果表明了该设计的有效性. 展开更多
关键词 无冲突访问 二维离散傅里叶变换 矢量基2×2 CORDIC算法
在线阅读 下载PDF
面向大尺寸滑动窗口应用的并行计算模型 被引量:1
6
作者 庞征斌 徐金波 +2 位作者 董亚卓 窦勇 张峻 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第2期140-144,共5页
大尺寸滑动窗口的应用在数据输入速度与处理速度之间存在较大差距。为了缩短差距,提出了一种并行计算模型,使用尽可能少的存储资源与尽可能简单的存储器读写控制逻辑实现了尽可能高的数据重用性与并行性。该模型将不同滑动窗口之间的并... 大尺寸滑动窗口的应用在数据输入速度与处理速度之间存在较大差距。为了缩短差距,提出了一种并行计算模型,使用尽可能少的存储资源与尽可能简单的存储器读写控制逻辑实现了尽可能高的数据重用性与并行性。该模型将不同滑动窗口之间的并行处理与单个窗口内不同数据之间的并行处理结合起来:对于不同窗口,按列进行分组并映射到多个处理单元上并行处理;对于单个窗口内的数据,使用多体存储结构进行缓存,并设计了存储体分配机制与寻址函数以实现多个数据的无冲突并行访问。在FPGA上的实验结果表明:提出的计算模型在没有明显增加存储资源使用代价与读写控制逻辑复杂性的情况下大大提高了处理速度。 展开更多
关键词 并行处理 无冲突并行访问 滑动窗口
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部