期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
多核下基于远程直接内存访问的高效远程过程调用研究
1
作者 李波 孟丹 霍志刚 《高技术通讯》 CAS CSCD 北大核心 2011年第7期681-686,共6页
针对目前基于远程直接内存访问(RDMA)的远程过程调用(RPC)设计在多核背景下存在的性能和扩展性问题,提出了一种新的基于RDMAWrite的高效RPC设计方法并对网络文件系统(NFS)提供了支持。重点就设计中的安全性问题和内存管理机制进... 针对目前基于远程直接内存访问(RDMA)的远程过程调用(RPC)设计在多核背景下存在的性能和扩展性问题,提出了一种新的基于RDMAWrite的高效RPC设计方法并对网络文件系统(NFS)提供了支持。重点就设计中的安全性问题和内存管理机制进行了分析,并针对内存有效利用提出了被动和主动两种回收机制。测试结果表明,这种新的RPC设计方法能降低RPC延迟13%~20%。对内存文件系统及真实磁盘文件系统的测试表明,此设计能有效提高多核系统中RPC的性能和扩展性。 展开更多
关键词 远程直接内存访问(Rdma) 远程过程调用(RPC) 多核 网络文件系统(NFS)
在线阅读 下载PDF
直接内存访问技术在无人机地面站遥测数据采集中的应用
2
作者 匡巍 张晓林 《遥测遥控》 2000年第6期38-42,共5页
介绍基于 DMA(直接内存访问 )技术的共轴式无人直升机地面站遥测数据采集系统。该地面站采集系统不仅要求采集来自遥测数据恢复系统的高速遥测数据流 ,同时要对采集到的遥测数据实时处理后显示并保存。采用串口通信或双口 RAM方式都会... 介绍基于 DMA(直接内存访问 )技术的共轴式无人直升机地面站遥测数据采集系统。该地面站采集系统不仅要求采集来自遥测数据恢复系统的高速遥测数据流 ,同时要对采集到的遥测数据实时处理后显示并保存。采用串口通信或双口 RAM方式都会占用较多的 CPU时间 ,难以满足要求。而 DMA传输方式是计算机高速数据采信的重要手段。通过联试 ,证明该遥测数据采集系统能够保证互不干扰地完成数据的采集、处理、显示与存盘等任务。 展开更多
关键词 直接内存访问技术 遥测 +无人机 数据采集
在线阅读 下载PDF
MCS-DMA:一种面向SoC内DMA传输的内存控制器优化设计 被引量:6
3
作者 黄侃 佟冬 +2 位作者 刘洋 杨寿贵 程旭 《电子学报》 EI CAS CSCD 北大核心 2010年第3期598-604,共7页
当前主流片上总线协议——AHB存在访存带宽利用率较低的问题.本文基于SoC内DMA传输较多的特点,提出一种新的优化设计:在内存控制器内部增加MCS-DMA模块,并通过驱动程序将MCS-DMA模块与目标DMA传输绑定.一方面实现数据预取,提升了单个DM... 当前主流片上总线协议——AHB存在访存带宽利用率较低的问题.本文基于SoC内DMA传输较多的特点,提出一种新的优化设计:在内存控制器内部增加MCS-DMA模块,并通过驱动程序将MCS-DMA模块与目标DMA传输绑定.一方面实现数据预取,提升了单个DMA传输时的总线带宽利用率;另一方面使访存请求在内存控制器内部流水化完成,提升多个DMA并发时的总线带宽利用率.将该设计应用到北大众志SKSoC后,单个DMA传输时的总线带宽利用率提升至100%,多个DMA并发时的总线带宽利用率从33.3%提升至85.5%,而芯片的设计面积仅增加2.9%. 展开更多
关键词 系统芯片 内存控制器 直接内存访问
在线阅读 下载PDF
异构千核处理器系统的统一内存地址空间访问方法 被引量:2
4
作者 裴颂文 吴小东 +1 位作者 唐作其 熊乃学 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第1期28-33,共6页
为了达到异构多核处理器能直接交叉访问对方的内存地址空间的目的,通过构建统一的三级Cache结构和数据块状态标记方法,并优化Cache块状态的修改算法,提出了异构千核处理器系统的统一内存地址空间访问方法,避免了当前独立式异构计算机系... 为了达到异构多核处理器能直接交叉访问对方的内存地址空间的目的,通过构建统一的三级Cache结构和数据块状态标记方法,并优化Cache块状态的修改算法,提出了异构千核处理器系统的统一内存地址空间访问方法,避免了当前独立式异构计算机系统结构下复制和传输数据块所带来的大量额外访存开销。通过采用部分Rodinia基准测试程序测试,获得了最高9.8倍的系统加速比,最多减少了90%的访存频率。因此,采用该方法能有效减少异构核心间交换数据块所带来的系统开销,提高异构千核处理器的系统性能加速比。 展开更多
关键词 异构千核处理器 内存地址空间 交叉式直接访问 CACHE
在线阅读 下载PDF
基于MemDMA方式的ADSP-BF533指令存储器的迂回访问 被引量:1
5
作者 杨波 杨俊 +1 位作者 王跃科 周永彬 《电子质量》 2004年第12期65-67,共3页
本文主要针对ADSP-BF533的内部存储器的访问方式进行了讨论,介绍了系统的内存管理机制,提出用MemDMA的方式对指令存储器进行迂回访问,描述了DMA的相关寄存器并给出其设置的具体实例,为Blackfin系列DSP的工程设计应用提供了重要参考。
关键词 dma方式 内部存储器 指令 访问方式 内存管理 寄存器 n系列 回访 机制 系统
在线阅读 下载PDF
广域抗损高吞吐URDMA技术
6
作者 段晓东 陆璐 +3 位作者 孙滔 李志强 杨红伟 杜宗鹏 《中兴通讯技术》 北大核心 2024年第6期23-30,共8页
随着国家“东数西算”战略实施以及智算、超算业务的快速发展,海量数据广域传输需求不断增多。提出一种广域抗损高吞吐超远程直接内存访问(URDMA)技术方案,通过对传输控制协议/互联网协议(TCP/IP)协议栈的完全卸载,消除中央处理器(CPU)... 随着国家“东数西算”战略实施以及智算、超算业务的快速发展,海量数据广域传输需求不断增多。提出一种广域抗损高吞吐超远程直接内存访问(URDMA)技术方案,通过对传输控制协议/互联网协议(TCP/IP)协议栈的完全卸载,消除中央处理器(CPU)对网络高吞吐性能的限制。采用拥塞控制、丢包恢复、丢包重传等技术增强标准第2代基于融合以太网的远程直接内存访问(RoCEv2)协议,使其在广域有损网络下保持高吞吐性能。测试结果表明,在往返时延(RTT)时延为20 ms、丢包率0.1%的网络环境下,TCP协议吞吐性能仅为0.02 Gbit/s,标准RoCEv2性能接近为0,URDMA协议吞吐性能为88.26 Gbit/s;当RTT时延增加到80 ms时,TCP和RoCEv2协议吞吐基本衰减为0,URDMA协议吞吐性能为83.12 Gbit/s,仍然保持较高的性能。 展开更多
关键词 广域抗损高吞吐 数据快递 远程直接内存访问 RoCEv2
在线阅读 下载PDF
基于PCIE驱动程序的数据传输卡DMA传输 被引量:16
7
作者 李晃 巩峰 陈彦化 《电子科技》 2014年第1期117-120,共4页
为提高数据传输速度,研制了一套基于PCIE接口的数据发送和接收系统。该系统主要由4部分组成:数据发送卡、数据接收卡、PCIE驱动程序以及上位机应用程序。文中介绍了数据传输卡的基本原理和构成,重点研究了在Windows XP系统下利用WinDri... 为提高数据传输速度,研制了一套基于PCIE接口的数据发送和接收系统。该系统主要由4部分组成:数据发送卡、数据接收卡、PCIE驱动程序以及上位机应用程序。文中介绍了数据传输卡的基本原理和构成,重点研究了在Windows XP系统下利用WinDriver开发PCIE设备驱动程序的主要步骤、DMA数据传输的实现和中断响应的处理。经测试,该数据传输系统比较稳定,开发的驱动程序可以实现数据的高速传输。 展开更多
关键词 PCI Express(PCIE) WINDRIVER 驱动 直接内存访问(dma)
在线阅读 下载PDF
数据处理单元赋能的智算中心网络拥塞控制机制
8
作者 陈锦前 郭少勇 +2 位作者 刘畅 亓峰 邱雪松 《通信学报》 北大核心 2025年第2期1-17,共17页
针对智算中心集群间交互频繁造成网络拥塞频发导致智能业务实时性难以保障的问题,以数据处理单元(DPU)为核心载体构建了深度强化学习算法驱动的拥塞控制模型,利用剪枝与量化融合的方式对模型进行压缩,并通过知识蒸馏方法生成高效梯度增... 针对智算中心集群间交互频繁造成网络拥塞频发导致智能业务实时性难以保障的问题,以数据处理单元(DPU)为核心载体构建了深度强化学习算法驱动的拥塞控制模型,利用剪枝与量化融合的方式对模型进行压缩,并通过知识蒸馏方法生成高效梯度增强决策树,实现调速动作与网络实时状态的精准匹配。仿真结果表明,所提机制在泛化能力和控制效果方面均优于现有方法,在多个压力测试场景中提升网络有效吞吐率与公平性指标JAIN10.8%和8.9%以上,降低P99端到端时延与丢包率17.31%和11.47%以上,降低并行计算场景下数据流传输任务完成时间11.23%以上,且具备应对网络状态突变的快速响应能力。 展开更多
关键词 拥塞控制 多智能体深度强化学习 智算中心网络 远程直接内存访问网络 数据处理单元
在线阅读 下载PDF
一种用于图像加速的DMA2D控制器 被引量:4
9
作者 王磊 王鑫 +2 位作者 王绍权 闫维高 齐贺飞 《半导体技术》 CAS 北大核心 2022年第7期564-569,共6页
随着片上系统(SoC)规模的不断增大,直接内存存取(DMA)控制器的功能也越来越完善,但目前对DMA控制器用于图像处理方面的理论研究和实现方法却鲜有报道。为了提高液晶屏(LCD)图像的刷新速度并降低内核的资源占用,提出了一种用于图像数据... 随着片上系统(SoC)规模的不断增大,直接内存存取(DMA)控制器的功能也越来越完善,但目前对DMA控制器用于图像处理方面的理论研究和实现方法却鲜有报道。为了提高液晶屏(LCD)图像的刷新速度并降低内核的资源占用,提出了一种用于图像数据处理的二维DMA(DMA2D)控制器。该控制器基于先进高性能总线(AHB)完成数据传输,支持多种RGB图像输入输出格式并且能够进行两层图像的混合处理运算。对DMA2D的技术和工作原理进行分析,提出了较为完善的DMA2D控制器的设计方案。后端设计基于28 nm工艺库,测试结果表明,DMA2D控制器的工作频率可达到180 MHz,面积仅为400μm×500μm,相比于通用DMA控制器,其面积减小约69%,功耗仅为2.97 mW。DMA2D控制器加速启用后,速度提升约60%,数据传输速度可达330 MiB/s,显著提高了液晶屏的图像刷新速度。 展开更多
关键词 直接内存存取(dma) 先进高性能总线(AHB)协议 物理设计 片上系统(SoC) 图像加速
在线阅读 下载PDF
基于TMS320VC5410 DMA方式的高速并行采样系统设计 被引量:1
10
作者 汪春梅 贾红涛 张春丽 《电视技术》 北大核心 2003年第11期84-85,91,共3页
针对便携式图像系统中视频信号采集与数字处理的需求,设计了以TMS320VC5410(DSP)为核心的通用采样处理系统。利用VC5410的6通道DMA(直接内存存取)控制端口,实现了信号的高速并行采样,其采样率最高可达20MBps。介绍了并行采样系统硬件组... 针对便携式图像系统中视频信号采集与数字处理的需求,设计了以TMS320VC5410(DSP)为核心的通用采样处理系统。利用VC5410的6通道DMA(直接内存存取)控制端口,实现了信号的高速并行采样,其采样率最高可达20MBps。介绍了并行采样系统硬件组成、DMA控制端口逻辑关系以及高速并行采样的编程实现。 展开更多
关键词 TMS320VC5410芯片 直接内存存取 高速并行采样 dma 视频信号采集
在线阅读 下载PDF
ADSP2116x中DMA的应用 被引量:2
11
作者 江志红 吴春光 《国外电子元器件》 2003年第7期27-30,共4页
直接内存存取(DMA)是DSP芯片中用于快速数据交换的重要技术,文中对AD公司的浮点系列芯片ADSP2116x中DMA的应用方法作了详细介绍,同时重点介绍了链式DMA的操作方法 ,给出了一些实际应用中的例子。
关键词 ADSP2116x dma 直接内存存取 DSP 浮点系列芯片 链式dma 应用
在线阅读 下载PDF
DSP的DMA通道在高速图像处理系统中的应用 被引量:2
12
作者 袁胜春 向健勇 杜奇 《电子工程师》 2003年第12期4-6,共3页
以高速数字信号处理器ADSP 21060和复杂可编程逻辑器件ACEX EP1K100构成的高速数字图像信号处理器为例,简要介绍了主机ACEX EP1K100与ADSP 21060的直接存储器访问(DMA)。调试结果表明,文中提出的设计方法可以让处理器内核从繁重的图像... 以高速数字信号处理器ADSP 21060和复杂可编程逻辑器件ACEX EP1K100构成的高速数字图像信号处理器为例,简要介绍了主机ACEX EP1K100与ADSP 21060的直接存储器访问(DMA)。调试结果表明,文中提出的设计方法可以让处理器内核从繁重的图像数据搬移工作中解脱出来,让数字信号处理器专心从事图像处理算法工作,显著地提高了系统的并行处理性能。 展开更多
关键词 DSP dma通道 图像处理 数字信号处理器 复杂可编程逻辑器件 直接存储器访问
在线阅读 下载PDF
1MPC8280的AAL2适配与DMA通道驱动软件的实现
13
作者 邵凯 梁燕 黄俊 《国外电子元器件》 2008年第3期59-61,共3页
在TD-SCDMA网络中,ATM适配层采用AAL5和AAL2处理ATM数据。由于目前大部分网络处理器都只支持AAL5的适配,不适合TD网络测试仪的应用。本文介绍了TD-SCDMA网络测试仪中基于PowerPC8280的ATM数据采集与DMA传输的实现方案,重点说明了AAL2适... 在TD-SCDMA网络中,ATM适配层采用AAL5和AAL2处理ATM数据。由于目前大部分网络处理器都只支持AAL5的适配,不适合TD网络测试仪的应用。本文介绍了TD-SCDMA网络测试仪中基于PowerPC8280的ATM数据采集与DMA传输的实现方案,重点说明了AAL2适配以及利用PCI的DMA传输完成上层应用与底层硬件的数据交互。实际应用表明,文中提出的数据采集卡能够正确处理ATM协议的AAL2适配和DMA传输。 展开更多
关键词 MPC8280 ATM适配层2(AAL2) TD-SCdma 直接内存存取(dma)
在线阅读 下载PDF
TMS320C6000的DMA技术 被引量:1
14
作者 胡林 徐胜 《电子产品世界》 2003年第07A期52-54,共3页
采用直接存储器访问(DMA)技术进行数据传输,将数字信号处理器(DSP)从大量的数据传输任务中解放出来,专门从事信号处理任务,将会大大提高系统性能。本文介绍了TMS320C6000系列DMA控制器特点和工程实现,并给出了应用实例。
关键词 TMS320C6000 dma技术 直接存储器访问 数据传输 数字信号处理器 系统性能
在线阅读 下载PDF
EDMA3在LiDAR点云实时处理中的应用
15
作者 刘超 李传荣 +3 位作者 胡坚 贺文静 牛京玉 孟凡荣 《航天返回与遥感》 北大核心 2016年第6期57-65,共9页
针对激光雷达(Light Detection and Ranging,LiDAR)点云解算在轨/机载/车载处理中数据量大、实时性要求较高的需求,需要将LiDAR数据存储在处理速度较快的内部存储器中进行点云解算以提高处理速度。为了解决通常LiDAR数据量较大,内部存... 针对激光雷达(Light Detection and Ranging,LiDAR)点云解算在轨/机载/车载处理中数据量大、实时性要求较高的需求,需要将LiDAR数据存储在处理速度较快的内部存储器中进行点云解算以提高处理速度。为了解决通常LiDAR数据量较大,内部存储器存储空间相对较小的问题,利用处理速度快的内部存储器和存储空间大的外部存储器建立数据缓存机制,用增强型直接内存访问(the Third Generation Enhanced Direct Memory Access,EDMA3)的乒乓缓存技术将LiDAR数据从外部存储器传输到内部存储器中以提高传输速率,并在内部存储器中开辟两个缓存区轮流接收LiDAR数据,以减少传输等待时间。传输LiDAR数据时是分块进行传输的,考虑到LiDAR数据的存储格式,将其按行分块,在DSP开发板上对不同分块大小的LiDAR数据分别进行了EDMA3乒乓读写方式和DSP的CPU读写方式的传输测试。将两种读写方式的数据传输性能进行了对比,验证了EDMA3的应用能够提高LiDAR数据传输速率,并对如何确定合理的数据分块大小,使EDMA3乒乓读写方式传输LiDAR数据的效率更高进行了探讨,对实时实现点云解算有一定的参考意义。 展开更多
关键词 点云解算 数字信号处理器 第三代增强型直接内存访问 乒乓存取
在线阅读 下载PDF
基于CoreConnect总线的DMA控制器设计 被引量:7
16
作者 吴思博 于宗光 《半导体技术》 CAS 北大核心 2020年第1期31-36,共6页
随着片上系统(SOC)规模的不断增大,各外部设备之间大量数据的交互问题成为芯片系统提高性能的瓶颈。提出了一种基于CoreConnect总线架构的直接内存存取(DMA)高速数据传输系统设计方法,并给出了一种较为完善的DMA控制器设计方案。根据DM... 随着片上系统(SOC)规模的不断增大,各外部设备之间大量数据的交互问题成为芯片系统提高性能的瓶颈。提出了一种基于CoreConnect总线架构的直接内存存取(DMA)高速数据传输系统设计方法,并给出了一种较为完善的DMA控制器设计方案。根据DMA在数据传输应用中的特性,减小了外部设备之间数据大量交互对CPU产生的负担,同时解决了处理器内部总线(PLB)上128 bit数据与片上外围总线(OPB)上32 bit数据之间的传输问题,实现PLB与OPB上外部设备之间数据的双向传输。最后给出了相应的功能仿真结果与现场可编程门阵列(FPGA)验证结果。 展开更多
关键词 片上系统(SOC) 直接内存存取(dma)控制器 CoreConnect总线架构 多通道 数据传输
在线阅读 下载PDF
BOOM-KV:基于RDMA的高性能NVM键值数据库
17
作者 李文捷 蒋德钧 +1 位作者 熊劲 包云岗 《高技术通讯》 CAS 2023年第1期29-41,共13页
随着英特尔傲腾数据中心持久化内存模块(DCPMM)开始进入市场以及远程直接内存访问(RDMA)硬件成本的降低,设计融合非易失性内存(NVM)和RDMA的键值(KV)数据库面临新的机遇和挑战。构建基于NVM和RDMA的KV数据库的关键在于设计一个高效的通... 随着英特尔傲腾数据中心持久化内存模块(DCPMM)开始进入市场以及远程直接内存访问(RDMA)硬件成本的降低,设计融合非易失性内存(NVM)和RDMA的键值(KV)数据库面临新的机遇和挑战。构建基于NVM和RDMA的KV数据库的关键在于设计一个高效的通信协议。遗憾的是,现有工作或采用NVM不感知的RDMA协议,或采用低效的NVM感知的RDMA协议,这导致它们无法最大化KV数据库的性能。本文提出了BOOM协议——一种新型的NVM感知的RDMA协议。相较于NVM不感知的协议,BOOM协议允许直接对远端NVM进行RDMA操作,消除了冗余的数据拷贝;相较于现有的NVM感知的协议,它可以显著减少元数据请求,降低KV请求的端对端延迟。在BOOM协议的基础上构建了BOOM-KV,并针对服务端中央处理器(CPU)利用率和宕机持久化等问题进一步进行优化。将BOOM-KV与最新的研究成果进行对比,结果表明,BOOM-KV能显著降低请求延迟,其中PUT延迟最大降低了42%,GET延迟最大降低了41%,并且展现出良好的扩展性。 展开更多
关键词 非易失性内存(NVM) 远程直接内存访问(Rdma) 键值(KV)数据库
在线阅读 下载PDF
DSLR最佳搭档,Lexar Pro UDMA 300X CF卡
18
《电子与电脑》 2007年第11期20-20,共1页
UDMA(Ultra Direct Memory Access)即存储器直接访问.属于硬盘技术的一种.它可以让硬盘直接与内存沟通而无须CPU过多的参与.有利于提高整个系统的效率。美国数码存储品牌Lexar(雷克沙)率先把UDMA技术与SLC制程NAND闪存颗粒相结合... UDMA(Ultra Direct Memory Access)即存储器直接访问.属于硬盘技术的一种.它可以让硬盘直接与内存沟通而无须CPU过多的参与.有利于提高整个系统的效率。美国数码存储品牌Lexar(雷克沙)率先把UDMA技术与SLC制程NAND闪存颗粒相结合,运用到CF上,使小小的CF卡达到了不可思议的45MB/s的写入速度。 展开更多
关键词 CF卡 DSLR Direct Memory NAND闪存 硬盘技术 dma技术 直接访问
在线阅读 下载PDF
基于DMA与中断方式的变电站通信电源监控系统
19
作者 刘晓玥 《通信电源技术》 2021年第10期53-55,共3页
为解决传统监控系统监控精度低和监控数据绝对误差大的问题,开展基于直接存储器访问(Direct Memory Access,DMA)与中断方式的变电站通信电源监控系统研究。硬件设计方面对DMA控制器和系统监控数据存储器进行选型,软件设计方面基于DMA与... 为解决传统监控系统监控精度低和监控数据绝对误差大的问题,开展基于直接存储器访问(Direct Memory Access,DMA)与中断方式的变电站通信电源监控系统研究。硬件设计方面对DMA控制器和系统监控数据存储器进行选型,软件设计方面基于DMA与中断方式实时访问系统前置监控。通过通信电源异常状态监控报警提出一种全新的监控系统,实验结果表明,该系统绝对误差均在0~0.02 V内,具有良好的监控精度。 展开更多
关键词 直接存储器访问(dma) 中断方式 变电站 通信电源 监控系统
在线阅读 下载PDF
面向大模型预训练的智算网络技术研究 被引量:3
20
作者 王学聪 冀思伟 李聪 《电信科学》 北大核心 2024年第6期160-172,共13页
随着人工智能的发展,大规模预训练模型在自然语言处理和计算机视觉等领域都取得了显著成果,促进了智算中心的建设。针对面向大模型预训练的智算网络关键技术展开研究,系统梳理了智算网络国内外最新的标准化进展,提出了一种面向智算网络... 随着人工智能的发展,大规模预训练模型在自然语言处理和计算机视觉等领域都取得了显著成果,促进了智算中心的建设。针对面向大模型预训练的智算网络关键技术展开研究,系统梳理了智算网络国内外最新的标准化进展,提出了一种面向智算网络的目标架构,探讨了智算网络关键技术的原理,包括远程直接内存访问(RDMA)、IB(InfiniBand)、基于以太网的RDMA(RoCE)、集合通信等,同时也分析了智算网络目前存在的问题以及未来的发展趋势,在推动智算网络技术发展、指导智算中心建设等方面具有重要意义。 展开更多
关键词 智算网络 远程直接内存访问 大模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部