期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
嵌入式GPU中二级高速缓存的设计与实现 被引量:2
1
作者 杜慧敏 杨超群 季凯柏 《微电子学与计算机》 CSCD 北大核心 2018年第2期94-99,共6页
针对嵌入式GPU与主存之间进行数据交互时出现速度不匹配的问题,设计了一种适用于嵌入式GPU的二级高速缓存Cache控制器.二级Cache控制器采用四路组相联的映射结构,使用伪最近最少使用(Pseudo_LRU)替换算法,可以管理16~512kB的二级高速缓... 针对嵌入式GPU与主存之间进行数据交互时出现速度不匹配的问题,设计了一种适用于嵌入式GPU的二级高速缓存Cache控制器.二级Cache控制器采用四路组相联的映射结构,使用伪最近最少使用(Pseudo_LRU)替换算法,可以管理16~512kB的二级高速缓存.实验结果表明,当选取Cache大小为128kB时,Cache的命中率达到71.12%. 展开更多
关键词 嵌入式gpu 高速缓存控制器 Rseudo_LRU算法
在线阅读 下载PDF
嵌入式GPU中U型存储布局tile缓存的设计与实现 被引量:2
2
作者 郝武 杜慧敏 +1 位作者 张丽果 黄世远 《微电子学与计算机》 北大核心 2019年第3期91-95,共5页
针对嵌入式GPU tile缓存在线性布局和Z型布局写回时由于地址跨度大而导致cache频繁冲突缺失的问题,设计了一种支持多级U型存储布局的tile缓存,使像素数据写回的地址连续,减少cache的冲突缺失,提高cache命中率.实验结果表明,当配置不同... 针对嵌入式GPU tile缓存在线性布局和Z型布局写回时由于地址跨度大而导致cache频繁冲突缺失的问题,设计了一种支持多级U型存储布局的tile缓存,使像素数据写回的地址连续,减少cache的冲突缺失,提高cache命中率.实验结果表明,当配置不同尺寸的tile缓存时,U型布局相对于线性布局cache命中率提高4%~13%,相对于Z型布局cache命中率提高1%~9%. 展开更多
关键词 嵌入式gpu tile缓存 U型布局
在线阅读 下载PDF
嵌入式GPU存储管理单元的设计与实现 被引量:2
3
作者 张丽果 刘雄 《西安邮电大学学报》 2018年第3期92-96,共5页
针对虚拟存储技术,设计并实现一种适用于嵌入式GPU的存储管理单元的硬件结构。采用两级页表同时匹配方式,对地址转换后援缓冲器结构进行改进,减少页切换;通过每级页表项存储检查标志位,实现存储保护;利用硬件机制处理异常,减少流水线暂... 针对虚拟存储技术,设计并实现一种适用于嵌入式GPU的存储管理单元的硬件结构。采用两级页表同时匹配方式,对地址转换后援缓冲器结构进行改进,减少页切换;通过每级页表项存储检查标志位,实现存储保护;利用硬件机制处理异常,减少流水线暂停导致的时钟周期浪费,从而实现虚拟地址到物理地址的转换。在SIMC0.18μm工艺库进行综合,并在ZC706开发板进行系统级验证,结果表明,该设计频率可达225 MHz,能够实现嵌入式GPU存储管理的要求。 展开更多
关键词 嵌入式gpu 存储管理元 转换后援缓冲器
在线阅读 下载PDF
基于双目相机与嵌入式GPU的SLAM系统设计 被引量:1
4
作者 佘黎煌 童文昊 +1 位作者 孙健伟 许洪瑞 《科技创新与应用》 2021年第4期59-61,66,共4页
定位与地图构建(Simultaneous Localization And Mapping,SLAM)技术在机器人、无人机以及虚拟现实等领域有着广泛的应用。然后由于计算资源等条件的限制,在嵌入式系统中应用SLAM技术仍是一种挑战。文章基于嵌入式GPU技术和双目流摄像头... 定位与地图构建(Simultaneous Localization And Mapping,SLAM)技术在机器人、无人机以及虚拟现实等领域有着广泛的应用。然后由于计算资源等条件的限制,在嵌入式系统中应用SLAM技术仍是一种挑战。文章基于嵌入式GPU技术和双目流摄像头设计实现了嵌入式实时SLAM系统,并结合深度学习的目标识别技术,来进一步优化环境信息的获取并解决环境认知和自身定位等问题。本应用系统样例,综合应用了人工智能、嵌入式操作系统和嵌入式GPU边缘计算技术,是嵌入式技术课程深入建设发展的重要趋势之一。 展开更多
关键词 嵌入教学 嵌入式gpu 双目SLAM 深度学习
在线阅读 下载PDF
基于嵌入式GPU的水声信号处理平台研究 被引量:1
5
作者 刘建涛 张海彬 《舰船电子工程》 2022年第1期146-149,共4页
GPU具有大规模并行运算的特点,使用GPU作为计算节点可以大量节省硬件投入成本。论文通过对GPU硬件架构分析研究GPU做为新一代信号处理平台的优势,通过对CUDA软件架构的分析,研究影响信号处理算法在GPU上的性能的主要因素和提升性能的方... GPU具有大规模并行运算的特点,使用GPU作为计算节点可以大量节省硬件投入成本。论文通过对GPU硬件架构分析研究GPU做为新一代信号处理平台的优势,通过对CUDA软件架构的分析,研究影响信号处理算法在GPU上的性能的主要因素和提升性能的方法。最后在Jetson agx xavier平台上实现波束形成算法,并和CPU与DSP上的运算性能进行对比。 展开更多
关键词 信号处理 嵌入式gpu CUDA 并行
在线阅读 下载PDF
基于嵌入式GPU的通信信号调制方式识别系统及实现
6
作者 曹洁 宋蓓蓓 《无线通信技术》 2020年第3期21-25,共5页
为了实现低成本、小型化无线电监测与识别,基于嵌入式GPU设计了一种通信信号调制方式识别系统。该系统由嵌入式GPU计算单元、无线收发单元、无线通信与定位单元等组成,具有通信信号采集、智能处理、信息远程发布等功能。在该系统上部署... 为了实现低成本、小型化无线电监测与识别,基于嵌入式GPU设计了一种通信信号调制方式识别系统。该系统由嵌入式GPU计算单元、无线收发单元、无线通信与定位单元等组成,具有通信信号采集、智能处理、信息远程发布等功能。在该系统上部署了通信信号采集、二维时频图计算和深度学习分类网络计算等程序。经过大量实际测试,针对BPSK、QPSK、8-PSK等11种调制信号,平均识别精度为89.2%。 展开更多
关键词 调制识别 嵌入式gpu 深度学习
在线阅读 下载PDF
基于嵌入式CPU+GPU异构平台的遥感图像滤波加速 被引量:1
7
作者 谭鹏源 薛长斌 周莉 《空间科学学报》 CAS CSCD 北大核心 2024年第1期95-102,共8页
针对遥感图像在轨实时处理提出一种基于嵌入式CPU+GPU异构平台的遥感图像滤波加速设计方法.以加速拉普拉斯滤波为例,利用GPU的并行计算特点,通过数据划分及数据映射的方法对算法进行并行设计;利用GPU的向量单元和缓存等硬件资源,通过采... 针对遥感图像在轨实时处理提出一种基于嵌入式CPU+GPU异构平台的遥感图像滤波加速设计方法.以加速拉普拉斯滤波为例,利用GPU的并行计算特点,通过数据划分及数据映射的方法对算法进行并行设计;利用GPU的向量单元和缓存等硬件资源,通过采取向量化和向量重组以及工作组调优方法进一步提高了算法的运行速度.在嵌入式开发板上验证了加速设计的可行性和高效性.实验结果表明,相比于单CPU的串行实现,在增加GPU并行处理后的拉普拉斯滤波获得了4.08~16.92倍的加速比.进一步利用GPU硬件资源优化性能后,加速比可达15.38~56.41倍. 展开更多
关键词 嵌入式gpu 遥感图像滤波 OPENCL 向量化 向量重组
在线阅读 下载PDF
基于GPU的并行化运动目标检测方法的研究 被引量:1
8
作者 吴翔翔 范远超 +1 位作者 叶恩光 刘镇 《电子设计工程》 2016年第22期134-137,共4页
在智能视频监控领域中,运动目标检测已经成为主要研究课题之一,针对传统的方向梯度直方图(HOG)算法并行化程度低等问题,采用了基于嵌入式GPU的并行化改进的运动目标检测方法,通过大数据量样本图片和实时采集视频进行检测验证,在GPU并行... 在智能视频监控领域中,运动目标检测已经成为主要研究课题之一,针对传统的方向梯度直方图(HOG)算法并行化程度低等问题,采用了基于嵌入式GPU的并行化改进的运动目标检测方法,通过大数据量样本图片和实时采集视频进行检测验证,在GPU并行化模式下得到的处理速度都比CPU模式下处理速度高3倍以上,从而验证了经并行化优化的HOG算法检测速度明显提高,使系统整体的运行效率得到显著提升。 展开更多
关键词 运动目标检测 嵌入式gpu 并行化 HOG
全文增补中
重心坐标插值的三角形着色算法硬件实现 被引量:2
9
作者 杜慧敏 季凯柏 +1 位作者 蒋忭忭 郭冲宇 《西安邮电大学学报》 2016年第5期39-42,共4页
针对三角形的平滑着色技术,设计并实现一种三角形颜色插值的硬件加速器。根据三角形建立单元输入的三角形顶点数据,利用边界方程计算三角形的面积以及面积倒数。通过扫描转化模块筛选出每个三角形覆盖的有效像素块,最后利用三角形建立... 针对三角形的平滑着色技术,设计并实现一种三角形颜色插值的硬件加速器。根据三角形建立单元输入的三角形顶点数据,利用边界方程计算三角形的面积以及面积倒数。通过扫描转化模块筛选出每个三角形覆盖的有效像素块,最后利用三角形建立单元得到的边界方程值与三角形面积倒数值,通过插值模块实现经过扫描转换模块处理后的三角形内所有片元的颜色插值。测试结果表明,该加速器最大工作频率可达约为222.2 MHz,能够实现嵌入式GPU中图形平滑着色的要求。 展开更多
关键词 重心坐标插值 平滑着色 嵌入式gpu
在线阅读 下载PDF
基于并行化的说话人识别方法的研究
10
作者 刘镇 范远超 +1 位作者 卜禹 陆璐璐 《信息技术》 2017年第10期121-123,128,共4页
随着人工智能时代的到来,语音信号处理已经成为热门的研究方向之一。基于并行化的说话人识别方法,利用拾音器阵列采集多路语音信号,传输到嵌入式GPU系统,在嵌入式GPU系统内依次进行预处理、并行化特征提取和特征匹配并把输出结果进行显... 随着人工智能时代的到来,语音信号处理已经成为热门的研究方向之一。基于并行化的说话人识别方法,利用拾音器阵列采集多路语音信号,传输到嵌入式GPU系统,在嵌入式GPU系统内依次进行预处理、并行化特征提取和特征匹配并把输出结果进行显示。针对现在大数据量的语音信号进行处理,对说话人识别算法进行了并行化改进,优化了语音信号处理等过程,提高说话人识别系统的效率和准确率,增强了说话人识别系统的鲁棒性。 展开更多
关键词 说话人识别 嵌入式gpu 并行化 神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部