期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
FC-AE-ASM协议优化设计 被引量:8
1
作者 李攀 田泽 +4 位作者 蔡叶芳 张亦姝 杨海波 霍卫涛 王玉欢 《计算机工程与科学》 CSCD 北大核心 2017年第2期280-284,共5页
参照文献资料对光纤通道FC协议的多种实现方式,深入研究光纤通道-航空电子环境-匿名订户消息FC-AE-ASM协议,基于Xilinx FC-IP核,对FC-AE-ASM协议实现流程中涉及到的ASM消息的接收/发送过程进行优化设计,遵循的原则是尽可能使用硬件电路... 参照文献资料对光纤通道FC协议的多种实现方式,深入研究光纤通道-航空电子环境-匿名订户消息FC-AE-ASM协议,基于Xilinx FC-IP核,对FC-AE-ASM协议实现流程中涉及到的ASM消息的接收/发送过程进行优化设计,遵循的原则是尽可能使用硬件电路,减少软件干预,提高协议处理和执行效率,以满足航空电子环境低延迟、实时性需求。最后使用Verilog语言对优化后的协议处理流程进行了实现,Modelsim仿真结果表明,FC链路速率为2.125/1.062 5Gbps时,最大有效载荷的ASM消息最大接收和发送带宽可达到FC链路线速率带宽,能够满足FC-AE-ASM协议实时性的要求,为在航空电子环境中构建嵌入式光纤通道网络提供参考。 展开更多
关键词 光纤通道 FC—AE—ASM 嵌入式系统 优先级调度 DMA
在线阅读 下载PDF
一种面向二维三维卷积的GPGPU cache旁路系统 被引量:1
2
作者 贾世伟 张玉明 +2 位作者 秦翔 孙成璐 田泽 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第2期92-100,共9页
通用图形处理器作为卷积神经网络的核心加速平台,其处理二维、三维卷积的性能,决定着神经网络在实时目标识别检测领域的有效应用。然而,受其固有cache系统功能的限制,当前通用图形处理器架构无法实现二维、三维卷积的高效加速。针对此问... 通用图形处理器作为卷积神经网络的核心加速平台,其处理二维、三维卷积的性能,决定着神经网络在实时目标识别检测领域的有效应用。然而,受其固有cache系统功能的限制,当前通用图形处理器架构无法实现二维、三维卷积的高效加速。针对此问题,首先提出一种L1Dcache动态旁路设计方案。该方案定义了一组能够动态反映指令访问cache特征的数据结构,并基于此数据结构定义访存特征记录表,以记录不同访存指令在请求cache时的执行状态。其次,采用优先线程块的warp调度策略来加速访存状态的采样。最后根据访存状态得出不同PC值下访存请求对L1Dcache的旁路的判定,并动态完成部分低局域性数据请求对L1Dcache的旁路。由此将L1Dcache空间保留给高局域性的数据并降低二维、三维卷积执行时的访存阻塞周期,进而提升了二维、三维卷积在通用图形处理器上执行时的访存效率。实验结果表明,相比原架构,在面向二维、三维卷积时分别带来了约2.16%与19.79%的性能提升,体现了设计方案的有效性与实用性。 展开更多
关键词 卷积 通用图形处理器 存储系统 cache旁路
在线阅读 下载PDF
图形命令大规模并行解析程序设计方法
3
作者 刘晖 田泽 +1 位作者 张琛 苏东阁 《计算机应用研究》 CSCD 北大核心 2020年第S02期214-215,226,共3页
超长图形流水线中图形命令执行的并行度直接制约图形处理的绘图及计算性能,图形命令解析程序完成图形接口到硬件可识别任务的映射,通过图形绘制接口的特征分类与特征提取,提出一种满足图形指令功能解析、符合图形流水线任务映射的编程... 超长图形流水线中图形命令执行的并行度直接制约图形处理的绘图及计算性能,图形命令解析程序完成图形接口到硬件可识别任务的映射,通过图形绘制接口的特征分类与特征提取,提出一种满足图形指令功能解析、符合图形流水线任务映射的编程结构和程序设计方法,加速了图形命令处理,并通过分析任务的处理流程与特征,设计了运行管理、中断管理与低功耗管理,提高了程序设计及功能执行的健壮性与时效性。 展开更多
关键词 图形命令 大规模并行 命令处理器
在线阅读 下载PDF
一种SATA Ⅲ失调锁相环扩频时钟产生器设计
4
作者 龙强 田泽 +1 位作者 唐龙飞 王晋 《无线电通信技术》 2016年第6期73-76,共4页
扩频时钟产生器可以分散频率谐波的能量、减小单位带宽内的辐射能量,因此,扩频时钟产生器广泛应用在SATA Ⅲ等系统中。给出了一种基于失调锁相环技术的SATA Ⅲ扩频时钟产生器的设计方法。在扩频时钟产生器中,一个低频扩频信号和一个直... 扩频时钟产生器可以分散频率谐波的能量、减小单位带宽内的辐射能量,因此,扩频时钟产生器广泛应用在SATA Ⅲ等系统中。给出了一种基于失调锁相环技术的SATA Ⅲ扩频时钟产生器的设计方法。在扩频时钟产生器中,一个低频扩频信号和一个直接数字频率合成器进行频率合成,然后和一个高频信号混频,产生一个更高的调制参考源。扩频时钟产生器采用1.2 V 0.13μm CMOS工艺,功耗为21.16 m W,主要的频率功率减小了16 d B,芯片面积0.7*0.45 mm2。测试结果表明,采用失调锁相环技术,扩频时钟产生器具有较低的时钟抖动,较小的EMI辐射功率,较好地满足了SATA Ⅲ的需求。 展开更多
关键词 扩频时钟产生器 锁相环 SATA III 失调
在线阅读 下载PDF
一种基于相位插值器的低抖动串行链路接收器 被引量:1
5
作者 吕俊盛 邵刚 田泽 《半导体技术》 CAS CSCD 北大核心 2016年第6期429-434,共6页
为了提高接收器在多通道和多协议应用中的性能,提出了一种基于高线性度相位插值器的低抖动串行链路接收器。采用环形压控振荡器锁相环提供参考时钟,通过数字滤波器控制相位插值器调整采样时钟相位从而完成低抖动的数据恢复。整个接收器... 为了提高接收器在多通道和多协议应用中的性能,提出了一种基于高线性度相位插值器的低抖动串行链路接收器。采用环形压控振荡器锁相环提供参考时钟,通过数字滤波器控制相位插值器调整采样时钟相位从而完成低抖动的数据恢复。整个接收器在65 nm CMOS工艺平台实现流片验证,单通道接收器的面积为320μm×685μm。测试结果表明,接收器工作在3.125 Gbit/s时,引入的总抖动仅为11.3 ps;电路采用1.2 V供电,功耗仅为21 m W;在PCIE,FC和SRIO三种协议规定的1.062 5-3.125 Gbit/s数据率下,收发器的误码率均小于10-12。 展开更多
关键词 多通道 多协议 低抖动 相位插值器 接收器
在线阅读 下载PDF
复杂环境下基于改进YOLOv5的手势识别方法 被引量:11
6
作者 闫颢月 王伟 田泽 《计算机工程与应用》 CSCD 北大核心 2023年第4期224-234,共11页
针对目前复杂环境下因光照不均匀、背景近肤色以及手势尺度较小等原因导致的手势检测算法识别率低的问题,提出了一种手势识别方法 HD-YOLOv5s。首先采用基于Retinex理论的自适应Gamma图像增强预处理方法降低光照变化对手势识别效果的影... 针对目前复杂环境下因光照不均匀、背景近肤色以及手势尺度较小等原因导致的手势检测算法识别率低的问题,提出了一种手势识别方法 HD-YOLOv5s。首先采用基于Retinex理论的自适应Gamma图像增强预处理方法降低光照变化对手势识别效果的影响;其次构建具有自适应卷积注意力机制SKNet的特征提取网络,提高网络的特征提取能力,减少复杂环境中的背景干扰问题;最后在特征融合网络中构建新型的双向特征金字塔结构,充分利用低层级特征以降低浅层语义信息的丢失,提高小尺度手势的检测精度,同时采用跨层级联的方式,进一步提高模型的检测效率。为了验证改进方法的有效性,分别在具有丰富光照强度对比的自制数据集和具有复杂背景的公共数据集NUS-Ⅱ上进行实验,识别率达到了99.5%和98.9%,单帧照片的检测时间仅需0.01~0.02 s。 展开更多
关键词 手势识别 YOLOv5 目标检测 注意力机制 双向特征金字塔
在线阅读 下载PDF
保持几何特征的导弹发射车模型简化算法 被引量:1
7
作者 姜艺诺 王伟 田泽 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第3期150-157,共8页
针对传统QEM算法对导弹发射车等三角形网格较多、结构复杂的三维模型简化时存在的几何特征丢失问题,提出了一种改进算法。在QEM算法的基础上引入三角形折叠,计算模型简化前后的体积比并通过计算局部顶点的高斯加权曲度得到网格显著度,... 针对传统QEM算法对导弹发射车等三角形网格较多、结构复杂的三维模型简化时存在的几何特征丢失问题,提出了一种改进算法。在QEM算法的基础上引入三角形折叠,计算模型简化前后的体积比并通过计算局部顶点的高斯加权曲度得到网格显著度,将上述2种权值作为约束因子引入到三角形折叠误差代价中,通过折叠代价大小决定三角形折叠次序。实验表明:使用改进算法得到简化模型的平均误差稳定在0.069 mm内,简化后模型视觉以及几何质量明显优于传统方法,对于提高复杂军事模拟场景的渲染效率提供了理论基础。 展开更多
关键词 网格简化 二次误差 体积比 双边滤波 网格显著度
在线阅读 下载PDF
面向OpenGL 2.0的图形处理器图像处理单元体系结构 被引量:2
8
作者 任向隆 田泽 +8 位作者 张骏 郑新建 韩立敏 王治 张亮 李哲 许宏杰 刘航 张宏伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第10期1858-1870,共13页
为实现图形处理器的自主可控,设计了面向OpenGL2.0图形处理器图像处理单元的体系结构.首先,确定了图像处理单元的单元结构及工作流程;其次,针对每条所处理的函数设计了数据通路;随后,依据各函数的数据通路和OpenGL规范,整理了各模块的... 为实现图形处理器的自主可控,设计了面向OpenGL2.0图形处理器图像处理单元的体系结构.首先,确定了图像处理单元的单元结构及工作流程;其次,针对每条所处理的函数设计了数据通路;随后,依据各函数的数据通路和OpenGL规范,整理了各模块的处理函数对照表;最后,实现了其体系结构,并在虚拟仿真和FPGA平台进行了纹理加载/获取、卷积、颜色表、柱状图等功能验证,对纹理加载进行了峰值性能验证,面向FPGA和ASIC进行了代价评估.结果表明,该结构能够实现图像处理单元所规定的系列功能,性能满足设计要求,峰值情况每秒可处理30帧2K×2K图像,实现代价可接受.目前,该图像处理单元已集成到完全自主研发的图形处理器之中. 展开更多
关键词 图形处理器 图像处理单元 图像管线 图像处理子集 像素传输 OPENGL 2.0
在线阅读 下载PDF
基于图元光栅化触发的高效GPU深度数据预取
9
作者 田泽 张骏 许宏杰 《高技术通讯》 CAS 2022年第11期1126-1133,共8页
数据预取技术已经广泛应用在各类中央处理器(CPU)设计领域,取得了很好的效果。而图形处理器(GPU)对存储带宽的需求更为巨大,与图形渲染流水线和图形算法直接相关,且数据访问模式与通用CPU有显著差异,需要更有针对性的有效数据预取机制... 数据预取技术已经广泛应用在各类中央处理器(CPU)设计领域,取得了很好的效果。而图形处理器(GPU)对存储带宽的需求更为巨大,与图形渲染流水线和图形算法直接相关,且数据访问模式与通用CPU有显著差异,需要更有针对性的有效数据预取机制。针对GPU深度测试关键功能,本文提出一种图元光栅化触发的高效深度数据预取机制——DPRT,通过图元光栅化过程中实时扫描到的片段块地址来触发Z缓存(Z Cache)的深度数据预取,同时为了适应不同实现中流水线处理延迟,为Z Cache数据块增加访问一次标志(OTT),保证深度数据预取有效性。实验结果表明,DPRT使深度测试时Z Cache访问命中率平均提升9.51%,深度测试延迟平均降低40.43%。 展开更多
关键词 图形处理器(GPU) 光栅化 扫描 深度测试
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部