期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于ZYNQ的稠密光流法软硬件协同处理 被引量:4
1
作者 王芝斌 阳文敏 +1 位作者 张圆蒲 柴志雷 《计算机工程与应用》 CSCD 2014年第18期44-49,共6页
光流法是计算机视觉中一个基础性的算法,可广泛应用于运动检测、运动估计、视频分析等领域。但光流法最大的问题是计算复杂、速度慢,限制了它在实际系统尤其是嵌入式系统中的应用。利用最新的高层综合(HLS)语言与传统的硬件描述语言相结... 光流法是计算机视觉中一个基础性的算法,可广泛应用于运动检测、运动估计、视频分析等领域。但光流法最大的问题是计算复杂、速度慢,限制了它在实际系统尤其是嵌入式系统中的应用。利用最新的高层综合(HLS)语言与传统的硬件描述语言相结合,在Xilinx的FPGA异构系统芯片(即ZYNQ)平台上,以软硬件协同的工作方式,设计了基于Horn-Schunck稠密光流法的硬件加速器。实验证明,对于640×480大小的图片,软硬件协同处理比纯软件处理的计算性能提高了34倍,执行时间从24.40 s降低到0.71 s。 展开更多
关键词 光流加速器 ZYNQ 高层综合语言 硬件协同处理 可编程器件
在线阅读 下载PDF
基于数据分布一致性的处理器硬件性能计数器复用估计方法 被引量:5
2
作者 林新华 王杰 +1 位作者 王一超 左思成 《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1192-1201,共10页
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,M... 同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%. 展开更多
关键词 处理硬件性能计数器 复用技术 性能分析 高性能计算 估计方法
在线阅读 下载PDF
基于现代硬件的并行内存排序方法综述 被引量:13
3
作者 郭诚欣 陈红 +2 位作者 孙辉 李翠平 吴天贞 《计算机学报》 EI CSCD 北大核心 2017年第9期2070-2092,共23页
研究了现代硬件上的并行内存排序方法,对其研究现状与进展进行了综述.首先简要阐述了经典排序算法以及排序网络的优缺点,分析其并行优化的适用性,然后从现代CPU处理器设备(多核、配备大内存)、图形处理器(GPU)、现场可编程逻辑门阵列(FP... 研究了现代硬件上的并行内存排序方法,对其研究现状与进展进行了综述.首先简要阐述了经典排序算法以及排序网络的优缺点,分析其并行优化的适用性,然后从现代CPU处理器设备(多核、配备大内存)、图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)等新型处理器设备介绍现有排序方法的研究成果.处理器设备的架构不同,对排序算法的优化策略也不同,现代CPU主要利用线程的本地存储层次优化数据在存储单元中的排列,以减少访存次数及减少访存缺失,同时利用单指令多数据流技术(SIMD),以提高算法的数据级并行度;GPU则需要将多个线程组织成线程块,依靠共享内存提高线程块的访存速度,而在线程块内则使用单指令多线程(SIMT)技术提高线程的执行效率;FPGA则更靠近于硬件底层,受到自身的资源限制,FPGA的优化策略主要依靠硬件描述语言或高级综合语言优化电路的设计,提高资源利用率的同时增加FPGA的吞吐量.现有的成果表明,GPU的并行内存排序性能优于CPU端上的并行内存排序性能.作者最后对未来的研究方向进行了展望. 展开更多
关键词 现代硬件处理 排序算法 存储访问层次 并行优化 图形处理 现场可编程逻辑门阵列
在线阅读 下载PDF
实时VLBI处理机技术 被引量:3
4
作者 郑为民 张娟 +3 位作者 徐志骏 刘磊 童力 张秀忠 《深空探测学报(中英文)》 2020年第4期354-361,共8页
实时处理机是探月工程VLBI测轨分系统数据处理中心的核心设备。软件处理机是自主开发的实时并行信号处理软件,运行于CPU+GPU结构的高性能集群服务器平台,硬件处理机是基于大规模FPGA器件研制的专用高速信号处理机。它们采用FX型结构,具... 实时处理机是探月工程VLBI测轨分系统数据处理中心的核心设备。软件处理机是自主开发的实时并行信号处理软件,运行于CPU+GPU结构的高性能集群服务器平台,硬件处理机是基于大规模FPGA器件研制的专用高速信号处理机。它们采用FX型结构,具备数据实时接收、解码、相关处理、相位校正信号提取、实时监视等功能。当探测器预报时延模型精度不够时,处理机系统可通过特殊的条纹搜索功能,现场实时自主重构高精度时延模型,引导处理机完成探测器信号相关处理。经过工程验证,月球探测器VLBI测定轨的总实时数据速率达到了512 Mbps。 展开更多
关键词 VLBI 软件相关处理 硬件相关处理 并行计算 条纹搜索
在线阅读 下载PDF
媒体处理器协同仿真平台中集成USB接口的研究 被引量:1
5
作者 陈若愚 姚庆栋 +2 位作者 刘鹏 王维东 蒋志迪 《计算机工程》 EI CAS CSCD 北大核心 2005年第1期225-227,共3页
分析了USB接口总线和媒体处理器的紧密联系,根据USB接口的规范协议,设计了集成于媒体处理器的USB1.1 IP核,开发了驱动程序。并在媒体处理器软硬件协同仿真验证平台上验证了USB核和驱动程序的正确性和稳定性。
关键词 媒体处理器软硬件协同仿真验证平台 USB核 驱动程序
在线阅读 下载PDF
红外弱小目标检测跟踪与实现 被引量:3
6
作者 李建勋 张世俊 +3 位作者 陈非 刘刚 刘广智 敬忠良 《系统工程与电子技术》 EI CSCD 北大核心 2006年第1期11-14,118,共5页
针对红外序列图像中弱小目标的检测问题,提出了一种基于旋转均值滤波的弱小目标检测方法,同时利用数据关联进行多帧积累实现序列图像跟踪。基于Hunt Engineering的HEPC9、双DSPC6201和双FPGA搭建了一套实时红外图像处理系统,并将上述检... 针对红外序列图像中弱小目标的检测问题,提出了一种基于旋转均值滤波的弱小目标检测方法,同时利用数据关联进行多帧积累实现序列图像跟踪。基于Hunt Engineering的HEPC9、双DSPC6201和双FPGA搭建了一套实时红外图像处理系统,并将上述检测、跟踪算法成功移植于DSPC6201硬件处理器。实测数据的实时处理证明,上述方法可实时和有效地检测和跟踪低信噪比(≈2)复杂序列图像,系统处理能力为50帧/s,320*240/帧,14位/像素(双6XDSP)。 展开更多
关键词 旋转均值滤波 数据关联 双DSPC6201硬件处理
在线阅读 下载PDF
微机实验室管理全攻略 被引量:13
7
作者 陆文捷 《实验室研究与探索》 CAS 2005年第8期35-37,45,共4页
怎样有效地建立和管理好一个中小型的微机室,是许多学校的微机管理人员共同关心的问题,本文结合了在微机实验室建设中的实践和体会,介绍了在微机实验室管理过程中一些常见问题的解决和处理方法,以及常见故障的处理方法。
关键词 微机实验室管理 软件安装 硬件处理 微机常见故障处理
在线阅读 下载PDF
图象帧存的计算机映射
8
作者 苏光大 《电信科学》 1988年第7期28-32,共5页
本文论述了图象帧存的计算机映射技术。帧存作为计算机内存的一部分,计算机可对其进行直接或间接的访问。本文提出了帧存的可变多周期嵌套技术。
关键词 映射技术 内存地址 硬件地址 图象处理 图象显示 交叉存取 存储芯片 读写周期 间接访问 硬件处理
在线阅读 下载PDF
基于DSP的AdaBoost人脸检测算法实现 被引量:5
9
作者 金友芝 苏光大 魏良 《计算机工程与设计》 CSCD 北大核心 2008年第14期3654-3656,共3页
为解决人脸检测实时性问题,提出了基于DSP实现人脸检测算法。改进了AdaBoost人脸检测算法,在层次型AdaBoost检测算法的基础上,改进了特征定义方式,提出模糊层次型人脸检测器结构。介绍了TI公司的DSP芯片及其外围电路,描述了系统中各个... 为解决人脸检测实时性问题,提出了基于DSP实现人脸检测算法。改进了AdaBoost人脸检测算法,在层次型AdaBoost检测算法的基础上,改进了特征定义方式,提出模糊层次型人脸检测器结构。介绍了TI公司的DSP芯片及其外围电路,描述了系统中各个模块的工作流程。最后,阐述了利用CCS对DSP程序进行优化。实验结果表明,在输入图像大小为256×256像素的条件下,检测速度达到每秒26帧,误检率只有0.9%,实现了实时人脸检测的要求。 展开更多
关键词 人脸检测 硬件处理 层次型分类器 视频采集 算法优化
在线阅读 下载PDF
基于SCA的SHP组件动态部署方案
10
作者 刘青 施峻武 曹凯 《计算机工程》 CAS CSCD 2012年第7期227-229,232,共4页
在软件通信体系结构(SCA)中,调制解调级硬件抽象层(MHAL)规范不支持专用硬件处理器(SHP)中组件的动态部署。为此,提出一种基于SCA的SHP组件动态部署方案。介绍MHAL通信机制,设计硬件装配描述文件和硬件组件描述文件,在此基础上实现动态... 在软件通信体系结构(SCA)中,调制解调级硬件抽象层(MHAL)规范不支持专用硬件处理器(SHP)中组件的动态部署。为此,提出一种基于SCA的SHP组件动态部署方案。介绍MHAL通信机制,设计硬件装配描述文件和硬件组件描述文件,在此基础上实现动态部署。分析结果表明,该方案能实现波形开发和部署阶段软件与硬件的分离,增强SCA对SHP的兼容性。 展开更多
关键词 软件通信体系结构 专用硬件处理 动态部署 波形
在线阅读 下载PDF
Kernel-based virtual machine事件跟踪机制的设计与实现 被引量:1
11
作者 刘锋 雷航 李晓瑜 《计算机应用》 CSCD 北大核心 2008年第S2期285-287,共3页
分析了基于处理器硬件虚拟化技术实现的KVM子系统的架构。针对KVM跟踪独立事件信息的局限性,提出一种新的KVM事件跟踪机制(kvmtrace)来达到性能调节的目的,并使用relayfs接口进行了设计与实现。同时探讨了Linux kernel Markers实现机制... 分析了基于处理器硬件虚拟化技术实现的KVM子系统的架构。针对KVM跟踪独立事件信息的局限性,提出一种新的KVM事件跟踪机制(kvmtrace)来达到性能调节的目的,并使用relayfs接口进行了设计与实现。同时探讨了Linux kernel Markers实现机制及其在kvmtrace的实际应用。 展开更多
关键词 处理硬件虚拟化 KVM kvmtrace
在线阅读 下载PDF
基于SCA的SHP组件部署策略
12
作者 刘青 曹凯 徐春林 《现代电子技术》 2012年第3期77-80,共4页
针对软件通信体系(SCA)中部署决策机制不能有效解决专用硬件处理器(SHP)上组件部署决策的问题,提出了基于对称结构的部署模型,设计了软件包部署描述文件和部署方案的评价函数,在此基础上给出了完整的SHP组件部署策略,实现了SHP组件到SH... 针对软件通信体系(SCA)中部署决策机制不能有效解决专用硬件处理器(SHP)上组件部署决策的问题,提出了基于对称结构的部署模型,设计了软件包部署描述文件和部署方案的评价函数,在此基础上给出了完整的SHP组件部署策略,实现了SHP组件到SHP设备的自动映射,增强了SCA对SHP的兼容性。 展开更多
关键词 软件通信体系 部署 专用硬件处理 组件 软件部署描述 软件包描述 资源调度
在线阅读 下载PDF
一种新的多普勒中心频率实时估计算法 被引量:3
13
作者 刘波 王贞松 +1 位作者 姚萍 李明峰 《计算机研究与发展》 EI CSCD 北大核心 2005年第11期1911-1917,共7页
针对可编程器件实现合成孔径雷达多普勒中心频率实时估计问题,提出了复符号估计算法·新算法利用合成孔径雷达回波先验零均值圆对称复高斯分布统计特性,运用复反正弦定律非线性估计回波相关值,降低了多普勒中心频率估计复杂度,适合... 针对可编程器件实现合成孔径雷达多普勒中心频率实时估计问题,提出了复符号估计算法·新算法利用合成孔径雷达回波先验零均值圆对称复高斯分布统计特性,运用复反正弦定律非线性估计回波相关值,降低了多普勒中心频率估计复杂度,适合硬件实现·分析和仿真结果表明,与已有的符号多普勒中心频率估计算法相比,复符号多普勒中心频率估计算法不但大大降低了运算量和相应硬件的实现面积,提高了整个多普勒中心频率估计运算部件的运行效率,而且具有与其相当的估计性能· 展开更多
关键词 多普勒中心频率 复符号估计算法 硬件信号处理
在线阅读 下载PDF
高速稳定内窥光学相干层析成像系统 被引量:1
14
作者 刘勤颖 唐玉国 +2 位作者 欧阳楠 李桂琴 李敏 《光学精密工程》 EI CAS CSCD 北大核心 2021年第10期2340-2348,共9页
为了实现消化道高速在体病理诊断,提出了一种高速并稳定成像的内窥扫频光学相干层析成像系统设计。为了实现高速内窥成像,采用200 kHz扫频光源研制了高速内窥扫频光学相干层析成像系统,并利用现场可编程门阵列和图形处理单元相结合的硬... 为了实现消化道高速在体病理诊断,提出了一种高速并稳定成像的内窥扫频光学相干层析成像系统设计。为了实现高速内窥成像,采用200 kHz扫频光源研制了高速内窥扫频光学相干层析成像系统,并利用现场可编程门阵列和图形处理单元相结合的硬件加速处理技术实现了数据的实时处理;为了提高成像稳定性,利用码盘反馈的脉冲信号进行系统逻辑控制,有效校正了图像漂移;对系统的成像速度和图像稳定性进行了测试分析,并进行了小鼠结直肠成像实验。实验结果表明:当图像尺寸为1024×1333时,系统实时成像速度可达141 frame/s;在逻辑控制时序下,系统图像稳定性从87.0%提高到98.6%以上;小鼠结直肠光学相干层析成像结果与病理切片结果一致。本文研制的系统具有高速稳定成像的特点,可在体、实时、清晰地区分小鼠结直肠组织的层析结构,有望为消化道等体腔疾病在体实时病理诊断提供一种全新的诊断方法。 展开更多
关键词 医用光学与生物光学 光学相干层析成像 内窥成像 硬件加速数据处理
在线阅读 下载PDF
基于层渲染的CSM 被引量:1
15
作者 郝钰 李毅 《计算机工程与设计》 CSCD 北大核心 2012年第10期3882-3886,共5页
为在大规模场景中产生良好的阴影效果,提出一种基于层的改进型CSM(级联阴影图)算法,通过GPU(可编程图形处理硬件)、几何着色器和层渲染的使用,分割视椎体,对每个视椎体生成阴影图,渲染阴影,解决传统的单Pass阴影图算法的走样问题和多Pas... 为在大规模场景中产生良好的阴影效果,提出一种基于层的改进型CSM(级联阴影图)算法,通过GPU(可编程图形处理硬件)、几何着色器和层渲染的使用,分割视椎体,对每个视椎体生成阴影图,渲染阴影,解决传统的单Pass阴影图算法的走样问题和多Pass的阴影图算法CSM由于多Pass的原因使得应用的帧率几乎是以Pass数线性降低,而限制了其在大规模场景中应用的问题。实验结果表明该方法在大规模仿真系统(塔台模拟系统)下能够高效真实的渲染出阴影效果,有较高的绘制效率和真实感。 展开更多
关键词 可编程图形处理硬件 级联阴影图 几何着色器 层渲染 阴影图算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部