期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
SIMD图像处理机存储系统研究
1
作者 段宗涛 沙爱民 孙朝云 《微电子学与计算机》 CSCD 北大核心 2008年第5期114-116,共3页
为了获得尽可能高的并行计算单元的计算能力,对SIMD图像处理机的存储系统进行了深入研究.该存储系统根据图像处理应用的特点,使用基于编译获得的数据流存取全局信息进行数据流调度,有效地提高了数据存取的速度,满足了并行计算单元对数... 为了获得尽可能高的并行计算单元的计算能力,对SIMD图像处理机的存储系统进行了深入研究.该存储系统根据图像处理应用的特点,使用基于编译获得的数据流存取全局信息进行数据流调度,有效地提高了数据存取的速度,满足了并行计算单元对数据存取速度的要求,为SIMD图像处理机系统性能的提高提供了支持. 展开更多
关键词 阵列处理器 协处理器 流调度 双缓冲区 simd
在线阅读 下载PDF
EDO-SIMD:内嵌数据组织的SIMD多媒体扩展指令集
2
作者 刘坤杰 秦兴 +2 位作者 严晓浪 李德贤 彭剑英 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第4期565-570,共6页
针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两... 针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两类特殊扩展指令,并与其他基本指令构成了EDO-SIMD(embedded data organi-zation SIMD)多媒体扩展指令集.性能测试结果表明,EDO-SIMD指令体系可显著降低典型媒体应用核心的非有效计算开销,并提高数据级并行效率. 展开更多
关键词 多媒体处理 单指令多数据 内嵌数据组织
在线阅读 下载PDF
一种基于HXDSP的移位器查找表技术 被引量:1
3
作者 叶鸿 顾乃杰 +2 位作者 林传文 张孝慈 陈瑞 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第10期2044-2050,共7页
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提... 高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1. 15~1. 20的性能提升效果。 展开更多
关键词 数字信号处理器(DSP) 移位器 查找表(LUT) 单指令多数据流(simd) 超长指令字(VLIW)
在线阅读 下载PDF
一种媒体处理器的高级语言及其编译系统
4
作者 张丹 赵银亮 +4 位作者 王海 李增智 宋红 曹德宏 刘波 《微电子学与计算机》 CSCD 北大核心 2004年第12期20-23,27,共5页
媒体处理器通常采用汇编语言编程以满足代码大小、性能和能耗方面的要求。本文提出了媒体处理器高级语言的设计原则,并针对Leadtek公司的媒体处理器设计,实现了VP6-C语言及其编译系统。VP6-C语言用于编写多媒体处理中的核心程序,为程序... 媒体处理器通常采用汇编语言编程以满足代码大小、性能和能耗方面的要求。本文提出了媒体处理器高级语言的设计原则,并针对Leadtek公司的媒体处理器设计,实现了VP6-C语言及其编译系统。VP6-C语言用于编写多媒体处理中的核心程序,为程序员提供一种C风格的、自然的编程方式。试验结果表明编译生成的目标代码有较高的质量。 展开更多
关键词 VP6-C VLIW simd GCC 媒体处理器
在线阅读 下载PDF
AVS熵解码与DSP实现 被引量:6
5
作者 陈光法 姚立敏 虞露 《电视技术》 北大核心 2004年第10期43-46,共4页
阐述了AVS标准的进展情况及AVS标准的特点,重点介绍了AVS熵解码的原理和采用Equator公司MAP-CABSP-15处理器中的协处理器(Vlx)实现AVS熵解码的方法。
关键词 宽带信号处理器 单指令多数据流 AVS标准 协处理器 熵解码
在线阅读 下载PDF
高性能可重构DSP处理器的数据通路设计 被引量:1
6
作者 韩亮 李莺 +1 位作者 张馨 陈杰 《电子科技大学学报》 EI CAS CSCD 北大核心 2005年第2期194-197,共4页
介绍了高性能定点可重构DSP处理器的数据通路设计。该数据通路以功能强大的16位定点计算单元为基础,搭建起高速16位数据处理平台;并能以单指令流多数据流的方式灵活支持多维向量运算;通过重构的方法有效地支持了32位数据处理。
关键词 数字信号处理 数据通路 可重构 单指令流多数据流 并行处理
在线阅读 下载PDF
MPEG-2音频解码算法优化 被引量:1
7
作者 赵永刚 唐昆 +2 位作者 崔慧娟 杜文 杨铭 《电声技术》 北大核心 2003年第12期10-12,22,共4页
以PC机为硬件平台对MPEG-2的音频解码算法进行优化,实现MPEG-2全软件的系统、视频、音频3个部分实时解码。在IDCT和IMDCT中应用了新的快速算法;结合PC机本身的特点及解码过程中有大量的乘加运算采用SIMD(single-instructionmultiple-da... 以PC机为硬件平台对MPEG-2的音频解码算法进行优化,实现MPEG-2全软件的系统、视频、音频3个部分实时解码。在IDCT和IMDCT中应用了新的快速算法;结合PC机本身的特点及解码过程中有大量的乘加运算采用SIMD(single-instructionmultiple-data)来对程序优化,并在实际运算中也对数据结构进行了优化。通过以上的优化使MPEG-2层II解码的运算量减少了40%以上,在奔腾3/450计算机上只占用不到5%的系统资源。这些优化算法已经应用于奔腾3/800为硬件平台的MPEG-2实时解码器中。 展开更多
关键词 MPEG-2 音频解码 simd 离散余弦反变换 修正离散余弦反变换 单指令多数据
在线阅读 下载PDF
视频处理器软硬件协同设计
8
作者 俞国军 刘鹏 +2 位作者 姚庆栋 蒋志迪 蔡卫光 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第7期1117-1122,共6页
为了提高视频图像处理速度与硬件资源利用,针对一种基于精简指令集处理器与数字信号处理器(RISC/DSP)混合体系结构的媒体处理器:浙大数芯(MD32),给出了一种软硬件协同设计策略.所给策略结合视频处理核心算法,研究分析MPEG视频编码标准... 为了提高视频图像处理速度与硬件资源利用,针对一种基于精简指令集处理器与数字信号处理器(RISC/DSP)混合体系结构的媒体处理器:浙大数芯(MD32),给出了一种软硬件协同设计策略.所给策略结合视频处理核心算法,研究分析MPEG视频编码标准的处理过程,进行了视频处理指令扩展设计,提高了数据的并行处理能力,利用了指令内并行执行特性.为有效实现扩展指令,处理器执行级采用了可扩展流水级技术.实验结果表明,指令扩展硬件成本仅占MD32的2.7%,逆离散余弦变换实现性能比MMX/SSE指令集实现的性能分别提高31%和23%,运动补偿性能比MMX指令集实现的性能提高了40%. 展开更多
关键词 视频处理器 视频压缩 协同设计 单指令多数据
在线阅读 下载PDF
Combining Task Scheduling in Power Adaptive Dynamic Reconfigurable System 被引量:2
9
作者 Hui Dong Le-Tian Huang +1 位作者 Jun-Shi Wang Terrence Mak 《Journal of Electronic Science and Technology》 CAS 2012年第4期296-301,共6页
Supplying the electronic equipment by exploiting ambient energy sources is a hot spot. In order to achieve the match between power supply and demands under the variance of environments at real time, a reconfigurable t... Supplying the electronic equipment by exploiting ambient energy sources is a hot spot. In order to achieve the match between power supply and demands under the variance of environments at real time, a reconfigurable technique is taken. In this paper, a dynamic power consumption model by using a lookup table as a unit is proposed. Then, we establish a system-level task scheduling model according to the task type. Based on single instruction multiple data (SIMD) architecture which contains a processing system and a control system with a Nios II processor, a practical dynamic reconfigurable system is built. The approach is evaluated on a hardware platform. The test results show that the system can automatically adjust the power consumption in case of external energy input changing. The utilization of the system dynamic power of their portion is from 80.05% to 91.75% during the first task assignment. During the entire processing cycle, the total energy efficiency is 97.67%. 展开更多
关键词 Nios II power adaptive recon-figuration single instruction multiple data simd taskscheduling model.
在线阅读 下载PDF
视频数字信号处理芯片XY-VDSP的并行性分析
10
作者 李卫华 王保保 韩俊刚 《西安邮电学院学报》 2003年第3期1-5,共5页
视频数字信号处理芯片XY VDSP是采用阵列结构的SIMD处理机。XY VDSP在硬件结构和指令级上采用高度并行,使其可以高效处理视频应用。本文将分析XY VDSP的并行性实现,并以一个矩阵矢量乘加的例子作为说明。
关键词 XY-VDSP 阵列结构 simd 单指令多数据流 并行性 视频数字信号处理
在线阅读 下载PDF
基于CUDA的GPU条件分支分歧聚合优化策略
11
作者 刘素芹 王鑫 +2 位作者 安仲奇 杨娜利 王俊爽 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期174-180,共7页
分析NVIDIA GPU底层处理SIMD条件分支分歧的方式及其对程序性能产生的影响。在软件层级提出两种利用'聚合'思想的SIMD条件分支分歧优化策略:循环推迟和循环提前。策略将不同SIMD道中选择相同路径的条件分支'聚合'到同... 分析NVIDIA GPU底层处理SIMD条件分支分歧的方式及其对程序性能产生的影响。在软件层级提出两种利用'聚合'思想的SIMD条件分支分歧优化策略:循环推迟和循环提前。策略将不同SIMD道中选择相同路径的条件分支'聚合'到同一步循环中,减少了SIMD操作的实际次数。使用CUDA对这两种策略进行的试验结果表明,在满足策略使用条件的前提下能够取得预想中的加速比。该策略实现难度较低、可操作性较强。 展开更多
关键词 simd 条件分支分歧 聚合 循环推迟 循环提前
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部