期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于单指令多数据流技术的视频信息处理优化 被引量:1
1
作者 赵鹤群 《信息技术与信息化》 2020年第10期33-35,共3页
单指令多数据流技术是目前视频信息处理中比较常用的技术,和传统处理技术相比,单指令多数据流技术可通过一个控制器来同时开展多个处理器,每组数据又可实现独立操作和执行,真正意义上实现了视频信息空间上的并行处理。基于此,本文结合... 单指令多数据流技术是目前视频信息处理中比较常用的技术,和传统处理技术相比,单指令多数据流技术可通过一个控制器来同时开展多个处理器,每组数据又可实现独立操作和执行,真正意义上实现了视频信息空间上的并行处理。基于此,本文结合理论实践,先分析了单指令多数据流技术的优势,接着探讨了单指令多数据流技术在视频信息处理优化中应用的关键技术,最后提出相应的优化方法并探讨了优化效果,希望对提升视频信息处理质量和效率有一定参考及借鉴。 展开更多
关键词 单指令 多数据 视频信息 处理优化
在线阅读 下载PDF
基于单指令多数据流技术的视频信息处理优化
2
作者 王恒 《煤炭技术》 CAS 北大核心 2012年第11期180-182,共3页
文章以H.264编码为例,首先对单指令多数据指令系统进行了简单介绍,并在该技术基础之上,分别从H.264整数离散余弦变换、量化以及运动估计等方面分析和探讨了依托于单指令多数据流技术的视频信息处理的优化方式,与之前的程序编码技术相比... 文章以H.264编码为例,首先对单指令多数据指令系统进行了简单介绍,并在该技术基础之上,分别从H.264整数离散余弦变换、量化以及运动估计等方面分析和探讨了依托于单指令多数据流技术的视频信息处理的优化方式,与之前的程序编码技术相比较而言,经过优化处理的程序编码速率提升了数倍。 展开更多
关键词 单指令多数据流技术 视频信息处理 优化 整数离散余弦变换
在线阅读 下载PDF
基于申威SIMD指令的H.264编码优化 被引量:2
3
作者 黄朴 刘世巍 +1 位作者 张昊 王聪 《现代电子技术》 北大核心 2024年第6期49-54,共6页
国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIM... 国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIMD指令系统,提出一种基于申威架构的SIMD指令集H.264编码优化方法。结合申威处理器的并行结构特点,利用申威适配的Perf、Top指令等系统性能分析工具,采集两种主流视频分辨率下与编码性能强相关的高频热点函数,详细分析其程序并行化可行性,采用手工嵌入申威SIMD和访存扩展等汇编指令进行细粒度优化。实验结果表明,该方法在申威架构下的H.264平均编码性能提升了约30%。相应工作成果已推送到申威社区,增强了基于申威处理器的国产计算机在桌面多媒体应用领域的工作体验。 展开更多
关键词 单指令多数据 H.264标准 申威处理器 热点函数 程序并行化 细粒度
在线阅读 下载PDF
EDO-SIMD:内嵌数据组织的SIMD多媒体扩展指令集
4
作者 刘坤杰 秦兴 +2 位作者 严晓浪 李德贤 彭剑英 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第4期565-570,共6页
针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两... 针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两类特殊扩展指令,并与其他基本指令构成了EDO-SIMD(embedded data organi-zation SIMD)多媒体扩展指令集.性能测试结果表明,EDO-SIMD指令体系可显著降低典型媒体应用核心的非有效计算开销,并提高数据级并行效率. 展开更多
关键词 多媒体处理 单指令多数据 内嵌数据组织
在线阅读 下载PDF
基于SIMD体系结构的数据相关控制语句转化方法 被引量:1
5
作者 高巍 宋妍 《微电子学与计算机》 CSCD 北大核心 2009年第8期182-185,共4页
数据并行应用具有规则的结构,该结构可以描述为一系列算术运算函数在数据流上的操作.对应于此应用的SIMD体系结构,可以充分利用这种规则性来提高性能.然而,含有数据相关控制结构的应用,在SIMD体系结构上的执行效率却很低.将数据相关的... 数据并行应用具有规则的结构,该结构可以描述为一系列算术运算函数在数据流上的操作.对应于此应用的SIMD体系结构,可以充分利用这种规则性来提高性能.然而,含有数据相关控制结构的应用,在SIMD体系结构上的执行效率却很低.将数据相关的控制结构转化成数据传输,就可以使含有数据相关控制流的应用在SIMD体系结构上高效执行.这种转化技术使更多的应用可以在SIMD体系结构上高效运行. 展开更多
关键词 数据相关控制 simd 共享控制器 图像
在线阅读 下载PDF
BWDSP SIMD指令的WHIRL中间表示生成研究 被引量:1
6
作者 王昊 王向前 《中国集成电路》 2015年第3期30-35,共6页
WHIRL是Open64采用的一种通用的中间表示,支持多种高级语言和多种目标机。Open64的后端优化工作都是基于WHIRL设计的。BWDSP是一款支持SIMD指令的数字信号处理器,SIMD指令能够提高该处理器的指令并行性。SIMD优化也需要产生WHIRL中间表... WHIRL是Open64采用的一种通用的中间表示,支持多种高级语言和多种目标机。Open64的后端优化工作都是基于WHIRL设计的。BWDSP是一款支持SIMD指令的数字信号处理器,SIMD指令能够提高该处理器的指令并行性。SIMD优化也需要产生WHIRL中间表示,本文对如何产生BWDSP SIMD指令的WHIRL中间表示进行了研究,并在BWDSP的编译器OCC上得以实现。 展开更多
关键词 数字信号处理器 单指令多数据 WHIRL 中间表示
在线阅读 下载PDF
一种基于嵌入式微处理器SIMD核的可重构数据总线设计
7
作者 王光 《电子产品世界》 2012年第11期32-34,共3页
提出了一种基于可重构总线的数据并行体系结构。首先,针对现代多媒体处理中存在的问题,提出了一种基于可重构总线的一维处理单元阵列体系结构;其次,设计各处理单元之间的通信模块以及处理元之间的数据传递方式,即可重构数据总线的设计;... 提出了一种基于可重构总线的数据并行体系结构。首先,针对现代多媒体处理中存在的问题,提出了一种基于可重构总线的一维处理单元阵列体系结构;其次,设计各处理单元之间的通信模块以及处理元之间的数据传递方式,即可重构数据总线的设计;最后,通过对几种常用的图像处理算法的验证,表明基于可重构总线的一维SIMD体系结构在逻辑上具有可行性。 展开更多
关键词 可重构总线 数据并行体系结构 FPGA simd
在线阅读 下载PDF
基于SIMD体系结构的指令级并行结构设计 被引量:4
8
作者 刘有耀 张仲伟 《电子设计工程》 2017年第21期152-156,共5页
通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。在分析SIMD体系结构的基础上,从体系结构系统设计到处理单元PE内部电路设计,给出一种多核处理器体系结构... 通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。在分析SIMD体系结构的基础上,从体系结构系统设计到处理单元PE内部电路设计,给出一种多核处理器体系结构,在处理单元中能够实现指令级并行(Instruction-level Parallelism,ILP)和数据级并行(Data-level Parallelism,DLP)处理。 展开更多
关键词 单指令多数据 处理单元 指令级并行 数据级并行
在线阅读 下载PDF
基于SIMD的AVS3并行率失真优化量化算法 被引量:1
9
作者 唐毅欣 黄晓峰 +3 位作者 唐然 周洋 崔燕 殷海兵 《电信科学》 北大核心 2024年第6期114-126,共13页
针对第三代音频视频标准(the third generation audio video coding standard,AVS3)中的率失真优化量化(rate-distortion optimization quantization,RDOQ)过程的编码效率问题,提出一种基于单指令多数据(single instruction multiple da... 针对第三代音频视频标准(the third generation audio video coding standard,AVS3)中的率失真优化量化(rate-distortion optimization quantization,RDOQ)过程的编码效率问题,提出一种基于单指令多数据(single instruction multiple data,SIMD)的并行RDOQ算法。首先,在最优系数决策(optimal coefficient decision,OCD)阶段,通过优化,仅保留扫描线内的依赖关系。然后,在最后一个非零位置决策(last non-zero position decision,LNPD)阶段,基于分治策略,通过将Zig-Zag扫描线分解成多个独立扫描线,实现每条扫描线上最优系数位置的并行计算。最后,采用SIMD指令进行并行加速,以提高整个率失真优化量化的计算效率。实验结果表明,该算法在AI配置下,可以降低29.46%的编码时间,而BD-Rate仅损失0.25%。 展开更多
关键词 AVS3 率失真优化量化 单指令多数据 并行加速
在线阅读 下载PDF
基于SIMD的VSIPL三角函数向量化技术研究
10
作者 闫妍 李典 +1 位作者 李康 周磊 《航空计算技术》 2024年第5期105-109,共5页
为提高嵌入式信号处理软件中三角函数的计算效率,并满足软件的可移植性需求,发展一种基于单指令多数据(SIMD)技术的三角函数向量化技术,并基于向量、信号与图像处理函数库(VSIPL)标准对向量化后的三角函数进行接口实现;同时,在ARM平台上... 为提高嵌入式信号处理软件中三角函数的计算效率,并满足软件的可移植性需求,发展一种基于单指令多数据(SIMD)技术的三角函数向量化技术,并基于向量、信号与图像处理函数库(VSIPL)标准对向量化后的三角函数进行接口实现;同时,在ARM平台上对VSIPL向量三角函数接口进行性能测试。测试结果显示该方法相比循环遍历的方式具有2倍以上的加速效果,表明方法能够显著提高三角函数的计算效率,在高性能、可移植嵌入式信号处理软件领域具有一定的工程价值。 展开更多
关键词 嵌入式信号处理 向量化技术 向量三角函数 单指令多数据 向量、信号与图像处理函数库
在线阅读 下载PDF
面向顶点染色算法的专用指令集优化处理器 被引量:5
11
作者 杜慧敏 李萌 《西安邮电大学学报》 2014年第2期60-66,共7页
为了提高图形处理器中顶点染色器的工作效率,设计一款改进的可编程顶点染色器。设计引入适用于顶点染色器的一种专用指令集,以完成顶点染色的加减乘除等基本操作,并加入染色算法中常见的向量操作和特殊函数计算的指令,另在浮点4路单指... 为了提高图形处理器中顶点染色器的工作效率,设计一款改进的可编程顶点染色器。设计引入适用于顶点染色器的一种专用指令集,以完成顶点染色的加减乘除等基本操作,并加入染色算法中常见的向量操作和特殊函数计算的指令,另在浮点4路单指令多数据的结构基础上加入带有旁路功能的五级宏流水线和超越函数运算单元。在工作站使用Linux环境下的QuestaSim6.5b进行功能仿真,使用Xilinx公司Virtex6-760芯片为目标器件对可编程顶点染色器进行逻辑综合。实验结果表明,该顶点染色器可以绘制出真实图形,其最大工作频率可达197MHz,顶点的处理能力可达5Mvertex/s。 展开更多
关键词 顶点染色器 专用指令 可编程 单指令多数据(simd)
在线阅读 下载PDF
一种高效的面向基2 FFT算法的SIMD并行存储结构 被引量:7
12
作者 陈海燕 杨超 +1 位作者 刘胜 刘仲 《电子学报》 EI CAS CSCD 北大核心 2016年第2期241-246,共6页
随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fo... 随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fourier Transform)并行算法面临的访存问题,采用简单的部分地址异或逻辑完成SIMD并行访存地址转换,实现了FFT运算的无冲突SIMD并行访存;提出了几种带特殊混洗模式的向量访存指令,可完全消除SIMD结构下基2FFT运算时需要的额外混洗指令操作.最后将其应用于某16路SIMD数字信号处理器YHFT-Matrix2中向量存储器VM的优化设计.测试结果表明,采用该SIMD并行存储结构优化的VM以增加18%的硬件开销实现了FFT运算全流水无冲突并行访存和100%并行访存带宽利用率;相比优化前的设计,不同点数FFT运算可获得1.32~2.66的加速比. 展开更多
关键词 快速傅里叶变换 单指令多数据 低位交叉 并行存储 访问冲突 数据混洗
在线阅读 下载PDF
基于SIMD技术的图像卷积处理器体系结构研究 被引量:5
13
作者 佟凤辉 樊晓桠 +1 位作者 王党辉 辛明瑞 《微电子学与计算机》 CSCD 北大核心 2003年第3期13-16,20,共5页
SIMD处理机特别适合于要求大量高速向量或矩阵计算的场合,数据缓存系统和对准网络是它的关键部件。而图像卷积是图像处理技术中最基本也是最重要的一项技术,文章根据数字图像的卷积定理对数字图像的卷积运算进行了分析,在此基础上提出... SIMD处理机特别适合于要求大量高速向量或矩阵计算的场合,数据缓存系统和对准网络是它的关键部件。而图像卷积是图像处理技术中最基本也是最重要的一项技术,文章根据数字图像的卷积定理对数字图像的卷积运算进行了分析,在此基础上提出了一种基于SIMD处理机的可变卷积模板的图像卷积处理器的体系结构。该处理器内部包含有接口部件、控制部件、数据缓存系统、对准电路和执行部件等。它的极高效率的数据缓存系统和对准电路成为该处理器最有特色的部分,它从根本上解决了图像卷积中的数据复用带来的CPU重复访问主存储器的问题。实现了3×3、5×5、7×7、9×9、11×11、13×13和15×15卷积模板的图像卷积运算的变换而无需另行更改硬件电路的特点。最后,对这个图像卷积处理器体系结构的性能进行了缜密的分析。 展开更多
关键词 simd技术 图像卷积处理器 体系结构 图像处理 计算机 simd处理机 数据缓存系统 对准电路
在线阅读 下载PDF
基于SIMD PE阵列的图像同态滤波并行算法 被引量:3
14
作者 唐思敏 党杰 钟升 《西安工程大学学报》 CAS 2010年第3期302-305,共4页
为了满足G级像素帧实时处理的要求,提出图像同态滤波的数据并行实现方法.讨论了图像帧和滤波器在SIMD PE阵列中的预置及数据并行的滤波处理实现方法,其处理方式规则性强、并行度高,提高了处理速度.由于SIMD PE阵列具有可裁减性,可以适... 为了满足G级像素帧实时处理的要求,提出图像同态滤波的数据并行实现方法.讨论了图像帧和滤波器在SIMD PE阵列中的预置及数据并行的滤波处理实现方法,其处理方式规则性强、并行度高,提高了处理速度.由于SIMD PE阵列具有可裁减性,可以适合不同规模图像帧的处理需求,满足不同的嵌入式应用环境. 展开更多
关键词 数据并行 simd PE阵列 PE选择 映射语言
在线阅读 下载PDF
多态并行处理器中的SIMD控制器设计与实现 被引量:4
15
作者 蒲林 李涛 +1 位作者 易学渊 韩俊刚 《电子技术应用》 北大核心 2013年第11期53-55,59,共4页
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了... 设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了SIMD和MIMD两种计算模式,能够实现两种计算模式的切换。专用的硬件电路设计提高了该处理器处理并行数据的能力。 展开更多
关键词 多态并行处理器 simd控制器 数据级并行 阵列机
在线阅读 下载PDF
LS SIMD计算机的并行技术 被引量:2
16
作者 赵晓红 沈绪榜 《微电子学与计算机》 CSCD 北大核心 2000年第2期15-17,41,共4页
文章主要讨论了LSSIMD计算机中所采用的并行技术 :数据并行技术、三级指令流水线并行技术与三组指令并行执行技术。
关键词 数据并行 三组指令并行 并行计算机 simd
在线阅读 下载PDF
高性能可重构DSP处理器的数据通路设计 被引量:1
17
作者 韩亮 李莺 +1 位作者 张馨 陈杰 《电子科技大学学报》 EI CAS CSCD 北大核心 2005年第2期194-197,共4页
介绍了高性能定点可重构DSP处理器的数据通路设计。该数据通路以功能强大的16位定点计算单元为基础,搭建起高速16位数据处理平台;并能以单指令流多数据流的方式灵活支持多维向量运算;通过重构的方法有效地支持了32位数据处理。
关键词 数字信号处理 数据通路 可重构 单指令多数据 并行处理
在线阅读 下载PDF
基于DSP和ASIC电路的图象处理SIMD并行结构
18
作者 程功宝 黄土坦 《微电子学与计算机》 CSCD 北大核心 2003年第B12期15-17,共3页
本文旨在通过分析图象处理应用中互相关算法的特点,提出一种能够满足当前图象处理应用需要的SIMD并行结构,这种面向算法的SIMD结构增加了多指令控制、共享存储器单元,能够最大限度的提高特定算法的执行效率。
关键词 DSP ASIC电路 图象处理 simd并行结构 单指令多数据流计算机 互连网络 共享存储器 互相关算法
在线阅读 下载PDF
SIMD在点云滤波处理中的应用
19
作者 柳红凯 徐晓 郭浩 《科技创新与应用》 2015年第34期86-87,共2页
为了进一步提高.NET平台数据处理能力,微软新推出基于.NET平台的新技术-SIMD。传统滤波算法大都采用单指令单数据流对点云数据进行处理,然而由于三维激光扫描获取的点云数据量极其庞大,单指令单数据的处理方式效率较低。文章在区域增长... 为了进一步提高.NET平台数据处理能力,微软新推出基于.NET平台的新技术-SIMD。传统滤波算法大都采用单指令单数据流对点云数据进行处理,然而由于三维激光扫描获取的点云数据量极其庞大,单指令单数据的处理方式效率较低。文章在区域增长理论基础上提出基于.NET平台的单指令多数据流(SIMD)点云滤波处理新算法。该方法在对数据处理时通过一次指令同时进行多个数据并行计算的方式达到提高效率的目的。通过对大量数据的运算实例表明算法的高效性。 展开更多
关键词 .NET simd 点云滤波 区域增长 单指令
在线阅读 下载PDF
时钟共享多线程处理器SIMD控制器设计与实现
20
作者 刘欢 韩俊刚 +1 位作者 李卯良 杨铮 《电子技术应用》 北大核心 2016年第11期29-32,共4页
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前... 针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前向处理单元、行控制器和列控制器的设计。实验结果表明,所设计的专用硬件电路能够有效提高图形图像处理器处理并行数据的能力。 展开更多
关键词 多线程处理器 simd控制器 数据级并行 状态机
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部