期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
基于单指令多数据流技术的视频信息处理优化 被引量:1
1
作者 赵鹤群 《信息技术与信息化》 2020年第10期33-35,共3页
单指令多数据流技术是目前视频信息处理中比较常用的技术,和传统处理技术相比,单指令多数据流技术可通过一个控制器来同时开展多个处理器,每组数据又可实现独立操作和执行,真正意义上实现了视频信息空间上的并行处理。基于此,本文结合... 单指令多数据流技术是目前视频信息处理中比较常用的技术,和传统处理技术相比,单指令多数据流技术可通过一个控制器来同时开展多个处理器,每组数据又可实现独立操作和执行,真正意义上实现了视频信息空间上的并行处理。基于此,本文结合理论实践,先分析了单指令多数据流技术的优势,接着探讨了单指令多数据流技术在视频信息处理优化中应用的关键技术,最后提出相应的优化方法并探讨了优化效果,希望对提升视频信息处理质量和效率有一定参考及借鉴。 展开更多
关键词 单指令 多数据 视频信息 处理优化
在线阅读 下载PDF
基于单指令多数据流技术的视频信息处理优化
2
作者 王恒 《煤炭技术》 CAS 北大核心 2012年第11期180-182,共3页
文章以H.264编码为例,首先对单指令多数据指令系统进行了简单介绍,并在该技术基础之上,分别从H.264整数离散余弦变换、量化以及运动估计等方面分析和探讨了依托于单指令多数据流技术的视频信息处理的优化方式,与之前的程序编码技术相比... 文章以H.264编码为例,首先对单指令多数据指令系统进行了简单介绍,并在该技术基础之上,分别从H.264整数离散余弦变换、量化以及运动估计等方面分析和探讨了依托于单指令多数据流技术的视频信息处理的优化方式,与之前的程序编码技术相比较而言,经过优化处理的程序编码速率提升了数倍。 展开更多
关键词 单指令多数据流技术 视频信息处理 优化 整数离散余弦变换
在线阅读 下载PDF
单指令调度下堆垛机平均行程时间研究
3
作者 王志珍 《物流技术》 2019年第3期108-112,127,共6页
在自动化立体库中,以堆垛机的行程时间为切入点,通过对不同条件下堆垛机水平、竖直方向上的不同运动模式的研究,提出了基于单指令调度模式的不同条件下的堆垛机平均行程时间模型,并通过与Flexsim仿真模型得到的结果进行对比评价,最终验... 在自动化立体库中,以堆垛机的行程时间为切入点,通过对不同条件下堆垛机水平、竖直方向上的不同运动模式的研究,提出了基于单指令调度模式的不同条件下的堆垛机平均行程时间模型,并通过与Flexsim仿真模型得到的结果进行对比评价,最终验证了模型的准确性。 展开更多
关键词 自动化立体库 堆垛机 单指令 平均行程时间 仿真
在线阅读 下载PDF
基于申威SIMD指令的H.264编码优化 被引量:2
4
作者 黄朴 刘世巍 +1 位作者 张昊 王聪 《现代电子技术》 北大核心 2024年第6期49-54,共6页
国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIM... 国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIMD指令系统,提出一种基于申威架构的SIMD指令集H.264编码优化方法。结合申威处理器的并行结构特点,利用申威适配的Perf、Top指令等系统性能分析工具,采集两种主流视频分辨率下与编码性能强相关的高频热点函数,详细分析其程序并行化可行性,采用手工嵌入申威SIMD和访存扩展等汇编指令进行细粒度优化。实验结果表明,该方法在申威架构下的H.264平均编码性能提升了约30%。相应工作成果已推送到申威社区,增强了基于申威处理器的国产计算机在桌面多媒体应用领域的工作体验。 展开更多
关键词 单指令流多数据流 H.264标准 申威处理器 热点函数 程序并行化 细粒度
在线阅读 下载PDF
面向顶点染色算法的专用指令集优化处理器 被引量:5
5
作者 杜慧敏 李萌 《西安邮电大学学报》 2014年第2期60-66,共7页
为了提高图形处理器中顶点染色器的工作效率,设计一款改进的可编程顶点染色器。设计引入适用于顶点染色器的一种专用指令集,以完成顶点染色的加减乘除等基本操作,并加入染色算法中常见的向量操作和特殊函数计算的指令,另在浮点4路单指... 为了提高图形处理器中顶点染色器的工作效率,设计一款改进的可编程顶点染色器。设计引入适用于顶点染色器的一种专用指令集,以完成顶点染色的加减乘除等基本操作,并加入染色算法中常见的向量操作和特殊函数计算的指令,另在浮点4路单指令多数据的结构基础上加入带有旁路功能的五级宏流水线和超越函数运算单元。在工作站使用Linux环境下的QuestaSim6.5b进行功能仿真,使用Xilinx公司Virtex6-760芯片为目标器件对可编程顶点染色器进行逻辑综合。实验结果表明,该顶点染色器可以绘制出真实图形,其最大工作频率可达197MHz,顶点的处理能力可达5Mvertex/s。 展开更多
关键词 顶点染色器 专用指令 可编程 单指令多数据(SIMD)
在线阅读 下载PDF
BWDSP SIMD指令的WHIRL中间表示生成研究 被引量:1
6
作者 王昊 王向前 《中国集成电路》 2015年第3期30-35,共6页
WHIRL是Open64采用的一种通用的中间表示,支持多种高级语言和多种目标机。Open64的后端优化工作都是基于WHIRL设计的。BWDSP是一款支持SIMD指令的数字信号处理器,SIMD指令能够提高该处理器的指令并行性。SIMD优化也需要产生WHIRL中间表... WHIRL是Open64采用的一种通用的中间表示,支持多种高级语言和多种目标机。Open64的后端优化工作都是基于WHIRL设计的。BWDSP是一款支持SIMD指令的数字信号处理器,SIMD指令能够提高该处理器的指令并行性。SIMD优化也需要产生WHIRL中间表示,本文对如何产生BWDSP SIMD指令的WHIRL中间表示进行了研究,并在BWDSP的编译器OCC上得以实现。 展开更多
关键词 数字信号处理器 单指令多数据 WHIRL 中间表示
在线阅读 下载PDF
EDO-SIMD:内嵌数据组织的SIMD多媒体扩展指令集
7
作者 刘坤杰 秦兴 +2 位作者 严晓浪 李德贤 彭剑英 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第4期565-570,共6页
针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两... 针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两类特殊扩展指令,并与其他基本指令构成了EDO-SIMD(embedded data organi-zation SIMD)多媒体扩展指令集.性能测试结果表明,EDO-SIMD指令体系可显著降低典型媒体应用核心的非有效计算开销,并提高数据级并行效率. 展开更多
关键词 多媒体处理 单指令多数据 内嵌数据组织
在线阅读 下载PDF
基于SIMD体系结构的指令级并行结构设计 被引量:4
8
作者 刘有耀 张仲伟 《电子设计工程》 2017年第21期152-156,共5页
通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。在分析SIMD体系结构的基础上,从体系结构系统设计到处理单元PE内部电路设计,给出一种多核处理器体系结构... 通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。在分析SIMD体系结构的基础上,从体系结构系统设计到处理单元PE内部电路设计,给出一种多核处理器体系结构,在处理单元中能够实现指令级并行(Instruction-level Parallelism,ILP)和数据级并行(Data-level Parallelism,DLP)处理。 展开更多
关键词 单指令多数据 处理单元 指令级并行 数据级并行
在线阅读 下载PDF
基于SIMD的AVS3并行率失真优化量化算法
9
作者 唐毅欣 黄晓峰 +3 位作者 唐然 周洋 崔燕 殷海兵 《电信科学》 北大核心 2024年第6期114-126,共13页
针对第三代音频视频标准(the third generation audio video coding standard,AVS3)中的率失真优化量化(rate-distortion optimization quantization,RDOQ)过程的编码效率问题,提出一种基于单指令多数据(single instruction multiple da... 针对第三代音频视频标准(the third generation audio video coding standard,AVS3)中的率失真优化量化(rate-distortion optimization quantization,RDOQ)过程的编码效率问题,提出一种基于单指令多数据(single instruction multiple data,SIMD)的并行RDOQ算法。首先,在最优系数决策(optimal coefficient decision,OCD)阶段,通过优化,仅保留扫描线内的依赖关系。然后,在最后一个非零位置决策(last non-zero position decision,LNPD)阶段,基于分治策略,通过将Zig-Zag扫描线分解成多个独立扫描线,实现每条扫描线上最优系数位置的并行计算。最后,采用SIMD指令进行并行加速,以提高整个率失真优化量化的计算效率。实验结果表明,该算法在AI配置下,可以降低29.46%的编码时间,而BD-Rate仅损失0.25%。 展开更多
关键词 AVS3 率失真优化量化 单指令多数据 并行加速
在线阅读 下载PDF
基于SIMD的VSIPL三角函数向量化技术研究
10
作者 闫妍 李典 +1 位作者 李康 周磊 《航空计算技术》 2024年第5期105-109,共5页
为提高嵌入式信号处理软件中三角函数的计算效率,并满足软件的可移植性需求,发展一种基于单指令多数据(SIMD)技术的三角函数向量化技术,并基于向量、信号与图像处理函数库(VSIPL)标准对向量化后的三角函数进行接口实现;同时,在ARM平台上... 为提高嵌入式信号处理软件中三角函数的计算效率,并满足软件的可移植性需求,发展一种基于单指令多数据(SIMD)技术的三角函数向量化技术,并基于向量、信号与图像处理函数库(VSIPL)标准对向量化后的三角函数进行接口实现;同时,在ARM平台上对VSIPL向量三角函数接口进行性能测试。测试结果显示该方法相比循环遍历的方式具有2倍以上的加速效果,表明方法能够显著提高三角函数的计算效率,在高性能、可移植嵌入式信号处理软件领域具有一定的工程价值。 展开更多
关键词 嵌入式信号处理 向量化技术 向量三角函数 单指令多数据 向量、信号与图像处理函数库
在线阅读 下载PDF
基于CEVA-XC4500 DSP平台5G-LDPC码编码实现
11
作者 吴思远 陈成 +1 位作者 姜明 徐安来 《无线电工程》 2024年第2期457-462,共6页
低密度奇偶校验(Low-Density Parity-Check,LDPC)码是第五代移动通信技术(5th Generation Mobile Communication Technology,5G)系统采用的信道编码技术之一,用于业务信道高速数据传输,具有很强的抗干扰能力和纠错能力。5G-LDPC码编译... 低密度奇偶校验(Low-Density Parity-Check,LDPC)码是第五代移动通信技术(5th Generation Mobile Communication Technology,5G)系统采用的信道编码技术之一,用于业务信道高速数据传输,具有很强的抗干扰能力和纠错能力。5G-LDPC码编译码在嵌入式平台的实现是一个值得关注的研究方向。CEVA-XC4500数字信号处理(Digital Signal Processing,DSP)芯片具有极低功耗、高密度计算、集成了超长指令字(Very Long Instruction Word,VLIW)和单指令多数据(Single Instruction Multiple Data,SIMD)矢量功能的特点。针对CEVA-XC4500 DSP矢量汇编指令和内联指令集的特点,提出一系列针对5G-LDPC码编码的代码优化方法,使其满足5G-LDPC码编码工程应用指标要求。仿真结果表明,优化后的5G-LDPC码编码在CEVA-XC4500 DSP内核上表现良好,中长块编码吞吐率超过100 Mb/s、核心矩阵吞吐率超过1 Gb/s,最大吞吐率达到250 Mb/s、最大核心矩阵吞吐率达到1.6 Gb/s。如果CEVA-XC4500 DSP芯片的最大数据位宽将来能进一步增大,吞吐率可以做得更好。该5G-LDPC码编码的代码优化方法为其他信道编码在类似嵌入式平台的实现提供了参考。 展开更多
关键词 CEVA-XC4500 DSP 超长指令 单指令多数据 5G-低密度奇偶校验码编码 矢量化
在线阅读 下载PDF
一种高效的面向基2 FFT算法的SIMD并行存储结构 被引量:7
12
作者 陈海燕 杨超 +1 位作者 刘胜 刘仲 《电子学报》 EI CAS CSCD 北大核心 2016年第2期241-246,共6页
随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fo... 随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fourier Transform)并行算法面临的访存问题,采用简单的部分地址异或逻辑完成SIMD并行访存地址转换,实现了FFT运算的无冲突SIMD并行访存;提出了几种带特殊混洗模式的向量访存指令,可完全消除SIMD结构下基2FFT运算时需要的额外混洗指令操作.最后将其应用于某16路SIMD数字信号处理器YHFT-Matrix2中向量存储器VM的优化设计.测试结果表明,采用该SIMD并行存储结构优化的VM以增加18%的硬件开销实现了FFT运算全流水无冲突并行访存和100%并行访存带宽利用率;相比优化前的设计,不同点数FFT运算可获得1.32~2.66的加速比. 展开更多
关键词 快速傅里叶变换 单指令多数据流 低位交叉 并行存储 访问冲突 数据混洗
在线阅读 下载PDF
软件无线电数字信号处理器体系结构研究 被引量:4
13
作者 刘衡竹 莫方政 +4 位作者 张波涛 赵恒 刘冬培 陈艇 周理 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第5期6-11,共6页
软件无线电因被认为是无线通信技术未来的发展趋势而受到广泛关注。目前数字信号处理器是软件无线电发展的瓶颈。通过分析、比较目前几种较为典型的软件无线电数字信号处理器结构,归纳总结各种结构各自设计出发点和优缺点,并对软件无线... 软件无线电因被认为是无线通信技术未来的发展趋势而受到广泛关注。目前数字信号处理器是软件无线电发展的瓶颈。通过分析、比较目前几种较为典型的软件无线电数字信号处理器结构,归纳总结各种结构各自设计出发点和优缺点,并对软件无线电数字信号处理器的发展趋势做了展望。 展开更多
关键词 软件无线电数字信号处理器 可重构 单指令多数据 超长指令
在线阅读 下载PDF
基于华睿1号的高性能数字脉压设计和实现 被引量:4
14
作者 周海斌 刘刚 李明 《现代雷达》 CSCD 北大核心 2012年第4期28-31,35,共5页
华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢量指令集,具有很强的FFT运算和数字脉压处理能力。在嵌入式实时操作系统下的实测表明华睿1号单核处理1 02... 华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢量指令集,具有很强的FFT运算和数字脉压处理能力。在嵌入式实时操作系统下的实测表明华睿1号单核处理1 024个单精度浮点复数FFT和数字脉压的运算时间分别为6.12μs和15.36μs,采用多线程FFT并行处理技术后,4核加速比可达3倍以上,满负荷功耗仅10 W,总体性能优于国内外同类处理器,适用于对实时性要求较高的雷达信号处理和电子对抗等领域。 展开更多
关键词 华睿1号 快速傅里叶变换 数字脉压 单指令多数据流 多线程 并行处理
在线阅读 下载PDF
一种易实现的SIMT调度模型分析 被引量:3
15
作者 徐元旭 张超 +1 位作者 杨兵 喻明艳 《微电子学与计算机》 CSCD 北大核心 2014年第1期25-28,共4页
以图像处理器(GPU)为基础,从中提取建立出单指令多线程调度模型,该模型独立于GPU,功能与其类似,但结构更简单,更易于理解和实现,方便向其他处理器结构中移植.并对该调度模型进行性能分析,分析结果揭示出该模型的特性,对该模型的使用和... 以图像处理器(GPU)为基础,从中提取建立出单指令多线程调度模型,该模型独立于GPU,功能与其类似,但结构更简单,更易于理解和实现,方便向其他处理器结构中移植.并对该调度模型进行性能分析,分析结果揭示出该模型的特性,对该模型的使用和向其他处理器中移植以及优化提供重要参考. 展开更多
关键词 多核处理器 多线程并行处理 单指令多线程 调度模型 性能分析
在线阅读 下载PDF
面向SDR应用的向量存储器的设计与优化 被引量:1
16
作者 陈海燕 刘胜 +1 位作者 刘仲 陈书明 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第3期98-102,共5页
针对面向SDR应用的SIMD数字信号处理器高带宽数据访存需求,提出并实现了一种新型的向量存储结构。该向量存储器由16路向量存储块构成,每路采用两组多体低位地址交叉编址存储结构,减少了访存体冲突,充分利用多存储体带宽,以较小的功耗代... 针对面向SDR应用的SIMD数字信号处理器高带宽数据访存需求,提出并实现了一种新型的向量存储结构。该向量存储器由16路向量存储块构成,每路采用两组多体低位地址交叉编址存储结构,减少了访存体冲突,充分利用多存储体带宽,以较小的功耗代价实现并行访问多个向量数据。在此基础上,还设计了一种向量访存重整理单元,使向量存储器可灵活支持多路SIMD结构向量处理单元的非对齐访问,实现了其对向量存储器的共享。测试结果表明,该向量存储器能有效减少或消除向量处理单元之间的数据混洗操作,加速相关应用算法。 展开更多
关键词 向量处理 单指令流多数据流 访存冲突 多存储体交叉 混洗 非对齐访问
在线阅读 下载PDF
H.264网络视频编码优化技术研究 被引量:2
17
作者 段大高 崔岩松 邓中亮 《电视技术》 北大核心 2005年第3期22-24,27,共4页
在CDMA1x无线视频传输系统的基础上,使用IntelSSE2技术对H.264编码中的SATD(SAD)计算、亚像素内插、整数变换和量化等复杂耗时模块进行了优化,使编码器的编码速度得到显著提高。
关键词 H.264标准 单指令多数据流扩展 编码优化 无线视频传输
在线阅读 下载PDF
一种全同态加密的安全内积计算方案 被引量:1
18
作者 邓江 许春香 杨浩淼 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第5期808-811,共4页
在云计算环境下密文top-k检索的众多方法中,该文聚焦于同态加密方法,该公钥加密方法具有不解密就能对密文进行操作的优点。在密文top-k查询中,内积相似性是度量索引向量和查询向量的相似性的最常用的一个指标。该文提出一个安全计算两... 在云计算环境下密文top-k检索的众多方法中,该文聚焦于同态加密方法,该公钥加密方法具有不解密就能对密文进行操作的优点。在密文top-k查询中,内积相似性是度量索引向量和查询向量的相似性的最常用的一个指标。该文提出一个安全计算两向量内积相似性的方案,该方案使用基于环上错误学习问题的批处理和打包的同态加密来保护隐私。与其他方法相比,该方案具有通信代价低和计算代价低的优点。 展开更多
关键词 中国剩余定理 全同态加密 环上错误学习问题 单指令多数据流
在线阅读 下载PDF
基于体素模型的锥束CT仿真投影快速计算 被引量:2
19
作者 梅创社 张顺利 《核电子学与探测技术》 CAS CSCD 北大核心 2012年第7期793-797,共5页
在锥束CT图像重建算法研究中,通常利用计算机仿真方法生成理想的投影数据。针对体素模型下投影仿真速度慢的问题,提出了一种快速仿真投影计算方法。采用一种高效的射线与体素的遍历和求交算法来计算三维射线穿过体素的索引及长度,然后使... 在锥束CT图像重建算法研究中,通常利用计算机仿真方法生成理想的投影数据。针对体素模型下投影仿真速度慢的问题,提出了一种快速仿真投影计算方法。采用一种高效的射线与体素的遍历和求交算法来计算三维射线穿过体素的索引及长度,然后使用Intel处理器的单指令多数据(SIMD)技术,一次性加载4个体素数据,利用SSE技术实现了仿真投影的快速并行计算。实验结果表明文中提出的方法非常有效,在生成准确仿真投影数据的同时取得了3~5倍的加速比。 展开更多
关键词 锥束计算机层析摄影术 仿真投影 图像重建 单指令多数据
在线阅读 下载PDF
基于PC的AVS视频解码器软件优化 被引量:1
20
作者 李辑 陈颖琪 王慈 《电视技术》 北大核心 2010年第11期40-42,50,共4页
简要介绍了AVS视频编码标准的主要特点以及单指令多数据(SIMD)汇编指令集运算优势,通过分析AVS参考解码器软件的性能以及造成解码器速度瓶颈的原因,提出了基于SIMD汇编指令的优化方案,最终实现了基于PC的高清AVS视频实时解码。
关键词 AVS标准 单指令多数据 PC 实时解码
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部