期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于单指令多数据流技术的视频信息处理优化
1
作者 王恒 《煤炭技术》 CAS 北大核心 2012年第11期180-182,共3页
文章以H.264编码为例,首先对单指令多数据指令系统进行了简单介绍,并在该技术基础之上,分别从H.264整数离散余弦变换、量化以及运动估计等方面分析和探讨了依托于单指令多数据流技术的视频信息处理的优化方式,与之前的程序编码技术相比... 文章以H.264编码为例,首先对单指令多数据指令系统进行了简单介绍,并在该技术基础之上,分别从H.264整数离散余弦变换、量化以及运动估计等方面分析和探讨了依托于单指令多数据流技术的视频信息处理的优化方式,与之前的程序编码技术相比较而言,经过优化处理的程序编码速率提升了数倍。 展开更多
关键词 单指令多数据流技术 视频信息处理 优化 整数离散余弦变换
在线阅读 下载PDF
空间应用的容错计算机
2
作者 王永平 《中国航天》 1983年第12期30-34,共5页
随着计算机结构和编码理论的发展,特别是半导体技术的巨大进步,就能在重量小、功耗低和成本低廉的情况下实现容错技术的逻辑功能。同时,由于飞行时间的增加,飞行任务具有多种目的和进一步自动化的要求,已开始在空间飞行器上应用容错计... 随着计算机结构和编码理论的发展,特别是半导体技术的巨大进步,就能在重量小、功耗低和成本低廉的情况下实现容错技术的逻辑功能。同时,由于飞行时间的增加,飞行任务具有多种目的和进一步自动化的要求,已开始在空间飞行器上应用容错计算机。 展开更多
关键词 容错计算机 容错技术 空间应用 计算机结构 多处理机 误差检测 编码理论 空间飞行器 飞行时间 单指令
在线阅读 下载PDF
基于申威SIMD指令的H.264编码优化 被引量:2
3
作者 黄朴 刘世巍 +1 位作者 张昊 王聪 《现代电子技术》 北大核心 2024年第6期49-54,共6页
国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIM... 国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIMD指令系统,提出一种基于申威架构的SIMD指令集H.264编码优化方法。结合申威处理器的并行结构特点,利用申威适配的Perf、Top指令等系统性能分析工具,采集两种主流视频分辨率下与编码性能强相关的高频热点函数,详细分析其程序并行化可行性,采用手工嵌入申威SIMD和访存扩展等汇编指令进行细粒度优化。实验结果表明,该方法在申威架构下的H.264平均编码性能提升了约30%。相应工作成果已推送到申威社区,增强了基于申威处理器的国产计算机在桌面多媒体应用领域的工作体验。 展开更多
关键词 单指令多数据流 H.264标准 申威处理器 热点函数 程序并行化 细粒度
在线阅读 下载PDF
一种全同态加密的安全内积计算方案 被引量:1
4
作者 邓江 许春香 杨浩淼 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第5期808-811,共4页
在云计算环境下密文top-k检索的众多方法中,该文聚焦于同态加密方法,该公钥加密方法具有不解密就能对密文进行操作的优点。在密文top-k查询中,内积相似性是度量索引向量和查询向量的相似性的最常用的一个指标。该文提出一个安全计算两... 在云计算环境下密文top-k检索的众多方法中,该文聚焦于同态加密方法,该公钥加密方法具有不解密就能对密文进行操作的优点。在密文top-k查询中,内积相似性是度量索引向量和查询向量的相似性的最常用的一个指标。该文提出一个安全计算两向量内积相似性的方案,该方案使用基于环上错误学习问题的批处理和打包的同态加密来保护隐私。与其他方法相比,该方案具有通信代价低和计算代价低的优点。 展开更多
关键词 中国剩余定理 全同态加密 环上错误学习问题 单指令多数据流
在线阅读 下载PDF
基于体素模型的锥束CT仿真投影快速计算 被引量:2
5
作者 梅创社 张顺利 《核电子学与探测技术》 CAS CSCD 北大核心 2012年第7期793-797,共5页
在锥束CT图像重建算法研究中,通常利用计算机仿真方法生成理想的投影数据。针对体素模型下投影仿真速度慢的问题,提出了一种快速仿真投影计算方法。采用一种高效的射线与体素的遍历和求交算法来计算三维射线穿过体素的索引及长度,然后使... 在锥束CT图像重建算法研究中,通常利用计算机仿真方法生成理想的投影数据。针对体素模型下投影仿真速度慢的问题,提出了一种快速仿真投影计算方法。采用一种高效的射线与体素的遍历和求交算法来计算三维射线穿过体素的索引及长度,然后使用Intel处理器的单指令多数据(SIMD)技术,一次性加载4个体素数据,利用SSE技术实现了仿真投影的快速并行计算。实验结果表明文中提出的方法非常有效,在生成准确仿真投影数据的同时取得了3~5倍的加速比。 展开更多
关键词 锥束计算机层析摄影术 仿真投影 图像重建 单指令多数
在线阅读 下载PDF
高性能可重构DSP处理器的数据通路设计 被引量:1
6
作者 韩亮 李莺 +1 位作者 张馨 陈杰 《电子科技大学学报》 EI CAS CSCD 北大核心 2005年第2期194-197,共4页
介绍了高性能定点可重构DSP处理器的数据通路设计。该数据通路以功能强大的16位定点计算单元为基础,搭建起高速16位数据处理平台;并能以单指令流多数据流的方式灵活支持多维向量运算;通过重构的方法有效地支持了32位数据处理。
关键词 数字信号处理 数据通路 可重构 单指令多数据流 并行处理
在线阅读 下载PDF
一种高效的面向基2 FFT算法的SIMD并行存储结构 被引量:7
7
作者 陈海燕 杨超 +1 位作者 刘胜 刘仲 《电子学报》 EI CAS CSCD 北大核心 2016年第2期241-246,共6页
随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fo... 随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fourier Transform)并行算法面临的访存问题,采用简单的部分地址异或逻辑完成SIMD并行访存地址转换,实现了FFT运算的无冲突SIMD并行访存;提出了几种带特殊混洗模式的向量访存指令,可完全消除SIMD结构下基2FFT运算时需要的额外混洗指令操作.最后将其应用于某16路SIMD数字信号处理器YHFT-Matrix2中向量存储器VM的优化设计.测试结果表明,采用该SIMD并行存储结构优化的VM以增加18%的硬件开销实现了FFT运算全流水无冲突并行访存和100%并行访存带宽利用率;相比优化前的设计,不同点数FFT运算可获得1.32~2.66的加速比. 展开更多
关键词 快速傅里叶变换 单指令多数据流 低位交叉 并行存储 访问冲突 数据混洗
在线阅读 下载PDF
基于DSP和ASIC电路的图象处理SIMD并行结构
8
作者 程功宝 黄土坦 《微电子学与计算机》 CSCD 北大核心 2003年第B12期15-17,共3页
本文旨在通过分析图象处理应用中互相关算法的特点,提出一种能够满足当前图象处理应用需要的SIMD并行结构,这种面向算法的SIMD结构增加了多指令控制、共享存储器单元,能够最大限度的提高特定算法的执行效率。
关键词 DSP ASIC电路 图象处理 SIMD并行结构 单指令多数据流计算机 互连网络 共享存储器 互相关算法
在线阅读 下载PDF
基于华睿1号的高性能数字脉压设计和实现 被引量:4
9
作者 周海斌 刘刚 李明 《现代雷达》 CSCD 北大核心 2012年第4期28-31,35,共5页
华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢量指令集,具有很强的FFT运算和数字脉压处理能力。在嵌入式实时操作系统下的实测表明华睿1号单核处理1 02... 华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢量指令集,具有很强的FFT运算和数字脉压处理能力。在嵌入式实时操作系统下的实测表明华睿1号单核处理1 024个单精度浮点复数FFT和数字脉压的运算时间分别为6.12μs和15.36μs,采用多线程FFT并行处理技术后,4核加速比可达3倍以上,满负荷功耗仅10 W,总体性能优于国内外同类处理器,适用于对实时性要求较高的雷达信号处理和电子对抗等领域。 展开更多
关键词 华睿1号 快速傅里叶变换 数字脉压 单指令多数据流 多线程 并行处理
在线阅读 下载PDF
H.264网络视频编码优化技术研究 被引量:2
10
作者 段大高 崔岩松 邓中亮 《电视技术》 北大核心 2005年第3期22-24,27,共4页
在CDMA1x无线视频传输系统的基础上,使用IntelSSE2技术对H.264编码中的SATD(SAD)计算、亚像素内插、整数变换和量化等复杂耗时模块进行了优化,使编码器的编码速度得到显著提高。
关键词 H.264标准 单指令多数据流扩展 编码优化 无线视频传输
在线阅读 下载PDF
面向SDR应用的向量存储器的设计与优化 被引量:1
11
作者 陈海燕 刘胜 +1 位作者 刘仲 陈书明 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第3期98-102,共5页
针对面向SDR应用的SIMD数字信号处理器高带宽数据访存需求,提出并实现了一种新型的向量存储结构。该向量存储器由16路向量存储块构成,每路采用两组多体低位地址交叉编址存储结构,减少了访存体冲突,充分利用多存储体带宽,以较小的功耗代... 针对面向SDR应用的SIMD数字信号处理器高带宽数据访存需求,提出并实现了一种新型的向量存储结构。该向量存储器由16路向量存储块构成,每路采用两组多体低位地址交叉编址存储结构,减少了访存体冲突,充分利用多存储体带宽,以较小的功耗代价实现并行访问多个向量数据。在此基础上,还设计了一种向量访存重整理单元,使向量存储器可灵活支持多路SIMD结构向量处理单元的非对齐访问,实现了其对向量存储器的共享。测试结果表明,该向量存储器能有效减少或消除向量处理单元之间的数据混洗操作,加速相关应用算法。 展开更多
关键词 向量处理 单指令多数据流 访存冲突 多存储体交叉 混洗 非对齐访问
在线阅读 下载PDF
一种基于HXDSP的移位器查找表技术 被引量:1
12
作者 叶鸿 顾乃杰 +2 位作者 林传文 张孝慈 陈瑞 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第10期2044-2050,共7页
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提... 高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1. 15~1. 20的性能提升效果。 展开更多
关键词 数字信号处理器(DSP) 移位器 查找表(LUT) 单指令多数据流(SIMD) 超长指令字(VLIW)
在线阅读 下载PDF
GSVM:一种支持Gather/Scatter的向量存储器
13
作者 陈海燕 刘胜 吴健虢 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第3期1-8,共8页
宽单指令多数据流(Single Instruction Multiple Data,SIMD)架构数字信号处理器一般都能高效支持地址连续或等距跨步等规则应用的向量访存,但对于科学与工程计算中广泛存在的不规则应用的数据访存则带宽利用率往往较低,从而大幅降低了... 宽单指令多数据流(Single Instruction Multiple Data,SIMD)架构数字信号处理器一般都能高效支持地址连续或等距跨步等规则应用的向量访存,但对于科学与工程计算中广泛存在的不规则应用的数据访存则带宽利用率往往较低,从而大幅降低了其整体运算能效。为了提高不规则应用的向量访存性能,基于某SIMD数字信号处理器的体系结构,设计了一种支持Gather/Scatter访存的向量存储器GSVM。通过设计与SIMD宽度相匹配的向量地址计算单元和合适深度的冲突缓冲器阵列,实现了Gather/Scatter指令向量地址计算、仲裁与缓存的全流水访存操作。实验结果表明,相比以前不支持Gather/Scatter访存的存储器,GSVM在增加22%的硬件代价基础上,基于稀疏矩阵向量乘的测试程序集获得了2~8的性能加速比。 展开更多
关键词 单指令多数据流 Gather/Scatter 向量随机访存 访存冲突
在线阅读 下载PDF
新一代数字信号处理器ADSP21161
14
作者 江志红 康立功 《信息技术》 2003年第7期24-26,共3页
ADSP2 116 1是美国AD公司生产的一种新的高性能、低价位的 32位浮点数字信号处理器。介绍了ADSP2 116 1的硬件结构 ,详细分析了ADSP2 116 1的CPU结构 ,重点介绍了ADSP2 116 1对单指令多数据流 (SIMD)特性的支持。
关键词 数字信号处理器 ADSP21161 硬件结构 CPU结构 单指令多数据流 模拟器件公司
在线阅读 下载PDF
AVS熵解码与DSP实现 被引量:6
15
作者 陈光法 姚立敏 虞露 《电视技术》 北大核心 2004年第10期43-46,共4页
阐述了AVS标准的进展情况及AVS标准的特点,重点介绍了AVS熵解码的原理和采用Equator公司MAP-CABSP-15处理器中的协处理器(Vlx)实现AVS熵解码的方法。
关键词 宽带信号处理器 单指令多数据流 AVS标准 协处理器 熵解码
在线阅读 下载PDF
媒体处理器视频哈夫曼解码快速算法 被引量:2
16
作者 倪昕 王维东 +1 位作者 刘鹏 张贻雄 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第12期2036-2039,共4页
为了提高视频处理中哈夫曼解码的性能,从减少比特操作、提高处理器内存利用率的角度出发,设计了2种不同的数据结构进行哈夫曼码表的组织,提出了一种新的并行分步查表算法,对Ishii的并行查表法进行了改进.实验结果表明,采用新算法及其内... 为了提高视频处理中哈夫曼解码的性能,从减少比特操作、提高处理器内存利用率的角度出发,设计了2种不同的数据结构进行哈夫曼码表的组织,提出了一种新的并行分步查表算法,对Ishii的并行查表法进行了改进.实验结果表明,采用新算法及其内存优化策略,以哈夫曼解码性能较少下降的代价,内存开销得到大幅降低.新算法比常用的分步查表算法的解码效率有较大提升,对MPEG系列、H.26X系列等视频压缩标准具有普适性. 展开更多
关键词 媒体处理器 哈夫曼解码 单指令多数据流 分步查表法
在线阅读 下载PDF
基于双PowerPC 7447A处理器的嵌入式系统硬件设计 被引量:2
17
作者 张中华 《现代电子技术》 2008年第24期9-13,共5页
随着雷达数据和信号处理需求的不断攀升,传统雷达数字处理系统的处理能力己渐显不足,因此有必要提高系统中每个处理单元的处理能力。鉴于此,设计一种基于CPCI标准总线和双PowerPC 7447A高性能处理器的通用处理单元硬件平台,并对部分功... 随着雷达数据和信号处理需求的不断攀升,传统雷达数字处理系统的处理能力己渐显不足,因此有必要提高系统中每个处理单元的处理能力。鉴于此,设计一种基于CPCI标准总线和双PowerPC 7447A高性能处理器的通用处理单元硬件平台,并对部分功能单元的设计进行描述。硬件平台由双处理节点、双PMC接口和CPCI总线接口等组成,本地互连采用PCI总线,对外采用CPCI总线。该平台具有数据处理能力强、功能扩展性强、通用性强、维护方便等特点,有较高的应用价值。 展开更多
关键词 POWERPC G4 非对称多重处理 全对称多重处理 单指令多数 精简指令计算机
在线阅读 下载PDF
基于ADRES处理器的并行FFT设计及实现
18
作者 李世平 陈铠 +2 位作者 陈晓东 周海斌 何国强 《现代雷达》 CSCD 北大核心 2022年第10期59-64,共6页
根据动态可重构嵌入式系统架构(ADRES)处理器单指令多数据流(SIMD)结构的特点,提出了一种基于SIMD的并行化快速傅里叶变换(FFT)算法,其在每个指令周期并行执行8个基4蝶形运算,同时将数据混洗和地址倒序操作嵌入向量蝶形运算过程中执行,... 根据动态可重构嵌入式系统架构(ADRES)处理器单指令多数据流(SIMD)结构的特点,提出了一种基于SIMD的并行化快速傅里叶变换(FFT)算法,其在每个指令周期并行执行8个基4蝶形运算,同时将数据混洗和地址倒序操作嵌入向量蝶形运算过程中执行,既保证了向量运算的并行度,也掩盖了FFT结果倒序所需的时间。该算法在ADRES处理器上实现,结果显示,与其他同等规模运算资源的处理器相比,处理性能达到1.1~10倍。 展开更多
关键词 并行FFT 单指令多数据流 向量蝶形运算
在线阅读 下载PDF
一种新颖的向量基-8布斯乘加器的设计
19
作者 张喆 张盛兵 黄小平 《微电子学与计算机》 CSCD 北大核心 2010年第11期20-24,共5页
提出一种新颖的部分冗余向量基-8布斯编码乘加器,快速地处理了部分积中的正负三倍被乘数项,并以亚字并行的方式支持单指令多数据流操作,可以完成16*16的有符号乘法运算以及两个8*8的有符号乘法运算.使用了4∶2压缩器进行部分积的压缩,... 提出一种新颖的部分冗余向量基-8布斯编码乘加器,快速地处理了部分积中的正负三倍被乘数项,并以亚字并行的方式支持单指令多数据流操作,可以完成16*16的有符号乘法运算以及两个8*8的有符号乘法运算.使用了4∶2压缩器进行部分积的压缩,并使用进位控制逻辑来控制短向量间的进位. 展开更多
关键词 向量基-8布斯 亚字并行 单指令多数据流 4∶2压缩器
在线阅读 下载PDF
基于TMS320C64系列的H.264的整数变换快速实现
20
作者 邓熙 葛宁 《电视技术》 北大核心 2008年第7期34-35,共2页
介绍了视频标准H.264中的4×4整数变换原理及一种一维整数变换的快速算法,在此基础上利用Kronecker乘积推导出一种适合于TMS320C64系列的二维整数变换的并行算法,结合TMS320C64系列的VILW和SIMD特点进行了相应的优化,提高了算法的... 介绍了视频标准H.264中的4×4整数变换原理及一种一维整数变换的快速算法,在此基础上利用Kronecker乘积推导出一种适合于TMS320C64系列的二维整数变换的并行算法,结合TMS320C64系列的VILW和SIMD特点进行了相应的优化,提高了算法的并行度。 展开更多
关键词 整数变换 单指令多数据流 超长指令 H.264标准
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部