期刊文献+
共找到158篇文章
< 1 2 8 >
每页显示 20 50 100
A parallel pipeline connected-component labeling method for on-orbit space target monitoring
1
作者 LI Zongling ZHANG Qingjun +1 位作者 LONG Teng ZHAO Baojun 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2022年第5期1095-1107,共13页
The paper designs a peripheral maximum gray differ-ence(PMGD)image segmentation method,a connected-compo-nent labeling(CCL)algorithm based on dynamic run length(DRL),and a real-time implementation streaming processor ... The paper designs a peripheral maximum gray differ-ence(PMGD)image segmentation method,a connected-compo-nent labeling(CCL)algorithm based on dynamic run length(DRL),and a real-time implementation streaming processor for DRL-CCL.And it verifies the function and performance in space target monitoring scene by the carrying experiment of Tianzhou-3 cargo spacecraft(TZ-3).The PMGD image segmentation method can segment the image into highly discrete and simple point tar-gets quickly,which reduces the generation of equivalences greatly and improves the real-time performance for DRL-CCL.Through parallel pipeline design,the storage of the streaming processor is optimized by 55%with no need for external me-mory,the logic is optimized by 60%,and the energy efficiency ratio is 12 times than that of the graphics processing unit,62 times than that of the digital signal proccessing,and 147 times than that of personal computers.Analyzing the results of 8756 images completed on-orbit,the speed is up to 5.88 FPS and the target detection rate is 100%.Our algorithm and implementation method meet the requirements of lightweight,high real-time,strong robustness,full-time,and stable operation in space irradia-tion environment. 展开更多
关键词 Tianzhou-3 cargo spacecraft(TZ-3) connected-component labeling(CCL)algorithms parallel pipeline processing on-orbit space target detection streaming processor
在线阅读 下载PDF
A High Speed Signal Processing Machine -Its Architecture, Language and Compiler
2
作者 Wang Yufei and Yu ShiqiBeijing Institute of Data Processing Technology, P.O.Box 3927, Beijing 100039, China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1991年第1期119-128,共10页
A systolic array architecture computer (FXCQ) has been designed for signal processing. R can handle floating point data at very high speed. It is composed of 16 processing cells and a cache that are connected linearly... A systolic array architecture computer (FXCQ) has been designed for signal processing. R can handle floating point data at very high speed. It is composed of 16 processing cells and a cache that are connected linearly and form a ring structure. All processing cells are identical and programmable. Each processing cell has the peak performance of 20 million floating-point operations per second (20MFLOPS). The machine therefore has a peak performance of 320 M FLOPS. It is integrated as an attached processor into a host system through VME bus interface. Programs for FXCQ are written in a high-level language -B language, which is supported by a parallel optimizing compiler. This paper describes the architecture of FXCQ, B language and its compiler. 展开更多
关键词 parallel processing Systolic array processor parallel language Compiler.
在线阅读 下载PDF
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
3
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量乘 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
网络处理器的分析与研究 被引量:62
4
作者 谭章熹 林闯 +1 位作者 任丰源 周文江 《软件学报》 EI CSCD 北大核心 2003年第2期253-267,共15页
目前,网络在提高链路速率的同时出现了大量的新协议及新服务,而传统的网络设备一般采用专用硬件芯片或者基于纯粹的软件方案,很难兼顾性能与灵活性两方面的要求.为此,一种并行可编程的网络处理器被引入到路由器(交换机)的处理层面.它基... 目前,网络在提高链路速率的同时出现了大量的新协议及新服务,而传统的网络设备一般采用专用硬件芯片或者基于纯粹的软件方案,很难兼顾性能与灵活性两方面的要求.为此,一种并行可编程的网络处理器被引入到路由器(交换机)的处理层面.它基于ASIP技术对网络程序处理进行了优化,同时还兼有硬件和软件两种方案的特点.网络处理器的出现将经典的存储-转发结构变为存储-处理-转发,这为复杂的QoS控制和负载处理提供了可能.从网络处理器本身及其应用两个角度出发,介绍了相关的研究工作,分析了系统特点和面临的挑战,并展望其未来的发展方向. 展开更多
关键词 网络处理器 计算机网络 并行处理 路由器 服务质量
在线阅读 下载PDF
多核处理器大规模并行系统中的任务分配问题及算法 被引量:15
5
作者 刘轶 张昕 +1 位作者 李鹤 钱德沛 《小型微型计算机系统》 CSCD 北大核心 2008年第5期972-975,共4页
对基于多核处理器的大规模并行系统中的任务分配问题进行了分析讨论,在此基础上建立了任务分配模型,并提出一种基于迭代的任务分配算法,该算法分为两轮操作,分别完成进程到处理节点和进程内线程到处理器核的分配,每轮操作经过带回溯的... 对基于多核处理器的大规模并行系统中的任务分配问题进行了分析讨论,在此基础上建立了任务分配模型,并提出一种基于迭代的任务分配算法,该算法分为两轮操作,分别完成进程到处理节点和进程内线程到处理器核的分配,每轮操作经过带回溯的多次迭代处理,最终得到任务关系图的划分.实验数据表明该算法能在较短时间内求得近优解,并且当线程个数增大时,算法的求解时间远小于遗传算法. 展开更多
关键词 任务分配 多核处理器 并行计算 启发式算法
在线阅读 下载PDF
星载SAR实时成像处理器的FPGA实现 被引量:19
6
作者 熊君君 王贞松 +1 位作者 姚建平 石长振 《电子学报》 EI CAS CSCD 北大核心 2005年第6期1070-1072,共3页
本文提出了一种用FPGA实现星载合成孔径雷达实时成像处理器的方法,用来实现星载SAR的CS算法(或RMA算法).该实时成像处理器由7片Xilinx公司的商业FPGA实现,其中4片作为并行的处理单元;一片为CS因子的生成单元;一片为SDRAM控制单元;一片... 本文提出了一种用FPGA实现星载合成孔径雷达实时成像处理器的方法,用来实现星载SAR的CS算法(或RMA算法).该实时成像处理器由7片Xilinx公司的商业FPGA实现,其中4片作为并行的处理单元;一片为CS因子的生成单元;一片为SDRAM控制单元;一片为系统的控制单元.该系统将流水处理和并行处理相结合,从而极大的减少了处理时间.同时根据算法各运算对数据的精度要求不同,将浮点运算和定点运算结合在一块,减少了硬件开销.该系统工作在100MHz时,33秒左右能完成16k16k星载样本点的成像,并对加拿大Radarsat的雷达原始信号进行成像处理,成像质量能达到要求. 展开更多
关键词 CS算法 实时成像处理器 FPGA 流水处理 并行处理
在线阅读 下载PDF
萤火虫2:一种多态并行机的硬件体系结构 被引量:16
7
作者 李涛 杨婷 +5 位作者 易学渊 蒲林 钱博文 黄光新 黄虎才 韩俊刚 《计算机工程与科学》 CSCD 北大核心 2014年第2期191-200,共10页
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机... 提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。 展开更多
关键词 阵列机 多态处理器 计算机图形 图像处理 信号处理 数据级并行 线程级并行
在线阅读 下载PDF
基于多核DSP激光成像雷达数据处理系统 被引量:13
8
作者 张文广 鲁敏 +2 位作者 郭裕兰 滕书华 张军 《激光与红外》 CAS CSCD 北大核心 2015年第11期1385-1391,共7页
采用多核DSP设计了一个用于地面目标检测的激光雷达实时图像处理系统。在详细分析算法各模块资源消耗量的基础上,完成了硬件电路设计,实现了以主辅拓扑结构为框架的软件并行处理系统开发。在系统实现时,先将图像进行分区,并合理地将分... 采用多核DSP设计了一个用于地面目标检测的激光雷达实时图像处理系统。在详细分析算法各模块资源消耗量的基础上,完成了硬件电路设计,实现了以主辅拓扑结构为框架的软件并行处理系统开发。在系统实现时,先将图像进行分区,并合理地将分区后的图像分配到四个DSP核中进行处理。最后,将并行系统进一步扩展到双核和六核,并与单核系统进行性能比较。对算法运算时间的测试结果表明,系统处理一帧图像仅需50 ms达到了实时性要求。结果表明,对于固定负载的处理系统,单纯地通过增加并行的核数来提高加速比的幅度是有限的。当增加并行的核数已不能明显地提高计算效率时,在系统设计中应着重减少每个核串行运算的负载量。 展开更多
关键词 激光雷达 图像处理系统 多核DSP 并行计算 目标检测
在线阅读 下载PDF
特定并行处理机上MUSIC算法的并行实现 被引量:11
9
作者 刘皓 魏平 肖先赐 《系统工程与电子技术》 EI CSCD 北大核心 2001年第1期86-89,共4页
用自行研制的一台使用 4片TMS32 0C40 ,且利用共享内存作为主要通讯手段的数字信号高速并行处理机实现了MUSIC算法的高速并行计算。实验证明 ,所提出的并行算法稳定、有效 ,MUSIC算法的并行计算取得了较好的结果。
关键词 并行处理机 并行算法 数字信号处理 MUSIC算法
在线阅读 下载PDF
大点数FFT的多DSPs并行处理算法及实现 被引量:9
10
作者 刘莉 高梅国 +1 位作者 周闰 王飞 《系统工程与电子技术》 EI CSCD 北大核心 2003年第10期1193-1196,共4页
在FFT变体的基础上 ,提出一种新的并行算法 :先将数据在几片DSPs上并行地进行前几级蝶型运算 ,然后将结果汇总到另一片DSPs进行后几级蝶型运算 ,以实现大点数的FFT。该算法便于流水处理 ,只有一次简单的数据通讯 ,而且旋转因子规律简单... 在FFT变体的基础上 ,提出一种新的并行算法 :先将数据在几片DSPs上并行地进行前几级蝶型运算 ,然后将结果汇总到另一片DSPs进行后几级蝶型运算 ,以实现大点数的FFT。该算法便于流水处理 ,只有一次简单的数据通讯 ,而且旋转因子规律简单易于将大点数FFT拆分成小点数FFT。应用该算法在多DSPs系统上 (5片TI公司的高速DSP芯片 :1片C6 2 0 2和 4片C6 70 1)实现 2 5 6K点复数FFT只需用 4 9ms,说明该算法有并行度高和易于实现的特点。 展开更多
关键词 多处理器结构 并行算法 信号处理
在线阅读 下载PDF
带工艺约束并行机调度问题的一种新的遗传算法 被引量:21
11
作者 尹文君 刘民 吴澄 《电子学报》 EI CAS CSCD 北大核心 2001年第11期1482-1485,共4页
以最小化拖期任务数为目标 ,研究了解决一类带工艺约束并行机调度问题的新的遗传算法 .基于向量组的染色体编码方法简单、译码快速 ,并能自动满足工艺约束 ;扩展的顺序交叉算子EOX能自动满足工艺约束并尽量保留父代遗传信息 ,在较大程... 以最小化拖期任务数为目标 ,研究了解决一类带工艺约束并行机调度问题的新的遗传算法 .基于向量组的染色体编码方法简单、译码快速 ,并能自动满足工艺约束 ;扩展的顺序交叉算子EOX能自动满足工艺约束并尽量保留父代遗传信息 ,在较大程度上优于传统的交叉算子 ;位变异和交换变异相结合的变异方法有利于更好保持种群的多样性 .大量模拟数据与生产线应用实例表明本文所提的基于向量组编码的遗传算法是相当有效的 . 展开更多
关键词 调度 并行机 工艺约束 遗传算法 向量组编码
在线阅读 下载PDF
面向分组密码的可重构异构多核并行处理架构 被引量:7
12
作者 冯晓 李伟 +2 位作者 戴紫彬 马超 李功丽 《电子学报》 EI CAS CSCD 北大核心 2017年第6期1311-1320,共10页
现有的可重构分组密码实现结构中,专用指令处理器吞吐率不高,阵列结构资源利用率低、算法映射过程复杂.为此,设计了分组密码可重构异构多核并行处理架构RAMCA(Reconfigurable Asymmetrical Multi-Core Architecture),分析了典型SP(AES-1... 现有的可重构分组密码实现结构中,专用指令处理器吞吐率不高,阵列结构资源利用率低、算法映射过程复杂.为此,设计了分组密码可重构异构多核并行处理架构RAMCA(Reconfigurable Asymmetrical Multi-Core Architecture),分析了典型SP(AES-128)、Feistel(SMS4)、L-M(IDEA)及MISTY(KASUMI)结构算法在RAMCA上的映射过程.在65nm CMOS工艺下完成了逻辑综合和功能仿真.实验表明,RAMCA工作频率可达到1GHz,面积约为1.13mm2,消除工艺影响后,对各分组密码算法的运算速度均高于现有专用指令处理器以及Celator、RCPA和BCORE等阵列结构密码处理系统. 展开更多
关键词 分组密码 异构多核 可重构 并行处理 密码处理器
在线阅读 下载PDF
并行DSP系统软件调试器设计与实现 被引量:9
13
作者 吴琼之 南方 张峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2011年第7期855-858,共4页
针对数字信号处理器(DSP)构成的专用并行处理系统的软件调试存在较多困难这一问题,提出了系统级调试的概念,在层次化总线硬件架构模型的基础上,讨论了系统软件调试的基本方法和任务,并采取层次化数据结构、静态符号表自动生成、可扩展... 针对数字信号处理器(DSP)构成的专用并行处理系统的软件调试存在较多困难这一问题,提出了系统级调试的概念,在层次化总线硬件架构模型的基础上,讨论了系统软件调试的基本方法和任务,并采取层次化数据结构、静态符号表自动生成、可扩展底层接口等关键技术实现了一种专用多DSP系统调试工具.分析表明,此调试工具大大减轻了实时信号处理软件的调试工作量. 展开更多
关键词 并行处理 信号处理机 软件调试
在线阅读 下载PDF
大点数FFT算法C6678多核DSP的并行实现 被引量:25
14
作者 袁琪 杨康 +1 位作者 周建江 李虹达 《电子测量技术》 2015年第2期74-80,共7页
随着数字信号处理平台发展趋向大计算量、大带宽、高集成度的特点,单核DSP器件渐渐不能满足日益增加的复杂度及实时性要求,多片处理器并行处理的模式将逐渐被广泛应用。基于TI推出的高性能8核处理器TMS320C6678,以大点数FFT算法分解及... 随着数字信号处理平台发展趋向大计算量、大带宽、高集成度的特点,单核DSP器件渐渐不能满足日益增加的复杂度及实时性要求,多片处理器并行处理的模式将逐渐被广泛应用。基于TI推出的高性能8核处理器TMS320C6678,以大点数FFT算法分解及并行实现为例,介绍了多核DSP的KeyStone架构特点,多核处理器的任务管理和分配方式,快速内存访问EDMA的实现以及核间通信(IPC)机制。最后对算法结果及算法的实时性能进行分析,该算例说明TMS320C6678多核DSP具有卓越的运算性能。 展开更多
关键词 并行处理 FFT EDMA 核间通信 多核DSP
在线阅读 下载PDF
多核DSP上的ISAR实时成像技术研究 被引量:7
15
作者 郭瑞 张月 +1 位作者 孙刚 陈曾平 《信号处理》 CSCD 北大核心 2013年第9期1238-1243,共6页
为了提高逆合成孔径雷达(ISAR)实时成像的性能,本文首先设计了一种基于TMS320C6678多核信号处理器(DSP)的高速实时信号处理平台,优化了功耗的同时提高了信号处理能力。其次,本文提出了一种利用窄带信息进行成像预处理的成像流程,该方法... 为了提高逆合成孔径雷达(ISAR)实时成像的性能,本文首先设计了一种基于TMS320C6678多核信号处理器(DSP)的高速实时信号处理平台,优化了功耗的同时提高了信号处理能力。其次,本文提出了一种利用窄带信息进行成像预处理的成像流程,该方法利用窄带信息进行目标运动特性分析,并用分析结果指导成像条件判断、成像数据选择和高速运动补偿。根据提出的成像流程将该成像任务分割成几个独立的任务,在分析任务的实时性和任务间的通信的基础上,完成了任务在多核DSP上的分配。利用本文平台对实测数据进行处理,并将成像性能和实时性与单核DSP信号处理平台做对比,进一步验证了多核信号处理平台的处理优势和算法设计的合理性。 展开更多
关键词 逆合成孔径成像 数字信号处理器 多核 并行处理
在线阅读 下载PDF
一种适合于网络处理器的并行多维分类算法AM-Trie 被引量:6
16
作者 郑波 林闯 曲扬 《软件学报》 EI CSCD 北大核心 2006年第9期1949-1957,共9页
针对当前高速网络应用对分组分类算法的要求以及网络处理器体系结构的特点,提出了一种高速多维分组分类算法——AM-Trie算法(asymmetricalmulti-bittrie,非对称多杈Trie树).该算法具有搜索速度快,并行性、可扩展性良好的特点,特别适合... 针对当前高速网络应用对分组分类算法的要求以及网络处理器体系结构的特点,提出了一种高速多维分组分类算法——AM-Trie算法(asymmetricalmulti-bittrie,非对称多杈Trie树).该算法具有搜索速度快,并行性、可扩展性良好的特点,特别适合于在网络处理器上实现.同时,给出了一种空间最优的启发式分类字段分段算法,并从理论上证明其在确定AM-Trie树层数的情况下使得存储空间最小.最后,基于IntelIXP2400网络处理器设计并实现了该算法.性能实测表明,该算法性能良好并具有很好的可扩展性,算法速度受规则库大小的影响很小,在各种情况下均达到了2.5Gbps的线速. 展开更多
关键词 分组分类 网络处理器 并行算法 多维分类 AM-Trie
在线阅读 下载PDF
基于并行技术的大规模矢量地图可视化方法 被引量:6
17
作者 张立强 徐翔 谭继强 《地理与地理信息科学》 CSCD 北大核心 2013年第4期9-12,共4页
随着测绘、遥感及相关技术的发展,矢量地图的数据规模和细节层次迅速增加,它们含有大量复杂地理空间要素,且要素间存在复杂的拓扑几何关系,使得大规模矢量地图的快速可视化对于高性能并行计算的需求十分迫切。为了实现大数据量矢量地图... 随着测绘、遥感及相关技术的发展,矢量地图的数据规模和细节层次迅速增加,它们含有大量复杂地理空间要素,且要素间存在复杂的拓扑几何关系,使得大规模矢量地图的快速可视化对于高性能并行计算的需求十分迫切。为了实现大数据量矢量地图实时可视化,提出了基于多核CPU和GPU的矢量地图快速可视化的方法。在GPU进行并行计算的同时,利用多核CPU创建多线程进行数据读写,隐藏数据I/O时间,提高显示的实时性。实验表明,与串行方法相比,该文的并行方法在大数据量矢量地图简化和可视化效率上有了极大提高。 展开更多
关键词 矢量地图 并行算法 多核处理器 GPU
在线阅读 下载PDF
高速定点快速傅立叶变换处理器的设计与实现 被引量:12
18
作者 谭磊 张朝阳 陈文正 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第3期407-413,共7页
针对宽带正交频分复用(OFDM)系统中高速数据处理的要求,提出了 64 点高速定点快速傅立叶变换(FFT)处理器在现场可编程门阵列(FPGA)中的设计与实现方法.该方法采用了基于按频率抽取(DIF)Radix 4 算法的3级流水线结构,每级将乘法器的旋转... 针对宽带正交频分复用(OFDM)系统中高速数据处理的要求,提出了 64 点高速定点快速傅立叶变换(FFT)处理器在现场可编程门阵列(FPGA)中的设计与实现方法.该方法采用了基于按频率抽取(DIF)Radix 4 算法的3级流水线结构,每级将乘法器的旋转因子输入端固定为常数值,而不是作为变量从ROM中读取,流水寄存中间数据结果,使之处于稳态,并进行比特位截取定点操作.实验结果表明,该方法在保证运算精度和实现复杂度的同时,减少了ROM读取时间,提高了处理器的数据时钟频率和处理速度,更好的满足了宽带 OFDM系统高速数据收发处理的要求. 展开更多
关键词 正交频分复用 快速傅立叶变换 按频率抽取 流水线
在线阅读 下载PDF
基于CUDA的拉普拉斯边缘检测算法 被引量:6
19
作者 孟小华 刘坚强 +1 位作者 区业祥 张庆丰 《计算机工程》 CAS CSCD 2012年第18期190-193,共4页
拉普拉斯边缘检测算法常用于去除CCD天文图像中的宇宙射线噪声,但其串行算法计算复杂度较高。为此,分析拉普拉斯边缘检测算法的并行性,在统一计算设备架构(CUDA)并行编程环境下,提出一种基于CUDA的拉普拉斯边缘检测图形处理单元(GPU)并... 拉普拉斯边缘检测算法常用于去除CCD天文图像中的宇宙射线噪声,但其串行算法计算复杂度较高。为此,分析拉普拉斯边缘检测算法的并行性,在统一计算设备架构(CUDA)并行编程环境下,提出一种基于CUDA的拉普拉斯边缘检测图形处理单元(GPU)并行算法。分割天文图像得到多幅子图,根据GPU的硬件配置设定Block和Grid的大小,将子图依次传输到显卡进行并行计算,传回主存后拼接得到完整的图像输出。实验结果表明,图像尺寸越大,该并行算法与串行算法相比具有的速度优势越大,可获得10倍以上的加速比。 展开更多
关键词 拉普拉斯边缘检测算法 图形处理单元 统一计算设备架构 并行处理 天文图像 宇宙射线
在线阅读 下载PDF
CT快速二维反投影算法 被引量:4
20
作者 孙丰荣 刘积仁 +1 位作者 王长宇 刘炜 《中国生物医学工程学报》 EI CAS CSCD 北大核心 2005年第2期179-185,共7页
CT图像重建过程中 ,标准的二维反投影运算计算量为O(N^3)。本研究提出一种快速二维反投影算法 ,其计算量仅为O(N^2 log_2~N )。该快速算法可以并行实现 ,处理器阵列规模为O(N^2 )时 ,计算量为O(log_2~N )。本研究还分析得到快速算法的... CT图像重建过程中 ,标准的二维反投影运算计算量为O(N^3)。本研究提出一种快速二维反投影算法 ,其计算量仅为O(N^2 log_2~N )。该快速算法可以并行实现 ,处理器阵列规模为O(N^2 )时 ,计算量为O(log_2~N )。本研究还分析得到快速算法的误差上界 ,并提出一种改进的快速二维反投影算法以获得更高的计算精度。最后 ,对算法进行了仿真实验。理论分析及仿真实验结果都表明 ,本研究的二维反投影算法在CT图像重建过程中有着更高的计算效率 ,并且具有良好的计算精度。 展开更多
关键词 反投影 二维 CT 图像重建 快速算法 计算精度 仿真实验 处理器 分析及
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部