期刊文献+
共找到2,014篇文章
< 1 2 101 >
每页显示 20 50 100
Real-time Parallel Processing System Design and Implementation for Underwater Acoustic Communication Based on Multiple Processors
1
作者 阎振华 黄建国 +1 位作者 张群飞 何成兵 《Defence Technology(防务技术)》 SCIE EI CAS 2007年第2期139-144,共6页
ADSP-TS101 is a high performance DSP with good properties of parallel processing and high speed.According to the real-time processing requirements of underwater acoustic communication algorithms,a real-time parallel p... ADSP-TS101 is a high performance DSP with good properties of parallel processing and high speed.According to the real-time processing requirements of underwater acoustic communication algorithms,a real-time parallel processing system with multi-channel synchronous sample,which is composed of multiple ADSP-TS101s,is designed and carried out.For the hardware design,field programmable gate array(FPGA)logical control is adopted for the design of multi-channel synchronous sample module and cluster/data flow associated pin connection mode is adopted for multiprocessing parallel processing configuration respectively.And the software is optimized by two kinds of communication ways:broadcast writing way through shared bus and point-to-point way through link ports.Through the whole system installation,connective debugging,and experiments in a lake,the results show that the real-time parallel processing system has good stability and real-time processing capability and meets the technical design requirements of real-time processing. 展开更多
关键词 信息处理 结构 设计最佳化 电子
在线阅读 下载PDF
New multi-DSP parallel computing architecture for real-time image processing 被引量:4
2
作者 Hu Junhong Zhang Tianxu Jiang Haoyang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2006年第4期883-889,共7页
The flexibility of traditional image processing system is limited because those system are designed for specific applications. In this paper, a new TMS320C64x-based multi-DSP parallel computing architecture is present... The flexibility of traditional image processing system is limited because those system are designed for specific applications. In this paper, a new TMS320C64x-based multi-DSP parallel computing architecture is presented. It has many promising characteristics such as powerful computing capability, broad I/O bandwidth, topology flexibility, and expansibility. The parallel system performance is evaluated by practical experiment. 展开更多
关键词 parallel computing image processing REAL-TIME computer architecture
在线阅读 下载PDF
Efficient Partially Asynchronous Parallel Simulation on Multicomputer Systems: Research and Practice
3
作者 Chen, Delai Hong, Bo +1 位作者 Xie, Zhiwu Weng, Shilie 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1998年第2期40-47,共8页
This paper presents partially asynchronous parallel simulation of continuous-system (PAPSoCS) and some approaches to the issues of its implementation on a multicomputer system. To guarantee the simulation results cor... This paper presents partially asynchronous parallel simulation of continuous-system (PAPSoCS) and some approaches to the issues of its implementation on a multicomputer system. To guarantee the simulation results correct and speedup the simulation, the scheme for efficient PAPSoCS is proposed and the virtual topology star is constructed to match the path of message passing for solving algorithm-architecture adequation problem. Under the circumstances that messages frequently passed inter-processor are much shorter, typically within several 4 bytes, asynchronous communication mode is employed to reduce the communication ratio. Experiment results show that asynchronous parallel simulation has much higher efficiency than its synchronous counterpart. 展开更多
关键词 parallel processing Asynchronous computation Virtual topology Multicomputer system SIMULATION
在线阅读 下载PDF
Parallel Algorithm Case Study Using Virtual Machine
4
作者 Zhang, Gongqing 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1997年第3期51-59,共9页
This paper takes the Sobel operator as example to study parallel sequential algorithm onto a memory-sharing multiprocessor by using a virtual machine. Several different parallel algorithms using function decomposition... This paper takes the Sobel operator as example to study parallel sequential algorithm onto a memory-sharing multiprocessor by using a virtual machine. Several different parallel algorithms using function decomposition and/or data decomposition methods are compared and their performances are analyzed in terms of processor utilization, data traffic, shared memory access, and synchronization overhead. The analysis is validated through a simulation experiment on the virtual machine of 64 parallel processors. Conclusions are presented at the end of this paper. 展开更多
关键词 Computer simulation Data processing Data storage equipment Image processing parallel processing systems SYNCHRONIZATION Telecommunication traffic
在线阅读 下载PDF
A High Speed Signal Processing Machine -Its Architecture, Language and Compiler
5
作者 Wang Yufei and Yu ShiqiBeijing Institute of Data Processing Technology, P.O.Box 3927, Beijing 100039, China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1991年第1期119-128,共10页
A systolic array architecture computer (FXCQ) has been designed for signal processing. R can handle floating point data at very high speed. It is composed of 16 processing cells and a cache that are connected linearly... A systolic array architecture computer (FXCQ) has been designed for signal processing. R can handle floating point data at very high speed. It is composed of 16 processing cells and a cache that are connected linearly and form a ring structure. All processing cells are identical and programmable. Each processing cell has the peak performance of 20 million floating-point operations per second (20MFLOPS). The machine therefore has a peak performance of 320 M FLOPS. It is integrated as an attached processor into a host system through VME bus interface. Programs for FXCQ are written in a high-level language -B language, which is supported by a parallel optimizing compiler. This paper describes the architecture of FXCQ, B language and its compiler. 展开更多
关键词 parallel processing Systolic array processor parallel language Compiler.
在线阅读 下载PDF
Seismic 3D Prestack Time Migration on Parallel Computers
6
作者 Liu Ping & Chen Yunhe(Wuhan Digital Engineering institute, Wuchang P. O. Box 74223, P. R. China 430074) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1995年第3期49-55,共7页
Parallel versions of prestack KirchhofT 3D integral migration algorithm, which is suitable forseismic data processing, are described in this paper. Firstly, the inherent parallel characteristics of seismicdata process... Parallel versions of prestack KirchhofT 3D integral migration algorithm, which is suitable forseismic data processing, are described in this paper. Firstly, the inherent parallel characteristics of seismicdata processing are analyzed. Then some principles in algorithm partition are discussed. Based on these analyses and the system architecture, communication mechanism, this algorithm is divided into four subtasksallocated to four nodes of 990 STAR-l. Then we describe in detail a module-partitioning method-theI / O processing and communication are separated from the computation process, the processes includingI / O processing and communication are allocated to transputer T805 and the other is allocated to processori860. These two processes are synchronized by shared memory and memory-lock mechanism, but the communication betWeen different nodes is implemented through links of transputer. Load balance among fourprocessor modules is performed dynamically. Finally, we discussed the speed--up of the parallel versions ofprestack KirchhofT 3D integral migration algorithm running on four nodes. Some further researches are also melltioned in this paper. 展开更多
关键词 parallel algorithm 3D prestack migration parallel processing
在线阅读 下载PDF
Multi-task Coalition Parallel Formation Strategy Based on Reinforcement Learning 被引量:6
7
作者 JIANG Jian-Guo SU Zhao-Pin +1 位作者 QI Mei-Bin ZHANG Guo-Fu 《自动化学报》 EI CSCD 北大核心 2008年第3期349-352,共4页
代理人联盟是代理人协作和合作的一种重要方式。形成一个联盟,代理人能提高他们的能力解决问题并且获得更多的实用程序。在这份报纸,新奇多工联盟平行形成策略被介绍,并且多工联盟形成的过程是一个 Markov 决定过程的结论理论上被证... 代理人联盟是代理人协作和合作的一种重要方式。形成一个联盟,代理人能提高他们的能力解决问题并且获得更多的实用程序。在这份报纸,新奇多工联盟平行形成策略被介绍,并且多工联盟形成的过程是一个 Markov 决定过程的结论理论上被证明。而且,学习的加强被用来解决多工联盟平行的代理人行为策略,和这个过程形成被描述。在多工面向的领域,策略罐头有效地并且平行形式多工联盟。 展开更多
关键词 强化学习 多任务合并 平行排列 马尔可夫决策过程
在线阅读 下载PDF
A parallel pipeline connected-component labeling method for on-orbit space target monitoring
8
作者 LI Zongling ZHANG Qingjun +1 位作者 LONG Teng ZHAO Baojun 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2022年第5期1095-1107,共13页
The paper designs a peripheral maximum gray differ-ence(PMGD)image segmentation method,a connected-compo-nent labeling(CCL)algorithm based on dynamic run length(DRL),and a real-time implementation streaming processor ... The paper designs a peripheral maximum gray differ-ence(PMGD)image segmentation method,a connected-compo-nent labeling(CCL)algorithm based on dynamic run length(DRL),and a real-time implementation streaming processor for DRL-CCL.And it verifies the function and performance in space target monitoring scene by the carrying experiment of Tianzhou-3 cargo spacecraft(TZ-3).The PMGD image segmentation method can segment the image into highly discrete and simple point tar-gets quickly,which reduces the generation of equivalences greatly and improves the real-time performance for DRL-CCL.Through parallel pipeline design,the storage of the streaming processor is optimized by 55%with no need for external me-mory,the logic is optimized by 60%,and the energy efficiency ratio is 12 times than that of the graphics processing unit,62 times than that of the digital signal proccessing,and 147 times than that of personal computers.Analyzing the results of 8756 images completed on-orbit,the speed is up to 5.88 FPS and the target detection rate is 100%.Our algorithm and implementation method meet the requirements of lightweight,high real-time,strong robustness,full-time,and stable operation in space irradia-tion environment. 展开更多
关键词 Tianzhou-3 cargo spacecraft(TZ-3) connected-component labeling(CCL)algorithms parallel pipeline processing on-orbit space target detection streaming processor
在线阅读 下载PDF
医生群体医患冲突信息接触与防御性医疗行为的关系及其心理机制 被引量:1
9
作者 沈慧 邹禧乾 +3 位作者 卢伟 张艳霞 赵桂花 陈爽 《北京大学学报(自然科学版)》 北大核心 2025年第3期593-600,共8页
为了探究医生群体医患冲突信息接触与防御性医疗行为的关系及其心理机制,基于拓展平行过程模型(EPPM),调查我国各级医院 216例医生人际和媒体渠道的医患冲突信息接触,对其医患冲突感知严重性、易感性、自我效能、反应效能、恐惧情绪以... 为了探究医生群体医患冲突信息接触与防御性医疗行为的关系及其心理机制,基于拓展平行过程模型(EPPM),调查我国各级医院 216例医生人际和媒体渠道的医患冲突信息接触,对其医患冲突感知严重性、易感性、自我效能、反应效能、恐惧情绪以及防御性医疗行为的影响.使用 SmartPLS 4.1,利用偏最小二乘结构方程模型(PLS-SEM)进行数据分析和模型检验.结果显示,人际医患冲突信息接触与感知易感性正相关,与感知自我效能负相关.媒体医患冲突信息接触分别与感知严重性和易感性正相关,与感知自我效能负相关.感知严重性和易感性分别对恐惧具有正向预测作用.感知自我效能和反应效能分别与恐惧负相关,且恐惧能够正向预测防御性医疗行为.中介效应分析结果显示,感知易感性和自我效能分别与恐惧在人际医患冲突信息接触和防御性医疗行为之间的关系中存在显著的序列中介作用.感知严重性、易感性以及自我效能分别与恐惧在媒体医患冲突信息接触和防御性医疗行为之间的关系中存在显著的序列中介作用.研究结果揭示了人际和媒体医患冲突信息接触对医生群体防御性医疗行为背后心理转化的差异性机制. 展开更多
关键词 医患冲突信息接触 防御性医疗行为 恐惧诉求 拓展平行过程模型(EPPM)
在线阅读 下载PDF
虚拟仿真在复杂化工专业实验教学中的探索与实践——以CO中温-低温串联催化转化仿真实验为例 被引量:1
10
作者 林雄超 王彩红 任艳娇 《应用化学》 北大核心 2025年第1期124-132,共9页
受场地、操作环境等极端条件制约,复杂工程性创新实验难于线下开展,导致学生对化工专业前沿技术认知缺失,工程实践能力训练短缺。针对此问题,在化工专业实验中开展以实为主、以虚为辅的混合教学模式的探索。虚拟实验可大大降低实验操作... 受场地、操作环境等极端条件制约,复杂工程性创新实验难于线下开展,导致学生对化工专业前沿技术认知缺失,工程实践能力训练短缺。针对此问题,在化工专业实验中开展以实为主、以虚为辅的混合教学模式的探索。虚拟实验可大大降低实验操作风险,弥补实验时间和条件的不足,是化工专业实践教学改革和发展的有益探索。仿真实验中的理论学习、习题测验、流程设计、实验操作和报告处理的过程性评价制度涵盖了学生整体学习过程,综合反映学生对知识的掌握程度和综合实践的能力。在CO中温-低温串联催化转化仿真实验教学中,4项课程目标平均达成度分别为0.80、0.91、0.83和0.73,教学效果良好。实践证明,虚拟仿真实验能够从应用实际出发,通过新颖的实验内容设计,更能调动学生参与实验的积极性和主动性,是培养学生解决复杂工程问题能力的有效手段之一。 展开更多
关键词 专业实验 虚实并行 催化转化 工艺仿真
在线阅读 下载PDF
Reliability Comparison Between Parallel and Cold-standby Two-unit System Under Poisson Shock 被引量:1
11
作者 TANG Jia-shan LANG Man ZHAO Xiao-ling 《南京邮电大学学报(自然科学版)》 北大核心 2012年第2期118-120,共3页
This paper investigates the comparison problem of the reliability index between a parallel and a cold-standby system,both of which are consisting of two identical units.On the contrary to the general intuitive result,... This paper investigates the comparison problem of the reliability index between a parallel and a cold-standby system,both of which are consisting of two identical units.On the contrary to the general intuitive result,we proved that,under the condition that the system is shocked by a Poisson stream,the life time of the parallel system is longer than that of the cold-standby one in the sense of probability. 展开更多
关键词 parallel system cold-standby system shock model Poisson process reliablity index
在线阅读 下载PDF
基于门控扩张循环卷积神经网络的语音增强
12
作者 郭业才 周雪 《计算机工程与设计》 北大核心 2025年第6期1818-1824,共7页
为解决语音增强任务中语音信息未充分利用的问题,提出一种基于深度学习的方法,即融合精确比值掩蔽的门控扩张循环卷积神经网络(gate-dilated recurrent convolutional neural network with accurate ratio masking, GDRCNN-ARM)。GDRCN... 为解决语音增强任务中语音信息未充分利用的问题,提出一种基于深度学习的方法,即融合精确比值掩蔽的门控扩张循环卷积神经网络(gate-dilated recurrent convolutional neural network with accurate ratio masking, GDRCNN-ARM)。GDRCNN由编码器、循环卷积层和解码器3部分组成,编码器中借助扩张卷积和门控机制实现对上下文语音信息的捕获,进行并行处理;循环卷积层采用GRU且引入多头注意力机制,捕捉网络中的长期依赖关系;解码器采用逐层解码且通过跳跃连接进行编码器信息的复用,实现对语音细节的还原。实验数据表明,GDRCNN网络在参数量和模型大小方面明显优于DNN、CRN等网络,PESQ平均提高了0.612、0.158,STOI平均提高了0.072、0.020,在语音增强和泛化方面表现出色。 展开更多
关键词 语音增强 深度学习 精确比值掩蔽 扩张卷积 门控机制 循环卷积 并行处理
在线阅读 下载PDF
High performance reconfigurable hardware system for real-time image processing
13
作者 赵广州 张天序 +2 位作者 王岳环 曹治国 左峥嵘 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第3期502-509,共8页
A novel reconfigurable hardware system which uses both muhi-DSP and FPGA to attain high performance and real-time image processing are presented. The system structure and working principle of mainly processing multi-B... A novel reconfigurable hardware system which uses both muhi-DSP and FPGA to attain high performance and real-time image processing are presented. The system structure and working principle of mainly processing multi-BSP board, extended multi-DSP board are analysed. The outstanding advantage is that the communication among different board components of this system is supported by high speed link ports & serial ports for increasing the system performance and computational power. Then the implementation of embedded real-time operating systems (RTOS) by us is discussed in detail. In this system, we adopt two kinds of parallel structures controlled by RTOS for parallel processing of algorithms. The experimental results show that exploitive period of the system is short, and maintenance convenient. Thus it is suitable for real-time image processing and can get satisfactory effect of image recognition. 展开更多
关键词 MULTI-DSP fidd programmable gate arrays real-time image processing real time operating systems parallel structure.
在线阅读 下载PDF
基于离散度分析的Top-k组合Skyline查询算法
14
作者 董雷刚 刘国华 +1 位作者 王鑫 崔晓微 《计算机应用与软件》 北大核心 2025年第2期72-80,共9页
现有的组合Skyline查询算法不能区分组合中数据的离散度,且输出结果集很大。针对这种情况,提出基于数据离散度分析的Top-k组合Skyline查询算法。提出基于权重的组合离散系数概念及其计算方法;设置分类器将组合划分至不同的组合队列;采... 现有的组合Skyline查询算法不能区分组合中数据的离散度,且输出结果集很大。针对这种情况,提出基于数据离散度分析的Top-k组合Skyline查询算法。提出基于权重的组合离散系数概念及其计算方法;设置分类器将组合划分至不同的组合队列;采用并行处理方式对各组合队列进行计算。实验结果表明,该算法可以根据用户自定义条件准确有效地返回结果,能满足实际应用的需要。 展开更多
关键词 组合Skyline 离散度分析 TOP-K 离散系数 分类器 并行处理
在线阅读 下载PDF
支管布置方式对输水系统水力过渡过程的影响
15
作者 李琳 张绮萱 +1 位作者 张鲁国 李刚 《长江科学院院报》 北大核心 2025年第10期88-96,共9页
采用Bently Hammer软件分析了事故工况运行条件下奇台高压自流输水工程5种不同支管布置方案下的水力过渡过程。结果表明,在符合支管额定供水量的前提下,小管径支管并联布置代替单根大管径支管输水,能有效减少水锤波在管内反射、叠加次数... 采用Bently Hammer软件分析了事故工况运行条件下奇台高压自流输水工程5种不同支管布置方案下的水力过渡过程。结果表明,在符合支管额定供水量的前提下,小管径支管并联布置代替单根大管径支管输水,能有效减少水锤波在管内反射、叠加次数,降低输水系统水锤压力,缩短压力波动时长。并联支管数从2根增至5根的过程中,最危险事故工况下主管、支管内最大水锤压力相较于单根大管径输水方案最大减幅为10.32%和48.75%;各事故工况下主、支管管内压力波动时长最大减小了63.16%和46.15%,同时消除管线负压力水头防护负压力水锤。研究发现当支管与支管连接位置处主管管径比值(β)满足0.12<β<0.28区间时,能稳定输水系统水力过渡过程又兼具经济实用性。 展开更多
关键词 重力流输水 并联布置 支管 水力过渡过程 数值模拟
在线阅读 下载PDF
分布式无证书网络身份系统的关键技术研究构想和成果展望
16
作者 张小松 曹晟 +4 位作者 陆天波 杨坤 桂勋 谢国涛 牛伟纳 《工程科学与技术》 北大核心 2025年第3期1-10,共10页
随着万物互联的持续演进与深化,工业互联网、能源互联网、车联网等数字业务规模不断扩大。同时,各类软硬件设备与系统逐渐呈现智能化和复杂化,中心化身份认证方法面临的性能问题和安全威胁日益突出,适用于分布式无证书网络身份认证的技... 随着万物互联的持续演进与深化,工业互联网、能源互联网、车联网等数字业务规模不断扩大。同时,各类软硬件设备与系统逐渐呈现智能化和复杂化,中心化身份认证方法面临的性能问题和安全威胁日益突出,适用于分布式无证书网络身份认证的技术和平台缺失。为有效应对分布式网络身份认证的严峻挑战,研究分布式无证书身份认证基础理论体系和应用模式,包括认证架构、密钥管理、硬件增强、并行执行、集成应用等。本研究针对分布式无证书网络身份认证的3个科学问题:密钥系统安全高效管理、海量接入硬件加速认证、智能合约并行优化运行;围绕5大课题研究方向:高性能无证书的网络身份认证技术与架构、无证书的分布式密钥管理、高并行分布式终端接入硬件增强、多层级并行化智能合约虚拟机、分布式大规模物联网身份认证应用与验证;重点突破10类关键技术:高性能分布式身份标识与共识技术,无证书身份认证协议族与网络架构技术,基于智能合约的无证书密钥自动化管理技术,可持续抗攻击的分布式密钥生成、分发及回收技术,内生安全的高性能硬件层级构建技术,异构终端跨域安全接入一体化硬件加速技术,智能合约并行化协处理架构技术,智能合约虚拟机优化调度技术,轻量无证书公钥标识框架技术,基于国密的物联网标识身份管理技术;研发5种主要系统/工具:设备数字身份全流程管理系统、密钥全生命周期管理系统、硬件增强的高性能终端并发接入系统、基于国产芯片的智能合约协处理器系统、大规模分布式数字身份系统应用检测评估工具。面向能源物联网、车联网等典型工业互联网业务的分布式无证书环境下网络身份认证场景,构建具备基于国密和物联网标识认证的终端设备可信身份、安全接入、安全管控等功能的分布式大规模物联网身份认证应用平台。建立分布式无证书环境下网络身份标识、共识、集成、应用全过程的关键技术体系。研究成果从数字身份安全层面保障国家数字经济高质量安全发展,支撑中国网络空间安全与治理重大战略实施,有效鉴别对中国关键信息基础设施的访问与入侵,对于提升国家网络安全和信息化有重要意义。 展开更多
关键词 网络空间安全 区块链 无证书 密钥管理 硬件增强 并行处理 身份认证
在线阅读 下载PDF
OpenMP在天气雷达基数据压缩/解压和解码中的应用
17
作者 沃伟峰 赵昶昱 +2 位作者 顾小丽 陶岚 王国荣 《气象》 北大核心 2025年第10期1226-1236,共11页
以常规的PC工作站为基准,采用OpenMP技术,针对压缩/解压过程,设计了一种并行分块处理方案,在12核/24线程的CPU下,当分块数量达到16块时,数据的压缩、解压时间分别能减少至单线程的1/5和1/8左右;针对解码过程,比较了按PPI、径向和距离库... 以常规的PC工作站为基准,采用OpenMP技术,针对压缩/解压过程,设计了一种并行分块处理方案,在12核/24线程的CPU下,当分块数量达到16块时,数据的压缩、解压时间分别能减少至单线程的1/5和1/8左右;针对解码过程,比较了按PPI、径向和距离库不同颗粒下并行处理的结果,发现在径向上并行处理的方案最优,能够将解码时间缩减至单线程的1/8左右。通过上述两项并行优化技术的应用,可以显著降低雷达基数据在数据传输、预处理环节中的压力,也能提升雷达软件的数据载入性能,改善基于基数据的雷达分析软件的交互体验。 展开更多
关键词 天气雷达 基数据 并行处理 压缩 解压 解码
在线阅读 下载PDF
基于Informer算法的燃料电池寿命估算
18
作者 施永 赵洪霄 +3 位作者 谢缔 汪亮亮 苏建徽 解宝 《太阳能学报》 北大核心 2025年第8期240-248,共9页
为解决长短期记忆网络(LSTM)和门控循环单元神经网络(GRU)在捕捉长期依赖关系上的不足以及估算精度较低的问题,该文提出基于Informer算法的燃料电池寿命估算方法,旨在提高估算的准确性和效率。该方法采用加权平均法和皮尔逊系数法对数... 为解决长短期记忆网络(LSTM)和门控循环单元神经网络(GRU)在捕捉长期依赖关系上的不足以及估算精度较低的问题,该文提出基于Informer算法的燃料电池寿命估算方法,旨在提高估算的准确性和效率。该方法采用加权平均法和皮尔逊系数法对数据进行平滑处理,以增强数据的趋势性并减少噪声影响。结合Informer模型的多尺度信息融合和长期依赖建模能力,设计了一个能够实现燃料电池寿命在线估算的寿命估算框架。随后设计3组实验与传统的LSTM和GRU模型进行比较,当训练集占比80%时,Informer模型U_(MAE)、U_(RMSE)、U_(MAPE)均最小,估算精度高于LSTM和GRU模型。说明Informer模型在长时间序列估算方面表现出色,为燃料电池寿命估算提供可靠的依据。 展开更多
关键词 神经网络 燃料电池 并行处理 寿命估算 多头概率稀疏自注意力机制
在线阅读 下载PDF
并发式Spark消息分发器
19
作者 何玉林 林泽杰 +2 位作者 徐毓阳 成英超 黄哲学 《深圳大学学报(理工版)》 北大核心 2025年第3期317-325,I0012,I0013,共11页
在大数据计算框架Spark中,驱动器采用迭代式消息分发机制,会增加任务提交的时间开销,影响任务执行的启动时间,限制了任务执行的并发性,导致多个执行器处于空闲等待状态,造成计算资源的浪费.使用线程池调度策略,构建一种高效且轻量级的... 在大数据计算框架Spark中,驱动器采用迭代式消息分发机制,会增加任务提交的时间开销,影响任务执行的启动时间,限制了任务执行的并发性,导致多个执行器处于空闲等待状态,造成计算资源的浪费.使用线程池调度策略,构建一种高效且轻量级的并发式Spark消息分发器.与迭代式Spark消息分发器不同,并发式消息分发器更加关注且更适合调度开销较大的细粒度任务作业,通过解析包含执行器重要信息的元数据,获取任务列表及各个任务对应的执行器标识,创建线程池并为每个任务启动异步计算,从而实现并发式任务分发,在保证系统稳定和任务顺利执行的前提下,最大程度地减少任务分发的时间开销.在虚拟机构建的仿真集群环境上,通过与迭代式消息分发器进行对比,证实了并发式消息分发器的良好效果.实验结果表明,在内存保持不变的前提下,并发式Spark消息分发器可减少约9%的任务执行时间,同时能提高约5%的中央处理器的利用率.并发式Spark消息分发器有效解决了迭代式消息分发机制针对细粒度任务分发的时间开销过大和计算资源浪费的问题. 展开更多
关键词 并行处理 大数据计算 Spark通信机制 消息分发 细粒度任务 线程池调度
在线阅读 下载PDF
多相滤波器组技术在低频全天总功率测量实验中的应用
20
作者 王兴涛 刘雄伟 +3 位作者 王伟华 吴亚军 余赟 杨小龙 《天文学进展》 北大核心 2025年第2期300-308,共9页
作为探测宇宙再电离时期的重要方法之一,低频全天总功率实验的核心目标是在频谱为50~200 MHz的全天总功率谱中寻找宇宙再电离时期极其微弱的中性氢21 cm信号。目前通常使用快速傅里叶变换(fast Fourier transform, FFT)来计算功率谱,其... 作为探测宇宙再电离时期的重要方法之一,低频全天总功率实验的核心目标是在频谱为50~200 MHz的全天总功率谱中寻找宇宙再电离时期极其微弱的中性氢21 cm信号。目前通常使用快速傅里叶变换(fast Fourier transform, FFT)来计算功率谱,其存在的频谱泄漏问题,使得射频干扰(radio frequency interference, RFI)无法彻底剔除,从而严重干扰了微弱的宇宙再电离信号的提取。多相滤波器组(polyphase filter bank, PFB)是一种将信号按频率均匀划分的技术,可以替代FFT计算功率谱。介绍了PFB的基本原理及基于统一计算架构(compute unified device architecture, CUDA)的实现,并且通过仿真比较了PFB和FFT的性能,还比较了不同阶数的PFB性能差异。结果表明,PFB技术具有更平坦的带通响应、更窄的过渡带、更好的带外抑制。最后,对天马望远镜的观测数据及低频总功率实验产生的数据进行处理,验证了PFB技术的优越性,为全天总功率实验的频谱分析提供了一种有效的解决方法。 展开更多
关键词 CUDA PFB技术 GPU并行计算 信号处理 多相滤波器 FFT运算
在线阅读 下载PDF
上一页 1 2 101 下一页 到第
使用帮助 返回顶部