期刊文献+
共找到605篇文章
< 1 2 31 >
每页显示 20 50 100
航电系统计算平台多核处理器的DAG可调度性分析优化
1
作者 杨欢 王晓东 +3 位作者 何佩 刘尊 姚红静 郭阳明 《小型微型计算机系统》 北大核心 2025年第3期759-768,共10页
随着高性能的多核处理器在客机航空电子系统中被应用,并且有向无环图(Directed Acyclic Graph,DAG)被用于模型功能依赖,本文研究运行在同构多处理器平台上的单周期非抢占式DAG,致力于减少DAG的完成时间并提供一个紧密而安全的界限,充分... 随着高性能的多核处理器在客机航空电子系统中被应用,并且有向无环图(Directed Acyclic Graph,DAG)被用于模型功能依赖,本文研究运行在同构多处理器平台上的单周期非抢占式DAG,致力于减少DAG的完成时间并提供一个紧密而安全的界限,充分利用DAG拓扑节点的两个关键因素:并行性和依赖性.首先,引入了一个并发父子模型(Concurrent Parent and Children Model,CPCM),它精确地捕捉了上述两个因素,并且可以在解析DAG时递归地应用.在CPCM基础上,提出了一种新的调度方法减少最大完工时间,节点按以下顺序排列:1)关键路径;2)关键路径的早期前驱路径;3)更长的路径.其次,提出了一种新的响应时间分析,它为非关键节点的任何执行顺序提供了一个通用的界限,并为固定的执行顺序提供了一个特定的界限.实验表明该可调度性分析方法优于其他方法. 展开更多
关键词 多核 并行 有限无环图 父子模型 响应时间分析
在线阅读 下载PDF
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
2
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量乘 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
一机多芯模块化服务器系统
3
作者 高显扬 吴安 +2 位作者 慈潭龙 李金锋 赵伟康 《计算机工程与应用》 北大核心 2025年第5期344-354,共11页
面向多样化应用场景需求和多元算力融合挑战,创新“一机多芯模块化服务器”软硬件体系结构。以服务器系统互连交换为中心,将多元计算单元和系统硬件资源进行解耦池化。通过标准化接口定义和统一控制与管理实现底层硬件差异化集成,实现... 面向多样化应用场景需求和多元算力融合挑战,创新“一机多芯模块化服务器”软硬件体系结构。以服务器系统互连交换为中心,将多元计算单元和系统硬件资源进行解耦池化。通过标准化接口定义和统一控制与管理实现底层硬件差异化集成,实现多元算力协同、资源按需调配、系统统一调度与管理。关键技术包括高性能无阻塞总线互连交换、池化单元长距离低延时互连、内存和存储资源解耦池化、整机系统监控管理和系统资源拓扑管理等。一机多芯模块化服务器系统,可实现全部硬件解耦和弹性组合,实现在服务器系统内兼容多元算力模组以及多元算力和共享资源按需在线调配。实验结果显示一机多芯系统实现了均衡的16卡GPU低延时通信和系统性能线性提升,可面向AI场景实现异构算力按需分配;实现了亚微秒级远端内存访问,扩展了内存带宽和容量,有效提升系统性能;实现了细粒度存储池化资源共享,满足多主机高并发存储应用需求。 展开更多
关键词 一机多芯 模块化服务器 融合架构 硬件解耦 资源池化 异构算力
在线阅读 下载PDF
同构多核平台上基于弱硬约束和优先级距离启发的任务划分算法
4
作者 龚伟强 韩建军 张昌安 《计算机科学》 北大核心 2025年第4期101-109,共9页
弱硬实时(Weakly-Hard Real-Time,WHRT)系统由于能够有效地利用计算资源,并且可以同时容忍部分作业的超时来保证系统的稳定性,因此在过去二十年中得到了极大的发展。然而,目前关于多核环境下弱硬实时任务调度的研究却较少,现有的基于全... 弱硬实时(Weakly-Hard Real-Time,WHRT)系统由于能够有效地利用计算资源,并且可以同时容忍部分作业的超时来保证系统的稳定性,因此在过去二十年中得到了极大的发展。然而,目前关于多核环境下弱硬实时任务调度的研究却较少,现有的基于全局调度的方案因任务迁移带来的高运行时开销,实际可行性受到了极大的限制;而作业级分区算法则通常忽略了弱硬约束下任务利用率的影响,因此任务集的可调度性性能不高。为了解决这些问题,基于单处理器的全局紧急调度(Global Emergency-Based Scheduling,GEBS),提出了一种弱硬约束启发的任务划分算法(Weakly-Hard-Constraint Aware Task Partition Algorithm,WHCA-TPA)和另一种优先级距离启发的任务划分算法(Priority-Distance-Aware Task Partition Algorithm,PDA-TPA)。WHCA-TPA考虑不同任务之间的干扰,对系统的利用率进行更合理的估计,并以此作为启发对任务进行更合理的分配。PDA-TPA通过减少同一核上不同优先级任务之间的抢占次数,来减少系统上下文切换的次数。将所提算法与现有的传统分区算法进行对比,大量的实验结果表明,WHCA-TPA在不同系统参数下都可以获得更高的可调度比例,并且和PDA-TPA在绝大部分情况下都能有效地降低运行时开销。 展开更多
关键词 多核处理器 实时系统 弱硬约束 利用率启发 分区算法
在线阅读 下载PDF
基于改进平衡优化器算法的绿色HJSMT问题求解
5
作者 亓祥波 佟年 +1 位作者 王亚双 宋岩 《制造技术与机床》 北大核心 2025年第5期153-163,共11页
针对混合多处理任务作业车间调度(hybrid job-shop scheduling with multiprocessor task, HJSMT)问题,以最小化最大完工时间和最小化总能耗为目标建立绿色HJSMT问题模型,提出一种改进平衡优化器算法(improved equilibrium optimizer, I... 针对混合多处理任务作业车间调度(hybrid job-shop scheduling with multiprocessor task, HJSMT)问题,以最小化最大完工时间和最小化总能耗为目标建立绿色HJSMT问题模型,提出一种改进平衡优化器算法(improved equilibrium optimizer, IEO)进行求解。算法在初始化阶段采用混合种群策略,融合随机生成与混沌映射规则,以提升初始解集的多样性与质量;在全局搜索阶段,引入Lévy飞行策略与反向搜索策略,有效扩大搜索范围的同时帮助种群跳出局部最优;此外,引入借鉴模拟退火思想的局部搜索,增强了算法的局部搜索能力,降低了种群陷入局部最优的风险。运用大量仿真实验对所提算法进行性能验证,实验结果表明,相较于其他对比算法,IEO在绿色HJSMT问题优化方面体现出更强的优越性和稳定性。 展开更多
关键词 混合车间调度 多处理机任务 平衡优化器算法 绿色调度 模拟退火思想
在线阅读 下载PDF
Approximation algorithm for multiprocessor parallel job scheduling 被引量:1
6
作者 陈松乔 黄金贵 陈建二 《Journal of Central South University of Technology》 2002年第4期267-272,共6页
P k |fix| C max problem is a new scheduling problem based on the multiprocessor parallel job, and it is proved to be NP hard problem when k ≥3. This paper focuses on the case of k =3. Some new observations and new te... P k |fix| C max problem is a new scheduling problem based on the multiprocessor parallel job, and it is proved to be NP hard problem when k ≥3. This paper focuses on the case of k =3. Some new observations and new techniques for P 3 |fix| C max problem are offered. The concept of semi normal schedulings is introduced, and a very simple linear time algorithm Semi normal Algorithm for constructing semi normal schedulings is developed. With the method of the classical Graham List Scheduling, a thorough analysis of the optimal scheduling on a special instance is provided, which shows that the algorithm is an approximation algorithm of ratio of 9/8 for any instance of P 3|fix| C max problem, and improves the previous best ratio of 7/6 by M.X.Goemans. 展开更多
关键词 multiprocessor PARALLEL JOB SCHEDULING APPROXIMATION algorithm NP-HARD problem
在线阅读 下载PDF
Temporal consistency maintenance on multiprocessor platforms with instance skipping
7
作者 BAI Tian LI Zhi-jie FAN Bo 《Journal of Central South University》 SCIE EI CAS CSCD 2020年第11期3364-3374,共11页
Maintaining temporal consistency of real-time data is important for cyber-physical systems.Most of the previous studies focus on uniprocessor systems.In this paper,the problem of temporal consistency maintenance on mu... Maintaining temporal consistency of real-time data is important for cyber-physical systems.Most of the previous studies focus on uniprocessor systems.In this paper,the problem of temporal consistency maintenance on multiprocessor platforms with instance skipping was formulated based on the(m,k)-constrained model.A partitioned scheduling method SC-AD was proposed to solve the problem.SC-AD uses a derived sufficient schedulability condition to calculate the initial value of m for each sensor transaction.It then partitions the transactions among the processors in a balanced way.To further reduce the average relative invalid time of real-time data,SC-AD judiciously increases the values of m for transactions assigned to each processor.Experiment results show that SC-AD outperforms the baseline methods in terms of the average relative invalid time and the average valid ratio under different system workloads. 展开更多
关键词 cyber-physical systems sensor transactions multiprocessor scheduling temporal consistency
在线阅读 下载PDF
基于Amdahl定律的异构多核密码处理器能效模型研究 被引量:1
8
作者 李伟 郎俊豪 +1 位作者 陈韬 南龙梅 《电子学报》 EI CAS CSCD 北大核心 2024年第3期849-862,共14页
边缘计算安全的资源受限特征及各种新型密码技术的应用,对多核密码处理器的高能效、异构性提出需求,但当前尚缺乏相关的异构多核能效模型研究.本文基于扩展Amdahl定律,引入密码串并特征、异构多核结构、数据准备时间、动态电压频率调节... 边缘计算安全的资源受限特征及各种新型密码技术的应用,对多核密码处理器的高能效、异构性提出需求,但当前尚缺乏相关的异构多核能效模型研究.本文基于扩展Amdahl定律,引入密码串并特征、异构多核结构、数据准备时间、动态电压频率调节等因素,将核划分空闲、活跃状态,建立异构多核密码处理器的能效模型.MATLAB仿真结果表明,数据准备时间占比小于10%时,对能效的负面影响大幅下降;固定电压,频率缩放会影响能效值大小;处理器核空闲/活跃能耗比例越小,能效值越大.架构上,固定异构核,同构核数量与密码任务最大并行度相等时能效值最大,最佳异构核数可由模型变化参数仿真得到;多任务调度执行上,流水与并发执行有利于能效值的进一步提升.多核密码处理器芯片板级测试结果表明,仿真结果与实测数据相关系数接近1,芯片实测的数据准备时间、电压频率缩放等因素的影响与仿真分析基本一致,验证了所提能效模型的有效性.该文重点从影响能效变化趋势因素上,为多核密码处理器异构、高能效设计提供一定的理论分析基础与建议. 展开更多
关键词 密码处理器 多核处理器 异构 AMDAHL定律 能效模型
在线阅读 下载PDF
长向量处理器高效RNN推理方法 被引量:1
9
作者 苏华友 陈抗抗 杨乾明 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期121-130,共10页
模型深度的不断增加和处理序列长度的不一致对循环神经网络在不同处理器上的性能优化提出巨大挑战。针对自主研制的长向量处理器FT-M7032,实现了一个高效的循环神经网络加速引擎。该引擎采用行优先矩阵向量乘算法和数据感知的多核并行方... 模型深度的不断增加和处理序列长度的不一致对循环神经网络在不同处理器上的性能优化提出巨大挑战。针对自主研制的长向量处理器FT-M7032,实现了一个高效的循环神经网络加速引擎。该引擎采用行优先矩阵向量乘算法和数据感知的多核并行方式,提高矩阵向量乘的计算效率;采用两级内核融合优化方法降低临时数据传输的开销;采用手写汇编优化多种算子,进一步挖掘长向量处理器的性能潜力。实验表明,长向量处理器循环神经网络推理引擎可获得较高性能,相较于多核ARM CPU以及Intel Golden CPU,类循环神经网络模型长短记忆网络可获得最高62.68倍和3.12倍的性能加速。 展开更多
关键词 多核DSP 长向量处理器 循环神经网络 并行优化
在线阅读 下载PDF
一种面向异构片上系统的调试器框架
10
作者 唐俊龙 李奕成 +1 位作者 邹望辉 时洋 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期119-127,共9页
异构片上系统具有定制化满足应用的特异性需求特点,成为多个领域内的主流解决方案.但用户在异构片上系统上进行开发需要面对多种计算资源带来的程序错误,而不同异构片上系统构建统一的调试器框架也面临巨大的挑战.针对上述问题,本文提... 异构片上系统具有定制化满足应用的特异性需求特点,成为多个领域内的主流解决方案.但用户在异构片上系统上进行开发需要面对多种计算资源带来的程序错误,而不同异构片上系统构建统一的调试器框架也面临巨大的挑战.针对上述问题,本文提出了一种面向异构片上系统的调试器框架,该调试器框架设计了异构处理器调试器框架通用接口,开发者可以通过框架功能接口快速构建异构调试器.该框架功能丰富,通过线程切换实现了对异构多核程序的调试,也实现了异构程序性能分析等功能.该框架生成的调试器与传统硬件调试器相比,加载异构程序速度快,是读内存速率的5.5倍,是写内存速率的16.5倍,调试速度大大提高. 展开更多
关键词 异构片上系统 调试器 异构调试 多核调试 性能分析
在线阅读 下载PDF
资源限制性并行任务固定优先级可调度性分析 被引量:1
11
作者 韩美灵 孙施宁 +4 位作者 金曦 邓庆绪 郑彬双 夏长清 宋波 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1496-1503,共8页
异构多核平台的发展,导致并行任务需要执行在具有多样性资源的多核平台上.虽然,并行任务的某个程序片段只能在规定的资源上执行,但是这样操作可以充分利用各类不同资源的特性,达到更加快速节能处理任务的目的.同时,具有资源限制任务的... 异构多核平台的发展,导致并行任务需要执行在具有多样性资源的多核平台上.虽然,并行任务的某个程序片段只能在规定的资源上执行,但是这样操作可以充分利用各类不同资源的特性,达到更加快速节能处理任务的目的.同时,具有资源限制任务的可调度性研究在实时嵌入式系统领域已有一定的研究成果,但是采用的任务模型相对简单,分析方法不够精确.鉴于此,本文对具有资源限制性的并行任务在全局固定优先级调度策略下的可调度性问题进行了研究,基于单并行任务的分析方法提出了基于全局固定优先级调度策略的分析方法.首先,基于分解策略提出了高优先级任务干涉的分析方法.然后,将高优先级任务干涉分析方法和单并行任务提出的路径抽象技术相结合,推导出并行任务的最差响应时间算法.最后,通过仿真实验进行验证所提出的算法在可调度性、精确度层面的性能.实验结果表明,提出的算法在各个参数下的接受率实验符合实验预期,分析时间相对降低,但平均分析时间仍然在离线分析的可接受范围内,提出的算法能够对实时系统并行软件设计提供一定的指导价值. 展开更多
关键词 异构多核 嵌入式实时系统 可调度性分析 并行任务 最差响应时间
在线阅读 下载PDF
面向多核向量加速器的卷积神经网络推理和训练向量化方法 被引量:1
12
作者 陈杰 李程 刘仲 《计算机工程与科学》 CSCD 北大核心 2024年第4期580-589,共10页
随着以卷积神经网络为代表的深度学习得到广泛应用,神经网络模型中的计算量也急速增长,推动了深度学习加速器的发展。如何针对加速器硬件的体系结构特性进行加速和优化神经网络模型的性能成为研究热点。针对自主设计的多核向量加速器FT-... 随着以卷积神经网络为代表的深度学习得到广泛应用,神经网络模型中的计算量也急速增长,推动了深度学习加速器的发展。如何针对加速器硬件的体系结构特性进行加速和优化神经网络模型的性能成为研究热点。针对自主设计的多核向量加速器FT-M7004上的VGG网络模型推理和训练算法,分别提出了卷积、池化和全连接等核心算子的向量化映射方法,采用SIMD向量化、DMA双缓冲传输和权值共享等优化策略,充分发挥了向量加速器的体系结构优势,取得了较高的计算效率。实验结果表明,在FT-M7004平台上,卷积层推理和训练的平均计算效率分别达到了86.62%和69.63%;全连接层推理和训练的平均计算效率分别达到了93.17%和81.98%;VGG网络模型在FT-M7004上的推理计算效率超过GPU平台20%以上。 展开更多
关键词 多核向量加速器 卷积神经网络 推理算法 训练算法
在线阅读 下载PDF
一种不规则稀疏矩阵的SpMV方法
13
作者 施禹 董攀 张利军 《计算机工程与科学》 CSCD 北大核心 2024年第7期1175-1184,共10页
稀疏矩阵-向量乘法SpMV是高性能计算领域的关键算子之一,在新兴的深度学习领域中有着重要应用。现有SpMV算子通常采用行列相等的稀疏矩阵,而对于不规则形状稀疏矩阵(行数与列数不等)的研究仍存在空缺,值得进一步深入探讨。相比于行列相... 稀疏矩阵-向量乘法SpMV是高性能计算领域的关键算子之一,在新兴的深度学习领域中有着重要应用。现有SpMV算子通常采用行列相等的稀疏矩阵,而对于不规则形状稀疏矩阵(行数与列数不等)的研究仍存在空缺,值得进一步深入探讨。相比于行列相等的稀疏矩阵,不规则形状稀疏矩阵凭借其行数与列数不对等的稀疏特点具有进一步优化的空间。因此,针对这种行数与列数不对等的不规则形状稀疏矩阵建立SpMV性能模型,分析得到其出现性能瓶颈的原因在于缓存和内存之间数据交互的带宽不足。同时做了以下2个方面的优化工作:(1)基于常用稀疏矩阵CSR存储格式,提出新型RCSR存储格式,其针对CSR存储格式中一个制约性能的数组进行了变换和压缩,使得SpMV更加高效;(2)结合国产处理器的SIMD指令扩展设计了基于RCSR格式的SpMV优化算法。在国产飞腾处理器上分别使用规则和不规则稀疏矩阵进行测试,在规则稀疏矩阵的情况下,通过采用RCSR存储格式和SIMD加速指令集,以GFLOPS为性能指标,实现了平均83.35%的性能提升;在不规则稀疏矩阵的情况下,性能提升与行列比相关,在行列不对等加剧时,具有更为明显的优化效果。 展开更多
关键词 稀疏矩阵 不规则矩阵 向量乘法 多核性能 性能优化
在线阅读 下载PDF
无监督健康指标在轴承早期故障检测中的应用
14
作者 肖飞 马萍 +1 位作者 张宏立 王聪 《组合机床与自动化加工技术》 北大核心 2024年第6期151-155,160,共6页
针对滚动轴承早期故障时间点难以检测问题,提出一种基于卷积深度置信网络(convolutional deep belief network, CDBN)与多核极限学习机自编码器(multi-kernel extreme learning machine based autoencoder, MKELM-AE)的无监督健康指标... 针对滚动轴承早期故障时间点难以检测问题,提出一种基于卷积深度置信网络(convolutional deep belief network, CDBN)与多核极限学习机自编码器(multi-kernel extreme learning machine based autoencoder, MKELM-AE)的无监督健康指标故障检测方法。首先,引入CDBN自适应提取滚动轴承健康状态振动信号频谱的深层高维特征信息,去除高维数据冗余信息后得到表征滚动轴承健康状态的低维特征;然后,采用粒子群优化(particle swarm optimization, PSO)的MKELM-AE对提取的低维特征进行重构训练;最后,将待测信号输入训练好的CDBN-MKELM-AE模型中计算重构误差作为反映滚动轴承退化的健康指标,并采用Bootstrap Pettitt异常检测方法检测待测健康指标发生突变的时间。实验结果表明,所提方法建立的健康指标能反映轴承退化的不同阶段,可有效检测出早期故障中健康指标发生突变的时间,定位早期故障点。 展开更多
关键词 滚动轴承 早期故障预测 卷积深度置信网络 多核极限学习机 健康指标
在线阅读 下载PDF
基于AMP模式多核处理器的可信节点构建方法 被引量:1
15
作者 刘威鹏 郝俊芳 +1 位作者 李跃鹏 李虎威 《现代电子技术》 北大核心 2024年第12期37-44,共8页
针对多核处理器的安全性进行研究,深入探讨了微处理器技术的发展背景以及多核处理器在非对称多处理(AMP)模式下所面临的安全挑战。通过运用可信计算技术和双体系架构,结合AMP模式的工作特点以及多核之间的控制机制,提出一种主动免疫防... 针对多核处理器的安全性进行研究,深入探讨了微处理器技术的发展背景以及多核处理器在非对称多处理(AMP)模式下所面临的安全挑战。通过运用可信计算技术和双体系架构,结合AMP模式的工作特点以及多核之间的控制机制,提出一种主动免疫防御系统的策略和可信节点的构建方法,分析了可信计算在全工作过程中的度量机制,有效解决了多核处理器在AMP模式下的安全问题,同时很好地保持了核内原有系统的实时性。该方法不仅可以增强多核处理器的安全性,还能确保系统的可信运行环境,为未来计算设备的安全提供了坚实的支撑。通过对实验验证结果的分析,构建方案完全可行,能够在实际应用中推广。 展开更多
关键词 非对称多处理 多核处理器 可信节点 可信计算技术 双体系架构 安全防护 可信环境
在线阅读 下载PDF
应用于相干成像的一种螺旋多芯光纤设计
16
作者 郑金虎 徐炳生 +2 位作者 沈赫男 于飞 陈建 《光子学报》 EI CAS CSCD 北大核心 2024年第1期212-221,共10页
用于内窥成像的多芯光纤在弯曲条件下传输的光场相位容易出现复杂的随机扰动,为相干成像中的相位恢复带来极大挑战。本文提出了一种可以用于相干成像的螺旋多芯光纤设计,通过调控纤芯尺寸、纤芯间距和螺距来抑制弯曲等外界扰动对纤芯间... 用于内窥成像的多芯光纤在弯曲条件下传输的光场相位容易出现复杂的随机扰动,为相干成像中的相位恢复带来极大挑战。本文提出了一种可以用于相干成像的螺旋多芯光纤设计,通过调控纤芯尺寸、纤芯间距和螺距来抑制弯曲等外界扰动对纤芯间群时延差和功率串扰的影响。本文建立了弯曲条件下螺旋多芯光纤纤芯光程的数学模型;根据变换光学基本原理,利用有限元仿真软件对螺旋多芯光纤的模式特性进行数值仿真计算。设计的螺旋多芯光纤具有20μm的芯间距和20π/m的扭转率,共有6层91个纤芯,不同层的纤芯尺寸不同。无弯曲时芯间群时延差小于6 fs/m;当弯曲半径大于5 cm时,芯间群时延差的变化小于32 fs/m,100 m长度上纤芯间串扰的仿真计算结果低于−550 dB。螺旋多芯光纤的芯间群时延差对弯曲不敏感,在相干成像中代替普通光纤束传递光场,有助于降低相干图像恢复方法的复杂度,可以广泛应用于光纤显微成像、超快激光成像等领域。 展开更多
关键词 多芯光纤 相干成像 串扰 群时延 螺旋线
在线阅读 下载PDF
一种分片式多核处理器的用户级模拟器 被引量:6
17
作者 黄琨 马可 +2 位作者 曾洪博 张戈 章隆兵 《软件学报》 EI CSCD 北大核心 2008年第4期1069-1080,共12页
随着片上晶体管资源的增多和互连线延迟的加大,分片式多核微处理器已成为多核处理器设计的新方向.为了对这种新型处理器进行体系结构的深入研究和设计空间的探索,设计并实现了针对分片式多核处理器的用户级多核性能模拟器.该多核模拟器... 随着片上晶体管资源的增多和互连线延迟的加大,分片式多核微处理器已成为多核处理器设计的新方向.为了对这种新型处理器进行体系结构的深入研究和设计空间的探索,设计并实现了针对分片式多核处理器的用户级多核性能模拟器.该多核模拟器在龙芯2号单处理器核的基础上,完整地模拟了基于目录的Cache一致性协议和存储转发式片上互联网络的结构模型,详细地刻画了由于系统乱序处理各种请求应答和请求之间的冲突而造成的时序特性,可以通过运行各种串行或并行的工作负载对多核处理器的各种重要性能指标加以评估,为多核处理器的结构设计提供了快速、灵活、高效的研究平台. 展开更多
关键词 分片式CMP(chip multiprocessor) 模拟器 片上网络 性能分析 龙芯2号微处理器
在线阅读 下载PDF
单片多处理器的研究 被引量:7
18
作者 史莉雯 樊晓桠 张盛兵 《计算机应用研究》 CSCD 北大核心 2007年第9期46-49,共4页
单片多处理器结构支持较高线程级的并行,能显著提高性能。介绍了单片多处理器的结构,对一些结构模型和实际的商用处理器进行举例,并对关键技术进行了研究分析。
关键词 单片多处理器 线程级并行 存储层次 核间互连 多核任务调度
在线阅读 下载PDF
内存OLAP多核并行查询优化技术研究 被引量:4
19
作者 焦敏 张延松 +1 位作者 王珊 陈红 《计算机学报》 EI CSCD 北大核心 2014年第9期1895-1910,共16页
随着以大内存和多核为代表的计算机硬件技术的发展,以cache-conscious算法为中心的查询优化技术逐渐转向以multicore-conscious为中心的查询优化技术,来提高多核处理器的并行处理性能.该文的研究目标是具备复杂星型连接特点的联机分析处... 随着以大内存和多核为代表的计算机硬件技术的发展,以cache-conscious算法为中心的查询优化技术逐渐转向以multicore-conscious为中心的查询优化技术,来提高多核处理器的并行处理性能.该文的研究目标是具备复杂星型连接特点的联机分析处理OLAP技术,以查询执行代价最大的星型连接为研究对象,提出同时满足cache-conscious和multicore-conscious的多核并行连接算法DDTA-MPJ.该算法包括基于事实表水平分片和维属性列共享访问模式的查询内多核并行算法IntraDDTA-MPJ、基于QuerySlots的查询间多核并行算法InterDDTAMPJ以及中位数多核并行算法Median-MPJ.实验结果表明该算法具有良好且稳定的并行查询处理性能,线性查询处理模型能够更好地利用多核处理器的先进性能. 展开更多
关键词 多核敏感算法 星型连接 多核并行 并行中位数聚集计算
在线阅读 下载PDF
多处理器实时系统可调度性分析的UPPAAL模型 被引量:19
20
作者 代声馨 洪玫 +3 位作者 郭兵 杨秋辉 黄蔚 徐保平 《软件学报》 EI CSCD 北大核心 2015年第2期279-296,共18页
随着多处理器实时系统在安全性攸关系统中的广泛应用,保证这类系统的正确性成为一项重要的工作.可调度性是实时系统正确性的一项关键性质.它表示系统必须满足的一些时间要求.传统的可调度性分析方法结论保守或者不完备,为了避免这些方... 随着多处理器实时系统在安全性攸关系统中的广泛应用,保证这类系统的正确性成为一项重要的工作.可调度性是实时系统正确性的一项关键性质.它表示系统必须满足的一些时间要求.传统的可调度性分析方法结论保守或者不完备,为了避免这些方法的缺陷,提出使用模型检测的方法来实现可调度性分析.提出了一个用于多处理器实时系统可调度性分析的模板,将与系统可调度性相关的部分包括实时任务、运行平台和调度管理模块都用时间自动机建模,并使用UPPAAL验证可调度的性质是否总被满足.符号化模型检测方法被用于推断可调度性,但是由于秒表触发的近似机制,符号化模型检测方法不能用于证明系统不可调度.作为补充,统计模型检测方法被用于估算系统不可调度的概率,并在系统不可调度时生成反例.此外,在系统可调度时,通过统计模型检测方法获取一些性能相关的信息. 展开更多
关键词 可调度性 模型检测 UPPAAL 多处理器实时系统 时间自动机
在线阅读 下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部