期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
云计算环境下多模态异构网络数据安全存储方法
1
作者 李晓静 杨秀杰 《现代电子技术》 北大核心 2025年第6期63-67,共5页
为了快速、准确地存储多模态异构网络数据,提出一种云计算环境下多模态异构网络数据安全存储方法。采用编译套件部署多模态异构网络,利用后端编译模组生成网络的初始化配置,再利用前端编译模组分析与优化网络。针对多模态异构网络,构建... 为了快速、准确地存储多模态异构网络数据,提出一种云计算环境下多模态异构网络数据安全存储方法。采用编译套件部署多模态异构网络,利用后端编译模组生成网络的初始化配置,再利用前端编译模组分析与优化网络。针对多模态异构网络,构建包括客户端、服务器端、云存储服务插件、元数据存储的私有云存储架构。私有云存储架构采用虚拟化加解密方式,运行基于匿名广播加密的数据加密算法,引入拉格朗日插值方法,利用数据对应的会话密钥实现多模态异构网络数据的安全存储。实验结果表明,所提方法能够高效地存储多模态异构网络数据,数据传输的吞吐量高于3 Mb/s,加解密耗时低,存储的完整性高。 展开更多
关键词 云计算环境 多模态 异构网络 数据安全 存储方法 匿名广播加密 云存储架构
在线阅读 下载PDF
城市街道绿化泛类结构的视觉感知特征——以天津市市内六区为例
2
作者 杨瀚文 邹尚恩 胡一可 《风景园林》 北大核心 2025年第5期37-44,共8页
【目的】绿化资源配置是城市公共空间优化的重要环节之一,对居民生活质量的提升有着积极的作用。城市街道绿化泛类结构(urban street greening general structure,USGGS)能够反映街道绿化在行人视觉环境中的整体特征,研究USGGS聚类对于... 【目的】绿化资源配置是城市公共空间优化的重要环节之一,对居民生活质量的提升有着积极的作用。城市街道绿化泛类结构(urban street greening general structure,USGGS)能够反映街道绿化在行人视觉环境中的整体特征,研究USGGS聚类对于物质空间要素数量以及物质空间形态的改变,能够有效探究街道绿化对行人视觉感知水平的影响。【方法】采用百度街景数据,利用DeepLabV3+神经网络模型,对天津市市内六区街道的物质空间要素进行分割,使用ArcGIS软件对空间分布特征进行可视化处理,结合数理统计分析结果,探讨USGGS与行人视觉感知之间的关系。【结果】USGGS聚类呈现向心聚集型的空间分布特征,城市主干道及快速路的行人视觉感知空间分布特征较为同质化,空间异质化现象集中出现在街道断面狭窄的生活型街道以及商业型街道。不同聚类的USGGS不仅对行人视觉感知有不同程度的影响,也与场所属性以及绿化空间位置密切相关。【结论】提升城市街道环境质量需要考虑行人视觉感知水平。合理的USGGS配置以及适当的种植点位能够更好地适应周围场所的属性,促进城市公共空间与城市街道绿化的有机融合,助推城市更新工作的精细化管理,提升城市人居环境质量。 展开更多
关键词 风景园林 计算机视觉 城市街道 绿化结构 视觉感知 空间异质性
在线阅读 下载PDF
基于可重构架构的数据中心异构加速软硬件系统级平台
3
作者 王彦伟 李仁刚 +1 位作者 徐冉 刘钧锴 《计算机研究与发展》 北大核心 2025年第4期963-977,共15页
构建数据中心加速服务的软硬件系统级原型平台,需要考虑高计算能力、扩展性、灵活性和低成本等因素.为了提高数据中心的能力,从软硬件协同的角度研究数据中心异构计算在云平台架构、硬件实现、高速互连和应用等方面的创新,研究设计并构... 构建数据中心加速服务的软硬件系统级原型平台,需要考虑高计算能力、扩展性、灵活性和低成本等因素.为了提高数据中心的能力,从软硬件协同的角度研究数据中心异构计算在云平台架构、硬件实现、高速互连和应用等方面的创新,研究设计并构建了一个可重构组合的软硬件加速原型系统,简化了现有以处理器为中心的系统级计算平台构建方法,实现目标软硬件设计的快速部署与系统级原型验证.针对以上目标,通过解耦的可重构架构设备虚拟化和远程映射等方法,发掘独立计算单元的潜力,构建了一套ISOF(independent system of FPGA(field programmable gate arrays))软硬件计算平台系统,可使其超越普通服务器设计所能提供的能力,实现计算单元低成本高效扩展,使客户端可灵活使用外设资源,并且为满足系统级通信挑战,设计了一套计算单元之间的通信硬件平台和交互机制.此外,为提升软硬件系统级平台的敏捷性,ISOF提供了灵活统一的调用接口.最后,通过对平台目标系统级的分析评估,验证了该平台在满足了当下计算与加速需求下,保证了高速、低延时的通信,以及良好的吞吐率和弹性扩容效率,另外在高速通信的基础上改进的拥塞避免和丢包恢复机制,满足了数据中心规模通信的稳定性需求. 展开更多
关键词 异构计算 加速平台 原型系统 高速互连 可重构架构 FPGA
在线阅读 下载PDF
基于OpenVPX标准的异构融合处理模块软硬件协同设计研究 被引量:1
4
作者 文敏华 石添介 田径 《弹箭与制导学报》 北大核心 2024年第3期103-108,共6页
随着计算机软硬件技术的持续进步,机载计算平台集成的任务功能日益增多,导致平台内部的计算需求在规模和复杂性上不断攀升。面对智能化应用的迅猛增长,传统的单一处理器架构已不足以应对多样化的复杂任务。为此,基于OpenVPX标准,定义并... 随着计算机软硬件技术的持续进步,机载计算平台集成的任务功能日益增多,导致平台内部的计算需求在规模和复杂性上不断攀升。面对智能化应用的迅猛增长,传统的单一处理器架构已不足以应对多样化的复杂任务。为此,基于OpenVPX标准,定义并设计了一种符合硬件开放式架构的3U异构融合处理模块,以适应多种复杂任务的需求。文中还提出了一种异构计算资源池化技术,旨在实现多类型任务应用的快速部署和高效运行,同时降低通信延迟,显著提升计算平台的处理能力和适用性。最后进行了实验验证,结果表明与多CPU架构相比,文中所设计的异构融合处理模块在执行特定神经网络算法时,处理时间缩短了约4.8倍,证明了其在性能上的显著提升。该研究成果不仅展示了异构融合处理模块在机载智能计算应用中的显著性能优势,而且为航空计算平台的未来发展提供了创新的解决方案和技术支持。 展开更多
关键词 机载计算平台 OpenVPX 硬件开放式架构 异构融合处理 资源池化
在线阅读 下载PDF
一种自主设计的面向E级高性能计算的异构融合加速器 被引量:13
5
作者 刘胜 卢凯 +9 位作者 郭阳 刘仲 陈海燕 雷元武 孙海燕 杨乾明 陈小文 陈胜刚 刘必慰 鲁建壮 《计算机研究与发展》 EI CSCD 北大核心 2021年第6期1234-1237,共4页
高性能计算(high performance computing,HPC)是推动科学技术发展的基础性领域之一,当前,作为超级计算机系统“下一个明珠”的E级高性能计算时代已经来临.面向E级高性能计算的加速器领域成为了全球高端芯片的竞技场.国际上,AMD、英伟达... 高性能计算(high performance computing,HPC)是推动科学技术发展的基础性领域之一,当前,作为超级计算机系统“下一个明珠”的E级高性能计算时代已经来临.面向E级高性能计算的加速器领域成为了全球高端芯片的竞技场.国际上,AMD、英伟达和英特尔公司已经占据这一领域多年.作为国内最早开始自主处理器设计的优势单位之一,国防科技大学一直以来都是高性能加速器领域强有力的竞争者.主要对国防科技大学自主设计的面向E级高性能计算的加速器芯片进行介绍,该芯片采用了CPU+GPDSP的异构融合架构,具备高性能、高效能和高可编程性的特点,有望成为新一代E级超算系统的核心计算芯片. 展开更多
关键词 高性能计算 加速器 异构融合体系结构 自主设计 高效能
在线阅读 下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
6
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
在线阅读 下载PDF
高性能网格并行计算 被引量:6
7
作者 张季平 曾国荪 吴豪 《计算机工程》 CAS CSCD 北大核心 2004年第1期1-3,19,共4页
对高性能计算的各种方式进行了分析和比较,并阐述了网格和元计算的关系。通 过对当前各种网格工程的透视,论述了网格体系结构和网格服务语义。探讨了网格的两个关 键特点:异构性和动态性及其解决方法。对于认识网格概念以及指明未来... 对高性能计算的各种方式进行了分析和比较,并阐述了网格和元计算的关系。通 过对当前各种网格工程的透视,论述了网格体系结构和网格服务语义。探讨了网格的两个关 键特点:异构性和动态性及其解决方法。对于认识网格概念以及指明未来高性能并行计算发 展方向有一定意义。 展开更多
关键词 网格 高性能计算 开放网格服务体系结构 异构性
在线阅读 下载PDF
一种流体系结构中软硬结合的异构核协同方法 被引量:2
8
作者 任巨 何义 +4 位作者 荀长庆 杨乾明 文梅 伍楠 张春元 《计算机学报》 EI CSCD 北大核心 2008年第11期2038-2046,共9页
在流体系结构中,标量核同流处理核是异构核,它们之间的协同是流处理器能够正确、高效运转的基础.文中针对异构核间所采用的软件协同方法性能低的问题,提出了一种软件和硬件相结合的异构核协同方法,并基于MASA-I流处理SOPC系统进行了实现... 在流体系结构中,标量核同流处理核是异构核,它们之间的协同是流处理器能够正确、高效运转的基础.文中针对异构核间所采用的软件协同方法性能低的问题,提出了一种软件和硬件相结合的异构核协同方法,并基于MASA-I流处理SOPC系统进行了实现.使用媒体和数字信号处理领域核心算法进行测试的结果表明,与软件协同方法相比,使用文中方法的协同性能有2个量级的提升,程序整体性能提高一倍. 展开更多
关键词 异构核 核间协同 软硬结合 流处理器 体系结构
在线阅读 下载PDF
一种基于DAG图的异构可重构任务划分方法 被引量:4
9
作者 郝水侠 曾国荪 谭一鸣 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第11期1693-1698,共6页
为了实现高性能低功耗的计算,以任务划分为研究对象,提出了异构可重构计算的基本概念和形式化描述方法,给出了基于异构计算任务和异构可重构体系结构相结合的异构可重构两种任务划分方法:节点内部可重组及网络可重建的任务划分及算法,... 为了实现高性能低功耗的计算,以任务划分为研究对象,提出了异构可重构计算的基本概念和形式化描述方法,给出了基于异构计算任务和异构可重构体系结构相结合的异构可重构两种任务划分方法:节点内部可重组及网络可重建的任务划分及算法,最后验证了其任务划分方法的有效性. 展开更多
关键词 有向无环图(DAG) 异构计算任务 可重构体系结构 任务划分
在线阅读 下载PDF
相似驱动的细粒度并行任务重构算法 被引量:1
10
作者 郝水侠 曾国荪 +1 位作者 马小信 许金超 《计算机科学》 CSCD 北大核心 2013年第9期44-50,共7页
异构计算是高性能计算技术的发展趋势,计算任务与体系结构匹配成为异构计算亟待解决的问题。重构技术为实现两者匹配带来了契机,要么任务重构适应体系结构,要么体系结构重构适应任务。提出基于相似驱动的并行任务重构算法以实现异构计... 异构计算是高性能计算技术的发展趋势,计算任务与体系结构匹配成为异构计算亟待解决的问题。重构技术为实现两者匹配带来了契机,要么任务重构适应体系结构,要么体系结构重构适应任务。提出基于相似驱动的并行任务重构算法以实现异构计算匹配。通过给出任务和系统匹配度量机制定义了图重构操作和图重构基本问题。根据问题给出细粒度重构算法,该算法主要有3个过程:任务图节点对融合、节点和边重构及重构精化过程。用格林威治大学典型实例图作为并行任务及典型体系结构测试了该算法。实验表明它在给定的误差范围内能保证计算任务和体系结构匹配。 展开更多
关键词 并行任务 体系结构 异构计算 图相似 重构
在线阅读 下载PDF
基于线性异构无线传感器网络的协同可靠数据传输 被引量:1
11
作者 赵增华 李腾飞 +2 位作者 金泉 毛延超 石高涛 《计算机研究与发展》 EI CSCD 北大核心 2010年第S2期205-208,共4页
大量无线传感器应用具有线性网络拓扑结构.结合高压输电线路监控系统的层次型异构无线传感器网络架构,提出了骨干网和子网协作进行可靠数据传输,以解决线性拓扑结构的单点失效问题.设计了骨干网节点自适应功率调整机制和传感器节点自动... 大量无线传感器应用具有线性网络拓扑结构.结合高压输电线路监控系统的层次型异构无线传感器网络架构,提出了骨干网和子网协作进行可靠数据传输,以解决线性拓扑结构的单点失效问题.设计了骨干网节点自适应功率调整机制和传感器节点自动子网切换机制,并在含9个骨干网节点的实验床上实现和性能验证.实验结果表明所提可靠数据传输机制能解决单点失效问题,并能有效改善网络性能. 展开更多
关键词 计算机系统结构 无线传感器网络 可靠数据传输 线性异构网络
在线阅读 下载PDF
基于混合编程模型的支持向量机训练并行化 被引量:2
12
作者 李涛 刘学臣 +2 位作者 张帅 王恺 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1098-1108,共11页
支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储... 支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture,CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface,MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力. 展开更多
关键词 支持向量机训练 计算统一设备架构 消息传递接口 页锁定内存 CPU-GPU异构系统
在线阅读 下载PDF
基于国产X86处理器的异构计算平台构建及敏感数据保护 被引量:1
13
作者 曾志平 萧海东 张新鹏 《计算机科学》 CSCD 北大核心 2015年第B11期317-322,共6页
大数据时代对敏感数据的保护需求与日俱增,如何在安全可控的软硬件环境下进行大数据集处理成为一个研究热点。设计了一种基于安全可控国产X86处理器的大数据平台,利用AES(Advanced Encryption Standard)算法对海量敏感数据提供安全... 大数据时代对敏感数据的保护需求与日俱增,如何在安全可控的软硬件环境下进行大数据集处理成为一个研究热点。设计了一种基于安全可控国产X86处理器的大数据平台,利用AES(Advanced Encryption Standard)算法对海量敏感数据提供安全保障;并合理构建GPU畀构计算环境,充分提高国产大数据平台的分析计算效率,为海量数据的安全处理提供了全新的解决方案。实验结果表明,基于国产兆芯X86处理器的GPU异构计算平台能有效满足大数据集处理需求;通过改进异构计算环境下的AES算法提升了加密效率,并获得了22-23倍的加速比。当应对海量数据(GB级以上)时,国产异构计算平台的并行处理能力和加速效果非常明显。该研究结果对有海量敏感信息的大数据集处理和信息安全保护具有重要应用价值。 展开更多
关键词 国产CPU X86构架 大数据 AES算法 GPU 异构计算
在线阅读 下载PDF
面向雾计算的嵌入式异构计算服务放置策略 被引量:2
14
作者 刘锦辉 易必杰 张昊 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第6期40-47,共8页
受限于云与端设备间的长距离通信,仅在云上处理数据已经不能满足时间敏感应用的需求,这促使部分应用开始向下层边缘设备扩展。随着嵌入式系统的快速发展,雾计算成为了连接云与端设备的新型计算范式,可以在更靠近数据源的地方执行应用程... 受限于云与端设备间的长距离通信,仅在云上处理数据已经不能满足时间敏感应用的需求,这促使部分应用开始向下层边缘设备扩展。随着嵌入式系统的快速发展,雾计算成为了连接云与端设备的新型计算范式,可以在更靠近数据源的地方执行应用程序。雾层计算能力通常源于高性能异构嵌入式板卡,服务在雾计算层不同的映射放置策略,对雾计算层设备的资源利用率影响巨大。现有的服务放置策略多数以提高系统服务质量为目标,忽略了嵌入式设备的异构性及计算资源的受限性,从而导致资源利用率降低。针对上述问题,提出了一种面向雾计算应用的服务放置策略,基于微服务架构,对雾计算层异构资源进行优化建模,细化了资源异构属性表征,在保证系统的基础上,通过动态对比服务放置消耗提升系统资源利用率。将这种策略与基于请求率的放置策略和iFogSim默认放置策略进行对比,该策略的系统资源利用率分别提高了约10.7%和28.7%。 展开更多
关键词 嵌入式架构 异构资源 容器 雾计算 微服务放置
在线阅读 下载PDF
嵌入式异构智能计算系统并行多流水线设计 被引量:1
15
作者 赵二虎 吴济文 +2 位作者 肖思莹 晋振杰 徐勇军 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3354-3364,共11页
嵌入式智能计算系统因其功耗受限和多传感器实时智能处理需要,对硬件平台的智能算力能效比和智能计算业务并行度提出了严峻挑战.传统嵌入式计算系统常采用的DSP+FPGA数字信号处理架构,无法适用于多个神经网络模型加速场景.本文基于ARM+D... 嵌入式智能计算系统因其功耗受限和多传感器实时智能处理需要,对硬件平台的智能算力能效比和智能计算业务并行度提出了严峻挑战.传统嵌入式计算系统常采用的DSP+FPGA数字信号处理架构,无法适用于多个神经网络模型加速场景.本文基于ARM+DLP+SRIO嵌入式异构智能计算架构,利用智能处理器多片多核多内存通道特性,提出了并行多流水线设计方法.该方法充分考虑智能计算业务中数据传输、拷贝、推理、结果反馈等环节时间开销,为不同的神经网络模型合理分配智能算力资源,以达到最大的端到端智能计算业务吞吐率.实验结果表明,采用并行多流水线设计方法的深度学习处理器利用率较单流水线平均提高约25.2%,较无流水线平均提高约30.7%,满足可见光、红外、SAR等多模图像实时智能处理需求,具有实际应用价值. 展开更多
关键词 嵌入式智能计算系统 异构计算架构 神经网络模型 并行多流水线 深度学习处理器
在线阅读 下载PDF
低功耗异构计算架构的高光谱遥感图像分类研究 被引量:2
16
作者 刘鹏飞 朱健晨 +1 位作者 万良易 江波 《计算机工程》 CAS CSCD 北大核心 2022年第12期9-15,23,共8页
高光谱图像分类算法通常需要逐点对图像中的像素点进行迭代处理,计算复杂度及并行程度存在较大差异。随着高光谱遥感图像空间、光谱和辐射分辨率的不断提升,这些算法无法满足实时处理海量遥感图像数据的需求。通过分析NPU存储计算一体... 高光谱图像分类算法通常需要逐点对图像中的像素点进行迭代处理,计算复杂度及并行程度存在较大差异。随着高光谱遥感图像空间、光谱和辐射分辨率的不断提升,这些算法无法满足实时处理海量遥感图像数据的需求。通过分析NPU存储计算一体化模式与遥感图像分类算法的实现步骤,设计低功耗CPU+NPU异构资源计算架构的低秩稀疏子空间聚类(LRSSC)算法,将数据密集型计算转移至NPU,并利用NPU数据驱动并行计算和内置AI加速,对基于机器学习算法的海量遥感数据进行实时分类。受到big.LITTLE计算范式的启发,CPU+NPU异构资源计算架构由8 bit和低精度位宽NPU共同组成以提高整体吞吐量,同时减少图网络推理过程中的能量损耗。实验结果表明,与CPU计算架构和CPU+GPU异构计算架构的LRSSC算法相比,CPU+NPU异构计算架构的LRSSC算法在Pavia University遥感数据集下的计算速度提升了3~14倍。 展开更多
关键词 高光谱遥感 图像分类算法 低秩稀疏子空间聚类 低功耗异构计算架构 编码孔径快照光谱成像
在线阅读 下载PDF
异构平台上多维线性哈希的研究
17
作者 刘勇 赵秦德 +2 位作者 赖正文 黄东平 王璟星 《计算机科学》 CSCD 北大核心 2012年第10期157-159,163,共4页
目前多维数据广泛应用于多个领域,但其复杂性影响了多维数据的操作效率。为提高对多维数据的处理能力,提出一种在CPU/GPU异构平台上的多维线性哈希并行计算方案。该方案通过对传统线性哈希表数据结构的扩展,可实现对哈希表的快速创建和... 目前多维数据广泛应用于多个领域,但其复杂性影响了多维数据的操作效率。为提高对多维数据的处理能力,提出一种在CPU/GPU异构平台上的多维线性哈希并行计算方案。该方案通过对传统线性哈希表数据结构的扩展,可实现对哈希表的快速创建和查询。同时,在多个处理器平台上进行的实验对提出的方案的有效性进行了验证。实验结果表明,当处理的数据规模较大时,提出的方案由于充分利用了GPU强大的并行处理能力,在创建哈希表和查询数据上,比传统的CPU方案性能分别提高了约25倍和38倍,充分显示出提出的方案在处理多维数据时的优势。 展开更多
关键词 异构平台 图形处理器 多维线性哈希 计算统一设备架构
在线阅读 下载PDF
异构计算中体系结构感知的并行任务分簇方法
18
作者 郝水侠 曾国荪 《计算机科学》 CSCD 北大核心 2013年第3期121-125,共5页
异构计算是高效能计算发展的必然趋势,针对异构计算运行中并行任务和体系结构难匹配的问题,提出了实现并行任务和体系结构匹配的并行任务分簇方法。首先给出效能的概念及异构计算中体系结构感知的分簇问题,然后从理论上分析了异构匹配... 异构计算是高效能计算发展的必然趋势,针对异构计算运行中并行任务和体系结构难匹配的问题,提出了实现并行任务和体系结构匹配的并行任务分簇方法。首先给出效能的概念及异构计算中体系结构感知的分簇问题,然后从理论上分析了异构匹配与效能的关系,提出了实现异构计算匹配和结构匹配的分簇理论,目的是发挥异构计算中机器的潜能,协同处理并行任务,实现高效能。在此基础上,给出相应的算法。最后通过仿真实验说明,该方法可通过簇图与体系结构的匹配缩短通信开销在执行时间上所占的比例,从而缩短并行执行时间,以提高系统利用率,最终实现异构计算的高效能。 展开更多
关键词 异构计算 并行任务匹配 体系结构感知 分簇
在线阅读 下载PDF
面向申威异构架构的并行代码自动生成 被引量:6
19
作者 陶小涵 朱雨 +2 位作者 庞建民 赵捷 徐金龙 《软件学报》 EI CSCD 北大核心 2023年第4期1570-1593,共24页
异构架构逐渐成为高性能计算领域的主流架构,但相较于同构多核架构,其硬件结构及存储层次更为复杂,程序编写更为困难.先进的优化编译器可以协助程序开发人员实现更为高效的代码,降低程序开发复杂度.多面体编译模型通过抽象分析将程序抽... 异构架构逐渐成为高性能计算领域的主流架构,但相较于同构多核架构,其硬件结构及存储层次更为复杂,程序编写更为困难.先进的优化编译器可以协助程序开发人员实现更为高效的代码,降低程序开发复杂度.多面体编译模型通过抽象分析将程序抽象成空间多面体表示形式,能够将多种循环变换与硬件映射相结合,并面向特定体系结构生成相应的代码.设计实现了一个面向国产申威异构架构的并行代码自动生成系统,采用“源-源”编译模式,基于多面体编译模型实现.系统针对申威异构架构特点将程序计算过程进行硬件部署,同时实现数据传输与内存空间的自动管理.实验基于Polybench测试集中线性代数相关用例进行测试.结果表明,利用代码自动生成系统生成的异构并行代码能够在申威异构平台上正确运行,并能够有效发挥申威异构平台的性能,基于申威异构平台利用64线程加速计算的平均加速比达到了539.16倍. 展开更多
关键词 申威异构架构 多面体模型 并行计算 代码生成
在线阅读 下载PDF
UPPA:面向异构众核系统的统一并行编程架构 被引量:5
20
作者 吴树森 董小社 +2 位作者 王宇菲 王龙翔 朱正东 《计算机学报》 EI CSCD 北大核心 2020年第6期990-1009,共20页
主流异构并行编程方法如CUDA和OpenCL,其编程抽象层次低,编程接口靠近底层,无法为用户屏蔽底层硬件和运行时细节,导致编程逻辑复杂,编程困难易错.同时应用性能绑定于底层运行时环境,在硬件架构变化时需要根据硬件特征进行针对性改动和优... 主流异构并行编程方法如CUDA和OpenCL,其编程抽象层次低,编程接口靠近底层,无法为用户屏蔽底层硬件和运行时细节,导致编程逻辑复杂,编程困难易错.同时应用性能绑定于底层运行时环境,在硬件架构变化时需要根据硬件特征进行针对性改动和优化,无法保证上层应用的统一.为了简化异构并行编程,提高编程效率,实现上层应用的统一和跨平台,本文提出了一种面向异构众核系统的高层统一并行编程架构UPPA(Unified Parallel Programming Architecture).架构中首先提出了数据关联计算编程模型,实现了不同层级不同模式并行性的统一描述,简化了异构并行编程逻辑,提供了高层统一的并行编程抽象;继而设计了数据关联计算描述语言为用户提供简便易用的统一编程接口,通过高层语义结构保留了应用的并行特征,可以指导编译和运行时系统实现向不同硬件架构的自动映射,保证了上层应用的统一,并采用C语言兼容的语法提供针对高层语义结构的语言扩展,保证编程接口的易学易用;最后提供了基于OpenCL的编译和运行时原型系统,以OpenCL为中间语言实现了高层应用在不同异构系统上的执行,提供了良好的跨平台特性.我们使用数据关联计算描述语言对Parboil和Rodinia测试集中的多个测试用例进行了重构,并在NVIDIA GPU和Intel MIC两种异构平台上进行了验证测试.每个测试用例重构的代码量与测试集提供的串行代码相当,仅为测试集OpenCL代码的13%~64%,有效地降低了异构编程的工作量.在编译和运行时系统的支持下,重构代码无需改动就可以在两种平台上执行.相比于人工编写且经过优化的测试集OpenCL代码,重构代码在GPU和MIC两种平台下分别能够达到其性能的91%~100%和76%~98%,这表明了本文方法的有效性和编译与运行时系统的高效. 展开更多
关键词 异构并行编程 数据关联计算 并行编程模型 统一编程架构 OPENCL
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部