期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
图计算加速架构综述 被引量:6
1
作者 严明玉 李涵 +5 位作者 邓磊 胡杏 叶笑春 张志敏 范东睿 谢源 《计算机研究与发展》 EI CSCD 北大核心 2021年第4期862-887,共26页
在大数据时代,图被用于各种领域表示具有复杂联系的数据.图计算应用被广泛用于各种领域,以挖掘图数据中潜在的价值.图计算应用特有的不规则执行行为,引发了不规则负载、密集读改写更新操作、不规则访存和不规则通信等挑战.现有通用架构... 在大数据时代,图被用于各种领域表示具有复杂联系的数据.图计算应用被广泛用于各种领域,以挖掘图数据中潜在的价值.图计算应用特有的不规则执行行为,引发了不规则负载、密集读改写更新操作、不规则访存和不规则通信等挑战.现有通用架构无法有效地应对上述挑战.为了克服加速图计算应用面临的挑战,大量的图计算硬件加速架构设计被提出.它们为图计算应用定制了专用的计算流水线、访存子系统、存储子系统和通信子系统.得益于这些定制的硬件设计,图计算加速架构相比于传统的通用处理器架构,在性能和能效上均取得了显著的提升.为了让相关的研究学者深入了解图计算硬件加速架构,首先基于计算机的金字塔组织结构,从上到下对现有工作进行分类和总结,并以多个完整架构实例分析应用于不同层次的优化技术之间的关系.接着以图神经网络加速架构的具体案例讨论新兴图计算应用的加速架构设计.最后对该领域的前沿研究方向进行了总结,并放眼于未来探讨图计算加速架构的发展趋势. 展开更多
关键词 图计算 图神经网络 加速架构 不规则访存 数据局部性 动态访存调度 负载均衡
在线阅读 下载PDF
应用于极致边缘计算场景的卷积神经网络加速器架构设计 被引量:3
2
作者 吴瑞东 刘冰 +2 位作者 付平 纪兴龙 鲁文帅 《电子与信息学报》 EI CSCD 北大核心 2023年第6期1933-1943,共11页
针对卷积神经网络在极致边缘计算(UEC)场景应用中的性能和功耗需求,该文针对场景中16 Bit量化位宽的网络模型提出一种不依赖外部存储的卷积神经网络(CNN)加速器架构,该架构基本结构设计为基于现场可编程逻辑门阵列(FPGA)的多核CNN全流... 针对卷积神经网络在极致边缘计算(UEC)场景应用中的性能和功耗需求,该文针对场景中16 Bit量化位宽的网络模型提出一种不依赖外部存储的卷积神经网络(CNN)加速器架构,该架构基本结构设计为基于现场可编程逻辑门阵列(FPGA)的多核CNN全流水加速器。在此基础上,实现了该加速器的层内映射与层间融合优化。然后,通过构建资源评估模型在理论上完成架构中的计算资源与存储资源评估,并在该理论模型指导下,通过设计空间探索来最大化资源使用率与计算效率,进而充分挖掘加速器在计算资源约束条件下的峰值算力。最后,以纳型无人机(UAV)自主快速人体检测UEC场景为例,通过实验完成了加速器架构性能验证与分析。结果表明,在实现基于单步多框目标检测(SSD)的人体检测神经网络推理中,加速器在100 MHz和25 MHz主频下分别实现了帧率为137和34的推理速度,对应功耗分别为0.514 W和0.263 W,满足纳型无人机自主计算这种典型UEC场景对图像实时处理的性能与功耗需求。 展开更多
关键词 极致边缘计算 卷积神经网络 现场可编程逻辑门阵列 加速架构
在线阅读 下载PDF
应用GPU集群加速计算蛋白质分子场 被引量:12
3
作者 张繁 王章野 +2 位作者 姚建 吴韬 彭群生 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第3期412-419,共8页
针对生物化学计算中采用量子化学理论计算蛋白质分子场所带来的巨大计算量的问题,搭建起一个GPU集群系统,用来加速计算基于量子化学的蛋白质分子场.该系统采用消息传递并行编程环境(MPI)连接集群各结点,以开放多线程OpenMP编程标准作为... 针对生物化学计算中采用量子化学理论计算蛋白质分子场所带来的巨大计算量的问题,搭建起一个GPU集群系统,用来加速计算基于量子化学的蛋白质分子场.该系统采用消息传递并行编程环境(MPI)连接集群各结点,以开放多线程OpenMP编程标准作为多核CPU编程环境,以CUDA语言作为GPU编程环境,提出并实现了集群系统结点中GPU和多核CPU协同计算的并行加速架构优化设计.在保持较高计算精度的前提下,结合MPI,OpenMP和CUDA混合编程模式,大大提高了系统的计算性能,并对不同体系和规模的蛋白质分子场模拟进行了计算分析.与相应的CPU集群、GPU单机和CPU单机计算方法对比,该GPU集群大幅度地提高了高分辨率复杂蛋白质分子场模拟的计算效率,比CPU集群的平均计算加速比提高了7.5倍. 展开更多
关键词 GPU集群 蛋白质分子场模拟 并行加速架构设计
在线阅读 下载PDF
广域网加速在FY-3气象卫星数据传输中的应用 被引量:4
4
作者 卫兰 林曼筠 +1 位作者 赵现纲 张战云 《应用气象学报》 CSCD 北大核心 2012年第1期121-128,共8页
风云三号(FY-3)极轨气象卫星数据传输系统需通过广域网链路,将海量卫星观测数据从卫星接收站快速传送到资料处理中心。该文研究广域网加速技术,解决广域网链路中传输气象卫星海量观测数据延迟高、带宽利用低等难题。文中针对FY-3气象卫... 风云三号(FY-3)极轨气象卫星数据传输系统需通过广域网链路,将海量卫星观测数据从卫星接收站快速传送到资料处理中心。该文研究广域网加速技术,解决广域网链路中传输气象卫星海量观测数据延迟高、带宽利用低等难题。文中针对FY-3气象卫星观测数据传输量大、时效要求高的特点,分别分析了数据压缩、数据缓存和协议优化3种不同加速技术对卫星数据的传输优化效果,并根据分析结果提出了一种适用于气象卫星数据的广域网传输加速架构。该架构结合3种不同加速技术设计了TCP代理模块、数据段索引模块和HS-TCP传输模块以及相应算法分别实现了数据压缩与缓存和协议优化等功能。通过测试和实际运行表明:在该加速架构下卫星数据广域网传输速率提高了50%~243%。 展开更多
关键词 广域网加速 极轨气象卫星 海量气象卫星数据 广域网传输 加速架构
在线阅读 下载PDF
自动驾驶系统并行加速测试方法研究 被引量:6
5
作者 张培兴 邱彬 +3 位作者 朱冰 赵健 孙宇航 范天昕 《汽车工程》 EI CSCD 北大核心 2022年第2期208-214,共7页
为提高作为自动驾驶系统安全性验证手段的场景测试的效率,本文中提出了一种自动驾驶系统并行加速测试方法。首先根据自动驾驶系统测试需求,构建了由顶层管理层、中层协调层和底层执行层构成的3层加速测试架构。然后确定不同层级的具体任... 为提高作为自动驾驶系统安全性验证手段的场景测试的效率,本文中提出了一种自动驾驶系统并行加速测试方法。首先根据自动驾驶系统测试需求,构建了由顶层管理层、中层协调层和底层执行层构成的3层加速测试架构。然后确定不同层级的具体任务:顶层管理单元流动,中层协调参数计算,底层执行试验运行。最后以前车切入场景为例,对某黑盒自动驾驶算法分别使用并行加速、并行遍历、单线程加速和单线程遍历4种方式进行对比测试。结果表明,在测试具体场景总数为4590的情况下,4种方式均发现所有危险场景,但其耗时差别悬殊,分别为1.3、5.7、22.4和96.2 h。说明本文提出的并行加速测试方法可有效、快速地发现参数空间中的危险场景,提高自动驾驶系统测试效率。 展开更多
关键词 车辆 自动驾驶系统 加速测试 并行测试 3层加速测试架构
在线阅读 下载PDF
Investigation on seismic response of a three-stage soil slope supported by anchor frame structure 被引量:7
6
作者 LIN Yu-liang LI Ying-xin +1 位作者 ZHAO Lian-heng YANG T Y 《Journal of Central South University》 SCIE EI CAS CSCD 2020年第4期1290-1305,共16页
Based on a typical prototype of a soil slope in engineering practice, a numerical model of a three-stage soil slope supported by the anchor frame structure was established by means of FLAC3D code. The dynamic response... Based on a typical prototype of a soil slope in engineering practice, a numerical model of a three-stage soil slope supported by the anchor frame structure was established by means of FLAC3D code. The dynamic responses of three-stage soil slope and frame structure were studied by performing a series of bidirectional Wenchuan motions in terms of the failure mode of three-stage structure, the acceleration of soil slope, the displacement of frame structure, and the anchor stress of frame structure. The response accelerations in both horizontal and vertical directions are the most largely amplified at the slope top of each stage subjected to different shaking cases. The platforms among the stages reduce the amplification effect of response acceleration. The residual displacement of frame structure increases significantly as the intensity of shaking case increases. The frame structure at each stage presents a combined displacement mode consisting of a translation and a rotation around the vertex. The anchor stress of frame structure is mainly increased by the first intense pulse of Wenchuan seismic wave, and it is sensitive to the intensity of shaking case. The anchor stress of frame structure at the first stage is the most considerably enlarged by earthquake loading. 展开更多
关键词 three-stage soil slope anchor frame structure ACCELERATION DISPLACEMENT anchor stress
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部