检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向申威平台的SIMD编程接口设计与研究: 1; 作者姜军顾晓阳 +2 位作者徐坤坤吕勇帅黄亮明《计算机科学》北大核心 2025年第6期66-73,共8页; 在国产申威处理器中,申威GCC编译器在对程序进行向量化时,使用自动向量化和内嵌汇编的方式很难对某些复杂的程序进行向量化,阻碍了国产申威处理器的性能发挥。针对部分程序不能向量化的问题,在申威GCC编译器中进行SIMD编程接口的设计与... 展开更多; 关键词向量化 SIMD编程接口向量指令内建函数指令模板; 在线阅读下载PDF 职称材料

二进制翻译技术综述被引量：3: 2; 作者谢汶兵田雪 +3 位作者漆锋滨武成岗王俊罗巧玲《软件学报》 EI CSCD 北大核心 2024年第6期2687-2723,共37页; 随着信息技术的快速发展,涌现出各种新型处理器体系结构.新的体系结构出现为处理器多样化发展带来机遇的同时也提出了巨大挑战,需要兼容运行已有软件,确保较为丰富的软件生态群.但要在短期内从源码编译构建大量生态软件并非易事,二进制... 展开更多; 关键词二进制翻译翻译效率等价变换软件迁移多融合优化; 在线阅读下载PDF 职称材料

一种面向纠删码的存储库优化方法: 3; 作者谢汶兵关睿雪 +2 位作者张艺鸣李佳梅王俊《计算机研究与发展》北大核心 2025年第5期1123-1135,共13页; 信息时代,数据存储的可靠性、一致性、安全性和实时性至关重要.纠删码(erasure code,EC)在允许多个存储设备发生故障的同时保证最低的存储开销,被大量应用在数据存储领域.纠删码的编码与解码运算具有计算密集的特征,其性能高低直接影响... 展开更多; 关键词纠删码伽罗华域乘法 4b分割法数据访问粒度 SIMD向量化数据查表; 在线阅读下载PDF 职称材料

基于循环代价分析的循环不变量外提算法: 4; 作者姜军翟彦河 +2 位作者曾志恒顾轶超黄亮明《计算机科学》北大核心 2025年第6期44-51,共8页; 循环不变量外提算法是一种针对程序中循环结构的常用编译优化算法,其通过将循环体中的不变计算移动到循环外部来减少重复计算的开销,从而提高程序运行的速度。但在LLVM编译器中,传统的循环不变量外提算法会将全部循环不变量外提到循环... 展开更多; 关键词 LLVM编译器编译优化循环不变量外提寄存器溢出循环代价分析; 在线阅读下载PDF 职称材料

基于申威平台寄存器溢出策略的预选先验优化: 5; 作者蔡淳豪梁淑萍 +1 位作者姜军邵宁远《计算机科学》北大核心 2025年第6期82-87,共6页; 在国产多核处理器申威平台上,申威JDK的C2即时编译器通过图着色寄存器分配算法完成寄存器分配工作。即时编译器在分配寄存器时并没有考虑国产处理器的指令特征,导致编译器生成了过多的访存代码,从而无法更全面地发挥国产处理器的性能。... 展开更多; 关键词图着色寄存器分配访存寻址溢出代码编译优化; 在线阅读下载PDF 职称材料

基于嵌入式GPU的pyramid LK光流法高速计算方法研究被引量：3: 6; 作者孙瑞鑫朱国梁 +2 位作者谢双镱郭雪亮柴志雷《计算机应用研究》 CSCD 北大核心 2022年第7期1966-1972,共7页; 在嵌入式计算平台上实现双向约束LK金字塔高精度光流的实时计算,是该算法能否应用于自动驾驶等场景的重要影响因素。为了实现该目的,提出了基于网格划分的特征提取方法及新的双向约束方法;然后设计了动态窗口的金字塔模型,解决了光流计... 展开更多; 关键词 LK光流嵌入式GPU CUDA SLAM 并行计算; 在线阅读下载PDF 职称材料

基于申威NMII的锁死故障监测与诊断被引量：3: 7; 作者郜晨何升杭骁骞《计算机应用研究》 CSCD 北大核心 2024年第4期1015-1021,共7页; 国产申威处理器的不可屏蔽核间中断(NMII)具有必须由某一核心主动发起的特性,导致目前无法适用Linux通用的锁死故障监测算法,严重情况下将影响关键领域的数据处理。针对该问题设计适用于申威架构的锁死故障监测与诊断系统。采用链式结... 展开更多; 关键词申威处理器不可屏蔽中断操作系统锁死故障诊断看门狗; 在线阅读下载PDF 职称材料

SDAA:面向申威智能加速卡的运行时系统被引量：1: 8; 作者赵玉龙张鲁飞 +3 位作者许国春李宇轩孙茹君刘鑫《软件学报》 EI CSCD 北大核心 2024年第12期5710-5724,共15页; 自主研制的申威智能加速卡上搭载了脉动阵列增强的申威众核处理器,其智能计算能力与主流GPU相当,但仍缺少配套的基础软件.为降低申威智能加速卡的使用门槛,有效支撑人工智能应用开发,设计面向申威智能加速卡的运行时系统SDAA,语义与主流... 展开更多; 关键词运行时系统申威智能加速卡人工智能软件定义; 在线阅读下载PDF 职称材料

基于数据局部性的循环分块选择算法: 9; 作者廖启华聂凯 +2 位作者韩林陈梦尧谢汶兵《计算机科学》 CSCD 北大核心 2024年第12期100-109,共10页; 现有的多面体编译框架(如Pluto,LLVM/Polly和GCC/Graphite)在进行循环分块时,都采用了固定分块大小,无法充分发挥不同硬件的缓存特性,导致存在较大的性能差异。针对这一问题,涌现了许多基于多级缓存和数据局部性的循环分块算法,但这些... 展开更多; 关键词数据局部性多面体模型循环分块分块大小负载均衡; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部