检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向深度学习编译器TVM的算子融合优化: 1; 作者高伟王磊 +2 位作者李嘉楠李帅龙韩林《计算机科学》北大核心 2025年第5期58-66,共9页; 算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方... 展开更多; 关键词深度学习编译器 TVM 算子融合融合规则动态规划; 在线阅读下载PDF 职称材料

深度学习编译器缺陷实证研究:现状与演化分析: 2; 作者沈庆超田家硕 +3 位作者陈俊洁陈翔陈庆燕王赞《软件学报》北大核心 2025年第7期3022-3040,共19页; 深度学习编译器已被广泛应用于深度学习模型的性能优化和部署.与传统编译器类似,深度学习编译器也存在缺陷.存在缺陷的深度学习编译器会导致编译失败或者产生错误的编译结果,甚至有时会带来灾难性的后果.为了深入理解深度学习编译器缺... 展开更多; 关键词深度学习编译器缺陷分析实证研究缺陷检测缺陷特征; 在线阅读下载PDF 职称材料

面向深度学习编译器的多粒度量化框架支持与优化: 3; 作者魏铭康李嘉楠 +3 位作者韩林高伟赵荣彩王洪生《计算机工程》北大核心 2025年第5期62-72,共11页; 随着各大厂商对大模型应用部署需求的激增,深度学习编译器TVM(Tensor Virtual Machine)的单一量化方式精度下降,已无法满足部署需求。设计并构建一种可选粒度的模型量化框架,具体包括逐层与逐通道量化流程的支持,以及阈值搜索与自适应... 展开更多; 关键词模型量化模型部署模型压缩推理加速深度学习编译器; 在线阅读下载PDF 职称材料

LLM生成计算图的深度学习模型编译器缺陷检测: 4; 作者潘丽敏赵智洋 +2 位作者邵思源罗森林张浩然《北京理工大学学报》北大核心 2025年第11期1204-1212,共9页; 深度学习模型编译器缺陷容易引发模型推理崩溃,严重影响模型的可用性和安全性,目前缺陷检测代码行覆盖严重不足、缺陷类型有限.现有方法以局部算子为约束进行检测,多算子交互引发的缺陷触发困难;语义保持的变异策略限制了计算图节点算... 展开更多; 关键词模糊测试深度学习模型编译器缺陷检测大语言模型; 在线阅读下载PDF 职称材料

AutoConfig:面向深度学习编译优化的自动配置机制被引量：2: 5; 作者张洪滨周旭林 +2 位作者邢明杰武延军赵琛《软件学报》 EI CSCD 北大核心 2024年第6期2668-2686,共19页; 随着深度学习模型和硬件架构的快速发展,深度学习编译器已经被广泛应用.目前,深度学习模型的编译优化和调优的方法主要依赖基于高性能算子库的手动调优和基于搜索的自动调优策略.然而,面对多变的目标算子和多种硬件平台的适配需求,高性... 展开更多; 关键词深度学习编译器编译优化代码生成自动配置机制; 在线阅读下载PDF 职称材料

面向深度学习算子的循环不变式外提算法被引量：1: 6; 作者梁佳利华保健 +1 位作者吕雅帅苏振宇《计算机科学与探索》 CSCD 北大核心 2023年第1期127-139,共13页; TVM是一个深度学习编译器,支持将TVM的领域专用语言即张量表达式定义的算子编译生成目标平台的代码,并在高级中间表示TVM IR上进行一系列优化。张量表达式对算子执行循环变换,产生与循环迭代变量相关的复杂表达式的计算,在多层嵌套循环... 展开更多; 关键词深度学习编译器领域专用语言循环不变量外提中间表示; 在线阅读下载PDF 职称材料

基于专用卷积神经网络加速器的编译器设计与实现被引量：1: 7; 作者焦禹铭吴凯 +2 位作者郭风祥王昭宋庆增《计算机应用》 CSCD 北大核心 2022年第S01期208-214,共7页; 不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方... 展开更多; 关键词现场可编程门阵列模型压缩深度学习编译器中间表示目标检测; 在线阅读下载PDF 职称材料

一种基于TVM的算子生成加速策略: 8; 作者高伟李帅龙 +3 位作者茆琳王磊李颖颖韩林《计算机工程》 CAS CSCD 北大核心 2024年第8期353-362,共10页; 随着人工智能(AI)的飞速发展,新算子和底层硬件层出不穷,这给算子库的开发和维护带来了巨大的工作量。单纯基于手工优化来解决AI模型的性能和效率很容易出现瓶颈。TVM深度学习编译器通过代码的自动化生成减轻了手工优化的负担,但同时也... 展开更多; 关键词深度学习编译器代价模型梯度提升算法剪枝策略自动调优; 在线阅读下载PDF 职称材料

基于MLIR的FP8量化模拟与推理内存优化: 9; 作者徐金龙桂中华 +2 位作者李嘉楠李颖颖韩林《计算机科学》 CSCD 北大核心 2024年第9期112-120,共9页; 随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理... 展开更多; 关键词模型压缩深度学习编译器 FP8量化 MLIR Yolov5s模型; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部