期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
关于零售评分模型部署方式的理论及实证研究 被引量:4
1
作者 陈强 陈文彬 《金融监管研究》 2013年第4期40-57,共18页
从国内外商业银行执行新资本协议的实践来看,构建以评分模型为代表的量化管理工具已成为促进零售业务发展、提高风险管理水平的必然趋势。而评分模型如何在系统中部署实施,往往是其落地、应用及持续监控的关键。本文对评分模型在系统中... 从国内外商业银行执行新资本协议的实践来看,构建以评分模型为代表的量化管理工具已成为促进零售业务发展、提高风险管理水平的必然趋势。而评分模型如何在系统中部署实施,往往是其落地、应用及持续监控的关键。本文对评分模型在系统中的不同部署方式进行解析比较,就其源问题的理论基础及置信区间进行了相应的推理和计算,并采用数值模拟方法从实证上求解出多维情形下不同部署方式的数值差异范围及分值出现差异的频率。最后;本文基于评分差异对商业银行经营管理所产生的影响,结合对两种部署方式在模型配置的便捷程度、维护成本及运算性能方面的比较分析,给出了零售评分模型部署方式的选择建议。 展开更多
关键词 评分模型部署 误差和密度函数 数值模拟
在线阅读 下载PDF
基于T-YOLO-LITE树干检测的模型部署方法 被引量:7
2
作者 高宗斌 崔永杰 李凯 《计算机应用与软件》 北大核心 2021年第2期132-139,共8页
为解决猕猴桃采摘机器人视觉导航问题,提出基于T-YOLO-LITE的猕猴桃树干检测方法。通过保留BN层、调整输入图像尺寸、修改anchor boxes、添加负样本对YOLO-LITE进行改进,并利用Movidius与OpenCV-DNN将改进后的模型分别部署在树莓派与CP... 为解决猕猴桃采摘机器人视觉导航问题,提出基于T-YOLO-LITE的猕猴桃树干检测方法。通过保留BN层、调整输入图像尺寸、修改anchor boxes、添加负样本对YOLO-LITE进行改进,并利用Movidius与OpenCV-DNN将改进后的模型分别部署在树莓派与CPU设备中。实验结果表明:通过改进优化使模型检测精度提升至59.75%;利用Movidius与OpenCV-DNN部署后,模型检测速度分别达到了2帧每秒和6帧每秒。该模型在检测精度与YOLOV2-TINY持平的情况下,检测速度为YOLOV2-TINY的两倍,并在非GPU设备上完成近实时的树干检测任务。 展开更多
关键词 YOLO 目标检测 模型部署 卷积神经网络
在线阅读 下载PDF
基于PLP-net轻量化模型的马铃薯捡拾收获中杂质检测方法
3
作者 潘志国 邱保华 +4 位作者 杨然兵 张还 张健 李莹莹 邓志熙 《农业工程学报》 北大核心 2025年第12期208-218,共11页
针对目前马铃薯杂质检测算法存在的运算量高、内存占用大、实时性差等问题,该研究提出了一种基于PLP-net的轻量化检测模型。首先,通过重构骨干网络架构并优化检测头网络,显著降低模型运算量;其次,引入ECA(efficient channel attention)... 针对目前马铃薯杂质检测算法存在的运算量高、内存占用大、实时性差等问题,该研究提出了一种基于PLP-net的轻量化检测模型。首先,通过重构骨干网络架构并优化检测头网络,显著降低模型运算量;其次,引入ECA(efficient channel attention)注意力机制强化关键特征提取能力,并采用Focal-DIoU损失函数(focal and distance-IoU loss)优化边界框回归过程来解决数据集中杂质样本失衡的问题,构建基础模型PL-net。然后,基于模型稀疏化训练结果,精确剪除冗余通道,有效缩减运算量及内存占用,提升模型实时性,后经微调训练后构建PLP-net轻量化模型。为实现工程化应用,该研究采用TensorRT推理部署框架将PLP-net部署至嵌入式设备,并基于PyQt5(Python Qt5 binding)框架开发了可视化交互系统以满足马铃薯杂质检测的生产需求。试验结果表明:与YOLOv8n模型相比,PLP-net在计算效率方面明显提升,浮点运算量降低7.2 G,模型体积压缩2.1 MB,推理速度提升99.4帧/s。使用TensorRT加速和未使用TensorRT加速的PLP-net模型相较于YOLOv8n分别提升18.4帧/s和11.4帧/s。PLP-net模型可为后续马铃薯杂质智能分拣提供技术支撑。 展开更多
关键词 马铃薯杂质 PLP-net 轻量化 模型剪枝 模型部署
在线阅读 下载PDF
基于AIC-YOLOv11n模型的砀山梨多表面缺陷检测方法
4
作者 李成轩 赵春江 +4 位作者 张驰 黄文倩 李佳琪 何鑫 王庆艳 《农业工程学报》 北大核心 2025年第14期320-328,共9页
针对实际应用场景中砀山梨表面缺陷检测实时性要求较高,边缘设备计算能力受限等问题,以提高砀山梨表面缺陷检测精度并对模型进行有效轻量化为前提,该研究提出一种基于改进YOLOv11n的AIC-YOLOv11n模型。首先,在主干网络中引入Adown下采... 针对实际应用场景中砀山梨表面缺陷检测实时性要求较高,边缘设备计算能力受限等问题,以提高砀山梨表面缺陷检测精度并对模型进行有效轻量化为前提,该研究提出一种基于改进YOLOv11n的AIC-YOLOv11n模型。首先,在主干网络中引入Adown下采样模块,减少模型浮点计算量和参数量提高网络提取特征能力;其次,使用融合了倒置残差块注意力机制(inverted residual mobile block,iRMB)的C2PSA-iRMB模块替换原主干网络中的C2PSA模块,在保持模型轻量的同时捕捉和利用长距离依赖;然后,将原模型的颈部结构替换为跨尺度特征融合模块(cross-scale feature fusion module,CFFM)融合不同尺度特征以提高模型对小尺度对象的检测能力。试验结果表明,采用AIC-YOLOv11n模型能够对砀山梨的多种类表面缺陷进行有效检测,在测试集上的精确度为92.5%,召回率为87.5%,平均精度均值mAP_(0.5)和mAP_(0.50~0.95)分别为92.7%和70.5%,相较于原YOLOv11n模型分别提高0.3、5.5、5.1、2.4个百分点;模型浮点计算量为4.3 G,参数量为1.46 M,模型大小为3.11 MB,分别相较于原模型下降31.7%、43.4%、40.5%;最大显存占用量为4.83 GB,帧率为120.1帧/s,计算资源占用少且推理速度满足表面缺陷检测实时性要求。研究结果可为砀山梨表面缺陷在线检测提供模型参考。 展开更多
关键词 砀山梨 机器视觉 缺陷检测 YOLOv11 轻量化 注意力机制 模型部署
在线阅读 下载PDF
面向边缘设备的目标检测模型研究
5
作者 徐伟峰 雷耀 +1 位作者 王洪涛 张旭 《智能系统学报》 北大核心 2025年第4期871-881,共11页
现有目标检测模型在边缘设备上部署时,其检测性能和推理速度的平衡有较大提升空间。针对此问题,本文基于YOLO(you can only look once)v8提出一种可部署到多类边缘设备上的目标检测模型。在模型的骨干网络部分,设计了EC2f(extended coar... 现有目标检测模型在边缘设备上部署时,其检测性能和推理速度的平衡有较大提升空间。针对此问题,本文基于YOLO(you can only look once)v8提出一种可部署到多类边缘设备上的目标检测模型。在模型的骨干网络部分,设计了EC2f(extended coarse-to-fine)结构,在降低参数量和计算复杂度的同时降低数据读写量;在颈部网络部分,将颈部网络替换为YOLOv6-3.0版本的颈部网络,加速了模型推理,并将推理精度维持在较好水平;预测头网络部分设计了多尺度卷积检测头,进一步降低了模型的计算复杂度和参数度。设计了两个版本(n/s尺度)以适应不同的边缘设备。在X光数据集的实验表明,模型在推理精度上比同尺度的基准模型分别提升0.5/1.7百分点,推理速度上分别提升11.6%/11.2%。在其他数据集上的泛化性能测试表明,模型的推理速度提升了10%以上,精度降低控制在1.3%以内。实验证明,模型在推理精度和速度之间实现了良好的平衡。 展开更多
关键词 目标检测 YOLO 边缘设备 推理精度 推理速度 数据读写量 计算复杂度 模型部署
在线阅读 下载PDF
基于强化学习的局部放电深度诊断模型的自动剪枝与轻量化部署
6
作者 朱永利 钱涛 《高电压技术》 CSCD 北大核心 2024年第12期5238-5247,I0001,共11页
目前在PC计算机或服务器端研发的各种基于局部放电信号采样数据的放电识别模型正判率高的几乎都是深度模型,这种模型的体量大,对计算机资源要求高,无法在局部放电检测装置上运行。为此,提出了基于强化学习的局部放电深度诊断模型的自动... 目前在PC计算机或服务器端研发的各种基于局部放电信号采样数据的放电识别模型正判率高的几乎都是深度模型,这种模型的体量大,对计算机资源要求高,无法在局部放电检测装置上运行。为此,提出了基于强化学习的局部放电深度诊断模型的自动剪枝方法与模型轻量化部署方案。在服务器端,采用深度强化学习进行智能体训练,通过与原始局部放电诊断模型交互进行自动搜索进而确定每层的剪枝率;再根据几何中值的滤波器剪枝(FPGM)方法来判别滤波器的重要程度,实现参数的裁剪。仿真实验结果表明:该方法在轻量化系列模型MobileNetV1、V2以及ResNet50经典系列神经网络上取得了85%以上的参数压缩效果。将压缩后的轻量化模型转换成轻量级的ONNX格式,保存在一台便携式电脑上,并通过无线传输方式将模型植入到树莓派智能终端中,进而在智能终端上实现了局部放电的诊断实验模拟。测试结果表明:使用该方法部署的剪枝后局部放电诊断模型在内存占用、功耗以及推理时长等性能指标方面都有很大改善。 展开更多
关键词 局部放电 强化学习剪枝 神经网络 几何中值的滤波器剪枝 模型的边缘部署
在线阅读 下载PDF
面向边缘计算的矿区障碍检测模型研究 被引量:1
7
作者 阮顺领 王京 +1 位作者 顾清华 卢才武 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第11期141-152,共12页
近年来,随着矿用卡车自动驾驶技术的兴起,使得矿区道路行车障碍物检测变得至关重要,基于深度学习的目标检测模型应用于矿区道路障碍检测取得了显著的效果,为矿用卡车自动驾驶技术的完善提供了可能。为解决现有模型应用于矿区障碍物检测... 近年来,随着矿用卡车自动驾驶技术的兴起,使得矿区道路行车障碍物检测变得至关重要,基于深度学习的目标检测模型应用于矿区道路障碍检测取得了显著的效果,为矿用卡车自动驾驶技术的完善提供了可能。为解决现有模型应用于矿区障碍物检测,往往存在算法庞大与部署成本较高的问题,提出一种面向边缘计算平台的改进YOLOv8矿区道路障碍检测模型,该模型针对资源有限的边缘计算设备进行优化部署,以实现对障碍物的快速、精准检测。该模型在特征提取阶段,引入深度可分离卷积和通道注意力机制,提高模型对障碍物整体特征提取能力,从而提升对不同尺寸障碍物的检测精度;特征融合阶段采用BiFPN网络结构,轻量化颈部网络并自适应地调整融合权重,减少冗余信息,提高特征的表达能力;使用局部卷积PConv对检测头进行重新设计,减少网络参数量以提高检测效率;最后,通过引入Inner-CIoU函数对边界框损失进行优化,加快模型收敛速度并提升边界框定位效果。实验结果显示,该网络在所使用的矿区障碍物数据集上,mAP@0.5仅下降0.05的前提下,模型参数减少了44%,推理时间缩短了34%。相比其他轻量型检测网络,该模型在实验硬件设备上的检测速度更快,且在精度和轻量化之间实现了更好的平衡,为障碍物检测模型的实际部署提供了可行方案。 展开更多
关键词 露天矿区 边缘计算 障碍检测 轻量化模型 模型部署
在线阅读 下载PDF
地震现场搜救力量部署模型研究 被引量:5
8
作者 吴新燕 顾建华 +1 位作者 郭红梅 雷秋霞 《自然灾害学报》 CSCD 北大核心 2013年第1期115-122,共8页
从搜救力量部署模型的原理出发,分别建立了区域搜救力量部署模型和局部搜救力量部署模型,并以汶川地震为背景,依托地震现场救援行动跟踪与监控软件,制作了区域搜救初次部署图、区域搜救自动部署图、局部搜索力量部署图以及局部营救力量... 从搜救力量部署模型的原理出发,分别建立了区域搜救力量部署模型和局部搜救力量部署模型,并以汶川地震为背景,依托地震现场救援行动跟踪与监控软件,制作了区域搜救初次部署图、区域搜救自动部署图、局部搜索力量部署图以及局部营救力量部署图。结果表明,所提模型可供地震灾害救援现场的指挥和力量部署参考。 展开更多
关键词 地震现场 搜救力量 部署模型
在线阅读 下载PDF
P2DR模型中策略部署模型的研究与设计 被引量:13
9
作者 韩锐生 徐开勇 赵彬 《计算机工程》 CAS CSCD 北大核心 2008年第20期180-183,共4页
分析动态自适应网络安全模型P2DR的缺陷,提出对P2DR模型的几点改进建议。针对模型中策略相关不足设计了一个策略部署模型,该部署模型实现了策略统一定制、自动分发、自适应管理等功能,同时在部署模型中引入了安全事件关联分析的思想,共... 分析动态自适应网络安全模型P2DR的缺陷,提出对P2DR模型的几点改进建议。针对模型中策略相关不足设计了一个策略部署模型,该部署模型实现了策略统一定制、自动分发、自适应管理等功能,同时在部署模型中引入了安全事件关联分析的思想,共享设备间安全信息以实现安全策略的联动操作,达到安全事故及时响应的目标。该部署模型实现了P2DR模型的动态性和自适应以及策略核心作用。 展开更多
关键词 部署模型 自适应管理 策略联动 安全事件关联
在线阅读 下载PDF
植物生长补光灯优化部署模型 被引量:3
10
作者 乔俊枫 周庆珍 +2 位作者 刘翔 樊宏攀 胡瑾 《农机化研究》 北大核心 2014年第5期48-51,共4页
人工补光可以有效提高温室作物产量与品质。针对温室补光光源空间部署不科学导致光照强度分布不均匀,不能满足作物实际需光量和资源配置不合理等问题,根据温室空间环境的影响以及光学原理计算,提出了基于温室补光灯光强场分布的圆形单... 人工补光可以有效提高温室作物产量与品质。针对温室补光光源空间部署不科学导致光照强度分布不均匀,不能满足作物实际需光量和资源配置不合理等问题,根据温室空间环境的影响以及光学原理计算,提出了基于温室补光灯光强场分布的圆形单光源补光灯与矩形多光源补光灯两类光源部署模型。这两类模型通过光学定律粗略计算,以补光灯辐射半中心光强边界为突破点,对补光灯的辐射重叠区域进行科学定位,使补光灯部署得到优化,从而实现温室光强按需均匀分布,避免补光光源部署冗余,减少能耗,促进了作物有效的生长。 展开更多
关键词 光源部署模型 光强场分布 光照强度 优化排布
在线阅读 下载PDF
地空导弹武器反TBM作战优化部署模型研究 被引量:1
11
作者 段锁力 张多林 刘昌云 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2011年第6期39-43,共5页
为了提高地空导弹武器反TBM作战效能,主要针对单套活力单元的部署问题进行研究。首先分析了影响地空导弹武器反TBM作战部署的主要因素和原则;其次,提出了地空导弹武器最大杀伤纵深优化部署准则;最后,充分考虑TBM再入角影响,利用TBM末段... 为了提高地空导弹武器反TBM作战效能,主要针对单套活力单元的部署问题进行研究。首先分析了影响地空导弹武器反TBM作战部署的主要因素和原则;其次,提出了地空导弹武器最大杀伤纵深优化部署准则;最后,充分考虑TBM再入角影响,利用TBM末段近似直线弹道的特性,建立了地空导弹武器"一对一"和"一对多"2种作战模式下的优化部署解析模型。仿真计算表明:所建地空导弹武器反TBM部署模型可行有效,能够满足地空导弹武器反TBM作战的要求。 展开更多
关键词 反TBM 杀伤纵深 优化部署模型
在线阅读 下载PDF
基于六边形网格部署模型的传感器网络密钥管理 被引量:3
12
作者 代航阳 徐红兵 《电子测量与仪器学报》 CSCD 2008年第5期48-52,共5页
在未知和敌对环境中,密钥管理是传感器网络安全的一个基本组成部分。本文提出了一种新的基于六边形网络部署模型的传感器网络密钥管理方案。该方案综合了Blom方案和节点部署知识的特点,把整个传感器网络划分为若干个互不重叠的六边形单... 在未知和敌对环境中,密钥管理是传感器网络安全的一个基本组成部分。本文提出了一种新的基于六边形网络部署模型的传感器网络密钥管理方案。该方案综合了Blom方案和节点部署知识的特点,把整个传感器网络划分为若干个互不重叠的六边形单元格,并在邻近的单元格应用Blom算法。分析和仿真结果显示:利用节点部署知识,网络连通概率保持了较高的水平;另一方面,通过引用Blom算法,方案在减少存储容量消耗的情况下提高了节点抗捕获攻击能力。 展开更多
关键词 传感器网络 安全 密钥管理 六边形网格部署模型
在线阅读 下载PDF
基于深度学习的激光粉末床熔融铺粉缺陷检测算法及其轻量化部署研究 被引量:1
13
作者 赵英健 姜子萌 +1 位作者 张英杰 龙雨 《航空制造技术》 CSCD 北大核心 2024年第15期65-73,80,共10页
激光粉末床熔融技术(Laser powder bed fusion,LPBF)在航空航天工业制造中的可重复性受到缺陷的严重影响,其中铺粉过程中的缺陷对零件质量具有重要影响。本文提出了一种基于实时语义分割算法的BiseNetV2(Bilateral segmentation network... 激光粉末床熔融技术(Laser powder bed fusion,LPBF)在航空航天工业制造中的可重复性受到缺陷的严重影响,其中铺粉过程中的缺陷对零件质量具有重要影响。本文提出了一种基于实时语义分割算法的BiseNetV2(Bilateral segmentation network)模型和加权损失的检测方法,用于实现对铺粉缺陷的类别识别和位置分割。此外,利用模型剪枝技术来优化深度学习(Deep learning,DL)模型的尺寸和性能,并通过TensorRT技术将轻量化模型部署在监测系统中的计算机上。结果表明,结合加权损失的BiseNetV2模型能以81.23%的平均准确率检出5种铺粉缺陷。通过剪枝技术得到的轻量化模型在牺牲0.44%精度的同时模型大小显著减小了13.39%。利用TensorRT技术能加速深度学习模型推理过程,在半精度浮点(Floating-point 16,FP16)数据下将检测时间缩短至5.94 ms。 展开更多
关键词 激光粉末床熔融(LPBF) 铺粉缺陷 深度学习 模型剪枝 模型部署
在线阅读 下载PDF
一种基于域的递增式策略部署模型
14
作者 何再朗 田敬东 张毓森 《电子科技大学学报》 EI CAS CSCD 北大核心 2006年第3期385-388,共4页
在介绍策略、域和策略目标等基本概念的基础上,提出了一个通用性的策略部署模型,该模型采用基于域的分层结构,把策略存储在离策略目标最近的域中,并以递增式算法进行收敛变化。模型独立于具体的策略底层实现机制,并可在混合策略环境中使... 在介绍策略、域和策略目标等基本概念的基础上,提出了一个通用性的策略部署模型,该模型采用基于域的分层结构,把策略存储在离策略目标最近的域中,并以递增式算法进行收敛变化。模型独立于具体的策略底层实现机制,并可在混合策略环境中使用,具有良好的多适性。 展开更多
关键词 策略 递增式 部署模型
在线阅读 下载PDF
基于SD的地空导弹混编群部署决策模型
15
作者 陈卓 商长安 郭蓬松 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2015年第6期84-88,共5页
地空导弹混编作战是应对信息化空袭、提高地面防空整体作战效能的必然选择。阐述了地空导弹混编部署的基本模式和准则,基于系统动力学(SD)理论方法,分析了构建地空导弹混编群部署决策模型的要素,主要包括:空袭目标参数、火力单元部署要... 地空导弹混编作战是应对信息化空袭、提高地面防空整体作战效能的必然选择。阐述了地空导弹混编部署的基本模式和准则,基于系统动力学(SD)理论方法,分析了构建地空导弹混编群部署决策模型的要素,主要包括:空袭目标参数、火力单元部署要素和武器性能参数,给出了SD仿真模型中射击条件判断的主要依据、变量设置和影响关系,以"中-近程"混编模式为范例,建立了地空导弹混编群部署决策SD模型,包括模型的结构流图和重要变量的运算关系,通过设置典型参数和对策序列,对SD模型进行了仿真实验,获得了重要变量的仿真结果,并对仿真结果的含义和应用进行了分析讨论。案例运行表明了SD模型的可行性和有效性。 展开更多
关键词 地空导弹 混编群 部署决策模型 系统动力学
在线阅读 下载PDF
复杂多方向威胁下的导弹预警雷达优化部署方法
16
作者 刘伟 刘昌云 +3 位作者 郭相科 樊良优 何晟 兰昊 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第4期1392-1404,共13页
针对现有导弹预警雷达部署相对独立、协同困难,难以满足大规模对抗场景的现状,从远程预警雷达、跟踪识别雷达、机动式预警雷达不同的任务特点出发,建立应对复杂多方向威胁的多型导弹预警雷达优化部署模型,在满足最优覆盖、协同交接、目... 针对现有导弹预警雷达部署相对独立、协同困难,难以满足大规模对抗场景的现状,从远程预警雷达、跟踪识别雷达、机动式预警雷达不同的任务特点出发,建立应对复杂多方向威胁的多型导弹预警雷达优化部署模型,在满足最优覆盖、协同交接、目标识别等任务约束下,解决雷达协同部署问题。针对所提模型设计了一种基于云自适应的分区优化离散粒子群(CPBPSO)算法,通过设计分区编码策略缩减算法求解空间、加入云自适应变异算子提高算法全局寻优和局部跳出能力,使算法更适用于导弹预警雷达部署问题的处理。实例验证了所提模型在求解单方向、多方向威胁场景部署问题的可行性,对比分析了CPBPSO算法的有效性,基本满足导弹预警雷达最优化协同部署的需求。 展开更多
关键词 导弹预警雷达 协同预警 优化部署模型 云自适应变异 粒子群算法
在线阅读 下载PDF
水声定位的正三角形网状节点部署模型
17
作者 梁佳敏 刘广钟 徐明 《计算机应用与软件》 CSCD 2015年第9期116-118,共3页
定位问题是水声传感器网络研究领域的关键技术之一。目前大部分定位算法集中在定位算法的改进,忽视节点部署模型对定位精度的影响。提出一种用于定位的正三角形节点部署模型,在二维空间下,将锚节点以正三角的形式均匀部署,在定位区域内... 定位问题是水声传感器网络研究领域的关键技术之一。目前大部分定位算法集中在定位算法的改进,忽视节点部署模型对定位精度的影响。提出一种用于定位的正三角形节点部署模型,在二维空间下,将锚节点以正三角的形式均匀部署,在定位区域内,未知节点总会处于以锚节点为顶点的正三角形中。在这个部署模型下,提出一种定位算法。通过Matlab进行仿真实验,结果表明,最小二乘法,Chan算法和改进算法按正三角形部署的节点模型的平均定位误差小于同节点密度下的均匀随机部署模型。在相同的节点部署密度下,正三角形模型部署下的改进算法稳定性要好于最小二乘法和Chan算法。 展开更多
关键词 水声传感器网络 定位 正三角形 部署模型 平均定位误差
在线阅读 下载PDF
面向深度学习编译器的多粒度量化框架支持与优化
18
作者 魏铭康 李嘉楠 +3 位作者 韩林 高伟 赵荣彩 王洪生 《计算机工程》 北大核心 2025年第5期62-72,共11页
随着各大厂商对大模型应用部署需求的激增,深度学习编译器TVM(Tensor Virtual Machine)的单一量化方式精度下降,已无法满足部署需求。设计并构建一种可选粒度的模型量化框架,具体包括逐层与逐通道量化流程的支持,以及阈值搜索与自适应... 随着各大厂商对大模型应用部署需求的激增,深度学习编译器TVM(Tensor Virtual Machine)的单一量化方式精度下降,已无法满足部署需求。设计并构建一种可选粒度的模型量化框架,具体包括逐层与逐通道量化流程的支持,以及阈值搜索与自适应舍入优化算法的实现。首先,基于量化模块“relay.quantize”构建信息标注、阈值校准与量化图实现的框架流程,并添加粒度属性以显式识别量化方式。其次,针对预定义校准方法无法确定有效量化信息的问题,对量化中的阈值校准、权重舍入进行调优,提高量化后模型精度。实验采用ImageNet数据集对视觉网络进行测试,针对MobileNetV1新量化方案将8 bit量化后模型精度损失降低到2.3%,调优后该损失降低到0.7%,实验结果表明多粒度量化框架可有效降低量化误差。 展开更多
关键词 模型量化 模型部署 模型压缩 推理加速 深度学习编译器
在线阅读 下载PDF
基于惯性测量单元的人体运动意图识别方法:现状与挑战
19
作者 衣淳植 贾翊丞 +1 位作者 姜峰 王修来 《智能系统学报》 北大核心 2025年第4期763-775,共13页
人体行为识别(human activity recognition,HAR)利用可穿戴计算、机器学习等技术识别和理解人体行为,在行为跟踪、健康监测及人机交互等领域得到广泛应用,极大提升了当下人类的生活水平。当前可穿戴传感器中,惯性传感器由于其高度小型... 人体行为识别(human activity recognition,HAR)利用可穿戴计算、机器学习等技术识别和理解人体行为,在行为跟踪、健康监测及人机交互等领域得到广泛应用,极大提升了当下人类的生活水平。当前可穿戴传感器中,惯性传感器由于其高度小型化、低成本、信号稳定等优势,已经日益成为可穿戴计算领域的主流应用设备。基于此,HAR领域内较多的研究以惯性信号作为数据源,并通过应用深度学习算法,以应对在数据利用率、隐私保护、模型部署等方面的挑战。本文系统地介绍面向HAR的深度学习方法并对现有工作进行了分类和总结,对于当前进展、发展趋势和主要挑战进行了全面分析。首先,本文介绍当前用于HAR研究的主流可穿戴设备及其数据模态,并对各模态数据特点进行介绍。其次,整理近年来常用的HAR数据集,并对各数据集中包含的数据模态、传感器位置、运动种类以及被引用次数等进行汇总。再次,本文从算法特点、应用场景等方面总结了当前HAR领域主要应用的几种深度学习方法的进展。最终,讨论当前HAR领域深度学习面临的挑战与潜在解决方法。 展开更多
关键词 人体行为识别 深度学习 惯性传感器 普适计算 数据隐私 模型部署 迁移学习 数据质量
在线阅读 下载PDF
基于张量虚拟机的深度神经网络模型加速方法 被引量:1
20
作者 申云飞 申飞 +1 位作者 李芳 张俊 《计算机应用》 CSCD 北大核心 2023年第9期2836-2844,共9页
随着人工智能(AI)技术的蓬勃发展,深度神经网络(DNN)模型被大规模应用到各类移动端与边缘端。然而,边缘端算力低、内存容量小,且实现模型加速需要深入掌握边缘端硬件知识,这增加了模型的部署难度,也限制了模型的推广应用。因此,基于张... 随着人工智能(AI)技术的蓬勃发展,深度神经网络(DNN)模型被大规模应用到各类移动端与边缘端。然而,边缘端算力低、内存容量小,且实现模型加速需要深入掌握边缘端硬件知识,这增加了模型的部署难度,也限制了模型的推广应用。因此,基于张量虚拟机(TVM)提出一种DNN加速与部署方法,从而实现卷积神经网络(CNN)模型在现场可编程门阵列(FPGA)上的加速,并在分心驾驶分类应用场景下验证了所提方法的可行性。通过计算图优化方法减小了模型的访存和计算开销,通过模型量化方法减小了模型尺寸,通过计算图打包方法将卷积计算卸载到FPGA上执行以提高模型推理速度。与微处理器(MPU)相比,所提方法可使ResNet50和ResNet18在MPU+FPGA上的推理时间分别减少88.63%和77.53%;而在AUC(American University in Cairo)数据集上,相较于MPU,两个模型在MPU+FPGA上的top1推理精度仅下降了0.26和0.16个百分点。可见,所提方法可以降低不同模型在FPGA上的部署难度。 展开更多
关键词 张量虚拟机 深度神经网络 现场可编程门阵列 边缘设备 模型部署 模型加速
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部