期刊文献+
共找到1,402篇文章
< 1 2 71 >
每页显示 20 50 100
Optimal hardware/software co-synthesis for core-based SoC desi gns 被引量:5
1
作者 Zhan Jinyu Xiong Guangze 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2006年第2期402-409,共8页
A hardware/software co-synthesis method is presented for SoC designs consisting of both hardware IP cores and software components on a graph-theoretic formulation. Given a SoC integrated with a set of functions and a ... A hardware/software co-synthesis method is presented for SoC designs consisting of both hardware IP cores and software components on a graph-theoretic formulation. Given a SoC integrated with a set of functions and a set of performance factors, a core for each function is selected from a set of alternative IP cores and software components, and optimal partitions is found in a way to evenly balance the performance factors and to ultimately reduce the overall cost, size, power consumption and runtime of the core-based SoC. The algorithm formulates IP cores and components into the corresponding mathematical models, presents a graph-theoretic model for finding the optimal partitions of SoC design and transforms SoC hardware/software co-synthesis problem into finding optimal paths in a weighted, directed graph. Overcoming the three main deficiencies of the traditional methods, this method can work automatically, evaluate more performance factors at the same time and meet the particularity of SoC designs. At last, the approach is illustrated that is practical and effective through partitioning a practical system. 展开更多
关键词 SOC co-synthesis partition IP core software component optimal path.
在线阅读 下载PDF
复杂三维体高效布尔运算技术的研究与实现 被引量:1
2
作者 张永亮 王家润 吴乾坤 《计算机应用与软件》 北大核心 2025年第1期249-257,327,共10页
高效、稳健的复杂三维体布尔运算是地理信息中的重点与难点。针对难点提出软硬件协同加速计算框架。在软件层面采用多种算法加速优化技术,包括:降维碰撞检测、三维多边形保留与丢弃的原则、新生成三维多边形的构建方法、三维线段与三维... 高效、稳健的复杂三维体布尔运算是地理信息中的重点与难点。针对难点提出软硬件协同加速计算框架。在软件层面采用多种算法加速优化技术,包括:降维碰撞检测、三维多边形保留与丢弃的原则、新生成三维多边形的构建方法、三维线段与三维多边形的高效求交、三维点或三维多边形与三维体包含关系的高效判断;基于以上加速优化技术提出一套高效的计算框架;在硬件层面基于GPU的众核算力加速计算,提出软硬件协同加速计算框架。实验证明,该计算框架高效性且稳健性,与现有的方法相比,软件层面计算框架效率提高3倍左右,软硬件协同加速框架将效率进一步提高3倍左右。 展开更多
关键词 加速优化技术 降维碰撞检测 高效 众核算力 软硬件协同加速
在线阅读 下载PDF
基于EIT技术的智能可穿戴传感器的研究进展
3
作者 王琦 王鑫 段晓杰 《天津工业大学学报》 北大核心 2025年第4期71-82,共12页
基于电阻抗成像(EIT)技术的智能可穿戴传感器在工业、医疗和电子产品中有广泛的应用。本文概述了EIT成像原理,总结了EIT智能可穿戴传感器在传感器材料、硬件结构设计、软件算法等方面的研究进展,详细介绍了EIT智能可穿戴传感器在人机交... 基于电阻抗成像(EIT)技术的智能可穿戴传感器在工业、医疗和电子产品中有广泛的应用。本文概述了EIT成像原理,总结了EIT智能可穿戴传感器在传感器材料、硬件结构设计、软件算法等方面的研究进展,详细介绍了EIT智能可穿戴传感器在人机交互、智能机器人和医疗保健方面的应用,并展望了其未来发展前景:更轻薄柔软的传感器材料、软件算法的优化、物联网和5G技术的普及、成本的降低和制造工艺的改进,将使得基于EIT的智能可穿戴传感器在更广泛的领域发挥其独特的优势,为人们的健康生活和工业发展提供更有力的支持。 展开更多
关键词 智能可穿戴传感器 电阻抗成像(EIT) 材料优化 硬件设计 软件算法
在线阅读 下载PDF
载荷转移系统硬件在环同步实验研究
4
作者 刘毅 丰宗强 +1 位作者 李文嵩 姚建涛 《机械设计与制造》 北大核心 2025年第11期271-277,283,共8页
传统机械系统模拟仿真存在驱动速度准确性较差与效率较为低下等问题,因此,提出一种基于数字孪生技术建立的样机与联合仿真相结合的虚实结合的实时检测系统。首先,设计舱内载荷转移系统机械结构方案,构建舱内载荷转移设备控制系统的总体... 传统机械系统模拟仿真存在驱动速度准确性较差与效率较为低下等问题,因此,提出一种基于数字孪生技术建立的样机与联合仿真相结合的虚实结合的实时检测系统。首先,设计舱内载荷转移系统机械结构方案,构建舱内载荷转移设备控制系统的总体架构。其次,基于软件在环实验形式,搭建联合仿真实验平台,利用系统辨识函数,对该数据进行了PID自诊定优化,基于虚拟控制器软件及机电一体化仿真软件,搭建联合虚拟调试平台。最后,基于硬件在环概念,搭建实时监测平台。通过虚实同步实验研究表明,该系统解决了虚拟模型电机驱动与真实电机驱动速度变化不一致的问题,提高了软件在环联合仿真的准确度,并解决了实验数据量化困难的问题,提高了实验效率,降低了实验成本。 展开更多
关键词 虚实同步 载荷转移 软件在环 硬件在环
在线阅读 下载PDF
面向隐私计算的模运算加速设计
5
作者 刘宏伟 支梁 +3 位作者 秦梦远 陈铭志 董文阔 郝沁汾 《计算机工程与科学》 北大核心 2025年第8期1331-1342,共12页
隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用... 隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用中广泛使用的模运算问题,在FPGA平台上基于PCIe接口设计实现了一个软硬件协同加速设计,能够有效掩盖通信延迟,并支持高达2048位的模运算,包括模乘和模幂运算,以服务于有隐私计算需求的数据中心场景。已有研究工作都仅关注模运算本身,而此软硬件协同框架则给出了一个完整的加速框架,不仅包含运算核心,还给出了数据和软硬件接口,并减少了通信延迟的影响。最后结合一个具体的运营商场景,实现了针对性的加速应用,通过实验验证了设计的性能优势。 展开更多
关键词 隐私计算 模乘 模幂 软硬件协同 RSA
在线阅读 下载PDF
基于有限元的地球物理电磁场三维正演仿真软件平台EMSIM
6
作者 陈卫营 薛国强 《地球科学与环境学报》 北大核心 2025年第5期857-870,共14页
电磁法是透视地球内部的重要手段,正演仿真模拟在洞悉电磁场响应机制、优化勘探策略以及深化反演处理与解释等方面扮演着不可或缺的关键角色。当前,针对各种电磁场正演算法的研究蓬勃发展,涌现出大量开源程序代码。然而,这些工具往往局... 电磁法是透视地球内部的重要手段,正演仿真模拟在洞悉电磁场响应机制、优化勘探策略以及深化反演处理与解释等方面扮演着不可或缺的关键角色。当前,针对各种电磁场正演算法的研究蓬勃发展,涌现出大量开源程序代码。然而,这些工具往往局限于单一程序层面,尤其在模型构建、网格剖分及后处理显示等核心环节上常需频繁切换至外部软件,增加了操作复杂性与时间成本。为此,开发了一套地球物理电磁场三维正演仿真软件平台EMSIM。该软件基于有限元法实现了三维空间内地球物理电磁场的正演模拟,并具备几何建模、网格剖分、分析求解、可视化显示、数据管理等全流程功能。在软件开发过程中,重点解决了复杂模型建模与剖分、并行计算优化、大规模计算数据高效管理、后处理显示等关键技术难题,显著提升了仿真计算的精度与效率。通过多个案例的对比验证,EMSIM软件在操作性能、计算精度与效率上满足实际应用需求,可作为地球物理电磁学研究的有力工具。 展开更多
关键词 地球物理学 电磁场 三维正演 软件开发 有限元 CAD建模 网格剖分 并行计算
在线阅读 下载PDF
草方格沙障铺设车控制系统设计
7
作者 常同立 王文健 许慧迎 《林业机械与木工设备》 2025年第1期52-58,共7页
为提高草方格沙障铺设车自动化水平,降低人工劳动强度,提高工作效率,设计电子控制方法对机械机构进行控制。首先介绍铺设车作业流程,以西门子1200系列PLC作为控制核心设计控制方法,其次根据工作环境特点完成硬件选择和整体架构,并绘制... 为提高草方格沙障铺设车自动化水平,降低人工劳动强度,提高工作效率,设计电子控制方法对机械机构进行控制。首先介绍铺设车作业流程,以西门子1200系列PLC作为控制核心设计控制方法,其次根据工作环境特点完成硬件选择和整体架构,并绘制控制系统接线原理图,然后根据工作需求对控制程序进行编写与仿真调试,最后对HMI进行组态。通过控制程序在Protal软件中的仿真运行,验证其能满足预期控制功能要求。 展开更多
关键词 草方格沙障铺设 PLC 硬件架构 软件设计
在线阅读 下载PDF
基于卷积神经网络的内窥镜图像识别及FPGA实现 被引量:1
8
作者 刘生山 林金朝 +2 位作者 庞宇 王元发 周前能 《现代电子技术》 北大核心 2025年第11期156-162,共7页
为提高内窥镜病灶识别准确率和速度,减少检测仪器功耗,针对现有VGG16网络模型参数量大、FPGA加速困难等缺陷,文中提出一种改进VGG的图像识别电路系统,并将该系统首次应用于内窥镜图像病灶识别。首先,通过软件技术优化VGG算法卷积层和全... 为提高内窥镜病灶识别准确率和速度,减少检测仪器功耗,针对现有VGG16网络模型参数量大、FPGA加速困难等缺陷,文中提出一种改进VGG的图像识别电路系统,并将该系统首次应用于内窥镜图像病灶识别。首先,通过软件技术优化VGG算法卷积层和全连接层,增加自适应平均池化层;然后设计优化的卷积IP核,实现卷积和最大池化FPGA加速。为减少模型参数量,有效降低FPGA资源消耗,将改进网络层和批归一化层融合。实验结果表明,改进后的网络模型平均识别准确率为95.59%,模型大小为35.90 MB,相比原始网络准确率提升了3.24%,模型参数量减少92.99%。FPGA板级检测时间为0.55 s/张,相较ARM端和CPU端检测时间减少1509.06 s/张和0.14 s/张。通过优化和改进,提出的电路系统显著提升了内窥镜病灶识别的效率和准确率,有效降低了硬件资源消耗。 展开更多
关键词 卷积神经网络 VGG模型 FPGA 内窥镜图像识别 高层次综合工具 软硬协同
在线阅读 下载PDF
面向智能制造的自主可控工业互联网发展研究 被引量:3
9
作者 袁礼伟 王耀南 +2 位作者 谭浩然 方遒 李哲 《中国工程科学》 北大核心 2025年第3期38-53,共16页
在制造业与新一代信息技术深度融合发展并加速智能化变革的背景下,亟需突破工业软件研发、高端装备制造等“卡脖子”技术环节,构建自主可控工业互联网技术体系以支撑智能制造全流程优化。本文梳理了智能制造与工业互联网的发展现状,从... 在制造业与新一代信息技术深度融合发展并加速智能化变革的背景下,亟需突破工业软件研发、高端装备制造等“卡脖子”技术环节,构建自主可控工业互联网技术体系以支撑智能制造全流程优化。本文梳理了智能制造与工业互联网的发展现状,从工业互联网技术要素、基于工业互联网的智能制造技术要素、自主可控工业互联网软硬件系统3个方面呈现了面向智能制造的自主可控工业互联网技术体系全貌;系统总结了面向智能制造的自主可控工业互联网技术示范应用,涵盖自主可控的机器人化智能制造、基于自主可控工业互联网的工业检测与感知、面向智能制造的网络化多机协同控制、面向智能制造的多机协同调度规划;进一步研判了面向智能制造的自主可控工业互联网的当前挑战和技术方向。可积极应用第五代移动通信、自主可控工业软件、工业互联网“云边端”协同、搭载国产分布式操作系统的机器人、自主可控的多机协同制造技术,同时加快构建自主可控标准体系,驱动工业互联网与智能制造的融合发展,为我国制造业稳健升级和高质量发展开辟新途径。 展开更多
关键词 工业互联网 智能制造 自主可控 机器人 软硬件系统 示范应用
在线阅读 下载PDF
采球机设备虚拟调试设计与仿真研究 被引量:1
10
作者 张泽坤 孙渊 王寻 《机床与液压》 北大核心 2025年第10期222-230,共9页
为了解决采球机调试成本高、周期长、效率低和风险大等问题,提出一种基于三维仿真平台NX MCD的采球机虚拟调试方法。基于NX MCD平台搭建机电一体化概念模型,定义机械、电气和自动化等属性,完成了平台内部的仿真序列调试;集成NX MCD、TI... 为了解决采球机调试成本高、周期长、效率低和风险大等问题,提出一种基于三维仿真平台NX MCD的采球机虚拟调试方法。基于NX MCD平台搭建机电一体化概念模型,定义机械、电气和自动化等属性,完成了平台内部的仿真序列调试;集成NX MCD、TIA博图V16和S7-PLCSIM Advanced V3.0实现软件在环调试;最后,结合S7-1200 PLC和KTP700 Basic PN HMI等实体设备完成硬件在环调试,实现了采球机的虚拟仿真设计与运行。验证了NX MCD在机电产品概念开发阶段的可行性和优越性,提出的“仿真序列-软件在环-硬件在环”三层次虚拟调试框架为复杂机电设备的开发提供了高效、安全的调试新范式。 展开更多
关键词 NX MCD 虚拟调试 软件在环 硬件在环
在线阅读 下载PDF
基于多操作数的RISC-V指令集设计与功能优化方法 被引量:1
11
作者 张钰儿 席宇浩 刘鹏 《计算机工程与科学》 北大核心 2025年第6期968-975,共8页
RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传... RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传统处理器加速方法通常采用“2输入1输出”模型,这在一定程度上限制了复杂操作的灵活性与执行效率。为突破该限制,提出了一种多操作数增强指令集的设计方法。该方法通过引入多操作数加速机制,突破了传统模型的结构性约束,为多输入多输出任务提供了灵活的指令接口。为验证所提机制的有效性,基于Western Digital开源的RISC-V VeeR EH1处理器核实现了该设计,并在FPGA平台上进行了基准测试,涵盖SHA-256,SHA-1以及FIR/IIR滤波器等典型算法。实验结果表明,在FPGA平台上的逻辑资源开销控制在3%以内的情况下,处理器性能最高提升可达14%。与传统“2输入1输出”加速方法相比,所提出的增强指令集设计能够显著提升RISC-V在复杂任务处理中的性能,展示了其在嵌入式计算和专用加速领域的潜在优势。 展开更多
关键词 RISC-V 自定义指令 软硬件协同设计
在线阅读 下载PDF
端智能推理加速技术综述
12
作者 章晋睿 龙婷婷 +3 位作者 张德宇 许愿 任炬 张尧学 《电子学报》 北大核心 2025年第4期1063-1102,共40页
智能下沉是迈向泛在智能时代的必经之路,也推动了端智能(on-device intelligence)技术的飞速发展.通过在终端设备直接部署运行深度学习模型,端智能在实时性、安全性、个性化等方面具有天然优势,已在自动驾驶、卫星侦察、虚拟现实/增强现... 智能下沉是迈向泛在智能时代的必经之路,也推动了端智能(on-device intelligence)技术的飞速发展.通过在终端设备直接部署运行深度学习模型,端智能在实时性、安全性、个性化等方面具有天然优势,已在自动驾驶、卫星侦察、虚拟现实/增强现实(Virtual Reality/Augmented Reality,VR/AR)等众多场景广泛应用.然而,随着深度学习模型参数量不断增大,端侧受限的硬件资源已难以支撑不断增长的计算开销.为提升终端设备在模型推理的计算效率,研究人员从模型算法、编译软件、设备硬件等多个层面开展了系统性优化,有效推动了端智能的发展与演进.本文从算法、软硬件结合优化等方面对现有端侧深度学习模型推理优化工作进行了总结,涵盖模型压缩技术、模型-软件-硬件的协同设计、模型异构并行部署策略以及大模型的端侧优化技术.最后,本文梳理了当前端智能推理加速技术所面临的挑战,并对未来发展趋势进行了展望. 展开更多
关键词 端智能 模型压缩 推理加速 深度学习 软硬件结合优化
在线阅读 下载PDF
自主运行智能水网的在环测试体系
13
作者 雷晓辉 张峥 +3 位作者 苏承国 王二朋 徐海洋 何立新 《南水北调与水利科技(中英文)》 北大核心 2025年第4期787-793,共7页
基于无人驾驶汽车领域在环测试技术,构建面向无人驾驶水网的在环测试体系,涵盖模型在环、软件在环、硬件在环及人在环4个层级,可以实现从仿真到实际控制全过程的递进式验证,并且能够有效提升测试的系统性和实用性。系统梳理各类在环测... 基于无人驾驶汽车领域在环测试技术,构建面向无人驾驶水网的在环测试体系,涵盖模型在环、软件在环、硬件在环及人在环4个层级,可以实现从仿真到实际控制全过程的递进式验证,并且能够有效提升测试的系统性和实用性。系统梳理各类在环测试层级所对应的验证目标、技术手段、关键算法以及量化评估指标体系,重点探讨无人驾驶汽车领域中如传感器融合、场景仿真和故障注入等核心测试技术在智能水网系统测试中的迁移适用性。针对水网系统的专业特有需求,深入分析仿真建模的精度要求、同步孪生的实时响应能力以及人机协同决策机制所面临的关键问题。同时,围绕测试场景库的构建、虚实交互协议的统一以及多智能体协同测试等重要层面,提出具备工程实践应用价值的建议,为智慧水网系统的全生命周期验证体系提供理论支撑和可行技术手段。 展开更多
关键词 自主运行智能水网 在环测试 模型在环 软件在环 硬件在环 人在环
在线阅读 下载PDF
一种软硬件协同的多核系统模拟器的设计与实现 被引量:1
14
作者 王鉴 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第3期335-342,共8页
基于软件实现的多核系统模拟器执行计算密集/数据密集任务的时效性极差,且存在模拟精度和性能评估准确性差的不足,限制其在多核系统结构优化探索中的应用。文章提出一种周期精确的软硬件协同多核系统模拟器(cycle accurate hardware-sof... 基于软件实现的多核系统模拟器执行计算密集/数据密集任务的时效性极差,且存在模拟精度和性能评估准确性差的不足,限制其在多核系统结构优化探索中的应用。文章提出一种周期精确的软硬件协同多核系统模拟器(cycle accurate hardware-software co-simulator,CAHSCS),通过在传统模拟器架构中引入硬件计算和存储模块,CAHSCS能有效改善全系统的模拟速度、精度,提高性能评估的准确性。复杂真实任务加载实验结果表明,CAHSCS将大规模复杂数据的运算效率提高了10倍,显著加快了系统设计收敛速度。 展开更多
关键词 软硬件协同模拟器 多核系统模拟器 大规模数据运算 硬件计算 模拟器加速
在线阅读 下载PDF
一种软硬件协同的访存踪迹实时分析处理工具
15
作者 李作骏 卢天越 +1 位作者 朱晨光 陈明宇 《高技术通讯》 北大核心 2025年第8期813-823,共11页
本文提出一种软硬件协同的访存踪迹实时分析处理工具,通过硬件采集并实时回传访存踪迹、实时分析处理访存踪迹、提取语义信息即时指导访存系统调控,解决了当前基于访存踪迹信息进行访存调控的软硬件系统研究中缺乏有效的实时分析处理手... 本文提出一种软硬件协同的访存踪迹实时分析处理工具,通过硬件采集并实时回传访存踪迹、实时分析处理访存踪迹、提取语义信息即时指导访存系统调控,解决了当前基于访存踪迹信息进行访存调控的软硬件系统研究中缺乏有效的实时分析处理手段的问题。该工具通过定制现场可编程门阵列(field programmable gate array,FPGA)采集卡,在双路Intel E52680 v4服务器平台中实现同机访存踪迹回传和实时分析处理。基准测试表明该工具的最低传输延迟为1.5μs,能够实时处理DDR4-1600速率下的高带宽访存,在安全监测场景实验中的平均异常检测响应时间为28.0μs,基于该工具的实时远端内存预取方案性能在25.0%和50.0%本地内存负载下分别比Fastswap高24.9%和32.0%。 展开更多
关键词 内存访问 踪迹 实时分析 软硬件协同 安全监测
在线阅读 下载PDF
AI+HPC:“智能+”驱动下的超算系统软件及应用技术发展综述
16
作者 谭政源 钟佳卿 陈娟 《计算机科学》 北大核心 2025年第5期1-10,共10页
人工智能(AI)和高性能计算(HPC)是计算机领域的两大重要技术。随着计算机技术的飞速发展,二者的联系逐渐紧密,并呈现出互相依赖、互相促进的关系。一方面,高性能计算系统面临的各种新问题与新挑战,需要人工智能方法技术辅助解决(AI for ... 人工智能(AI)和高性能计算(HPC)是计算机领域的两大重要技术。随着计算机技术的飞速发展,二者的联系逐渐紧密,并呈现出互相依赖、互相促进的关系。一方面,高性能计算系统面临的各种新问题与新挑战,需要人工智能方法技术辅助解决(AI for HPC);另一方面,人工智能领域理论的突破,依赖于HPC提供的强大的计算能力(HPC for AI)。在这样的背景下,AI和HPC两领域交叉融合,深度发展。文中系统回顾了近年来AI和HPC两个领域各自技术的发展脉络,着重从以下几方面展开分析:1)AI技术在解决HPC硬件体系结构、操作系统资源管理、编译优化和软件开发等几个方面问题的贡献;2)HPC为AI在硬件基础设施及软件应用上的支持;3)AI和HPC领域融合的未来发展前景与挑战。 展开更多
关键词 人工智能 高性能计算 领域融合 硬件体系 软件应用
在线阅读 下载PDF
用于RF雷达液位计自动标定的控制系统
17
作者 贾浩 张玉 +1 位作者 贺华 陆新宇 《现代电子技术》 北大核心 2025年第11期109-113,共5页
为了解决生产厂家对RF雷达液位计产品标定过程中,自动化程度不足而导致的产品一致性差、产量难以提高的问题,文中设计一款能够实现五点标定的自动控制系统。该控制系统采用PLC作为控制核心,其中包括对原有手动标定系统的自动化升级和改... 为了解决生产厂家对RF雷达液位计产品标定过程中,自动化程度不足而导致的产品一致性差、产量难以提高的问题,文中设计一款能够实现五点标定的自动控制系统。该控制系统采用PLC作为控制核心,其中包括对原有手动标定系统的自动化升级和改造。通过PLC控制各个点位的反射板运动,使用PLC通信模块实现控制系统与上位机标定系统之间的通信,完成仪表读数与点位控制间的配合。另外,该系统利用精度高、不受外界杂散电磁场影响的激光测距仪实现了对RF雷达液位计的辅助标定,通过读取激光测距仪发送的模拟电压量判断点位控制是否正确。实验结果表明,该系统在提高了生产线对RF雷达液位计标定的规范性和准确程度的同时,也提高了RF雷达液位计产品产线的自动程度,使生产效率得到了进一步的提升。 展开更多
关键词 RF雷达液位计 仪表标定 PLC 自动化 硬件设计 软件编程
在线阅读 下载PDF
基于测量不确定度表示指南的红外目标检测不确定度测量方案
18
作者 蒋沛宇 王永光 +2 位作者 任亚亭 李硕晨 谭火彬 《计算机应用》 北大核心 2025年第7期2162-2168,共7页
针对当前目标检测算法的不确定性研究将不确定性建模作为优化预测结果的一个步骤,而忽视了不确定性本身的性质的问题,提出一种基于测量不确定度表示指南(GUM)的目标检测结果评定方案。首先,将目标检测的不确定度来源分解为数据、模型、... 针对当前目标检测算法的不确定性研究将不确定性建模作为优化预测结果的一个步骤,而忽视了不确定性本身的性质的问题,提出一种基于测量不确定度表示指南(GUM)的目标检测结果评定方案。首先,将目标检测的不确定度来源分解为数据、模型、平台3个互相独立的方面,并从这3个方面提取不确定度影响因素,从而构建不确定度测量函数;其次,使用GUM中的A类评定方法和B类评定方法对不确定度影响分量进行度量;最后,基于测量函数使用不确定度合成法则,并由不确定度分量合成标准不确定度。在目标检测算法上展开实验,结果表明,与峰值信噪比(PSNR)和结构相似性(SSIM)相比,数据不确定度在捕捉噪声数据方面分别提高了5.30和19.08个百分点;模型不确定度对预测结果的影响很小,在10-6范围内可以忽略;平台的不确定度可以用数值化形式表示由软硬件平台带来的预测结果差异。 展开更多
关键词 目标检测算法 不确定度测量 不确定度分解与合成 图像数据 软硬件平台
在线阅读 下载PDF
基于RISC-V Matrix指令集扩展的LLM矢量点积加速研究
19
作者 陈煦豪 胡思鹏 +3 位作者 刘洪超 刘伯然 唐丹 赵地 《计算机科学》 北大核心 2025年第5期83-90,共8页
鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效... 鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效大语言模型(LLM)推理计算的需求。针对大语言模型的特性,基于RISC-V指令集扩展了自定义指令完成矢量点积计算,在专用的矢量点积加速硬件上进行大语言模型的运算加速;基于开源高性能RISC-V处理器核“香山”nanhu版本架构,实现了矢量点积专用指令集处理器nanhu-vdot,其在高性能处理器“香山”(nanhu版本)的基础上增加了矢量点积计算单元以及流水线处理逻辑;对nanhu-vdot进行FPGA硬件测试,在几乎没有增加额外的硬件资源和功耗消耗的前提下,矢量点积运算速度相比标量方法提高4倍以上,使用软硬件协同方案进行第二代生成式预训练(Generative Pre-Trained-2,GPT-2)模型推理,相比纯软件实现,速度提高了约30%。 展开更多
关键词 指令集扩展 矢量点积 软硬件协同 大语言模型推理
在线阅读 下载PDF
基于新工科理念的“嵌入式系统设计”课程改革和创新 被引量:1
20
作者 漆强 周建华 +1 位作者 刘子骥 胡哲峰 《实验室研究与探索》 北大核心 2025年第6期162-166,共5页
针对嵌入式系统教学中长期存在的“产学脱节、学用脱离、重软轻硬、考核单一”等问题,以产学合作为导向,实施了“产教融合、项目导向、软硬并重、课赛结合”的创新举措。从教学内容、教学方法、实践教学和考核方式等4个维度进行了全方... 针对嵌入式系统教学中长期存在的“产学脱节、学用脱离、重软轻硬、考核单一”等问题,以产学合作为导向,实施了“产教融合、项目导向、软硬并重、课赛结合”的创新举措。从教学内容、教学方法、实践教学和考核方式等4个维度进行了全方位的教学改革。经过近5年的教学实践,学生的硬件设计能力和工程思维得到了有效的提升,并多次荣获学科竞赛的国家级奖项。课程在建设过程中也获得国家级一流本科课程(线上)等多项国家级和省级教学成果,相关教学经验在国内高校推广。 展开更多
关键词 新工科 产教融合 项目导向 软硬并重 课赛结合
在线阅读 下载PDF
上一页 1 2 71 下一页 到第
使用帮助 返回顶部