期刊文献+
共找到1,338篇文章
< 1 2 67 >
每页显示 20 50 100
基于EIT技术的智能可穿戴传感器的研究进展
1
作者 王琦 王鑫 段晓杰 《天津工业大学学报》 北大核心 2025年第4期71-82,共12页
基于电阻抗成像(EIT)技术的智能可穿戴传感器在工业、医疗和电子产品中有广泛的应用。本文概述了EIT成像原理,总结了EIT智能可穿戴传感器在传感器材料、硬件结构设计、软件算法等方面的研究进展,详细介绍了EIT智能可穿戴传感器在人机交... 基于电阻抗成像(EIT)技术的智能可穿戴传感器在工业、医疗和电子产品中有广泛的应用。本文概述了EIT成像原理,总结了EIT智能可穿戴传感器在传感器材料、硬件结构设计、软件算法等方面的研究进展,详细介绍了EIT智能可穿戴传感器在人机交互、智能机器人和医疗保健方面的应用,并展望了其未来发展前景:更轻薄柔软的传感器材料、软件算法的优化、物联网和5G技术的普及、成本的降低和制造工艺的改进,将使得基于EIT的智能可穿戴传感器在更广泛的领域发挥其独特的优势,为人们的健康生活和工业发展提供更有力的支持。 展开更多
关键词 智能可穿戴传感器 电阻抗成像(EIT) 材料优化 硬件设计 软件算法
在线阅读 下载PDF
面向隐私计算的模运算加速设计
2
作者 刘宏伟 支梁 +3 位作者 秦梦远 陈铭志 董文阔 郝沁汾 《计算机工程与科学》 北大核心 2025年第8期1331-1342,共12页
隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用... 隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用中广泛使用的模运算问题,在FPGA平台上基于PCIe接口设计实现了一个软硬件协同加速设计,能够有效掩盖通信延迟,并支持高达2048位的模运算,包括模乘和模幂运算,以服务于有隐私计算需求的数据中心场景。已有研究工作都仅关注模运算本身,而此软硬件协同框架则给出了一个完整的加速框架,不仅包含运算核心,还给出了数据和软硬件接口,并减少了通信延迟的影响。最后结合一个具体的运营商场景,实现了针对性的加速应用,通过实验验证了设计的性能优势。 展开更多
关键词 隐私计算 模乘 模幂 软硬件协同 RSA
在线阅读 下载PDF
复杂三维体高效布尔运算技术的研究与实现
3
作者 张永亮 王家润 吴乾坤 《计算机应用与软件》 北大核心 2025年第1期249-257,327,共10页
高效、稳健的复杂三维体布尔运算是地理信息中的重点与难点。针对难点提出软硬件协同加速计算框架。在软件层面采用多种算法加速优化技术,包括:降维碰撞检测、三维多边形保留与丢弃的原则、新生成三维多边形的构建方法、三维线段与三维... 高效、稳健的复杂三维体布尔运算是地理信息中的重点与难点。针对难点提出软硬件协同加速计算框架。在软件层面采用多种算法加速优化技术,包括:降维碰撞检测、三维多边形保留与丢弃的原则、新生成三维多边形的构建方法、三维线段与三维多边形的高效求交、三维点或三维多边形与三维体包含关系的高效判断;基于以上加速优化技术提出一套高效的计算框架;在硬件层面基于GPU的众核算力加速计算,提出软硬件协同加速计算框架。实验证明,该计算框架高效性且稳健性,与现有的方法相比,软件层面计算框架效率提高3倍左右,软硬件协同加速框架将效率进一步提高3倍左右。 展开更多
关键词 加速优化技术 降维碰撞检测 高效 众核算力 软硬件协同加速
在线阅读 下载PDF
草方格沙障铺设车控制系统设计
4
作者 常同立 王文健 许慧迎 《林业机械与木工设备》 2025年第1期52-58,共7页
为提高草方格沙障铺设车自动化水平,降低人工劳动强度,提高工作效率,设计电子控制方法对机械机构进行控制。首先介绍铺设车作业流程,以西门子1200系列PLC作为控制核心设计控制方法,其次根据工作环境特点完成硬件选择和整体架构,并绘制... 为提高草方格沙障铺设车自动化水平,降低人工劳动强度,提高工作效率,设计电子控制方法对机械机构进行控制。首先介绍铺设车作业流程,以西门子1200系列PLC作为控制核心设计控制方法,其次根据工作环境特点完成硬件选择和整体架构,并绘制控制系统接线原理图,然后根据工作需求对控制程序进行编写与仿真调试,最后对HMI进行组态。通过控制程序在Protal软件中的仿真运行,验证其能满足预期控制功能要求。 展开更多
关键词 草方格沙障铺设 PLC 硬件架构 软件设计
在线阅读 下载PDF
面向智能制造的自主可控工业互联网发展研究 被引量:1
5
作者 袁礼伟 王耀南 +2 位作者 谭浩然 方遒 李哲 《中国工程科学》 北大核心 2025年第3期38-53,共16页
在制造业与新一代信息技术深度融合发展并加速智能化变革的背景下,亟需突破工业软件研发、高端装备制造等“卡脖子”技术环节,构建自主可控工业互联网技术体系以支撑智能制造全流程优化。本文梳理了智能制造与工业互联网的发展现状,从... 在制造业与新一代信息技术深度融合发展并加速智能化变革的背景下,亟需突破工业软件研发、高端装备制造等“卡脖子”技术环节,构建自主可控工业互联网技术体系以支撑智能制造全流程优化。本文梳理了智能制造与工业互联网的发展现状,从工业互联网技术要素、基于工业互联网的智能制造技术要素、自主可控工业互联网软硬件系统3个方面呈现了面向智能制造的自主可控工业互联网技术体系全貌;系统总结了面向智能制造的自主可控工业互联网技术示范应用,涵盖自主可控的机器人化智能制造、基于自主可控工业互联网的工业检测与感知、面向智能制造的网络化多机协同控制、面向智能制造的多机协同调度规划;进一步研判了面向智能制造的自主可控工业互联网的当前挑战和技术方向。可积极应用第五代移动通信、自主可控工业软件、工业互联网“云边端”协同、搭载国产分布式操作系统的机器人、自主可控的多机协同制造技术,同时加快构建自主可控标准体系,驱动工业互联网与智能制造的融合发展,为我国制造业稳健升级和高质量发展开辟新途径。 展开更多
关键词 工业互联网 智能制造 自主可控 机器人 软硬件系统 示范应用
在线阅读 下载PDF
端智能推理加速技术综述
6
作者 章晋睿 龙婷婷 +3 位作者 张德宇 许愿 任炬 张尧学 《电子学报》 北大核心 2025年第4期1063-1102,共40页
智能下沉是迈向泛在智能时代的必经之路,也推动了端智能(on-device intelligence)技术的飞速发展.通过在终端设备直接部署运行深度学习模型,端智能在实时性、安全性、个性化等方面具有天然优势,已在自动驾驶、卫星侦察、虚拟现实/增强现... 智能下沉是迈向泛在智能时代的必经之路,也推动了端智能(on-device intelligence)技术的飞速发展.通过在终端设备直接部署运行深度学习模型,端智能在实时性、安全性、个性化等方面具有天然优势,已在自动驾驶、卫星侦察、虚拟现实/增强现实(Virtual Reality/Augmented Reality,VR/AR)等众多场景广泛应用.然而,随着深度学习模型参数量不断增大,端侧受限的硬件资源已难以支撑不断增长的计算开销.为提升终端设备在模型推理的计算效率,研究人员从模型算法、编译软件、设备硬件等多个层面开展了系统性优化,有效推动了端智能的发展与演进.本文从算法、软硬件结合优化等方面对现有端侧深度学习模型推理优化工作进行了总结,涵盖模型压缩技术、模型-软件-硬件的协同设计、模型异构并行部署策略以及大模型的端侧优化技术.最后,本文梳理了当前端智能推理加速技术所面临的挑战,并对未来发展趋势进行了展望. 展开更多
关键词 端智能 模型压缩 推理加速 深度学习 软硬件结合优化
在线阅读 下载PDF
基于卷积神经网络的内窥镜图像识别及FPGA实现
7
作者 刘生山 林金朝 +2 位作者 庞宇 王元发 周前能 《现代电子技术》 北大核心 2025年第11期156-162,共7页
为提高内窥镜病灶识别准确率和速度,减少检测仪器功耗,针对现有VGG16网络模型参数量大、FPGA加速困难等缺陷,文中提出一种改进VGG的图像识别电路系统,并将该系统首次应用于内窥镜图像病灶识别。首先,通过软件技术优化VGG算法卷积层和全... 为提高内窥镜病灶识别准确率和速度,减少检测仪器功耗,针对现有VGG16网络模型参数量大、FPGA加速困难等缺陷,文中提出一种改进VGG的图像识别电路系统,并将该系统首次应用于内窥镜图像病灶识别。首先,通过软件技术优化VGG算法卷积层和全连接层,增加自适应平均池化层;然后设计优化的卷积IP核,实现卷积和最大池化FPGA加速。为减少模型参数量,有效降低FPGA资源消耗,将改进网络层和批归一化层融合。实验结果表明,改进后的网络模型平均识别准确率为95.59%,模型大小为35.90 MB,相比原始网络准确率提升了3.24%,模型参数量减少92.99%。FPGA板级检测时间为0.55 s/张,相较ARM端和CPU端检测时间减少1509.06 s/张和0.14 s/张。通过优化和改进,提出的电路系统显著提升了内窥镜病灶识别的效率和准确率,有效降低了硬件资源消耗。 展开更多
关键词 卷积神经网络 VGG模型 FPGA 内窥镜图像识别 高层次综合工具 软硬协同
在线阅读 下载PDF
采球机设备虚拟调试设计与仿真研究
8
作者 张泽坤 孙渊 王寻 《机床与液压》 北大核心 2025年第10期222-230,共9页
为了解决采球机调试成本高、周期长、效率低和风险大等问题,提出一种基于三维仿真平台NX MCD的采球机虚拟调试方法。基于NX MCD平台搭建机电一体化概念模型,定义机械、电气和自动化等属性,完成了平台内部的仿真序列调试;集成NX MCD、TI... 为了解决采球机调试成本高、周期长、效率低和风险大等问题,提出一种基于三维仿真平台NX MCD的采球机虚拟调试方法。基于NX MCD平台搭建机电一体化概念模型,定义机械、电气和自动化等属性,完成了平台内部的仿真序列调试;集成NX MCD、TIA博图V16和S7-PLCSIM Advanced V3.0实现软件在环调试;最后,结合S7-1200 PLC和KTP700 Basic PN HMI等实体设备完成硬件在环调试,实现了采球机的虚拟仿真设计与运行。验证了NX MCD在机电产品概念开发阶段的可行性和优越性,提出的“仿真序列-软件在环-硬件在环”三层次虚拟调试框架为复杂机电设备的开发提供了高效、安全的调试新范式。 展开更多
关键词 NX MCD 虚拟调试 软件在环 硬件在环
在线阅读 下载PDF
AI+HPC:“智能+”驱动下的超算系统软件及应用技术发展综述
9
作者 谭政源 钟佳卿 陈娟 《计算机科学》 北大核心 2025年第5期1-10,共10页
人工智能(AI)和高性能计算(HPC)是计算机领域的两大重要技术。随着计算机技术的飞速发展,二者的联系逐渐紧密,并呈现出互相依赖、互相促进的关系。一方面,高性能计算系统面临的各种新问题与新挑战,需要人工智能方法技术辅助解决(AI for ... 人工智能(AI)和高性能计算(HPC)是计算机领域的两大重要技术。随着计算机技术的飞速发展,二者的联系逐渐紧密,并呈现出互相依赖、互相促进的关系。一方面,高性能计算系统面临的各种新问题与新挑战,需要人工智能方法技术辅助解决(AI for HPC);另一方面,人工智能领域理论的突破,依赖于HPC提供的强大的计算能力(HPC for AI)。在这样的背景下,AI和HPC两领域交叉融合,深度发展。文中系统回顾了近年来AI和HPC两个领域各自技术的发展脉络,着重从以下几方面展开分析:1)AI技术在解决HPC硬件体系结构、操作系统资源管理、编译优化和软件开发等几个方面问题的贡献;2)HPC为AI在硬件基础设施及软件应用上的支持;3)AI和HPC领域融合的未来发展前景与挑战。 展开更多
关键词 人工智能 高性能计算 领域融合 硬件体系 软件应用
在线阅读 下载PDF
用于RF雷达液位计自动标定的控制系统
10
作者 贾浩 张玉 +1 位作者 贺华 陆新宇 《现代电子技术》 北大核心 2025年第11期109-113,共5页
为了解决生产厂家对RF雷达液位计产品标定过程中,自动化程度不足而导致的产品一致性差、产量难以提高的问题,文中设计一款能够实现五点标定的自动控制系统。该控制系统采用PLC作为控制核心,其中包括对原有手动标定系统的自动化升级和改... 为了解决生产厂家对RF雷达液位计产品标定过程中,自动化程度不足而导致的产品一致性差、产量难以提高的问题,文中设计一款能够实现五点标定的自动控制系统。该控制系统采用PLC作为控制核心,其中包括对原有手动标定系统的自动化升级和改造。通过PLC控制各个点位的反射板运动,使用PLC通信模块实现控制系统与上位机标定系统之间的通信,完成仪表读数与点位控制间的配合。另外,该系统利用精度高、不受外界杂散电磁场影响的激光测距仪实现了对RF雷达液位计的辅助标定,通过读取激光测距仪发送的模拟电压量判断点位控制是否正确。实验结果表明,该系统在提高了生产线对RF雷达液位计标定的规范性和准确程度的同时,也提高了RF雷达液位计产品产线的自动程度,使生产效率得到了进一步的提升。 展开更多
关键词 RF雷达液位计 仪表标定 PLC 自动化 硬件设计 软件编程
在线阅读 下载PDF
基于测量不确定度表示指南的红外目标检测不确定度测量方案
11
作者 蒋沛宇 王永光 +2 位作者 任亚亭 李硕晨 谭火彬 《计算机应用》 北大核心 2025年第7期2162-2168,共7页
针对当前目标检测算法的不确定性研究将不确定性建模作为优化预测结果的一个步骤,而忽视了不确定性本身的性质的问题,提出一种基于测量不确定度表示指南(GUM)的目标检测结果评定方案。首先,将目标检测的不确定度来源分解为数据、模型、... 针对当前目标检测算法的不确定性研究将不确定性建模作为优化预测结果的一个步骤,而忽视了不确定性本身的性质的问题,提出一种基于测量不确定度表示指南(GUM)的目标检测结果评定方案。首先,将目标检测的不确定度来源分解为数据、模型、平台3个互相独立的方面,并从这3个方面提取不确定度影响因素,从而构建不确定度测量函数;其次,使用GUM中的A类评定方法和B类评定方法对不确定度影响分量进行度量;最后,基于测量函数使用不确定度合成法则,并由不确定度分量合成标准不确定度。在目标检测算法上展开实验,结果表明,与峰值信噪比(PSNR)和结构相似性(SSIM)相比,数据不确定度在捕捉噪声数据方面分别提高了5.30和19.08个百分点;模型不确定度对预测结果的影响很小,在10-6范围内可以忽略;平台的不确定度可以用数值化形式表示由软硬件平台带来的预测结果差异。 展开更多
关键词 目标检测算法 不确定度测量 不确定度分解与合成 图像数据 软硬件平台
在线阅读 下载PDF
基于RISC-V Matrix指令集扩展的LLM矢量点积加速研究
12
作者 陈煦豪 胡思鹏 +3 位作者 刘洪超 刘伯然 唐丹 赵地 《计算机科学》 北大核心 2025年第5期83-90,共8页
鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效... 鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效大语言模型(LLM)推理计算的需求。针对大语言模型的特性,基于RISC-V指令集扩展了自定义指令完成矢量点积计算,在专用的矢量点积加速硬件上进行大语言模型的运算加速;基于开源高性能RISC-V处理器核“香山”nanhu版本架构,实现了矢量点积专用指令集处理器nanhu-vdot,其在高性能处理器“香山”(nanhu版本)的基础上增加了矢量点积计算单元以及流水线处理逻辑;对nanhu-vdot进行FPGA硬件测试,在几乎没有增加额外的硬件资源和功耗消耗的前提下,矢量点积运算速度相比标量方法提高4倍以上,使用软硬件协同方案进行第二代生成式预训练(Generative Pre-Trained-2,GPT-2)模型推理,相比纯软件实现,速度提高了约30%。 展开更多
关键词 指令集扩展 矢量点积 软硬件协同 大语言模型推理
在线阅读 下载PDF
面向创新能力培养的脑-机接口实验教学模式设计
13
作者 龚晓亮 《实验室研究与探索》 北大核心 2025年第8期218-221,共4页
聚焦“软硬协同、交叉创新”培养理念,针对传统脑-机接口(brain-computer interface, BCI)技术实验教学存在的进口设备昂贵、实验设计单一、本科生实践不充分等问题,设计了BCI实验教学模式。在课内实验中集成脑电信号采集、特征解码及... 聚焦“软硬协同、交叉创新”培养理念,针对传统脑-机接口(brain-computer interface, BCI)技术实验教学存在的进口设备昂贵、实验设计单一、本科生实践不充分等问题,设计了BCI实验教学模式。在课内实验中集成脑电信号采集、特征解码及控制反馈模块,形成“硬件层—算法层—应用层”全链条实验教学载体;在课外鼓励学生积极交叉创新实践,使学生经历“问题发现—方案设计—应用实现”过程。该模式有效提升学生在生物电子系统设计、智能信息处理、控制系统设计等领域的创新能力。 展开更多
关键词 脑-机接口技术 软硬协调 交叉创新 智能信息处理 实践教学
在线阅读 下载PDF
基于多操作数的RISC-V指令集设计与功能优化方法
14
作者 张钰儿 席宇浩 刘鹏 《计算机工程与科学》 北大核心 2025年第6期968-975,共8页
RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传... RISC-V架构凭借其开放性和模块化的指令集架构(ISA)设计,为特定应用及其软件生态系统的定制指令集成提供了良好支持,使其能够高效处理复杂算法并执行重复性操作。然而,由于操作数数量的限制,为RISC-V处理器设计加速指令仍面临挑战。传统处理器加速方法通常采用“2输入1输出”模型,这在一定程度上限制了复杂操作的灵活性与执行效率。为突破该限制,提出了一种多操作数增强指令集的设计方法。该方法通过引入多操作数加速机制,突破了传统模型的结构性约束,为多输入多输出任务提供了灵活的指令接口。为验证所提机制的有效性,基于Western Digital开源的RISC-V VeeR EH1处理器核实现了该设计,并在FPGA平台上进行了基准测试,涵盖SHA-256,SHA-1以及FIR/IIR滤波器等典型算法。实验结果表明,在FPGA平台上的逻辑资源开销控制在3%以内的情况下,处理器性能最高提升可达14%。与传统“2输入1输出”加速方法相比,所提出的增强指令集设计能够显著提升RISC-V在复杂任务处理中的性能,展示了其在嵌入式计算和专用加速领域的潜在优势。 展开更多
关键词 RISC-V 自定义指令 软硬件协同设计
在线阅读 下载PDF
面向工业面板状态监测的边缘智能视觉感知系统
15
作者 符长虹 张立国 +2 位作者 郑皓文 林华 左浩博 《仪表技术与传感器》 北大核心 2025年第5期43-48,52,共7页
为解决人工方式监测工业面板数据存在的成本高、效率低、准确性差等问题,设计基于边缘视觉感知的工业面板状态监测系统。设计以嵌入式边缘智能相机为核心的移动式硬件框架,为系统运行提供稳定环境与强大算力,并保证图像采集距离合适、... 为解决人工方式监测工业面板数据存在的成本高、效率低、准确性差等问题,设计基于边缘视觉感知的工业面板状态监测系统。设计以嵌入式边缘智能相机为核心的移动式硬件框架,为系统运行提供稳定环境与强大算力,并保证图像采集距离合适、清晰稳定。为利于边缘部署,引入一种轻量级维度重构模块,以降低字符监测方法计算复杂度,开发高效的色板对比方法与波形监测方法,实现色板与波形实时监测,设计交互界面实现人机数据交互。在实际工业场景中部署与应用,结果表明系统具备便捷的部署能力,能够完成工业面板信息监测任务。 展开更多
关键词 工业测试场景 边缘智能视觉感知 工业面板 在线状态监测 硬件系统 软件系统
在线阅读 下载PDF
呼吸性粉尘质量浓度在线监测技术研究
16
作者 李瑞楼 《中国安全生产科学技术》 北大核心 2025年第6期95-99,共5页
为有效对煤矿井下环境中呼吸性粉尘质量浓度进行实时在线监测并保证呼吸性粉尘分离器的分离效能,提出1种基于光散射原理的呼吸性粉尘质量浓度在线监测技术。首先,基于虚拟冲击原理,仿真分析分离器内部颗粒轨迹分布,阐述光散射法的检测原... 为有效对煤矿井下环境中呼吸性粉尘质量浓度进行实时在线监测并保证呼吸性粉尘分离器的分离效能,提出1种基于光散射原理的呼吸性粉尘质量浓度在线监测技术。首先,基于虚拟冲击原理,仿真分析分离器内部颗粒轨迹分布,阐述光散射法的检测原理,并设计呼吸性粉尘光学检测单元。其次,基于孔板流量检测技术,构建恒流量控制系统,设计监测仪器的硬件结构和光学检测算法模型。最后,将呼吸性粉尘质量浓度监测仪器的测量数据与滤膜称重法的呼吸性粉尘采样器检测数据进行对比。研究结果表明:基于光散射法的呼吸性粉尘质量浓度传感器的检测范围为0~300 mg/m^(3),最大的检测相对误差为8.18%。研究结果可精准检测呼吸性粉尘质量浓度,为尘肺病预警提供基础数据参考。 展开更多
关键词 呼吸性粉尘 实时监测 分离器 硬件 软件
在线阅读 下载PDF
一种软硬件协同的多核系统模拟器的设计与实现
17
作者 王鉴 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第3期335-342,共8页
基于软件实现的多核系统模拟器执行计算密集/数据密集任务的时效性极差,且存在模拟精度和性能评估准确性差的不足,限制其在多核系统结构优化探索中的应用。文章提出一种周期精确的软硬件协同多核系统模拟器(cycle accurate hardware-sof... 基于软件实现的多核系统模拟器执行计算密集/数据密集任务的时效性极差,且存在模拟精度和性能评估准确性差的不足,限制其在多核系统结构优化探索中的应用。文章提出一种周期精确的软硬件协同多核系统模拟器(cycle accurate hardware-software co-simulator,CAHSCS),通过在传统模拟器架构中引入硬件计算和存储模块,CAHSCS能有效改善全系统的模拟速度、精度,提高性能评估的准确性。复杂真实任务加载实验结果表明,CAHSCS将大规模复杂数据的运算效率提高了10倍,显著加快了系统设计收敛速度。 展开更多
关键词 软硬件协同模拟器 多核系统模拟器 大规模数据运算 硬件计算 模拟器加速
在线阅读 下载PDF
基于访存图案变形的CGRA存储划分优化
18
作者 潘德财 牟迪 +1 位作者 尚家兴 刘大江 《计算机研究与发展》 北大核心 2025年第4期1003-1016,共14页
由于兼具高灵活性和高能效的特征,粗粒度可重构阵列(coarse-grained reconfigurable array,CGRA)是一种具有潜力的领域定制加速器架构.为了利用多bank存储器的访问并行性,通常会在CGRA中引入存储器划分.然而,在CGRA上进行存储划分工作... 由于兼具高灵活性和高能效的特征,粗粒度可重构阵列(coarse-grained reconfigurable array,CGRA)是一种具有潜力的领域定制加速器架构.为了利用多bank存储器的访问并行性,通常会在CGRA中引入存储器划分.然而,在CGRA上进行存储划分工作要么以昂贵的寻址开销为代价实现最佳分区解决方案,要么以更多的存储bank消耗为代价来减少面积和功耗开销.为此,提出了一种通过访存图案变形来实现面向CGRA的存储划分方法.通过对包含多维数组的应用进行存储划分和算子调度协同优化,形成了存储划分友好的访存图案,从而可以用全“1”超平面对其进行存储划分,进而优化了划分结果并减少了访存地址计算开销.基于全“1”超平面的划分策略,还提出了一种可精简地址生成单元的高能效CGRA架构.实验结果表明,与最先进的方法相比,该方法可以实现1.25倍的能效提升. 展开更多
关键词 粗粒度可重构阵列 存储划分 软硬件联合设计 算子调度 访存图案
在线阅读 下载PDF
基于国密算法的隐私集合求交协议设计
19
作者 黄海 关志博 +3 位作者 于斌 马超 杨锦波 马项羽 《电子与信息学报》 北大核心 2025年第8期2757-2767,共11页
现有的隐私集合求交协议存在安全漏洞不可控的风险,此外计算效率不能满足实际应用需求。该文提出一种基于国密算法SM2和SM3的隐私集合求交协议SM-PSI,采用国产安全芯片对协议中的关键算法如含数据加密、非交互零知识证明等进行了硬件加... 现有的隐私集合求交协议存在安全漏洞不可控的风险,此外计算效率不能满足实际应用需求。该文提出一种基于国密算法SM2和SM3的隐私集合求交协议SM-PSI,采用国产安全芯片对协议中的关键算法如含数据加密、非交互零知识证明等进行了硬件加速设计,通过理论分析证明了协议在半诚实敌手模型下的安全性。使用模拟数据集进行实验,结果表明,在相同的安全等级下,所提协议通过软硬件协同优化,其计算效率显著优于现有方法,计算速度比CPU运行最优方案SpOT-Light的PSI协议平均提升4.2倍,比DH-IPP方案平均提升6.3倍。该研究为实现我国网络空间安全自主可控提供了重要支撑。 展开更多
关键词 隐私集合求交 SM2 SM3 软硬件协同 半诚实敌手
在线阅读 下载PDF
基于新工科理念的“嵌入式系统设计”课程改革和创新
20
作者 漆强 周建华 +1 位作者 刘子骥 胡哲峰 《实验室研究与探索》 北大核心 2025年第6期162-166,共5页
针对嵌入式系统教学中长期存在的“产学脱节、学用脱离、重软轻硬、考核单一”等问题,以产学合作为导向,实施了“产教融合、项目导向、软硬并重、课赛结合”的创新举措。从教学内容、教学方法、实践教学和考核方式等4个维度进行了全方... 针对嵌入式系统教学中长期存在的“产学脱节、学用脱离、重软轻硬、考核单一”等问题,以产学合作为导向,实施了“产教融合、项目导向、软硬并重、课赛结合”的创新举措。从教学内容、教学方法、实践教学和考核方式等4个维度进行了全方位的教学改革。经过近5年的教学实践,学生的硬件设计能力和工程思维得到了有效的提升,并多次荣获学科竞赛的国家级奖项。课程在建设过程中也获得国家级一流本科课程(线上)等多项国家级和省级教学成果,相关教学经验在国内高校推广。 展开更多
关键词 新工科 产教融合 项目导向 软硬并重 课赛结合
在线阅读 下载PDF
上一页 1 2 67 下一页 到第
使用帮助 返回顶部