期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
芯粒互联技术综述
1
作者 王浩 王勇 +3 位作者 冯长磊 盖伟新 吴鹏 钱江 《计算机研究与发展》 北大核心 2025年第11期2651-2662,共12页
作为摩尔定律的“破局者”,芯粒(Chiplet)技术被业界寄予了厚望.芯粒技术能够将多个具有特定功能的“小芯粒”通过高速互联技术组合成一个“小芯粒”集成芯片,其技术核心是能够实现芯粒组合扩展的芯粒互联技术.从芯粒互联协议、互联架... 作为摩尔定律的“破局者”,芯粒(Chiplet)技术被业界寄予了厚望.芯粒技术能够将多个具有特定功能的“小芯粒”通过高速互联技术组合成一个“小芯粒”集成芯片,其技术核心是能够实现芯粒组合扩展的芯粒互联技术.从芯粒互联协议、互联架构、容错机制、典型互联芯粒、基于互联芯粒的可测性设计5个方面进行了分析与讨论.首先详细对比分析了国内外芯粒互联协议,给出了各协议的分层及功能.然后介绍了3种典型的芯粒互联架构,分析了各种架构的特点及优势.之后介绍了芯粒容错机制,介绍了互联接口容错编码、容错拓扑和容错路由等容错途径.接着给出了可编程互联芯粒、路径可编程互联芯粒以及专用互联芯粒3种设计方案.最后介绍了基于互联芯粒的可测试性设计与测试方案.以芯粒互联为主题,旨在帮助读者对芯粒互联技术进行系统性了解. 展开更多
关键词 芯粒 互联 互联芯粒 架构 容错机制 可测性设计
在线阅读 下载PDF
压电谐振式音叉陀螺结构设计与仿真
2
作者 陈光伟 张一飞 +1 位作者 赵前程 曲发义 《仪表技术与传感器》 北大核心 2025年第4期45-49,共5页
针对静电陀螺需刻蚀亚微米电容间隙和大直流偏置电压的问题,提出了一种采用压电薄膜换能的谐振式音叉陀螺结构。理论分析了该结构的差分驱动原理、压电检测原理以及陀螺所受冲击载荷特性,并且使用有限元软件COMSOL对该压电陀螺结构进行... 针对静电陀螺需刻蚀亚微米电容间隙和大直流偏置电压的问题,提出了一种采用压电薄膜换能的谐振式音叉陀螺结构。理论分析了该结构的差分驱动原理、压电检测原理以及陀螺所受冲击载荷特性,并且使用有限元软件COMSOL对该压电陀螺结构进行了仿真分析。模态仿真结果表明:陀螺的驱动模态和检测模态的谐振频率分别为263.9 kHz和263.4 kHz,两者频差为0.5 kHz;标度系数仿真结果显示陀螺的电流灵敏度约为5.87 pA/[(°)·s^(-1)];根据冲击仿真结果,陀螺结构的最大应力约为57.3 MPa、最大位移量约为1.3μm,证明该结构有较好的抗冲击性能。此外,在300 K温度下仿真了该陀螺在不同真空度下的品质因数,结果表明其在压力为0.001 Pa时的品质因数约为100 721,在1atm压力时的品质因数约为6 531。 展开更多
关键词 压电传感器 压电陀螺 COMSOL仿真
在线阅读 下载PDF
快速上电响应的硅压阻式压力传感器温漂补偿 被引量:1
3
作者 周聪 闫晋平 +3 位作者 郭建成 游雨霖 杨振川 高成臣 《传感器与微系统》 北大核心 2025年第4期128-131,136,共5页
温度变化使得硅压阻式压力传感器产生零点漂移和灵敏度漂移,该漂移误差是硅压阻式压力传感误差的主要来源,也导致压阻式压力传感器上电后短时间出现上电热漂移现象,需要一定的预热时间。本文改进了实验测试平台的温控系统,提出了上电热... 温度变化使得硅压阻式压力传感器产生零点漂移和灵敏度漂移,该漂移误差是硅压阻式压力传感误差的主要来源,也导致压阻式压力传感器上电后短时间出现上电热漂移现象,需要一定的预热时间。本文改进了实验测试平台的温控系统,提出了上电热漂移补偿算法,设计了一种具有快速上电响应能力的压阻式压力传感器,能够实现自动化的温度补偿。经测试,温度补偿后,压力传感器的示值误差在0~40℃的温度范围优于0.02%FS。找出了影响上电热漂移的关键因素,对上电后8~60 s满量程输出进行上电热漂补,将上电热漂移由0.012%FS减小到了0.0016%FS,提高了上电快速响应能力。 展开更多
关键词 MEMS压力传感器 硅压阻式 上电响应 高精度 温度补偿
在线阅读 下载PDF
面向芯粒互连的单端64 Gb/s全双工收发机设计
4
作者 王知非 黄之闻 +5 位作者 叶天辰 叶秉奕 李芳竹 王玮 于敦山 盖伟新 《电子与信息学报》 北大核心 2025年第9期2979-2993,共15页
芯粒集成将多颗不同功能、工艺的芯粒封装在一起,为高性能芯片发展开辟了新的思路。芯粒间互连接口电路作为数据传输的纽带,其带宽密度、误码率和功耗对芯片算力和数据吞吐量等关键性能至关重要。针对带宽密度提升带来的信号反射和串扰... 芯粒集成将多颗不同功能、工艺的芯粒封装在一起,为高性能芯片发展开辟了新的思路。芯粒间互连接口电路作为数据传输的纽带,其带宽密度、误码率和功耗对芯片算力和数据吞吐量等关键性能至关重要。针对带宽密度提升带来的信号反射和串扰等问题,该文提出了一种具备回波、近端串扰和远端串扰消除功能的全双工收发机电路,并基于28 nm工艺进行了流片验证。其利用全双工技术提升了单通道数据速率,利用动态阈值判决技术实现了双向收发信号分离、回波与近端串扰消除,利用信道间容性与感性耦合的平衡实现了远端串扰消除。此外,延时匹配的源同步时钟结构降低了时钟相对数据抖动、提升了噪声容限,驻波与重置信号传输电路实现了发送信号的同步,提高了近端串扰消除精度。测试结果表明,在3 mm长的无屏蔽互连信道上,此收发机可以64 Gb/s的单通道速率、10.5 Tb/(s·mm)的带宽密度,实现低于10–16的误码率,能效为1.21 pJ/b。 展开更多
关键词 芯粒互连 收发机 全双工 串扰消除
在线阅读 下载PDF
PetS:针对参数高效Transformer模型的可扩展推理服务系统
5
作者 魏学超 周哲 +3 位作者 徐盈辉 张洁靖 谢源 孙广宇 《计算机研究与发展》 北大核心 2025年第7期1816-1832,共17页
在多任务推理服务场景下使用基于预训练-微调范式的Transformer模型存在很多困难:服务端必须维护每个下游任务的完整模型副本,从而造成很大的存储和显存开销.最近逐渐兴起的参数高效Transformer(PET)算法在不同的下游任务之间共享预训... 在多任务推理服务场景下使用基于预训练-微调范式的Transformer模型存在很多困难:服务端必须维护每个下游任务的完整模型副本,从而造成很大的存储和显存开销.最近逐渐兴起的参数高效Transformer(PET)算法在不同的下游任务之间共享预训练模型,仅微调一小部分任务特定的模型参数,从而减少存储的开销.然而,现有的后端服务系统既没有灵活的PET任务管理机制,也不能有效地跨任务进行输入的批量处理.针对不同的下游任务,现有框架在多卡分布式场景下也难以提供良好的负载均衡机制.因此,提出了PetS,一个用于多任务PET推理服务的可扩展框架.具体而言,不同的PET任务在算法上被抽象成一种统一表示形式.基于这种统一表示,设计了一个专门的PET推理引擎,以批处理不同任务的输入,并使用任务无关的共享算子和任务特定的PET算子进行推理.通过PET推理引擎,PetS在单个GPU设备上可以支持更多的任务数量.为了进一步提高系统吞吐量,提出了一种协同批处理(CB)策略,同时考虑了输入的长度、PET任务类型以及系统负载平衡.为了提升多卡部署的负载均衡,创新性地提出了基于PET实时迁移的负载均衡机制.PetS在包括边缘端、桌面端和服务器端GPU等多个平台上都经过了评估.全面的实验证明,PetS支持多达26倍的并发任务,并将服务吞吐量在桌面和服务器GPU节点上分别提高了1.53倍和1.63倍.在多GPU场景下,该负载均衡策略可以将吞吐量进一步提升29%之多. 展开更多
关键词 推理服务 参数高效Transformer GPU 分布式系统 机器学习系统
在线阅读 下载PDF
基于15位像素级模数转换器的640×512规格中波红外成像用48 mW数字读出电路 被引量:3
6
作者 于善哲 张雅聪 +6 位作者 牛育泽 周晔 卓毅 马丁 鲁文高 陈中建 李向阳 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2022年第4期785-791,共7页
提出了一种用于中波红外成像的基于15位像素级单斜率模数转换器的低功耗数字读出电路。像素级模数转换器采用一种新型功耗自适应的脉冲输出型比较器,只有当斜坡电压信号接近积分电压时,比较器才产生功耗。此外,比较器输出脉冲信号,降低... 提出了一种用于中波红外成像的基于15位像素级单斜率模数转换器的低功耗数字读出电路。像素级模数转换器采用一种新型功耗自适应的脉冲输出型比较器,只有当斜坡电压信号接近积分电压时,比较器才产生功耗。此外,比较器输出脉冲信号,降低了15位量化结果存储器上消耗的动态功耗。该存储器采用三管动态结构,仅占约54μm^(2)面积,以满足15μm像素中心距的面积约束。量化结果以电流模式读出到列级,避免相邻列总线间的电压串扰。基于0.18μm CMOS工艺,采用该结构,设计并制造了640×512规格的数字读出电路。测试结果表明,在120 Hz的帧频下,功耗仅为48 mW,总积分电容为740 fF,电荷处理能力为8.8 Me^(-)。在满阱状态,等效到积分电容的噪声电压为116μV,峰值信噪比为84 dB。 展开更多
关键词 红外焦平面阵列 数字读出电路 像素级单斜率模数转换器 功耗自适应比较器
在线阅读 下载PDF
基于改进自适应滤波的MEMS陀螺振动误差抑制研究 被引量:4
7
作者 陈杰 侯帅康 +1 位作者 刘玉县 何春华 《传感器与微系统》 CSCD 北大核心 2024年第4期61-63,67,共4页
本文提出一种基于改进自适应滤波的MEMS陀螺随机振动误差的补偿算法。该算法采用简化Sage-Husa自适应滤波算法估计量测噪声,并通过协方差匹配技术引入收敛性判据抑制了滤波的发散,它提高了实时性且减少了计算量。实验结果表明:经过改进... 本文提出一种基于改进自适应滤波的MEMS陀螺随机振动误差的补偿算法。该算法采用简化Sage-Husa自适应滤波算法估计量测噪声,并通过协方差匹配技术引入收敛性判据抑制了滤波的发散,它提高了实时性且减少了计算量。实验结果表明:经过改进算法滤波后,MEMS陀螺随机振动误差的方差减少97.76%,与常规卡尔曼滤波相比,改进算法的方差减少了72.66%,验证了改进的自适应卡尔曼滤波算法可以有效地抑制MEMS陀螺因随机振动引起的输出误差。 展开更多
关键词 MEMS陀螺 简化Sage-Husa自适应滤波 时间序列模型
在线阅读 下载PDF
基于超短脉冲激光刻蚀的双解耦MEMS陀螺仪调频技术研究 被引量:1
8
作者 刘玉县 侯帅康 +2 位作者 赵前程 崔健 张大成 《传感器与微系统》 CSCD 北大核心 2024年第7期39-42,共4页
以双解耦双质量硅微陀螺仪为主要研究对象,从微观结构入手,分析其工作原理和双解耦运动模型,并提出影响模态特征频率的因素。提出一种改变陀螺仪弹性梁结构厚度来调整其特征频率的方法,建立模型通过Comsol软件仿真陀螺仪梁厚度变化对特... 以双解耦双质量硅微陀螺仪为主要研究对象,从微观结构入手,分析其工作原理和双解耦运动模型,并提出影响模态特征频率的因素。提出一种改变陀螺仪弹性梁结构厚度来调整其特征频率的方法,建立模型通过Comsol软件仿真陀螺仪梁厚度变化对特征频率的影响关系,并选择皮秒激光刻蚀系统刻蚀陀螺弹性梁厚度,测试其两模态特征频率。测试结果表明:对应频率变化符合理论推导和仿真趋势。 展开更多
关键词 微机械陀螺 结构解耦 频率调节 短脉冲激光
在线阅读 下载PDF
压电检测陀螺薄膜材料分析及仿真研究 被引量:2
9
作者 张一飞 陈光伟 赵前程 《传感器与微系统》 CSCD 北大核心 2024年第6期11-14,共4页
理论分析了影响压电微机电系统(MEMS)陀螺检测电压输出幅值的因素,结合MEMS领域常用的氮化铝(AlN)、氧化锌(ZnO)和锆钛酸铅(PZT)这3种压电薄膜材料,设计了一种微梁构型的检测陀螺。利用有限元软件COMSOL进行了陀螺的模态、功能的仿真分... 理论分析了影响压电微机电系统(MEMS)陀螺检测电压输出幅值的因素,结合MEMS领域常用的氮化铝(AlN)、氧化锌(ZnO)和锆钛酸铅(PZT)这3种压电薄膜材料,设计了一种微梁构型的检测陀螺。利用有限元软件COMSOL进行了陀螺的模态、功能的仿真分析。仿真结果显示:使用AlN柔度系数的陀螺结构驱动与检测模态固有频率频差为22 Hz;陀螺结构可以敏感z轴角速度输入;ZnO、AlN和PZT陀螺电压灵敏度分别为2.23,2.16,0.79μV/((°)·s^(-1)),AlN和ZnO的电压灵敏度大于PZT,且AlN的工艺性好于ZnO;因此,AlN在3种压电材料中最适合用于压电检测MEMS陀螺。 展开更多
关键词 压电陀螺 薄膜材料 COMSOL仿真 电压灵敏度
在线阅读 下载PDF
窄线宽外腔半导体激光器研究进展 被引量:3
10
作者 秦晓敏 史田田 +2 位作者 王志洋 史航博 陈景标 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第2期63-78,共16页
窄线宽外腔半导体激光器具有结构简单、可调谐、噪声低等优势,广泛应用于量子精密测量、光通信、激光雷达等领域。根据外腔选频器件的不同,本文主要介绍光栅型激光器、干涉滤光型激光器、波导型激光器和法拉第激光器四类外腔半导体激光... 窄线宽外腔半导体激光器具有结构简单、可调谐、噪声低等优势,广泛应用于量子精密测量、光通信、激光雷达等领域。根据外腔选频器件的不同,本文主要介绍光栅型激光器、干涉滤光型激光器、波导型激光器和法拉第激光器四类外腔半导体激光器,分析各类激光器的基本结构与选频机制、介绍各自的优缺点以及国内外研究进展。其中,前三类激光器采用非量子器件进行频率选择,而法拉第激光器利用共振法拉第旋光效应选频,输出波长直接对应原子跃迁谱线,对激光二极管的电流与温度变化具有良好的鲁棒性。随后介绍外腔半导体激光器的应用情况,尤其是在精密测量领域中的典型应用。最后总结并展望窄线宽外腔半导体激光器的未来发展方向。 展开更多
关键词 外腔半导体激光器 法拉第激光器 窄线宽 精密测量 外腔选频器件。
在线阅读 下载PDF
适配PAICORE2.0的硬件编码转帧加速单元设计
11
作者 丁亚伟 曹健 +4 位作者 李琦彬 冯硕 杨辰涛 王源 张兴 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期786-798,共13页
为了解决北京大学脉冲神经网络芯片PAICORE2.0类脑终端系统中软件编码和转帧过程速度较慢的问题,提出一种硬件加速方法。通过增加硬件加速单元,将Xilinx ZYNQ的处理系统PS端串行执行的软件编码转帧过程转移到可编程逻辑PL端的数据通路... 为了解决北京大学脉冲神经网络芯片PAICORE2.0类脑终端系统中软件编码和转帧过程速度较慢的问题,提出一种硬件加速方法。通过增加硬件加速单元,将Xilinx ZYNQ的处理系统PS端串行执行的软件编码转帧过程转移到可编程逻辑PL端的数据通路中流水化并行执行。硬件加速单元主要包含高度并行的卷积单元、参数化的脉冲神经元和位宽平衡数据缓冲区等。实验结果表明,该方法在几乎不增加数据通路传输延迟的前提下,可以消除软件编码和转帧过程的时间开销。在CIFAR-10图像分类的例子中,与软件编码和转帧方法相比,硬件编码转帧模块仅增加9.3%的LUT、3.7%的BRAM、2.6%的FF、0.9%的LUTRAM、14.9%的DSP以及14.6%的功耗,却能够实现约8.72倍的推理速度提升。 展开更多
关键词 脉冲神经网络芯片 PAICORE2.0 ZYNQ 脉冲编码 硬件加速 卷积加速单元
在线阅读 下载PDF
压电微泵一体化自闭环微系统热管理技术研究 被引量:2
12
作者 余怀强 杜建宇 +4 位作者 刘雨陇 陈星 邓立科 张磊 王玮 《压电与声光》 CAS 北大核心 2021年第5期676-679,共4页
近年来,以嵌入式微流体液冷散热技术为代表的主动热管理因其优异的散热性能而被广泛研究。然而,嵌入式微流体液冷散热技术常使用体积较大的外置泵、阀等构成流体回路,以致该技术难以应用于现有的射频微系统。该文提出了一种集成压电微... 近年来,以嵌入式微流体液冷散热技术为代表的主动热管理因其优异的散热性能而被广泛研究。然而,嵌入式微流体液冷散热技术常使用体积较大的外置泵、阀等构成流体回路,以致该技术难以应用于现有的射频微系统。该文提出了一种集成压电微泵阵列的一体化自闭环微系统热管理方法,并完成了该微系统样机的设计与研制。在常温、高温与低温环境下分别对该微系统样机供液流量及散热性能进行了测试。常温测试结果表明,在芯片热流密度为250.9 W/cm^(2)时,芯片表面温升能控制在56℃以下,而集成的2×2压电微泵阵列实现了高达57 mL/min的供液流量。该技术可用于解决高功率射频微系统的高效一体化热管理问题。 展开更多
关键词 热管理 微系统 压电微泵 热流密度 内嵌微通道
在线阅读 下载PDF
脉冲神经网络权重量化方法与对抗鲁棒性分析
13
作者 李莹 李艳杰 +2 位作者 崔小欣 倪庆龙 周崟灏 《电子与信息学报》 EI CSCD 北大核心 2023年第9期3218-3227,共10页
类脑芯片中的脉冲神经网络(SNNs)具有高稀疏性和低功耗的特点,在视觉分类任务中存在应用优势,但仍面临对抗攻击的威胁。现有研究缺乏对网络部署到硬件的量化过程中鲁棒性损失的度量方法。该文研究硬件映射阶段的SNN权重量化方法及其对... 类脑芯片中的脉冲神经网络(SNNs)具有高稀疏性和低功耗的特点,在视觉分类任务中存在应用优势,但仍面临对抗攻击的威胁。现有研究缺乏对网络部署到硬件的量化过程中鲁棒性损失的度量方法。该文研究硬件映射阶段的SNN权重量化方法及其对抗鲁棒性。建立基于反向传播和替代梯度的监督训练算法,并在CIFAR-10数据集上生成快速梯度符号法(FGSM)对抗攻击样本。创新性地提出一种感知量化的权重量化方法,并建立与对抗攻击的训练与推理相融合的评估框架。实验结果表明,在VGG9网络下,直接编码对抗鲁棒性最差。在权重量化前后,4种编码和4种结构参数组合方式下,推理精度损失差与层间脉冲活动的平均变化幅度分别增大73.23%和51.5%。该文指出稀疏性因素对鲁棒性的影响相关度为:阈值增加大于权重量化bit降低大于稀疏编码,所提对抗鲁棒性分析框架与权重量化方法在PIcore类脑芯片中得到了硬件验证。 展开更多
关键词 脉冲神经网络 权重量化 对抗鲁棒性 稀疏性 对抗攻击
在线阅读 下载PDF
基于ARM+FPGA异构平台的目标检测加速模块设计与实现 被引量:4
14
作者 李放 曹健 +4 位作者 李普 谢豪 赵雄波 王源 张兴 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第6期1035-1041,共7页
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速... 为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度。实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性。 展开更多
关键词 深度学习 目标检测 模型剪枝量化 异构平台 边缘计算
在线阅读 下载PDF
金刚石薄膜场发射特性研究现状 被引量:2
15
作者 王旸 张锦文 《功能材料》 CAS CSCD 北大核心 2023年第9期9007-9016,共10页
金刚石薄膜具有负电子亲合能、高热导率和极强的化学惰性等优势,作为场发射材料引起了广泛关注。回顾了金刚石薄膜的分类,介绍了氢化金刚石薄膜具有的负电子亲合能特性,分析了金刚石薄膜场发射特性的影响因素,列举了场发射特性的优化方... 金刚石薄膜具有负电子亲合能、高热导率和极强的化学惰性等优势,作为场发射材料引起了广泛关注。回顾了金刚石薄膜的分类,介绍了氢化金刚石薄膜具有的负电子亲合能特性,分析了金刚石薄膜场发射特性的影响因素,列举了场发射特性的优化方向,并总结了文献中报道的金刚石薄膜与其他材料复合获得的场发射阴极的性能,对于分析和改进金刚石薄膜器件场发射性能具有重要意义。 展开更多
关键词 金刚石薄膜 场电子发射 负电子亲合能
在线阅读 下载PDF
基于机器学习的FPGA电子设计自动化技术研究综述 被引量:6
16
作者 田春生 陈雷 +4 位作者 王源 王硕 周婧 庞永江 杜忠 《电子与信息学报》 EI CSCD 北大核心 2023年第1期1-13,共13页
随着后摩尔时代的来临,现场可编程门阵列(FPGA)凭借其灵活的重复可编程特性、开发成本低的特点,现已被广泛应用于物联网(IoTs)、5G通信、航空航天以及武器装备等各个领域。作为FPGA设计开发过程中所必备的手段,FPGA电子设计自动化(EDA)... 随着后摩尔时代的来临,现场可编程门阵列(FPGA)凭借其灵活的重复可编程特性、开发成本低的特点,现已被广泛应用于物联网(IoTs)、5G通信、航空航天以及武器装备等各个领域。作为FPGA设计开发过程中所必备的手段,FPGA电子设计自动化(EDA)技术的研究在各界得到了广泛的关注。尤其是在机器学习方法的推动下,FPGA EDA工具的运行效率和结果质量(QoR)得到了很大的提升。该文首先对FPGA EDA技术与机器学习技术的概念内涵进行了简要概述,随后综述了机器学习技术在FPGA EDA高层次综合(HLS)、逻辑综合、布局与布线等各个不同阶段应用的研究现状。最后,对基于机器学习的FPGA EDA技术的发展进行了展望。以期为本领域及相关领域的专家和学者提供参考,为后摩尔时代我国集成电路产业的发展提供技术支持。 展开更多
关键词 集成电路 现场可编程门阵列 机器学习 电子设计自动化
在线阅读 下载PDF
基于图神经网络的电子设计自动化技术研究进展 被引量:6
17
作者 田春生 陈雷 +5 位作者 王源 王硕 周婧 王卓立 庞永江 杜忠 《电子与信息学报》 EI CSCD 北大核心 2023年第9期3069-3082,共14页
在摩尔定律的推动下,工艺节点在不断演进,集成电路设计复杂度也在不断增加,电子设计自动化(EDA)技术面临着来自运行时间与计算资源等诸多方面的挑战。为了缓解这些挑战,机器学习方法已被纳入EDA工具的设计流程中。与此同时,鉴于电路网... 在摩尔定律的推动下,工艺节点在不断演进,集成电路设计复杂度也在不断增加,电子设计自动化(EDA)技术面临着来自运行时间与计算资源等诸多方面的挑战。为了缓解这些挑战,机器学习方法已被纳入EDA工具的设计流程中。与此同时,鉴于电路网表作为图形数据的本质,图神经网络(GNN)在EDA流程中的应用正变得越来越普遍,为复杂问题的建模以及最优问题的求解带来了新思路。该文首先对GNN与EDA技术的概念内涵进行了简要的概述,详细地梳理了GNN在高层次综合(HLS)、逻辑综合、布图规划与布局、布线、反向工程、硬件木马检测以及测试点插入等不同EDA设计流程中的主要作用,以及当前基于GNN的EDA技术的一些重要探索。以希望为集成电路设计自动化以及相关领域的研究人员提供参考,为我国先进集成电路产业的发展提供技术支持。 展开更多
关键词 电子设计自动化 图神经网络 先进集成电路技术 敏捷设计
在线阅读 下载PDF
基于自适应剪枝率与高效权重继承的神经网络通道剪枝方法 被引量:1
18
作者 刘相呈 曹健 +3 位作者 姚宏毅 徐鹏涛 张袁 王源 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期764-772,共9页
目前的通道级剪枝方法往往需要复杂的搜索和微调过程,并且容易陷入局部最优解,针对此问题,提出一种新颖的通道剪枝框架(AdaPruner),只需通过一次稀疏训练,就可以针对各种预算复杂度,自适应地生成相应的子网络,并高效地选择适合当前结构... 目前的通道级剪枝方法往往需要复杂的搜索和微调过程,并且容易陷入局部最优解,针对此问题,提出一种新颖的通道剪枝框架(AdaPruner),只需通过一次稀疏训练,就可以针对各种预算复杂度,自适应地生成相应的子网络,并高效地选择适合当前结构的初始化权重。在图像分类任务的多个数据集上实验结果表明,该方法在常用的残差网络和轻量级网络上的性能都优于以往剪枝方法。 展开更多
关键词 卷积神经网络 通道剪枝 稀疏化训练 神经网络结构搜索 图像分类
在线阅读 下载PDF
OpenPARF:基于深度学习工具包的大规模异构FPGA开源布局布线框架 被引量:1
19
作者 麦景 王嘉睿 +1 位作者 邸志雄 林亦波 《电子与信息学报》 EI CSCD 北大核心 2023年第9期3118-3131,共14页
该文提出一个面向大规模可编辑逻辑门阵列(FPGA)的开源布局布线框架OpenPARF。该框架基于深度学习工具包PyTorch实现,支持GPU大规模并行计算求解。在布局算法方面,该文设计了一种新型非对称多静电场系统,对FPGA布局问题进行建模。在布... 该文提出一个面向大规模可编辑逻辑门阵列(FPGA)的开源布局布线框架OpenPARF。该框架基于深度学习工具包PyTorch实现,支持GPU大规模并行计算求解。在布局算法方面,该文设计了一种新型非对称多静电场系统,对FPGA布局问题进行建模。在布线算法方面,该文支持对FPGA可编程逻辑块(CLB)内部布线资源进行准确建模,并在大规模不规则布线资源图上进行布线,提高了异构FPGA芯片布线器的性能和效率。该文在ISPD 2016和2017 FPGA竞赛数据集和工业标准级FPGA数据集上进行了实验,结果表明该框架可减少0.4%~12.7%的布线线长,并实现两倍以上布局效率提升。 展开更多
关键词 集成电路设计与设计自动化 物理实现 FPGA 布局布线 机器学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部