检索结果-维普期刊中文期刊服务平台

高性能自研处理器物理设计频率提升方法被引量：1: 1; 作者何小威乐大珩 +2 位作者郭维隋兵才邓全《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1429-1435,共7页; 提升处理器核的频率是提升处理器性能的重要手段.传统的物理设计流程难以实现高主频的处理器核.基于业界主流的布局布线工具,通过嵌入手工定制部件的网表、逻辑和物理设计协同优化、优化定制布线规则、优化物理设计方法学等组合策略.在... 展开更多; 关键词布局布线协同优化物理设计签核频率; 在线阅读下载PDF 职称材料

一种可重构的单精度近似浮点乘法器设计: 2; 作者李鹏程黄立波 +5 位作者陈刚赖明澈邓林刘威杨乾明王永文《计算机研究与发展》北大核心 2025年第6期1581-1593,共13页; 人工智能(AI)和物联网(IoT)技术的迅速发展,对计算能效提出了更高的要求,终端设备在硬件资源开销方面同样面临巨大挑战.为了应对能效问题,新型低功耗近似计算单元的设计得到了广泛研究.在数字信号处理和图像处理等应用场景中,存在大量... 展开更多; 关键词近似浮点乘法器 MTA 非对称截断精度开销; 在线阅读下载PDF 职称材料

FireLink:一种面向芯粒设计空间探索的评估框架: 3; 作者李开曾坤 +3 位作者荣培涛陈志强张甜王永文《计算机研究与发展》北大核心 2025年第5期1108-1122,共15页; 基于先进封装技术的芯粒(Chiplet)集成芯片在制造成本、设计效率以及专用定制等方面更具优势,是延续芯片性能增长的有效途径.设计空间探索(design space exploration,DSE)作为体系结构量化分析的重要方法,能够帮助设计者理解并权衡设计... 展开更多; 关键词芯粒设计空间探索模拟评估微架构; 在线阅读下载PDF 职称材料

混洗SRAM:SRAM中的并行按位数据混洗: 4; 作者张敦博曾灵灵 +2 位作者王若曦王耀华沈立《计算机研究与发展》北大核心 2025年第1期75-89,共15页; 向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来... 展开更多; 关键词向量单指令多数据体系结构静态随机访问存储器混洗操作向量内存存内计算; 在线阅读下载PDF 职称材料

面向低磨损存内计算的多状态逻辑门综合: 5; 作者赵安宁许诺 +4 位作者刘康罗莉潘炳征薄子怡谭承浩《计算机研究与发展》北大核心 2025年第3期620-632,共13页; 通过融合布尔逻辑和非易失存储的功能,忆阻状态逻辑电路可以消除计算过程中的数据移动,实现在存储器中计算,打破传统冯·诺依曼计算系统的“存储墙”和“能耗墙”.近年来,通过构建条件转变到数学逻辑关系之间的映射,已经有一系列存... 展开更多; 关键词忆阻器状态逻辑翻转率逻辑综合与映射低磨损; 在线阅读下载PDF 职称材料

题名高性能自研处理器物理设计频率提升方法被引量：1: 1; 作者何小威乐大珩郭维隋兵才邓全; 机构国防科技大学计算机学院先进微处理器芯片与系统重点实验室(国防科技大学); 出处《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1429-1435,共7页; 基金国防科技大学科研计划项目(ZK22-05) 全军共用信息系统装备预研专用技术项目(31513010105)。; 文摘提升处理器核的频率是提升处理器性能的重要手段.传统的物理设计流程难以实现高主频的处理器核.基于业界主流的布局布线工具,通过嵌入手工定制部件的网表、逻辑和物理设计协同优化、优化定制布线规则、优化物理设计方法学等组合策略.在相同工艺、面积、功耗对等条件下,达到流片签核要求时,自研处理器核物理设计频率比原始设计可提升约30%.; 关键词布局布线协同优化物理设计签核频率; Keywords place and route co-optimization physical design signoff frequency; 分类号 TN47 [电子电信—微电子学与固体电子学]; 在线阅读下载PDF 职称材料

题名一种可重构的单精度近似浮点乘法器设计: 2; 作者李鹏程黄立波陈刚赖明澈邓林刘威杨乾明王永文; 机构国防科技大学计算机学院先进微处理器芯片与系统重点实验室(国防科技大学) 中山大学计算机学院; 出处《计算机研究与发展》北大核心 2025年第6期1581-1593,共13页; 基金国家自然科学基金项目(62102433,62272475) 湖南省自然科学基金项目(2022JJ10064)。; 文摘人工智能(AI)和物联网(IoT)技术的迅速发展,对计算能效提出了更高的要求,终端设备在硬件资源开销方面同样面临巨大挑战.为了应对能效问题,新型低功耗近似计算单元的设计得到了广泛研究.在数字信号处理和图像处理等应用场景中,存在大量的浮点运算.这些应用消耗了大量的硬件资源,但它们具有一定的容错性,没有必要进行完全精确的计算.据此,提出了一种基于移位近似算法MTA(multiplication to shift addition)和非对称截断的单精度可重构近似浮点乘法器设计方法.首先,采用了一种低功耗的近似算法MTA,将部分操作数的乘法运算转换为移位加法.其次,为了在精度和成本之间取得平衡,设计了针对操作数高有效位的非对称截断处理,并对截断后保留的部分进行精确计算.通过采用不同位宽的MTA近似计算和改变截断后部分积阵列的行数,生成了广阔的设计空间,从而可以在精度和成本之间进行多种权衡调整.与精确浮点乘法器相比,所提出设计MTA5T5的精度损失(MRED)仅约为0.32%,功耗降低了85.80%,面积减少了79.53%.对于精度较低的MTA3T3,其精度损失约为1.92%,而功耗和面积分别降低了90.55%和85.80%.最后,进行了FIR滤波和图像处理的应用测试,结果表明所提出的设计在精度和开销方面具有显著优势.; 关键词近似浮点乘法器 MTA 非对称截断精度开销; Keywords approximate floating-point multiplier MTA asymmetric truncation accuracy cost; 分类号 TP331 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名FireLink:一种面向芯粒设计空间探索的评估框架: 3; 作者李开曾坤荣培涛陈志强张甜王永文; 机构国防科技大学计算机学院先进微处理器芯片与系统重点实验室(国防科技大学); 出处《计算机研究与发展》北大核心 2025年第5期1108-1122,共15页; 基金高层次科技创新人才工程人选自主科研项目(22-TDRCJH-02-006) 国家自然科学基金青年科学基金项目(NSFC-62202481) 国防科技大学科研计划项目(ZK22-05)。; 文摘基于先进封装技术的芯粒(Chiplet)集成芯片在制造成本、设计效率以及专用定制等方面更具优势,是延续芯片性能增长的有效途径.设计空间探索(design space exploration,DSE)作为体系结构量化分析的重要方法,能够帮助设计者理解并权衡设计参数间的复杂关系.但是将传统的芯片体系结构DSE方法直接应用于Chiplet设计时,存在评估不全面、模拟不精确以及探索效率低下等问题,针对这些问题提出了解决方案FireLink,作为一个面向Chiplet设计空间探索的评估框架,它支持Chiplet微架构以及互连网络的建模和模拟,具备高效评估性能、功耗、面积和成本指标的能力.此外,在该框架下采用了ID3(iterative dichotomiser 3)机器学习算法进行了实验,结果显示该框架能够有效提高DSE的效率.与现有的DSE框架和方法相比,FireLink在评估全面性、建模完整性和高效性方面具有显著优势,使得设计者能够在更短时间内探索更广泛的设计空间,进而选定较优的Chiplet设计方案.; 关键词芯粒设计空间探索模拟评估微架构; Keywords Chiplet design space exploration simulation evaluation microarchitecture; 分类号 TP391.9 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名混洗SRAM:SRAM中的并行按位数据混洗: 4; 作者张敦博曾灵灵王若曦王耀华沈立; 机构国防科技大学计算机学院先进微处理器芯片与系统重点实验室(国防科技大学); 出处《计算机研究与发展》北大核心 2025年第1期75-89,共15页; 基金国家自然科学基金项目(61972407)。; 文摘向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来处理混洗指令将带来昂贵的数据移动开销,并且数据混洗单元只能串行混洗数据.事实上,混洗操作只会改变数据的布局,理想情况下混洗操作应在内存中完成.随着存内计算技术的发展,SRAM不仅可以作为存储部件,同时还能作为计算单元.为了实现存内混洗,提出了混洗SRAM,它可以在SRAM体中逐位地并行混洗多个向量.混洗SRAM的关键思想是利用SRAM体中位线的数据移动能力来改变数据的布局.这样SRAM体中位于同一位线上不同数据的相同位可以同时被移动,从而使混洗操作拥有高度的并行性.通过适当的数据布局和向量混洗扩展指令的支持,混洗SRAM可以高效地处理常用的混洗操作.评测结果表明,对于常用的混洗操作,混洗SRAM可以实现平均28倍的性能增益,对于FFT,AlexNet,VggNet等实际的应用,可以实现平均3.18倍的性能增益.混洗SRAM相较于传统SRAM的面积开销仅增加了4.4%.; 关键词向量单指令多数据体系结构静态随机访问存储器混洗操作向量内存存内计算; Keywords vector SIMD architecture SRAM shuffle operations vector memory processing in memory; 分类号 TP333 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名面向低磨损存内计算的多状态逻辑门综合: 5; 作者赵安宁许诺刘康罗莉潘炳征薄子怡谭承浩; 机构国防科技大学计算机学院先进微处理器芯片与系统重点实验室(国防科技大学); 出处《计算机研究与发展》北大核心 2025年第3期620-632,共13页; 基金国家自然科学基金项目(62202483) 湖南省自然科学基金项目(2022JJ40563) +1 种基金 PDL开放基金项目(WDZC20235250112)。; 文摘通过融合布尔逻辑和非易失存储的功能,忆阻状态逻辑电路可以消除计算过程中的数据移动,实现在存储器中计算,打破传统冯·诺依曼计算系统的“存储墙”和“能耗墙”.近年来,通过构建条件转变到数学逻辑关系之间的映射,已经有一系列存内状态逻辑门被提出,功能覆盖IMP,NAND,NOR,NIMP等多个逻辑运算.然而,复杂计算过程到存内状态逻辑实现的自动化综合映射方法仍处于萌芽阶段,特别是缺少针对器件磨损的探讨,限制了设备维修不便的边缘计算场景应用.为降低复杂存内状态逻辑计算过程的磨损(翻转率),实现了一种面向低磨损存内计算的多状态逻辑门综合映射过程.与领域内熟知的SIMPLER MAGIC状态逻辑综合流程相比,该综合映射流程在复杂计算过程的翻转率上实现了对EPFL,LGSynth91的典型基准测试电路分别平均35.55%,47.26%以上的改进;与最新提出的LOSSS状态逻辑综合流程相比,在复杂计算过程的翻转率上实现了对EPFL,LGSynth91的典型基准测试电路分别平均8.48%,6.72%以上的改进.; 关键词忆阻器状态逻辑翻转率逻辑综合与映射低磨损; Keywords memristor stateful logic toggle rate logic synthesis and mapping low wear; 分类号 TP333 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	高性能自研处理器物理设计频率提升方法	何小威乐大珩郭维隋兵才邓全	《计算机研究与发展》 EI CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料
2	一种可重构的单精度近似浮点乘法器设计	李鹏程黄立波陈刚赖明澈邓林刘威杨乾明王永文	《计算机研究与发展》北大核心	2025	0	在线阅读下载PDF 职称材料
3	FireLink:一种面向芯粒设计空间探索的评估框架	李开曾坤荣培涛陈志强张甜王永文	《计算机研究与发展》北大核心	2025	0	在线阅读下载PDF 职称材料
4	混洗SRAM:SRAM中的并行按位数据混洗	张敦博曾灵灵王若曦王耀华沈立	《计算机研究与发展》北大核心	2025	0	在线阅读下载PDF 职称材料
5	面向低磨损存内计算的多状态逻辑门综合	赵安宁许诺刘康罗莉潘炳征薄子怡谭承浩	《计算机研究与发展》北大核心	2025	0	在线阅读下载PDF 职称材料