期刊文献+
共找到255篇文章
< 1 2 13 >
每页显示 20 50 100
NoC加速器中的高效DNN动态切片与智能映射算法
1
作者 齐芸 欧阳一鸣 《电信科学》 北大核心 2025年第10期151-160,共10页
针对深度神经网络(deep neural network,DNN)模型在传统切片与映射方法中存在的资源调度和数据传输瓶颈问题,提出了一种基于片上网络(network on chip,NoC)加速器的高效DNN动态切片与智能映射优化算法。该算法通过动态切片技术灵活划分... 针对深度神经网络(deep neural network,DNN)模型在传统切片与映射方法中存在的资源调度和数据传输瓶颈问题,提出了一种基于片上网络(network on chip,NoC)加速器的高效DNN动态切片与智能映射优化算法。该算法通过动态切片技术灵活划分DNN模型的计算任务,并结合智能映射策略优化NoC架构中的任务分配与数据流管理。实验结果表明,与传统方法相比,该算法在计算吞吐量、NoC传输时延、外部内存访问次数和计算能效等方面均显著提升,尤其在复杂模型上表现突出。 展开更多
关键词 noc加速器 DNN切片 智能映射
在线阅读 下载PDF
用于MIMO检测的基于NoC的多核动态可重构架构
2
作者 范文杰 周牧也 +8 位作者 朱凌晓 李世平 陈铠 邓松峰 何国强 冯书谊 宋文清 李丽 傅玉祥 《现代电子技术》 北大核心 2024年第21期1-6,共6页
随着无线通信技术的发展,实现多输入多输出(MIMO)系统检测性能与复杂度之间的最优权衡日益困难,深度学习DL为此提供了新方向。文中提出基于片上网络(NoC)的多核动态可重构架构MCDBP,以提高基于DL的MIMO检测算法的性能,并增强架构的可编... 随着无线通信技术的发展,实现多输入多输出(MIMO)系统检测性能与复杂度之间的最优权衡日益困难,深度学习DL为此提供了新方向。文中提出基于片上网络(NoC)的多核动态可重构架构MCDBP,以提高基于DL的MIMO检测算法的性能,并增强架构的可编程性和扩展性。MCDBP通过集成轻量级计算内核及片上网络互连,并行处理矢量-矩阵乘法、常数-矢量乘法、矢量点积、矢量加法等大多数深度展开网络的基本运算,有效提高复杂MIMO检测性能。架构的创新在于可重构的处理元件PE设计,可以依据DL驱动的MIMO检测需求动态调整。该设计对基于DL的MIMO检测算法共性进行深入分析,支持多种基本运算模式,展现极高灵活性。实验结果显示,MCDBP在执行基于DL的MIMO检测算法时,与通用CPU相比,可以实现12.66~22.98的加速比,算法性能有所提高,可以适应不同应用场景。 展开更多
关键词 无线通信 MIMO检测 深度学习 数据驱动网络 模型驱动网络 noc 可重构 多核架构
在线阅读 下载PDF
基于流水线计算的3D NoC测试规划研究
3
作者 胡聪 白杨 +2 位作者 周甜 朱爱军 许川佩 《计算机应用与软件》 北大核心 2024年第5期240-246,303,共8页
为了提高三维片上网络(3D NoC)资源内核的测试效率,提出一种在功耗约束条件下多播流水线并行测试同构核与单播测试异构核相结合的方法对IP核进行测试。为了减少测试数据因资源冲突而进行等待的时间,设计一种改进XYZ路由算法,并采用改进... 为了提高三维片上网络(3D NoC)资源内核的测试效率,提出一种在功耗约束条件下多播流水线并行测试同构核与单播测试异构核相结合的方法对IP核进行测试。为了减少测试数据因资源冲突而进行等待的时间,设计一种改进XYZ路由算法,并采用改进人工蜂群(ABC)算法求解最佳测试规划方案。以国际标准电路测试集ITC'02作为实验对象,结果表明,测试时间最大优化率达到15.45%,与其他测试规划方法相比该文方法能有效地提高并行测试效率。 展开更多
关键词 三维片上网络 流水线计算 多播通信 测试规划 人工蜂群算法
在线阅读 下载PDF
基于蚁群优化算法的NoC映射 被引量:14
4
作者 周干民 尹勇生 +1 位作者 胡永华 高明伦 《计算机工程与应用》 CSCD 北大核心 2005年第18期7-10,150,共5页
功耗问题正逐渐成为NoC领域的研究热点,很多研究人员都在研究NoC功耗最小化的设计技术。文章采用一种有效的蚁群优化算法实现了NoC映射:在自动映射处理单元的同时,尽可能地减少了系统的通讯功耗。实验结果表明采用蚁群优化算法可以很快... 功耗问题正逐渐成为NoC领域的研究热点,很多研究人员都在研究NoC功耗最小化的设计技术。文章采用一种有效的蚁群优化算法实现了NoC映射:在自动映射处理单元的同时,尽可能地减少了系统的通讯功耗。实验结果表明采用蚁群优化算法可以很快地收敛;针对不同的应用,可以减少25%70%的通讯功耗。 展开更多
关键词 蚁群优化算法 noc映射 通讯功耗
在线阅读 下载PDF
基于故障节点再利用的细粒度NoC容错路由算法 被引量:5
5
作者 陈庆强 罗兴国 +1 位作者 张帆 刘亮亮 《计算机应用研究》 CSCD 北大核心 2012年第7期2586-2588,2617,共4页
针对传统NoC容错算法中容错粒度过粗造成资源浪费的问题,提出了一种细粒度的自适应容错路由算法,对带有部分故障的节点重新利用。算法将各种故障映射为一种功能故障模型,结合新提出的路由端口优先级策略和嵌入的奇偶转向模型,实现数据... 针对传统NoC容错算法中容错粒度过粗造成资源浪费的问题,提出了一种细粒度的自适应容错路由算法,对带有部分故障的节点重新利用。算法将各种故障映射为一种功能故障模型,结合新提出的路由端口优先级策略和嵌入的奇偶转向模型,实现数据包的无死锁容错路由。实验表明,随着负载和故障数目的增加,该算法具有更优越的容错性能,证明了算法的有效性。 展开更多
关键词 片上网络(noc) 容错 故障模型 优先级 细粒度 奇偶转向模型
在线阅读 下载PDF
基于动态优先级的3D NoC偏转路由容错方法 被引量:3
6
作者 欧阳一鸣 欧阳小叶 +2 位作者 梁华国 黄正峰 刘军 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第3期486-492,共7页
若3DNoC中水平和垂直方向出现不可恢复的链路故障,将严重影响整个网络的性能.为此提出一种新型的高效率、低开销的容错方法——基于动态优先级的偏转路由方法.该方法根据目的节点和当前节点的相对位置,动态地设定输出端口优先级,以确保... 若3DNoC中水平和垂直方向出现不可恢复的链路故障,将严重影响整个网络的性能.为此提出一种新型的高效率、低开销的容错方法——基于动态优先级的偏转路由方法.该方法根据目的节点和当前节点的相对位置,动态地设定输出端口优先级,以确保数据包始终选择最优路径传输;为了提高层内和层间数据包传输的速度,采用了两级交叉开关结构.使用Booksim 2.0和Orion 2.0工具与其他方法的实验结果表明,文中方法的网络平均包延时最大降幅达20%,且面积不随网络规模增大而增加,提高了片上网络整体性能. 展开更多
关键词 3D noc 永久故障 容错 偏转路由
在线阅读 下载PDF
3D NoC的冗余双向TSV容错设计 被引量:5
7
作者 欧阳一鸣 袁吴铃 +2 位作者 梁华国 谢涛 黄正峰 《电子测量与仪器学报》 CSCD 2013年第4期326-333,共8页
3D NoC(Network-on-Chip)中,若连接层间相邻路由器的两组单向TSV(Through-Silicon Via)中有1组故障,数据便不能经该通道传输。为实现容错,提出一种在基于簇的3D NoC中添加冗余双向TSV的设计。任何1组单向TSV故障,都可通过配置这组双向TS... 3D NoC(Network-on-Chip)中,若连接层间相邻路由器的两组单向TSV(Through-Silicon Via)中有1组故障,数据便不能经该通道传输。为实现容错,提出一种在基于簇的3D NoC中添加冗余双向TSV的设计。任何1组单向TSV故障,都可通过配置这组双向TSV来替换,实现容错。在无故障TSV时,也可配置这组双向TSV来帮助传输数据包,实现数据的高速传输。与参考文献相比,实验表明,有TSV故障时该设计的平均延时至少减少了43.8%,且提高了系统可靠性。 展开更多
关键词 3D noc 容错 冗余 双向TSV
在线阅读 下载PDF
基于多FPGA的NoC多核处理器验证平台设计 被引量:3
8
作者 黄晓林 潘红兵 +5 位作者 易伟 杨虎 凌梦 黄辰 何书专 李丽 《计算机工程与设计》 CSCD 北大核心 2012年第1期180-185,共6页
为了能够灵活地验证和实现自主设计的基于NoC的多核处理器,缩短NoC多核处理器的设计周期,提出了设计集成4片Virtex-6-550TFPGA的NoC多核处理器原型芯片设计/验证平台。分析和评估了NoC多核处理器的规模以及对FPGA硬件资源的需求,在此基... 为了能够灵活地验证和实现自主设计的基于NoC的多核处理器,缩短NoC多核处理器的设计周期,提出了设计集成4片Virtex-6-550TFPGA的NoC多核处理器原型芯片设计/验证平台。分析和评估了NoC多核处理器的规模以及对FPGA硬件资源的需求,在此基础上给出了集成4片FPGA的开发板详细设计方案,并对各主要模块如互联架构、电源、板级时钟分布、接口技术、存储资源等关键设计要点进行阐述。描述了开发板各个主要模块的测试过程和结果,表明了该设计的可行性。 展开更多
关键词 多FPGA片上网络(noc) 多核处理器 高吞吐率 并行计算
在线阅读 下载PDF
片上通信结构——共享总线和NoC的分析与比较 被引量:5
9
作者 周文彪 张岩 毛志刚 《计算机工程与应用》 CSCD 北大核心 2007年第15期121-124,共4页
采用模块化方法对集中式仲裁共享总线和二维网格片上网络(Network on Chip,NoC)的硬件开销和延迟进行了数学上的分析。在此基础上,通过可综合Verilog代码对这两种片上通信结构在RTL级进行描述,并建立了这两种通信方式的周期准确级的功... 采用模块化方法对集中式仲裁共享总线和二维网格片上网络(Network on Chip,NoC)的硬件开销和延迟进行了数学上的分析。在此基础上,通过可综合Verilog代码对这两种片上通信结构在RTL级进行描述,并建立了这两种通信方式的周期准确级的功能验证和性能分析环境。结果表明,在同样工艺条件下,共享总线的面积与NoC相比相当小;但对于大规模片上系统通信,NoC的吞吐效率及带宽明显优于共享总线。 展开更多
关键词 共享总线 noc 路由 片上通信
在线阅读 下载PDF
二维网格NoC中资源-网络接口设计与实现 被引量:3
10
作者 侯宁 高明伦 +3 位作者 杜高明 张多利 耿罗锋 汤益华 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第8期1155-1158,共4页
通常把使用片上网络通讯的多核SoC称为NoC,各类资源(处理器、存储器等)与片上网络之间的接口称为资源-网络接口。文章基于二维网格的通讯方式,设计了其间的资源-网络接口,讨论了基于FPGA的实现技术。使用具体应用实例——轨迹显示方案,... 通常把使用片上网络通讯的多核SoC称为NoC,各类资源(处理器、存储器等)与片上网络之间的接口称为资源-网络接口。文章基于二维网格的通讯方式,设计了其间的资源-网络接口,讨论了基于FPGA的实现技术。使用具体应用实例——轨迹显示方案,对设计进行验证。实验表明,在60 MHz的频率下,使用该接口的NoC系统原型能够稳定工作。 展开更多
关键词 二维网格noc 资源-网络接口 多核技术
在线阅读 下载PDF
NoC低功耗技术研究综述 被引量:3
11
作者 沈剑良 严明 +1 位作者 李思昆 侯一凡 《计算机工程与科学》 CSCD 北大核心 2009年第A01期88-92,共5页
当前在高性能SoC设计中,功耗约束已成为NoC设计所面临的重要问题。本文着重阐述了NoC低功耗优化技术的相关内容,在分析现有NoC模拟器和功耗模型的基础上,从物理逻辑设计、软件编译优化、网络拓扑结构低功耗映射等方面评述了当前NoC低功... 当前在高性能SoC设计中,功耗约束已成为NoC设计所面临的重要问题。本文着重阐述了NoC低功耗优化技术的相关内容,在分析现有NoC模拟器和功耗模型的基础上,从物理逻辑设计、软件编译优化、网络拓扑结构低功耗映射等方面评述了当前NoC低功耗关键技术。最后,对未来NoC低功耗技术研究的方向做出了预测。 展开更多
关键词 noc 低功耗 模拟器 功耗模型
在线阅读 下载PDF
PSO基础的链路平衡NoC映射与路由 被引量:3
12
作者 周文彪 张岩 毛志刚 《系统工程与电子技术》 EI CSCD 北大核心 2008年第12期2506-2511,共6页
针对NoC设计流程中IP核映射和路由分配两个关键步骤,提出了一种基于PSO低功耗IP核映射和链路平衡的路由分配算法PLBMR。PLBMR是一个两步PSO优化算法,在建立NoC的通信功耗和链路负载的数学表示的基础上,采用一种有效IP核映射与路由分配的... 针对NoC设计流程中IP核映射和路由分配两个关键步骤,提出了一种基于PSO低功耗IP核映射和链路平衡的路由分配算法PLBMR。PLBMR是一个两步PSO优化算法,在建立NoC的通信功耗和链路负载的数学表示的基础上,采用一种有效IP核映射与路由分配的PSO粒子编码方法,使得NoC的通信能量消耗最小以及保证NoC的通信链路负载平衡。仿真结果表明,采用PLBMR算法产生的NoC通信能量消耗平均比GA和BnB分别少了0.7%和0.6%,特别是,PLBMR算法在计算时间上都优于GA和BnB;对于链路负载的平衡能力,PLBMR平均分别比MOCA小了9%,比BnB小了7%。 展开更多
关键词 noc 映射 路由 低功耗 链路负载平衡
在线阅读 下载PDF
基于混合优化映射算法的NoC自动生成方法研究 被引量:3
13
作者 李君艺 刘怡俊 乐建亮 《系统仿真学报》 CAS CSCD 北大核心 2017年第5期1141-1146,共6页
针对片上网络映射算法中,粒子群优化算法对于离散的优化问题处理不佳,容易陷入局部最优问题,提出了一种基于粒子群优化(particle swarm optimization,PSO)算法和遗传算法(genetic algorithm,GA)的混合优化映射算法(PSO_GA)。选择两个种... 针对片上网络映射算法中,粒子群优化算法对于离散的优化问题处理不佳,容易陷入局部最优问题,提出了一种基于粒子群优化(particle swarm optimization,PSO)算法和遗传算法(genetic algorithm,GA)的混合优化映射算法(PSO_GA)。选择两个种群分别进行GA和PSO操作,由GA算法中的优良个体代替PSO算法中的初始随机粒子,保留优良粒子的同时,又维持了群体的多样性并提高搜索效率。基于NS-2仿真实验结果表明,采用混合优化映射算法的自动生成工具得出的片上网络对比同等计算规模下的随机映射方式,在网络延迟、吞吐量、链路带宽等方面有明显的优化。 展开更多
关键词 2D MESH 混合算 noc映射 NS-2
在线阅读 下载PDF
NoC目录协议能耗分析与建模研究 被引量:1
14
作者 王继禾 郭兵 +2 位作者 沈艳 伍元胜 刘云本 《计算机学报》 EI CSCD 北大核心 2011年第9期1603-1610,共8页
在MPSoC芯片设计中,能耗问题是一个关键因素,NoC(Network-on-Chip片上网络)的能耗占芯片总能耗的50%以上.文中首先对NoC应用层协议的能耗行为进行统一的数学描述,在此基础上,针对目前Cache一致性中常用的目录协议进行深入分析,提出一种... 在MPSoC芯片设计中,能耗问题是一个关键因素,NoC(Network-on-Chip片上网络)的能耗占芯片总能耗的50%以上.文中首先对NoC应用层协议的能耗行为进行统一的数学描述,在此基础上,针对目前Cache一致性中常用的目录协议进行深入分析,提出一种基于位置概率分布的目录协议能耗模型,其考虑目录信息与数据块节点位置分布的无关性,定位数据块在NoC中的节点位置,计算任意节点间数据传输的概率矩阵,并结合路由单元能耗、连线能耗以及网络拓扑结构,准确获得目录协议中一次数据块传输的能耗.仿真实验表明,该文提出的模型在发包概率稳定的Mesh(网孔)网络中可有效计算出不同类型目录协议产生的能耗,且精度较高(误差小于2%),为下一步协议能耗优化研究提供可信的量化的评判依据. 展开更多
关键词 MPSOC noc 协议功耗 目录协议 CACHE一致性
在线阅读 下载PDF
基于云自适应遗传算法的NoC映射研究 被引量:2
15
作者 许川佩 陈征南 任智新 《计算机工程与应用》 CSCD 2012年第36期70-74,104,共6页
NoC映射是NoC设计中的重要步骤,映射结果的优劣对NoC的QoS约束和通信功耗有着很大的影响。提出一种采用云自适应遗传算法实现NoC映射的方案,该算法利用云模型对传统遗传算法加以改进,以此新方法自动调整遗传算法过程中的交叉概率和变异... NoC映射是NoC设计中的重要步骤,映射结果的优劣对NoC的QoS约束和通信功耗有着很大的影响。提出一种采用云自适应遗传算法实现NoC映射的方案,该算法利用云模型对传统遗传算法加以改进,以此新方法自动调整遗传算法过程中的交叉概率和变异概率,从而达到优化遗传算法的目的。结合NoC映射中的具体问题,在功耗和延时约束的限制条件下,建立了延时约束下的NoC映射功耗数学模型。实验表明,该方法在NoC映射中取得了良好的效果,降低了通信功耗。 展开更多
关键词 片上网络(noc) 映射 云模型 遗传算法
在线阅读 下载PDF
基于NoC结构的图像中值滤波并行处理模式分析 被引量:2
16
作者 刘佳 路铭 李哲英 《计算机科学》 CSCD 北大核心 2012年第1期311-314,共4页
给出了一个多处理器NoC结构以实现指定的中值滤波算法。为了提高图像处理的速度,在NoC设计的专用SoC中使用了系统并行机制与基本计算单元指令并行机制相结合的方法。它既可以满足处理速度的要求,又能达到降低功率损耗的目的。对图像处... 给出了一个多处理器NoC结构以实现指定的中值滤波算法。为了提高图像处理的速度,在NoC设计的专用SoC中使用了系统并行机制与基本计算单元指令并行机制相结合的方法。它既可以满足处理速度的要求,又能达到降低功率损耗的目的。对图像处理中的中值滤波处理结构进行了并行设计,可极大地提高处理速度。 展开更多
关键词 noc 中值滤波 并行处理
在线阅读 下载PDF
一种用于Multi-Processor测量系统的NOC结构的路由节点设计及性能评估 被引量:1
17
作者 武畅 李玉柏 彭启琮 《电子测量与仪器学报》 CSCD 2008年第5期101-106,共6页
本文提出了一种用于多处理器(Multi-Processor)测量系统的NOC结构的路由节点的微结构,并详细描述了路由节点的各个部分结构及其各自功能。为了说明本文提出的结构的可行性和实用性,本文设计了一套以DSP和FPGA为基础的用于NOC结构仿真的... 本文提出了一种用于多处理器(Multi-Processor)测量系统的NOC结构的路由节点的微结构,并详细描述了路由节点的各个部分结构及其各自功能。为了说明本文提出的结构的可行性和实用性,本文设计了一套以DSP和FPGA为基础的用于NOC结构仿真的硬件平台,评估了路由节点的资源消耗。最后,本文通过16个路由节点建立了一个基于4×4Mesh拓扑结构的NOC。通过仿真,得到了该网络在不同通信模式下的不同注入率情况下的延时、吞吐率、和面积消耗等性能,并与采用输出缓冲的路由节点进行了比较。同时,针对VOQ(virtual output queue)和输出缓冲大小这两个影响网络性能的重要微结构参数,给出了比较和分析结果。 展开更多
关键词 noc 路由节点 微结构 多处理器 仿真
在线阅读 下载PDF
3D NoC中基于分组共享的TSV混合容错方法 被引量:1
18
作者 欧阳一鸣 陈奇 +3 位作者 黄正峰 梁华国 杜高明 李建华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第11期2123-2132,共10页
冗余和串行化是解决硅通孔(TSV)的故障问题的2种主要方法,仅使用其中一种方法会面临资源浪费和容错效率低等问题.为此,提出一种3D NoC中基于分组共享的TSV混合容错方法.首先将TSV分成4组,并且每2组为一个相邻组,相邻组内实现TSV分组共享... 冗余和串行化是解决硅通孔(TSV)的故障问题的2种主要方法,仅使用其中一种方法会面临资源浪费和容错效率低等问题.为此,提出一种3D NoC中基于分组共享的TSV混合容错方法.首先将TSV分成4组,并且每2组为一个相邻组,相邻组内实现TSV分组共享;然后基于分组共享,充分考虑资源的合理配置,高效利用资源设计一种新型的TSV冗余和串行化架构;最后根据TSV故障程度的不同自适应地选择冗余机制或者串行化机制,实现TSV的混合容错.实验结果表明,与单纯地使用冗余机制和串行化机制相比,该方法在性能提升上更明显. 展开更多
关键词 3Dnoc 分组共享 容错 硅通孔
在线阅读 下载PDF
面向NoC多核芯片组的任务映射算法 被引量:3
19
作者 侯宁 张多利 《电子测量与仪器学报》 CSCD 2011年第8期695-699,共5页
片上网络(Network On Chip,NoC)是一种高效的片上互连技术。由于NoC的数据通讯具有并发、分离的特性,因此可以方便的在板级集成多块NoC多核芯片协同工作,构成NoC多核芯片组,快速提供更强大的处理能力。板级通讯的数据链路带宽远小于芯... 片上网络(Network On Chip,NoC)是一种高效的片上互连技术。由于NoC的数据通讯具有并发、分离的特性,因此可以方便的在板级集成多块NoC多核芯片协同工作,构成NoC多核芯片组,快速提供更强大的处理能力。板级通讯的数据链路带宽远小于芯片内的带宽,因此必须尽力减小芯片间的数据通讯量。针对这一问题,提出一种面向NoC多核芯片组的任务映射算法。实验表明,该算法可以使芯片间的数据通讯量比初始映射降低24%,能显著提高系统性能。 展开更多
关键词 片上网络 noc多核芯片组 映射算法 路由协议
在线阅读 下载PDF
mesh结构NoC的时钟网络研究 被引量:1
20
作者 周国昌 沈绪榜 《西北工业大学学报》 EI CAS CSCD 北大核心 2006年第4期472-476,共5页
分析了m esh结构N oC的3种时钟网络,针对同步时钟网络瞬时功耗大,非对称瀑布网络(w aterfall)和对称瀑布网络通信延迟大的弊端,提出并设计了一种混合结构的时钟网络。并以4×4混合结构时钟网络为例,计算得出该时钟网络的最大通信延... 分析了m esh结构N oC的3种时钟网络,针对同步时钟网络瞬时功耗大,非对称瀑布网络(w aterfall)和对称瀑布网络通信延迟大的弊端,提出并设计了一种混合结构的时钟网络。并以4×4混合结构时钟网络为例,计算得出该时钟网络的最大通信延迟为非对称瀑布网络的12.5%,局部单方向数据流的通信延迟约为对称瀑布网络的25%,芯片的瞬时功耗约为同步时钟网络的50%。 展开更多
关键词 noc 时钟分布网络 WATERFALL 混合结构时钟网络
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部