期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
微处理器安全推测执行研究
1
作者 余发洪 唐志敏 《高技术通讯》 北大核心 2025年第8期824-836,共13页
幽灵、熔断等瞬态执行攻击打破了基于微处理器的软件逻辑隔离,给信息系统安全带来了巨大挑战。针对基于软件的防御策略有很高的性能开销且需要升级所有已经存在的软件,学术界提出了很多基于硬件或者软硬件结合的防御策略,但都存在不能... 幽灵、熔断等瞬态执行攻击打破了基于微处理器的软件逻辑隔离,给信息系统安全带来了巨大挑战。针对基于软件的防御策略有很高的性能开销且需要升级所有已经存在的软件,学术界提出了很多基于硬件或者软硬件结合的防御策略,但都存在不能覆盖所有已知攻击和高性能开销等问题。本文深入研究瞬态执行攻击,分析总结其行为模式,提出并建立了一种安全推测执行模型,在保留推测执行带来的微处理器性能增益的前提下,消除了其安全隐患。基于安全推测执行模型,设计并实现了一种安全缓存(Cache),能够抵御基于Cache侧信道的瞬态执行攻击。评估结果表明,安全Cache能够达到安全设计目标。与目前最先进的瞬态执行攻击防御研究GhostMinion相比,安全Cache将安全设计带来的单核性能开销降低了19.18%,多核性能开销基本可以忽略不计。 展开更多
关键词 微处理器 安全 缓存侧信道 幽灵攻击 熔断攻击 瞬态执行攻击
在线阅读 下载PDF
处理器时间侧信道攻防技术综述
2
作者 唐博文 武成岗 王喆 《高技术通讯》 CAS 北大核心 2024年第5期439-452,共14页
现代处理器优化机制众多,设计人员在追求性能提升时,往往忽略背后的安全风险。时间侧信道攻击因其影响面广且隐蔽性好已成为最主要的安全威胁之一。随着瞬态执行攻击的出现,时间侧信道攻击的能力被进一步扩展,计算系统的安全基础被动摇... 现代处理器优化机制众多,设计人员在追求性能提升时,往往忽略背后的安全风险。时间侧信道攻击因其影响面广且隐蔽性好已成为最主要的安全威胁之一。随着瞬态执行攻击的出现,时间侧信道攻击的能力被进一步扩展,计算系统的安全基础被动摇。为此,处理器厂商及安全人员提出了大量防御机制。这些机制具有不同的防护能力及性能开销。与此同时,新的瞬态执行漏洞和隐蔽信道也不断被发现,已提出的防御机制被不断突破。围绕处理器时间侧信道攻防技术的博弈日益激烈。本文从基本攻击原理出发,对现有时间侧信道攻击进行了归纳总结,并在此基础上进一步分析了相关防御机制的保护能力和性能瓶颈,从而梳理出时间侧信道攻防技术的发展趋势,为未来软硬件系统开发和安全技术探索提供参考。 展开更多
关键词 处理器微架构 时间侧信道攻击 隐蔽信道 瞬态执行攻击 投机执行 防御技术
在线阅读 下载PDF
新一代神威处理器上高效任务流并行系统 被引量:1
3
作者 傅游 杜雷明 +1 位作者 高希然 陈莉 《计算机科学》 CSCD 北大核心 2024年第12期137-146,共10页
我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型。顺序任务流(Sequential Task Flow,STF)模型基于数据流信息... 我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型。顺序任务流(Sequential Task Flow,STF)模型基于数据流信息实现对串行程序的自动任务并行,并通过任务间的细粒度同步实现异步并行,相比于BSP模型的全局同步,并行度更高,负载更均衡。STF模型为用户高效使用神威平台提供了一种新选择。但在众核系统上,STF模型的运行时开销会直接影响并行程序性能。首先,分析新一代神威处理器影响STF模型高效实现的两个特征;然后,利用处理器架构的独有特性,提出一种基于代理的数据流构图机制以实现模型的构图需求,以及一种无锁的集中式任务调度机制以优化调度开销。最后,基于以上技术,为AceMesh模型实现了高效的任务流并行系统。实验表明,实现的任务流并行系统相比传统运行时支持优势显著,在细粒度任务场景下最高加速2.37倍;AceMesh性能高于神威平台的OpenACC模型,对典型应用的加速最高达到2.07倍。 展开更多
关键词 顺序任务流模型 异构众核并行 任务调度 数据流并行 块同步模型
在线阅读 下载PDF
面向通用处理器芯粒架构探索和评估的系统级模拟器
4
作者 张聪武 刘澳 +2 位作者 张科 常轶松 包云岗 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第12期4575-4588,共14页
随着摩尔定律的逐步失效,芯片制造工艺的提升愈发困难,芯片性能的提升面临“面积墙”问题,chiplet(芯粒)技术开始被广泛采用来解决此问题。然而,面向chiplet引入的架构设计参数,目前的体系结构模拟器面临新的挑战。为了能够探索chiplet... 随着摩尔定律的逐步失效,芯片制造工艺的提升愈发困难,芯片性能的提升面临“面积墙”问题,chiplet(芯粒)技术开始被广泛采用来解决此问题。然而,面向chiplet引入的架构设计参数,目前的体系结构模拟器面临新的挑战。为了能够探索chiplet架构的特定设计参数,现有工作通常只会为模拟器增加单一的功能,导致其难以用于探索多个参数对chiplet芯片的整体影响。为了能够较为全面地探索和评估chiplet芯片架构,该文基于现有gem5模拟器实现了面向通用处理器芯粒架构探索和评估的系统级模拟器(SEEChiplet)模拟器框架。首先,总结了现在chiplet芯片设计关注的3类设计参数,包括:(1)芯片cache系统设计;(2)封装方式模拟;(3) chiplet间的互连网络。其次,针对上述3类参数:(1)设计并实现了私有末级缓存系统,扩大了cache系统设计空间;(2)修改了gem5已有的全局目录,以适配私有末级缓存(LLC)系统;(3)建模了两种常见的chiplet封装方式以及chiplet间互连网络。最后,该文在SEEChiplet框架中进行了系统级的模拟评估,在被测chiplet架构通用处理器上运行操作系统及PARSEC 3.0基准测试程序,验证了SEEChiplet的功能,证明SEEChiplet可以对chiplet设计空间进行探索和评估。 展开更多
关键词 芯粒 设计空间探索 体系结构模拟器 缓存系统
在线阅读 下载PDF
基于ARMv8处理器的实数FFT实现与性能优化研究 被引量:2
5
作者 赵翔 贾海鹏 +3 位作者 张云泉 邓明森 张广婷 郭金鑫 《计算机学报》 EI CAS CSCD 北大核心 2023年第5期1003-1018,共16页
FFT(快速傅里叶变换)是离散傅里叶变换或其逆变换的一种常见快速算法,是高性能计算领域最重要的基础核心算法之一,在科学、工程和数学等领域的应用十分广泛.实数FFT算法,即输入或者输出为实数的FFT算法,其中包括R2C(Real-to-Complex)、C... FFT(快速傅里叶变换)是离散傅里叶变换或其逆变换的一种常见快速算法,是高性能计算领域最重要的基础核心算法之一,在科学、工程和数学等领域的应用十分广泛.实数FFT算法,即输入或者输出为实数的FFT算法,其中包括R2C(Real-to-Complex)、C2R(Complex-to-Real)等变换类型.相比复数FFT算法,实数FFT算法在图形图像处理、数据压缩等领域有着不可替代的作用.传统实数FFT实现针对的是输入规模为偶数,一般转变为复数FFT进行运算.然而当前鲜有针对输入规模为奇数的实数FFT高效实现.对此,本文提出了一种实数FFT高效算法(DRFFT),并采用蝶形网络优化、蝶形计算优化、访存优化、SIMD优化以及数据转置等方法进行优化,大幅提升了实数FFT算法性能,最终构建了一种针对实数FFT的高性能算法库.实验结果表明,本文实现的DRFFT R2C变换在单双精度浮点数处理方面较FFTW库性能分别平均提升了37.6%和4.6%,较ARMPL库性能分别平均提升了67.6%和28.1%.DRFFT C2R变换在单双精度浮点数处理方面则较FFTW库性能分别平均提升了58.6%和10.8%,较ARMPL库性能分别平均提升了121.8%和85.2%. 展开更多
关键词 ARMv8 FFT算法 R2C C2R FFTW
在线阅读 下载PDF
基于位串行计算的动态精度神经网络处理器
6
作者 郝一帆 支天 杜子东 《高技术通讯》 CAS 2022年第9期881-893,共13页
针对当前神经网络动态精度计算系统在周期性的模型重训练和动态精度切换的过程中会引入大量的计算和访存开销问题,提出了基于串行位计算的动态精度神经网络处理器(DPNN),其可支持任意规模、任意精度的神经网络模型;支持以非重训练的方... 针对当前神经网络动态精度计算系统在周期性的模型重训练和动态精度切换的过程中会引入大量的计算和访存开销问题,提出了基于串行位计算的动态精度神经网络处理器(DPNN),其可支持任意规模、任意精度的神经网络模型;支持以非重训练的方式对模型数据精度进行细粒度调整,并消除了动态精度切换时因权值bit位重叠造成的重复计算与访存。实验结果表明,相较于自感知神经网络系统(SaNNs)的最新进展之一MinMaxNN,DPNN可使计算量平均降低1.34~2.52倍,访存量降低1.16~1.93倍;相较于代表性的bit串行计算神经网络处理器Stripes,DPNN使性能提升2.57倍、功耗节省2.87倍、面积减少1.95倍。 展开更多
关键词 神经网络处理器 动态精度计算 位串行计算
在线阅读 下载PDF
芯粒集成芯片架构-封装协同设计
7
作者 卢美璇 许浩博 +2 位作者 王颖 王梦迪 韩银和 《电子与信息学报》 北大核心 2025年第9期2994-3009,共16页
芯粒集成技术凭借封装集成的可扩展性,成为后摩尔时代算力拓展的有效途径。然而,芯粒集成芯片架构与封装的紧密耦合导致复杂的多目标权衡问题,同时体积集成密度的提高加剧了可靠性挑战,仅依靠封装层面设计难以解决,传统架构与封装分离... 芯粒集成技术凭借封装集成的可扩展性,成为后摩尔时代算力拓展的有效途径。然而,芯粒集成芯片架构与封装的紧密耦合导致复杂的多目标权衡问题,同时体积集成密度的提高加剧了可靠性挑战,仅依靠封装层面设计难以解决,传统架构与封装分离的设计范式失效,架构-封装协同设计成为保障芯粒集成芯片性能与可靠性的必要手段。该工作总结芯粒集成驱动的新兴架构特征,梳理芯粒集成芯片架构与封装的紧密耦合关系,阐明协同设计的必要性;理清架构层与封装层核心设计要素对系统关键指标的影响机制,在此基础上定义架构层和封装层协同界面;最后结合已有工作提出架构-封装协同设计的关键组成和协同方法。 展开更多
关键词 芯粒 协同设计 架构 封装
在线阅读 下载PDF
Web应用访问控制漏洞检测研究进展
8
作者 孟海宁 陆杰 +3 位作者 李昊峰 黄永恒 曹立庆 李炼 《高技术通讯》 北大核心 2025年第3期227-240,共14页
访问控制机制在维护Web应用安全方面扮演着至关重要的角色。然而,不安全的访问控制机制已经成为威胁Web应用安全的主要风险来源之一。为了保护Web应用安全,及早地检测并报告访问控制漏洞至关重要。为了帮助安全研究者和程序开发者更深... 访问控制机制在维护Web应用安全方面扮演着至关重要的角色。然而,不安全的访问控制机制已经成为威胁Web应用安全的主要风险来源之一。为了保护Web应用安全,及早地检测并报告访问控制漏洞至关重要。为了帮助安全研究者和程序开发者更深入地了解Web应用的访问控制漏洞以及现有工作的研究进展,本文对该领域的相关工作进行了系统总结,概括了访问控制漏洞的基本概念与特征,归纳了检测访问控制漏洞的关键步骤和核心思想。此外,本文进一步针对功能级、对象级和对象属性级3类高危访问控制漏洞,详细分析和讨论了现有工作的漏洞检测能力。最后,对Web应用访问控制漏洞检测技术的发展进行了总结与展望。 展开更多
关键词 WEB应用 访问控制 访问控制漏洞 漏洞检测 越权访问 软件缺陷检测
在线阅读 下载PDF
一种软硬件协同的访存踪迹实时分析处理工具
9
作者 李作骏 卢天越 +1 位作者 朱晨光 陈明宇 《高技术通讯》 北大核心 2025年第8期813-823,共11页
本文提出一种软硬件协同的访存踪迹实时分析处理工具,通过硬件采集并实时回传访存踪迹、实时分析处理访存踪迹、提取语义信息即时指导访存系统调控,解决了当前基于访存踪迹信息进行访存调控的软硬件系统研究中缺乏有效的实时分析处理手... 本文提出一种软硬件协同的访存踪迹实时分析处理工具,通过硬件采集并实时回传访存踪迹、实时分析处理访存踪迹、提取语义信息即时指导访存系统调控,解决了当前基于访存踪迹信息进行访存调控的软硬件系统研究中缺乏有效的实时分析处理手段的问题。该工具通过定制现场可编程门阵列(field programmable gate array,FPGA)采集卡,在双路Intel E52680 v4服务器平台中实现同机访存踪迹回传和实时分析处理。基准测试表明该工具的最低传输延迟为1.5μs,能够实时处理DDR4-1600速率下的高带宽访存,在安全监测场景实验中的平均异常检测响应时间为28.0μs,基于该工具的实时远端内存预取方案性能在25.0%和50.0%本地内存负载下分别比Fastswap高24.9%和32.0%。 展开更多
关键词 内存访问 踪迹 实时分析 软硬件协同 安全监测
在线阅读 下载PDF
基于RISC-V Matrix指令集扩展的LLM矢量点积加速研究
10
作者 陈煦豪 胡思鹏 +3 位作者 刘洪超 刘伯然 唐丹 赵地 《计算机科学》 北大核心 2025年第5期83-90,共8页
鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效... 鉴于边缘AI的高性能与低功耗需求,基于RISC-V指令集架构,针对边缘设备数字信号处理的实际问题,设计了一种边缘AI的专用指令集处理器,在有限的硬件开销下,提升了边缘AI的执行效率,降低了边缘AI的能量消耗,能够满足边缘AI应用中进行高效大语言模型(LLM)推理计算的需求。针对大语言模型的特性,基于RISC-V指令集扩展了自定义指令完成矢量点积计算,在专用的矢量点积加速硬件上进行大语言模型的运算加速;基于开源高性能RISC-V处理器核“香山”nanhu版本架构,实现了矢量点积专用指令集处理器nanhu-vdot,其在高性能处理器“香山”(nanhu版本)的基础上增加了矢量点积计算单元以及流水线处理逻辑;对nanhu-vdot进行FPGA硬件测试,在几乎没有增加额外的硬件资源和功耗消耗的前提下,矢量点积运算速度相比标量方法提高4倍以上,使用软硬件协同方案进行第二代生成式预训练(Generative Pre-Trained-2,GPT-2)模型推理,相比纯软件实现,速度提高了约30%。 展开更多
关键词 指令集扩展 矢量点积 软硬件协同 大语言模型推理
在线阅读 下载PDF
基于用户级兼容技术的高效打印机驱动迁移方法
11
作者 谢本壹 张福新 《高技术通讯》 北大核心 2025年第2期124-133,共10页
打印机驱动匮乏长期困扰着全球Linux桌面用户。在办公环境中存在大量老旧打印机,这些打印机通常只支持X86 Windows的打印机驱动。然而,国产计算机平台普遍使用Linux操作系统,且存在多种非X86指令集。在信息技术应用创新的背景下,迫切需... 打印机驱动匮乏长期困扰着全球Linux桌面用户。在办公环境中存在大量老旧打印机,这些打印机通常只支持X86 Windows的打印机驱动。然而,国产计算机平台普遍使用Linux操作系统,且存在多种非X86指令集。在信息技术应用创新的背景下,迫切需要解决在国产计算机平台上复用这些老旧打印机的问题。现有方法采用系统级二进制翻译运行Windows操作系统进行打印,存在效率低下且需额外授权的不足。为此,本文提出了一种基于用户级兼容技术的打印机驱动迁移方法,高效地将X86 Windows打印机驱动迁移至国产计算机平台。该方法由操作系统兼容层和用户级二进制翻译两部分组成。操作系统兼容层负责将打印机驱动相关的系统库调用转换成宿主操作系统的调用,用户级二进制翻译负责将X86指令翻译成宿主中央处理器(central processing unit,CPU)的指令。由于无需运行Windows操作系统,本文提出的迁移方法相较于系统级二进制翻译的方法更为高效且无额外授权成本。实验结果表明,采用本方法打印相同内容比系统级二进制翻译方法快10倍左右。该方法已成功应用于搭载了龙芯CPU的国产计算机平台,其可行性和稳定性已得到市场的检验。 展开更多
关键词 打印机驱动 二进制翻译 操作系统兼容
在线阅读 下载PDF
基于数据面加速器的工业5G协议处理架构研究 被引量:2
12
作者 杨喜宁 周一青 陈洋 《高技术通讯》 CAS 2023年第10期1038-1046,共9页
伴随5G标准的不断演进和商用网络的规模部署,5G已成为引领我国智能制造高质量发展的新引擎。与此同时,以高带宽、高频次小包通信为特征的工业应用也对5G终端基带芯片协议处理提出了挑战。本文提出一种以数据面加速器(DPA)为核心的高性... 伴随5G标准的不断演进和商用网络的规模部署,5G已成为引领我国智能制造高质量发展的新引擎。与此同时,以高带宽、高频次小包通信为特征的工业应用也对5G终端基带芯片协议处理提出了挑战。本文提出一种以数据面加速器(DPA)为核心的高性能软硬件协同5G协议处理架构,该架构将异构芯片计算资源与协议处理功能进行了合理映射,并通过并行化设计大幅提升5G用户面数据处理性能。实验结果表明,相比纯软件的实现方案本文提出的协同架构在不同业务负载条件下,数据包处理时延平均下降28.3%,包处理通量平均提升38%。在0.5 ms的时隙周期配置下,本文架构的数据包处理速率大于2000包/s,可以满足工业5G大规模现场节点集中式数据采集的需求。 展开更多
关键词 工业5G 软硬协同 协议处理 加速器
在线阅读 下载PDF
第一性原理极化率计算中的众核优化方法研究 被引量:1
13
作者 罗海文 吴扬俊 商红慧 《计算机科学》 CSCD 北大核心 2023年第6期1-9,共9页
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效... 基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。 展开更多
关键词 密度函数微扰理论 第一性原理计算 高性能计算 新一代神威异构众核处理器
在线阅读 下载PDF
基于正规基的大规模S盒FPGA设计与实现
14
作者 张磊 李国元 +2 位作者 洪睿鹏 王建新 肖超恩 《密码学报(中英文)》 北大核心 2025年第4期854-869,共16页
传统上的分组密码S盒硬件实现采用查表法,其实现效果受到芯片资源的限制.针对16-bit大规模S盒在FPGA硬件实现中资源消耗大的问题,本文提出了基于复合域中正规基的S盒构造方法,研究使用较少的硬件资源实现16-bit S盒.首先,设计了基于复... 传统上的分组密码S盒硬件实现采用查表法,其实现效果受到芯片资源的限制.针对16-bit大规模S盒在FPGA硬件实现中资源消耗大的问题,本文提出了基于复合域中正规基的S盒构造方法,研究使用较少的硬件资源实现16-bit S盒.首先,设计了基于复合域的16-bit S盒构造实现方案,构建了线性的同构映射矩阵及其逆矩阵.其次,通过映射矩阵使有限域GF(2^(16))的乘法逆转换到复合域GF((((2^(2))^(2))^(2))^(2))上,进而将非线性的高维乘法逆简化为低维子域运算.然后,通过分析各级复合域不同参数对S盒实现的影响,筛选最优参数.最后,结合所提出的16-bit S盒构造实现框架,本文利用Xilinx公司的Vivado开发工具,以MK-3算法的16-bit S盒为例进行了FPGA仿真验证与性能分析.结果表明,本文构造方法实现的MK-3算法S盒需要186个LUT,时钟频率为114.129 MHz,在时钟频率/LUT的性能指标下达到了0.61360.同目前已公开文献同类方法中的最优实现性能0.43538相比,性能提升了40.93%.本文的16-bit S盒实现方案能够在降低硬件资源消耗的同时保持密码算法较高的运行频率,对有基于有限域构造的S盒的高效软硬件实现具有一定的参考价值. 展开更多
关键词 大规模S盒 复合域 正规基 MK-3算法 FPGA
在线阅读 下载PDF
基于DWGA的低轨卫星多波束调度策略 被引量:1
15
作者 李红光 石晶林 +1 位作者 周一青 刘垚圻 《西安电子科技大学学报》 北大核心 2025年第3期73-84,共12页
低轨卫星通信是天地一体化信息网络的重要组成部分,在实时业务和应急通信等领域具有重要作用。针对地面用户业务需求时空分布差异大,导致低轨卫星波束资源利用率低的问题,提出一种基于时延加权和遗传算法的低轨卫星多波束调度策略。首... 低轨卫星通信是天地一体化信息网络的重要组成部分,在实时业务和应急通信等领域具有重要作用。针对地面用户业务需求时空分布差异大,导致低轨卫星波束资源利用率低的问题,提出一种基于时延加权和遗传算法的低轨卫星多波束调度策略。首先设计了低轨卫星多波束调度架构;其次通过构建的波束干扰模型分析同频复用距离对载干噪比的影响,从而确定全频率复用的干扰规避方案;然后采用真实人口密度分布和用户调度速率构建业务模型;接着将待发往不同波束小区的业务容量与业务容忍时延加权得到容量调度因子,以避免业务数据超时失效;最后以最大化卫星容量为目标,采用遗传算法求解出不同调度次序下的跳波束图案。仿真结果表明,与遗传算法、轮询算法和随机算法对比,所提算法容量利用率分别平均提升2.74%,45.5%,46.23%;业务超时失效率分别平均降低2.52%,20.66%,25.36%;与遗传算法相比,所提算法代价为存储容量。 展开更多
关键词 低轨卫星 跳波束 资源分配 遗传算法
在线阅读 下载PDF
AI构建视距径地图的低时延数据路由方法
16
作者 卞留念 周一青 +3 位作者 刘玲 李达 时宁哲 石晶林 《西安电子科技大学学报》 北大核心 2025年第3期188-201,共14页
在存在爆炸性气体或液体的特殊工厂中,自动导引车需要以移动自组网的形式组网。当工厂中有遮挡物遮挡无线信号时,车辆移动会造成车辆间信道条件在视距和非视距之间变化,车辆节点的无线传输范围随之改变,现有基于固定传输范围的数据路由... 在存在爆炸性气体或液体的特殊工厂中,自动导引车需要以移动自组网的形式组网。当工厂中有遮挡物遮挡无线信号时,车辆移动会造成车辆间信道条件在视距和非视距之间变化,车辆节点的无线传输范围随之改变,现有基于固定传输范围的数据路由方法的丢包或时延增加。面向遮挡环境中的移动自组网,文中提出基于视距径地图的低时延数据路由方法。首先,提出了一种基于全连接神经网络构建视距径地图的方法,通过估计路由消息的信噪比生成原始数据,基于信噪比大小将原始数据转换为训练数据,训练全连接神经网络得到视距径地图。然后,提出了一种基于视距径地图的时延感知数据路由协议,可在视距径地图基础上,估计节点间无线链路期望传输次数,基于该次数计算和更新路由评估分数,节点选择路由评估分数大(对应时延小)的路径上的节点作为下一跳转发节点。最后,仿真结果表明,在存在遮挡物的场景中,与基于固定传输范围的数据路由方法相比,文中所提方法能够在不降低数据包交付率的同时将通信时延降低66%。 展开更多
关键词 移动自组织网络 路由协议 自动导引车 视距径
在线阅读 下载PDF
高低轨卫星联合覆盖干扰规避多波束资源分配
17
作者 胡金龙 刘子凡 +2 位作者 周一青 曹欢 陈道进 《西安电子科技大学学报》 北大核心 2025年第3期12-25,共14页
高低轨卫星联合覆盖系统中低轨卫星部署必须无条件规避对高轨卫星的干扰。已有研究采用基于隔离角的空域隔离多波束资源分配,或不满足国际电联的干扰规避要求,或会造成低轨卫星系统服务质量下降。针对以上问题,提出一种高低轨卫星联合... 高低轨卫星联合覆盖系统中低轨卫星部署必须无条件规避对高轨卫星的干扰。已有研究采用基于隔离角的空域隔离多波束资源分配,或不满足国际电联的干扰规避要求,或会造成低轨卫星系统服务质量下降。针对以上问题,提出一种高低轨卫星联合覆盖的干扰规避多波束资源分配机制,以等效功率通量密度(Equivalent Power Flux Density,EPFD)为干扰规避约束,以最大化波位服务满意度(Beam Service Satisfaction,BSS)为目标,构建高低轨卫星联合覆盖多波束资源分配优化问题模型,并提出一种联合粒子群和遗传算法的求解算法(BSS Beam Hopping Interference Avoidance with PSO and GA,BBHIA-PG)。在系统忙时和闲时,分别与基于隔离角的联合迭代多星跳波束算法(Joint Iterative Multi-Satellite Beam Hopping,JIMS-BH)和负载均衡及功率控制多星跳波束算法(Load Balancing and Energy-Efficient Beam Hopping,LB-EE-BH)对比。仿真结果表明:基于所选取业务模型,系统最忙时,文中算法较负载均衡及功率控制和多星跳波束算法均满足等效功率通量密度门限要求;波位服务满意度方面,文中算法较负载均衡及功率控制多星跳波束算法提升7.43%,较基于隔离角的联合迭代多星跳波束算法降低3.31%;波位总吞吐量文中算法较负载均衡及功率控制多星跳波束算法提升11.91%,较基于隔离角的联合迭代多星跳波束算法提升2.99%。系统最闲时,3种算法波位服务满意度和波位总吞吐量性能一致,但隔离角的联合迭代多星跳波束资源分配算法不满足等效功率能量密度门限要求。 展开更多
关键词 卫星通信系统 高低轨联合覆盖 资源分配 干扰规避
在线阅读 下载PDF
优化器对神经网络力场性能的影响与分析
18
作者 李恩吉 胡思宇 +1 位作者 谭光明 贾伟乐 《计算机科学》 北大核心 2025年第5期50-57,共8页
分子动力学模拟是一种广泛应用于多个学科(如材料科学、计算化学等)的关键研究方法。近年来,随着计算能力的提升、神经网络模型的发展以及第一性原理数据的增加,神经网络力场模型已经展现出高精度的预测能力。目前存在多种神经网络力场... 分子动力学模拟是一种广泛应用于多个学科(如材料科学、计算化学等)的关键研究方法。近年来,随着计算能力的提升、神经网络模型的发展以及第一性原理数据的增加,神经网络力场模型已经展现出高精度的预测能力。目前存在多种神经网络力场模型的训练算法,而神经网络力场模型处于一个快速迭代的阶段,当前仍然缺乏神经网络力场模型及与之适配的优化器的指导建议。选取3种有代表性的神经网络力场模型和目前3种用于神经网络力场模型上的优化算法,在4个真实数据集上进行测试和评估,分析影响其收敛性的原因。设计实验对其进行全方位的评估,包括模型参数量对优化器的影响,神经网络宽度对收敛性的影响,以及模型训练时间与优化器的关联等。文中工作可以针对神经网络力场模型,给出优化器算法的建议。 展开更多
关键词 分子动力学模拟 神经网络 力场训练 优化器
在线阅读 下载PDF
Lite-IJformer:面向长序列Transformer的轻量化方法
19
作者 连家诚 郝一帆 +2 位作者 张曦珊 支天 孙广中 《高技术通讯》 北大核心 2025年第2期167-174,共8页
针对面向长序列的Transformer计算复杂度高的问题,本文提出了一种Trans-former轻量化方法Lite-IJformer。其核心思路分为2步:(1)对自注意力(self-attention)进行线性化,将Transformer的计算复杂度从输入序列的平方降至线性;(2)基于低秩... 针对面向长序列的Transformer计算复杂度高的问题,本文提出了一种Trans-former轻量化方法Lite-IJformer。其核心思路分为2步:(1)对自注意力(self-attention)进行线性化,将Transformer的计算复杂度从输入序列的平方降至线性;(2)基于低秩矩阵分解理论对KV矩阵乘法进行降维,进一步减少计算规模。在长序列竞技基准测试上的实验表明,当输入长度为1000~2000时,线性化可以将self-attention计算量降低13~26倍,将Transformer的推理速度提升4.75~5.72倍而无精度损失;在经过降维后,self-attention的计算量进一步减少了17.0%,模型推理速度提升了1.17倍,精度损失在0.5%以内。 展开更多
关键词 TRANSFORMER 自注意力 线性化方法 降维
在线阅读 下载PDF
Quantum Circuit Implementation and Resource Evaluation of Ballet‑p/k Under Grover’s Attack
20
作者 HONG Rui-Peng ZHANG Lei +3 位作者 PANG Chen-Xu LI Guo-Yuan DING Ding WANG Jian-Xin 《密码学报(中英文)》 北大核心 2025年第5期1178-1194,共17页
The advent of Grover’s algorithm presents a significant threat to classical block cipher security,spurring research into post-quantum secure cipher design.This study engineers quantum circuit implementations for thre... The advent of Grover’s algorithm presents a significant threat to classical block cipher security,spurring research into post-quantum secure cipher design.This study engineers quantum circuit implementations for three versions of the Ballet family block ciphers.The Ballet‑p/k includes a modular-addition operation uncommon in lightweight block ciphers.Quantum ripple-carry adder is implemented for both“32+32”and“64+64”scale to support this operation.Subsequently,qubits,quantum gates count,and quantum circuit depth of three versions of Ballet algorithm are systematically evaluated under quantum computing model,and key recovery attack circuits are constructed based on Grover’s algorithm against each version.The comprehensive analysis shows:Ballet-128/128 fails to NIST Level 1 security,while when the resource accounting is restricted to the Clifford gates and T gates set for the Ballet-128/256 and Ballet-256/256 quantum circuits,the design attains Level 3. 展开更多
关键词 Grover’s algorithm quantum circuit Ballet family block ciphers quantum ripple-carry adder
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部