期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
SIMD-to-RVV动态二进制翻译中的跨架构编程模型适配优化
1
作者 赖远明 李亚龙 +3 位作者 胡瀚之 谢梦瑶 王喆 武成岗 《计算机研究与发展》 北大核心 2025年第6期1469-1491,共23页
RISC-V因其开源和模块化设计等特性,已在嵌入式领域取得显著成功,并逐步向高性能计算(HPC)领域拓展.面向HPC的RISC-V硬件(如Sophon SG2042多核处理器)已展现出与x86/ARM同类型产品相当的性能水平,但不完善的软件生态是阻碍其发展的最大... RISC-V因其开源和模块化设计等特性,已在嵌入式领域取得显著成功,并逐步向高性能计算(HPC)领域拓展.面向HPC的RISC-V硬件(如Sophon SG2042多核处理器)已展现出与x86/ARM同类型产品相当的性能水平,但不完善的软件生态是阻碍其发展的最大障碍之一.开发了面向RISC-V的进程级动态二进制翻译(DBT)器RVBT,用于将成熟的x86软件生态移植到RISC-V平台,加速RISC-V在HPC领域的应用进程.针对HPC程序广泛依赖SIMD指令的特性,聚焦于解决SIMD与RVV间显著的编程模型差异导致的翻译性能瓶颈问题,提出了3项创新的优化方案.x86SIMD将数据类型硬编码于操作码,而RVV需动态配置vtype和掩码寄存器,这导致直接翻译产生了大量冗余操作,严重拉低了翻译运行的效率.通过充分利用程序数据类型的局部性,优化方案可删除跨架构适配编程模型导致的冗余设置,混合使用浮点扩展和向量扩展翻译SIMD指令并按需同步数据,大幅提升了SIMD指令的翻译运行效率.3项优化方案具备通用性,也适用于ARM平台的SIMD到RVV的翻译.实验表明,以SPECCPU2006作为测试集,优化方案对csrr,vsetvl,vsetvli指令的平均动态消除率分别达到了100%,100%和56.31%,在浮点测试集上,掩码设置操作的平均动态消除率达到了74.66%,数据的平均动态同步率为67.35%.优化后的RVBT在整点和浮点测试集上的平均运行效率达到了本地执行的47.39%和40.06%,相比优化前的加速比分别为1.21和8.31,并远超QEMU18.84%和4.81%,展现出了应用于部分HPC场景的潜力. 展开更多
关键词 二进制翻译 RISC-V向量扩展 x86SIMD 跨架构编程模型适配 浮点计算 冗余设置消除 混合翻译
在线阅读 下载PDF
融合语义与属性特征的跨架构漏洞检测
2
作者 李坤 李斌 +1 位作者 朱文静 周清雷 《计算机科学与探索》 北大核心 2025年第3期787-801,共15页
二进制漏洞检测在程序安全领域有着重要的作用,为应对大规模的漏洞检测任务,越来越多的神经网络技术被应用到跨架构漏洞检测中,这些技术显著提高了漏洞检测的准确率,但是现有方法仍然面临提取到的信息单一、不能进行跨架构漏洞检测等问... 二进制漏洞检测在程序安全领域有着重要的作用,为应对大规模的漏洞检测任务,越来越多的神经网络技术被应用到跨架构漏洞检测中,这些技术显著提高了漏洞检测的准确率,但是现有方法仍然面临提取到的信息单一、不能进行跨架构漏洞检测等问题。提出了一种融合语义与属性特征的跨架构漏洞检测方法。使用二进制函数的汇编代码和属性控制流图作为输入,提取基本块中所有汇编代码的语义信息,将基本块级的语义信息与属性特征信息进行特征融合,生成139维的基本块级向量表示,以此来更全面地表示函数的语义和属性信息。使用基于卷积神经网络的孪生网络模型生成函数级的嵌入向量,以此来提取不同基本块中不同空间层次结构的特征并减少神经网络的参数量,通过计算函数级嵌入向量的距离来判断待检测的两个二进制函数是否相似。在进行跨架构漏洞检测时,只需要输入二进制文件中的函数和已知漏洞函数的汇编代码和属性控制流图即可完成漏洞检测。实验结果表明,该方法检测的准确率为95.64%,AUC(area under curve)值为0.9969,与现有方法相比,准确率可以提升0.26~7.04个百分点,AUC可以提升0.11~1.59个百分点,在真实环境的漏洞检测中表现优异。 展开更多
关键词 漏洞检测 神经网络 跨架构 特征融合 函数级
在线阅读 下载PDF
基于IR2Vec模型的跨架构密码算法识别
3
作者 赵晨霞 舒辉 沙子涵 《计算机科学》 CSCD 北大核心 2023年第S01期720-726,共7页
在信息安全领域,加密技术被用来保障信息的安全性,在可执行文件中识别密码算法对于保护信息安全有着重要意义。现有密码算法识别技术大多只能针对单一架构,在跨架构场景下识别能力较差,因此,提出了IR2Vec模型,着力解决跨架构下的密码算... 在信息安全领域,加密技术被用来保障信息的安全性,在可执行文件中识别密码算法对于保护信息安全有着重要意义。现有密码算法识别技术大多只能针对单一架构,在跨架构场景下识别能力较差,因此,提出了IR2Vec模型,着力解决跨架构下的密码算法识别问题。该模型首先基于LLVM衔接不同的前端和后端的特性来解决跨架构的问题,利用LLVM-RetDec将可执行文件反编译成中间表示语言,然后改进PV-DM模型将中间表示语言语义向量化,通过求取向量的余弦距离来判断语义相似性。收集多种密码算法来建立密码算法库,将待检测目标可执行文件分别与密码算法库中的文件进行一一对比,取相似度最高的为识别结果。实验结果表明,该技术能够有效识别出可执行文件中的密码算法,该模型可同时支持X86,ARM和MIPS 3种架构,Clang和GCC两种编译器,以及O0,O1,O2和O3这4种优化选项的二进制文件交叉识别。 展开更多
关键词 相似性识别 跨架构 密码算法 LLVM
在线阅读 下载PDF
C/C++代码跨形态相似性检测技术研究
4
作者 王彦昕 贾鹏 +1 位作者 范希明 彭熙 《信息网络安全》 北大核心 2025年第10期1627-1638,共12页
源码二进制相似性检测在软件开发和软件安全相关的任务中起着重要的作用,如逆向工程、版权侵权检测等。目前,源码二进制相似性检测方法虽然取得了不错的效果,但大多局限在相同架构、编译器、优化级别下的二进制代码与源代码进行相似性... 源码二进制相似性检测在软件开发和软件安全相关的任务中起着重要的作用,如逆向工程、版权侵权检测等。目前,源码二进制相似性检测方法虽然取得了不错的效果,但大多局限在相同架构、编译器、优化级别下的二进制代码与源代码进行相似性检测。而在实际检测中,被检测的二进制文件常常是不同架构、编译器和优化级别的,若对此进行区分再进行检测会带来额外的时间开销,同时会给特征设计提取带来额外的挑战。为此,文章提出了一种基于中间表示的跨架构、编译器和优化级别的源码二进制相似性检测方法,该检测方法在二进制端将二进制转换为能在不同平台和编程语言之间进行代码转换的中间表示,以减少不同编译情况下同源二进制文件的语义差距,使用CodeBERT模型提取源码特征,使用BERT模型和GCN模型提取二进制文件特征,由余弦相似性计算两端相似性。为了验证该检测方法的有效性,文章通过不同编译器、优化级别和编译架构将7个组件编译成二进制文件并构造数据集,在数据集上进行了一对一检测和一对多检测两项任务,并探究了预训练、合并指令、阈值等因素对识别准确性产生的影响。实验结果和分析表明,文章提出的基于中间表示的源码二进制相似性检测方法能够有效解决多种编译情况下同源二进制函数与源码的相似性检测问题。 展开更多
关键词 跨架构 编译器 优化级别 代码相似性检测
在线阅读 下载PDF
基于跨地域分布式架构的无限加盟电子商务新模式
5
作者 夏阳 陈贵海 徐钊 《计算机科学》 CSCD 北大核心 2009年第9期143-147,共5页
在给出了一种全新的跨地域分布式电子商务系统架构的基础上,提出了全球化跨地域无限加盟的电子商务新模式。这种分散式架构可以充分利用计算机新技术的优势,将商务事件逻辑合理地分布在地域各异的多个服务器阵列上,充分利用松散耦合的... 在给出了一种全新的跨地域分布式电子商务系统架构的基础上,提出了全球化跨地域无限加盟的电子商务新模式。这种分散式架构可以充分利用计算机新技术的优势,将商务事件逻辑合理地分布在地域各异的多个服务器阵列上,充分利用松散耦合的服务构件集成多种业务活动,提高了系统的可扩展性、可成长性、可复用性以及互操作性和可维护性,为构建大型地域分布式电子商务系统提供了崭新的思路。基于该架构的无限加盟电子商务新模式,使得商家和企业可以方便地在其当地通过发布服务低成本加入到全球卖场,并可涵盖传统的B2B,C2C和B2C 3种交易模式,其意义不言而喻。 展开更多
关键词 地域分布式架构 电子商务模式 WEB服务 构件 无限加盟
在线阅读 下载PDF
Elsa:一种面向跨区域架构的无协调分布式键值存储系统 被引量:2
6
作者 崔玉龙 付国 +1 位作者 张岩峰 于戈 《软件学报》 EI CSCD 北大核心 2023年第5期2427-2445,共19页
作为具备高性能和高可伸缩性的分布式存储解决方案,键值存储系统近年来被广泛采用,例如Redis、MongoDB、Cassandra等.分布式存储系统中广泛使用的多副本机制一方面提高了系统吞吐量和可靠性,但同时也增加了系统协调和副本一致性的额外开... 作为具备高性能和高可伸缩性的分布式存储解决方案,键值存储系统近年来被广泛采用,例如Redis、MongoDB、Cassandra等.分布式存储系统中广泛使用的多副本机制一方面提高了系统吞吐量和可靠性,但同时也增加了系统协调和副本一致性的额外开销.对于跨域分布式系统来说,远距离的副本协调开销甚至可能成为系统的性能瓶颈,降低系统的可用性和吞吐量.提出分布式键值存储系统Elsa,这是一种面向跨区域架构的无协调键值存储系统.Elsa在保证高性能和高可拓展性的基础上,采用无冲突备份数据结构(CRDT)技术来无协调的保证副本间的强最终一致性,降低了系统节点间的协调开销.在阿里云上构建了跨4数据中心8节点的跨区域分布式环境,进行了大规模分布式性能对比实验,实验结果表明:在跨域的分布式环境下,对于高并发争用的负载,Elsa系统的性能具备明显的优势,最高达到MongoDB集群的7.37倍,Cassandra集群的1.62倍. 展开更多
关键词 区域架构 键值存储系统 无冲突备份数据结构 副本一致性 强最终一致性
在线阅读 下载PDF
面向一云多芯的应用平滑切换技术
7
作者 亓开元 吴栋 +2 位作者 徐冠群 马梦雨 张东 《计算机集成制造系统》 北大核心 2025年第4期1420-1431,共12页
云计算环境呈现多元异构发展趋势,一云多芯成为生态碎片化挑战的最优解。当前阶段主要解决“多芯”的混部问题,距离以应用为中心的跨架构运行及低成本切换存在较大差距,仍面临服务请求丢失或下降的挑战。因此,首次提出一种应用跨架构运... 云计算环境呈现多元异构发展趋势,一云多芯成为生态碎片化挑战的最优解。当前阶段主要解决“多芯”的混部问题,距离以应用为中心的跨架构运行及低成本切换存在较大差距,仍面临服务请求丢失或下降的挑战。因此,首次提出一种应用跨架构运行与平滑切换的设计方案,包括算力等价调度、流量平滑切换、数据状态同步3个关键技术,此外,结合监控方法的观测式反馈,能够进一步优化应用切换前后服务的等价效果。最后,以云原生和服务网格技术为底座设计原型系统InCloud OS进行实验,评估典型应用在两种CPU架构之上发生切换前后的性能指标,结果表明InCloud OS在一云多芯场景下能够实现应用跨架构切换的平滑效果,避免服务水平协议(SLA)的下降。 展开更多
关键词 一云多芯 跨架构运行 平滑切换 云计算
在线阅读 下载PDF
基于OpenFlow协议的光与IP网络统一控制架构的研究(英文)
8
作者 何锐颖 张杰 +2 位作者 赵永利 杨辉 张维伟 《光子学报》 EI CAS CSCD 北大核心 2014年第S1期102-107,共6页
软件定义网络是近几年才提出的基于集中式控制技术的新型网络架构.本文提出了一个基于软件定义网路为网络中的OpenFlow协议异构网络跨域的统一控制架构.此架构在实现对物理层光交换节点与电交换节点统一控制的基础上,以最小化减小运营... 软件定义网络是近几年才提出的基于集中式控制技术的新型网络架构.本文提出了一个基于软件定义网路为网络中的OpenFlow协议异构网络跨域的统一控制架构.此架构在实现对物理层光交换节点与电交换节点统一控制的基础上,以最小化减小运营商损失的同时最大化保留IP网路与光网络自身的优势为目的,利用SDN实现多域中数据中心服务的统一控制与分配,最大化保留了IP网络无连接交换以及光网络大容量高速率的优势. 展开更多
关键词 软件定义网络 OpenFlow协议 光网络 域控制架构 网络架构 网络性能优化 光通信 性能 控制器
在线阅读 下载PDF
卷积协同注意力模型下的作物幼苗与杂草识别
9
作者 闫可 张聪 +2 位作者 陈新波 成泞伸 魏志慧 《江苏农业科学》 北大核心 2024年第13期188-196,共9页
在农作物的杂草防治中,部分杂草与作物幼苗的形态相似且颜色相近,导致杂草不易被快速准确识别。针对田间作物幼苗与杂草识别精度不高的问题,提出了一种卷积协同注意力模型(CCA-ViT)。该模型以视觉Transformer模型为基础,采用跨尺度金字... 在农作物的杂草防治中,部分杂草与作物幼苗的形态相似且颜色相近,导致杂草不易被快速准确识别。针对田间作物幼苗与杂草识别精度不高的问题,提出了一种卷积协同注意力模型(CCA-ViT)。该模型以视觉Transformer模型为基础,采用跨尺度金字塔架构,加强图像浅层信息与深层语义的交互。为提高相似作物与杂草的特征判别能力,在特征提取网络中构建了卷积协同注意力机制,优先关注叶片的纹理和边缘细小特征,获取局部信息注意力权重后协同全局特征进行建模。并在全局建模前引入可移动位置编码捕获感受野的同时降低模型的复杂度。将该模型用于识别小麦、玉米等6种作物幼苗与雀麦、猪殃殃等6种杂草上,识别准确率比同类规模的视觉Transformer模型提高了1.91百分点,达到了97.81%。同时该模型用于田间小麦和玉米幼苗的实际预测准确率也能达到80%以上。体现出该模型可用于复杂背景下具有纹理细小特征的作物幼苗与杂草的识别,能够对形态相似、颜色相近的作物幼苗与杂草进行有效区分。 展开更多
关键词 作物幼苗与杂草识别 尺度金字塔架构 卷积协同注意力机制 可移动位置编码 Transformer模型
在线阅读 下载PDF
PNET:像素级台标识别网络 被引量:3
10
作者 徐佳宇 张冬明 +3 位作者 靳国庆 包秀国 袁庆升 张勇东 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2018年第10期1878-1889,共12页
台标识别是典型的细微目标识别问题,针对台标区域小、信息量低,且镂空、半透明台标极易受到画面背景影响的难题,提出一个基于端到端全卷积网络的像素级台标识别网络——PNET.首先构建一个像素级标注的台标数据集,通过视频抽帧和图像预... 台标识别是典型的细微目标识别问题,针对台标区域小、信息量低,且镂空、半透明台标极易受到画面背景影响的难题,提出一个基于端到端全卷积网络的像素级台标识别网络——PNET.首先构建一个像素级标注的台标数据集,通过视频抽帧和图像预处理获得台标图像集,并提出一种逐图像的像素级半自动标注方法获得二值标签图像集;然后提出一个像素级台标识别网络,在典型分类网络AlexNet,VGG的基础上,通过微调,将分类网络在分类任务中学习到的网络参数转换为像素级台标识别网络在台标分割任务中的所需的网络参数;最后引入跨层架构,融合来自网络深层的全局信息和浅层的局部信息.实验结果表明PNET实现了准确的像素级分割,准确率高达98.3%,在NVIDIA Tesla K80上单幅图像识别时间不超过1.5 s. 展开更多
关键词 视频分类 台标识别 全卷积网络 像素级半自动标注 架构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部