期刊文献+
共找到149篇文章
< 1 2 8 >
每页显示 20 50 100
A survey of fine-grained visual categorization based on deep learning
1
作者 XIE Yuxiang GONG Quanzhi +2 位作者 LUAN Xidao YAN Jie ZHANG Jiahui 《Journal of Systems Engineering and Electronics》 CSCD 2024年第6期1337-1356,共20页
Deep learning has achieved excellent results in various tasks in the field of computer vision,especially in fine-grained visual categorization.It aims to distinguish the subordinate categories of the label-level categ... Deep learning has achieved excellent results in various tasks in the field of computer vision,especially in fine-grained visual categorization.It aims to distinguish the subordinate categories of the label-level categories.Due to high intra-class variances and high inter-class similarity,the fine-grained visual categorization is extremely challenging.This paper first briefly introduces and analyzes the related public datasets.After that,some of the latest methods are reviewed.Based on the feature types,the feature processing methods,and the overall structure used in the model,we divide them into three types of methods:methods based on general convolutional neural network(CNN)and strong supervision of parts,methods based on single feature processing,and meth-ods based on multiple feature processing.Most methods of the first type have a relatively simple structure,which is the result of the initial research.The methods of the other two types include models that have special structures and training processes,which are helpful to obtain discriminative features.We conduct a specific analysis on several methods with high accuracy on pub-lic datasets.In addition,we support that the focus of the future research is to solve the demand of existing methods for the large amount of the data and the computing power.In terms of tech-nology,the extraction of the subtle feature information with the burgeoning vision transformer(ViT)network is also an important research direction. 展开更多
关键词 deep learning fine-grained visual categorization convolutional neural network(CNN) visual attention
在线阅读 下载PDF
面向YOLO神经网络的数据流架构优化研究 被引量:2
2
作者 穆宇栋 李文明 +5 位作者 范志华 吴萌 吴海彬 安学军 叶笑春 范东睿 《计算机学报》 北大核心 2025年第1期82-99,共18页
YOLO目标检测算法具有速度快、精度高、结构简单、性能稳定等优点,因此在多种对实时性要求较高的场景中得到广泛应用。传统的控制流架构在执行YOLO神经网络时面临计算部件利用率低、功耗高、能效较低等挑战。相较而言,数据流架构的执行... YOLO目标检测算法具有速度快、精度高、结构简单、性能稳定等优点,因此在多种对实时性要求较高的场景中得到广泛应用。传统的控制流架构在执行YOLO神经网络时面临计算部件利用率低、功耗高、能效较低等挑战。相较而言,数据流架构的执行模式与神经网络算法匹配度高,更能充分挖掘其中的数据并行性。然而,在数据流架构上部署YOLO神经网络时面临三个问题:(1)数据流架构的数据流图映射并不能结合YOLO神经网络中卷积层卷积核较小的特点,造成卷积运算数据复用率过低的问题,并进一步降低计算部件利用率;(2)数据流架构在算子调度时无法利用算子间结构高度耦合的特点,导致大量数据重复读取;(3)数据流架构上的数据存取与执行高度耦合、串序执行,导致数据存取延迟过高。为解决这些问题,本文设计了面向YOLO神经网络的数据流加速器DFU-Y。首先,结合卷积嵌套循环的执行模式,本文分析了小卷积核卷积运算的数据复用特征,并提出了更有利于执行单元内部数据复用的数据流图映射算法,从而整体提升卷积运行效率;然后,为充分利用结构耦合的算子间的数据复用,DFU-Y提出数据流图层次上的算子融合调度机制以减少数据存取次数、提升神经网络运行效率;最后,DFU-Y通过双缓存解耦合数据存取与执行,从而并行执行数据存取与运算,掩盖了程序间的数据传输延迟,提高了计算部件利用率。实验表明,相较数据流架构(DFU)和GPU(NVIDIA Xavier NX),DFU-Y分别获得2.527倍、1.334倍的性能提升和2.658倍、3.464倍的能效提升;同时,相较YOLO专用加速器(Arria-YOLO),DFU-Y在保持较好通用性的同时,达到了其性能的72.97%、能效的87.41%。 展开更多
关键词 YOLO算法 数据流架构 数据流图优化 卷积神经网络 神经网络加速
在线阅读 下载PDF
基于数据流架构的NTT蝶式计算加速
3
作者 石泓博 范志华 +4 位作者 李文明 张志远 穆宇栋 叶笑春 安学军 《计算机研究与发展》 北大核心 2025年第6期1547-1561,共15页
全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限... 全同态加密(fully homomorphic encryption,FHE)因其在计算全过程中保持数据加密的能力,为云计算等分布式环境中的隐私保护提供了重要支撑,具有广泛的应用前景.然而,FHE在计算过程中普遍存在运算复杂度高、数据局部性差以及并行度受限等问题,导致其在实际应用中的性能严重受限.其中,快速数论变换(number theoretic transform,NTT)作为FHE中关键的基础算子,其性能对整个系统的效率具有决定性影响.针对NTT中的核心计算模式--蝶式(butterfly)计算,提出一种基于数据流计算模型的NTT加速架构.首先,设计面向NTT蝶式计算的RVFHE扩展指令集,定制高效的模乘与模加/模减运算单元,以提升模运算处理效率.其次,提出一种NTT数据重排方法,并结合结构化的蝶式地址生成策略,以降低跨行列数据交换的控制复杂度与访问冲突.最后,设计融合数据流驱动机制的NTT加速架构,通过数据依赖触发方式实现高效的片上调度与数据复用,从而充分挖掘操作级并行性.实验结果表明,与NVIDIA GPU相比,提出的架构获得了8.96倍的性能提升和8.53倍的能效提升;与现有的NTT加速器相比,所提架构获得了1.37倍的性能提升. 展开更多
关键词 数据流 全同态加密 NTT算法 蝶式计算 RISC-V指令集
在线阅读 下载PDF
基于下推自动机的同步数据流语言可信编译
4
作者 于涛 王珊珊 +6 位作者 徐芊卉 董晓晗 胡代金 罗杰 杨溢龙 吕江花 马殿富 《软件学报》 北大核心 2025年第8期3554-3569,共16页
同步数据流语言Lustre是安全关键系统开发中常用的开发语言,其现存的官方代码生成器和SCADE的KCG代码生成器既没有经过形式化验证,对用户也处于黑盒状态.近年来,通过证明源代码和目标代码的等价性间接证明编译器的正确性的翻译确认方法... 同步数据流语言Lustre是安全关键系统开发中常用的开发语言,其现存的官方代码生成器和SCADE的KCG代码生成器既没有经过形式化验证,对用户也处于黑盒状态.近年来,通过证明源代码和目标代码的等价性间接证明编译器的正确性的翻译确认方法被证明是成功的.基于下推自动机的编译方法和基于语义一致性的验证方法,提出Lustre语言可信编译方法,能够将Lustre语言转换为C语言并进行形式化验证以保证编译的正确性,并使用Isabelle对翻译转换过程进行严格的正确性证明. 展开更多
关键词 同步数据流语言 经过验证的编译器 形式化验证 Lustre语言
在线阅读 下载PDF
面向Dataflow的异构集群混合式资源调度框架研究 被引量:6
5
作者 汤小春 赵全 +4 位作者 符莹 朱紫钰 丁朝 胡小雪 李战怀 《软件学报》 EI CSCD 北大核心 2022年第12期4704-4726,共23页
Dataflow模型的使用,使得大数据计算的批处理和流处理融合为一体.但是,现有的针对大数据计算的集群资源调度框架,要么面向流处理,要么面向批处理,不适合批处理与流处理作业共享集群资源的需求.另外,GPU用于大数据分析计算时,由于缺乏有... Dataflow模型的使用,使得大数据计算的批处理和流处理融合为一体.但是,现有的针对大数据计算的集群资源调度框架,要么面向流处理,要么面向批处理,不适合批处理与流处理作业共享集群资源的需求.另外,GPU用于大数据分析计算时,由于缺乏有效的CPU-GPU资源解耦方式,降低了资源使用效率.在分析现有的集群资源调度框架的基础上,设计并实现了一种可以感知批处理/流处理应用的混合式资源调度框架HRM.它以共享状态架构为基础,采用乐观封锁协议和悲观封锁协议相结合的方式,确保流处理作业和批处理作业的不同资源要求.在计算节点上,提供CPU-GPU资源的灵活绑定,采用队列堆叠技术,不但满足流处理作业的实时性需求,也减少了反馈延迟并实现了GPU资源的共享.通过模拟大规模作业的调度,结果显示,HRM的调度延迟只有集中式调度框架的75%左右;使用实际负载测试,批处理与流处理共享集群时,使用HRM调度框架,CPU资源利用率提高25%以上;而使用细粒度作业调度方法,不但GPU利用率提高2倍以上,作业的完成时间也能够减少50%左右. 展开更多
关键词 数据流模型 批处理 流处理 作业感知 CPU-GPU 队列堆叠
在线阅读 下载PDF
一种具有动态可重构数据流的混合矩阵向量处理器
6
作者 艾晨阳 赵乐川 +2 位作者 华涛 王新安 王颖 《计算机工程与科学》 北大核心 2025年第11期1912-1921,共10页
脉动阵列作为通用矩阵乘法(GEMM)算子的高能效加速器,受到了学术界和工业界广泛关注。然而,它往往占用大量面积,并且通常需要VPU单元配合使用,这种组合经常出现在神经网络加速器中。此外,它还存在时间空间利用率低、端到端场景性能有限... 脉动阵列作为通用矩阵乘法(GEMM)算子的高能效加速器,受到了学术界和工业界广泛关注。然而,它往往占用大量面积,并且通常需要VPU单元配合使用,这种组合经常出现在神经网络加速器中。此外,它还存在时间空间利用率低、端到端场景性能有限等问题。为了解决这些问题,通过结合脉动阵列与向量处理器,提出了一种脉动向量处理器HVSA。通过对VPU中存储、广播和通道间通信单元进行复用,HVSA可在阵列的形状和数据流方面进行可重构配置,可以在可接受的硬件面积开销的前提下,更有效地支持GEMM和向量运算。同时提出了适用于HVSA的端到端编译框架,包括基于MLIR的编译前端、数据流调度和兼容RISC-V向量扩展的编程模型。实验数据表明,与同等面积的脉动阵列相比,HVSA计算速度提升了30.30倍。在端到端应用中,相比同等面积的“VPU+脉动阵列”,HVSA的平均运行时间缩短为原来的约4.7%,能耗减少约58.7%。 展开更多
关键词 通用矩阵乘法 向量运算 脉动阵列 向量处理单元 数据流调度 编译器
在线阅读 下载PDF
可重构CNN处理器的高效能自适应映射策略
7
作者 常立博 武丹妮 +3 位作者 杜慧敏 张盛兵 郝鹏 蔡秀霞 《计算机辅助设计与图形学学报》 北大核心 2025年第7期1157-1169,共13页
针对因CNN模型巨大的参数规模和数据访问量,及不同CNN模型或同一模型中不同层的计算模式存在多样性,导致其仅可支持单一或固定映射方式及片上数据缓存的计算系统整体效能较低的问题,提出软硬件协同设计策略.将基于深度强化学习的自适应... 针对因CNN模型巨大的参数规模和数据访问量,及不同CNN模型或同一模型中不同层的计算模式存在多样性,导致其仅可支持单一或固定映射方式及片上数据缓存的计算系统整体效能较低的问题,提出软硬件协同设计策略.将基于深度强化学习的自适应访存优化机制与片上弹性缓存动态划分方法结合,根据可重构CNN处理器中存储结构相关参数,针对不同CNN运算层自动搜索最优的循环调度策略;并通过设计可重构片上互联结构、地址映射逻辑以及动态存储调度方法,使片上弹性缓存可根据不同调度策略动态划分地址映射空间.在基于Eyeriss和TPU的CNN处理器构架上,与对比的调度策略相比,采用所提方法可分别将2种可重构CNN处理器的效能提升约3倍和4倍;并且,采用相同的调度策略,与固定容量双缓存结构相比,文中的弹性存储划分方法可分别将功耗减少30.28%和18.43%.与基于FPGA平台的相关研究相比,文中可重构CNN处理器将计算效率和计算效能分别提高了约10倍和2倍. 展开更多
关键词 卷积神经网络模型映射器 卷积神经网络模型数据流 深度强化学习 片上弹性缓存
在线阅读 下载PDF
基于数据流架构的雷达信号调制方式识别加速 被引量:3
8
作者 黄湘松 王振 潘大鹏 《实验技术与管理》 CAS 北大核心 2024年第5期23-30,共8页
在雷达电子战中,快速并准确地识别敌方雷达信号调制技术对于获得战术优势至关重要,而传统依赖于图形处理单元(graphics processing unit,GPU)的识别方法难以满足此应用场景的低延迟要求。为此,该文设计了一种基于数据流架构(dataflow ar... 在雷达电子战中,快速并准确地识别敌方雷达信号调制技术对于获得战术优势至关重要,而传统依赖于图形处理单元(graphics processing unit,GPU)的识别方法难以满足此应用场景的低延迟要求。为此,该文设计了一种基于数据流架构(dataflow architecture,DF)的雷达信号调制方式识别加速系统。该系统通过对卷积神经网络权值进行二值化来减少模型参数,便于将算法部署到现场可编程门阵列(field-programmablegatearray,FPGA),同时采用数据流架构加快雷达信号调制方式的识别过程。实验结果表明,在确保整体识别准确率的前提下,该加速系统的推理速度相比i7-11800H CPU提升44.43倍,相比RTX 3050Ti GPU提升2.59倍,系统功耗仅为1.724 W。 展开更多
关键词 调制方式识别 深度学习 数据流架构 二值化神经网络 硬件部署
在线阅读 下载PDF
Dual networks with hierarchical attention for fine-grained image classification
9
作者 YANG Tao WANG Gaihua 《中国科学院大学学报(中英文)》 2025年第6期806-813,共8页
In this paper,we propose hierarchical attention dual network(DNet)for fine-grained image classification.The DNet can randomly select pairs of inputs from the dataset and compare the differences between them through hi... In this paper,we propose hierarchical attention dual network(DNet)for fine-grained image classification.The DNet can randomly select pairs of inputs from the dataset and compare the differences between them through hierarchical attention feature learning,which are used simultaneously to remove noise and retain salient features.In the loss function,it considers the losses of difference in paired images according to the intra-variance and inter-variance.In addition,we also collect the disaster scene dataset from remote sensing images and apply the proposed method to disaster scene classification,which contains complex scenes and multiple types of disasters.Compared to other methods,experimental results show that the DNet with hierarchical attention is robust to different datasets and performs better. 展开更多
关键词 dual network(DNet) fine-grained image classification hierarchical attention features
在线阅读 下载PDF
新一代神威处理器上高效任务流并行系统 被引量:1
10
作者 傅游 杜雷明 +1 位作者 高希然 陈莉 《计算机科学》 CSCD 北大核心 2024年第12期137-146,共10页
我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型。顺序任务流(Sequential Task Flow,STF)模型基于数据流信息... 我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型。顺序任务流(Sequential Task Flow,STF)模型基于数据流信息实现对串行程序的自动任务并行,并通过任务间的细粒度同步实现异步并行,相比于BSP模型的全局同步,并行度更高,负载更均衡。STF模型为用户高效使用神威平台提供了一种新选择。但在众核系统上,STF模型的运行时开销会直接影响并行程序性能。首先,分析新一代神威处理器影响STF模型高效实现的两个特征;然后,利用处理器架构的独有特性,提出一种基于代理的数据流构图机制以实现模型的构图需求,以及一种无锁的集中式任务调度机制以优化调度开销。最后,基于以上技术,为AceMesh模型实现了高效的任务流并行系统。实验表明,实现的任务流并行系统相比传统运行时支持优势显著,在细粒度任务场景下最高加速2.37倍;AceMesh性能高于神威平台的OpenACC模型,对典型应用的加速最高达到2.07倍。 展开更多
关键词 顺序任务流模型 异构众核并行 任务调度 数据流并行 块同步模型
在线阅读 下载PDF
基于Actor模型的众核数据流硬件架构探索
11
作者 张家豪 邓金易 +2 位作者 尹首一 魏少军 胡杨 《计算机工程与科学》 CSCD 北大核心 2024年第6期959-967,共9页
超大规模AI模型的分布式训练对芯片架构的通信能力和可扩展性提出了挑战。晶圆级芯片通过在同一片晶圆上集成大量的计算核心和互联网络,实现了超高的计算密度和通信性能,成为了训练超大规模AI模型的理想选择。AMCoDA是一种基于Actor模... 超大规模AI模型的分布式训练对芯片架构的通信能力和可扩展性提出了挑战。晶圆级芯片通过在同一片晶圆上集成大量的计算核心和互联网络,实现了超高的计算密度和通信性能,成为了训练超大规模AI模型的理想选择。AMCoDA是一种基于Actor模型的众核数据流硬件架构,旨在利用Actor并行编程模型的高度并行性、异步消息传递和高扩展性等特点,在晶圆级芯片上实现AI模型的分布式训练。AMCoDA的设计包括计算模型、执行模型和硬件架构3个层面。实验表明,AMCoDA能广泛支持分布式训练中的各种并行模式和集合通信模式,灵活高效地完成复杂分布式训练策略的部署和执行。 展开更多
关键词 晶圆级芯片 分布式训练 Actor模型 众核数据流架构
在线阅读 下载PDF
空间加速器的受约束数据流建模与评估框架 被引量:1
12
作者 贺裕兴 王腾 +1 位作者 滕文彬 宫磊 《计算机工程与应用》 CSCD 北大核心 2024年第17期74-88,共15页
将张量计算任务部署在空间加速器上已被证明能有效提高其执行速度和效率。为了在空间加速器上高效地进行张量计算,学术界提出了一系列数据流建模与评估框架。这些框架能够快速评估数据流,以便进行高效的设计空间探索。然而,这些框架缺... 将张量计算任务部署在空间加速器上已被证明能有效提高其执行速度和效率。为了在空间加速器上高效地进行张量计算,学术界提出了一系列数据流建模与评估框架。这些框架能够快速评估数据流,以便进行高效的设计空间探索。然而,这些框架缺乏对硬件结构的细粒度描述,因此无法有效地建模硬件结构对数据流的约束,从而无法有效地探索受到真实加速器硬件结构限制的数据流设计空间。为了解决这一问题,对硬件结构进行了细粒度建模,采用多层次的空间加速器硬件结构作为模板。每一层都包括阵列结构、存储结构和互连网络结构三部分,以分别描述硬件结构对数据流在空间展开、存储容量和数据传输方式方面的限制。提出了一种计算任务和数据流建模方法,该方法能够有效地求解数据流对硬件资源的需求。基于此,提出了一个数据流评估框架,包括需求分析、约束分析和性能分析三部分。需求分析用于求解计算任务和数据流对硬件资源的需求;约束分析旨在检查数据流是否违反硬件结构约束;性能分析用于评估数据流的延迟、数据重用和资源利用率等性能指标。实验结果表明,与之前最先进的评估框架相比,提出的框架在延迟评估方面的误差有所降低,并且能够有效地支持对受限数据流设计空间的探索。 展开更多
关键词 张量计算 空间加速器 数据流 建模与评估 设计空间探索
在线阅读 下载PDF
DNN在位级可组合架构上的数据流优化方法
13
作者 高汉源 宫磊 王腾 《计算机工程与应用》 CSCD 北大核心 2024年第18期147-157,共11页
位级可组合架构用于支持有多种数据位宽类型的神经网络计算。其硬件结构有较多变体,面对不同神经网络模型需额外设计程序调度。过程耗时,阻碍软硬件的快速迭代和部署,效果难以评估。相关的数据流建模工作缺乏位级计算描述和自动化方法... 位级可组合架构用于支持有多种数据位宽类型的神经网络计算。其硬件结构有较多变体,面对不同神经网络模型需额外设计程序调度。过程耗时,阻碍软硬件的快速迭代和部署,效果难以评估。相关的数据流建模工作缺乏位级计算描述和自动化方法。提出了基于数据流建模的自适应位级可组合架构上的数据调度优化方法解决上述问题。引入位级数据流建模,以多种循环原语和张量-索引关系矩阵,描述位级可组合硬件结构的特征和应用的数据调度过程。从建模表达中提取数据访问信息,统计数据复用情况,进行快速评估。构建了设计空间探索框架,针对不同应用和硬件设计约束自适应优化数据调度过程。利用索引匹配方法和循环变换方法进行设计采样,添加贪心规则进行剪枝,以提高探索效率。在多个应用程序和多种硬件结构约束下进行实验。结果表明对比先进的手动设计的加速器和数据调度,获得了更好的性能表现。 展开更多
关键词 神经网络加速器 可变位宽 数据流 设计空间探索
在线阅读 下载PDF
基于污点分析的源代码脆弱性检测技术 被引量:12
14
作者 孔德光 郑烇 +2 位作者 帅建梅 陈超 葛瑶 《小型微型计算机系统》 CSCD 北大核心 2009年第1期78-82,共5页
基于源代码的静态分析技术是检测软件脆弱性的一种重要手段.针对不可信数据输入导致软件脆弱性的问题,提出一种基于污点分析的脆弱性检测方法.通过跟踪程序参数、环境变量等各种外部输入,标记输入的类型,在构造控制流图基础上,利用数据... 基于源代码的静态分析技术是检测软件脆弱性的一种重要手段.针对不可信数据输入导致软件脆弱性的问题,提出一种基于污点分析的脆弱性检测方法.通过跟踪程序参数、环境变量等各种外部输入,标记输入的类型,在构造控制流图基础上,利用数据流分析中的相关信息,污点传播至各类脆弱性函数,从而解决缓冲区溢出、格式化字符串等问题.利用控制流、数据流分析的相关信息,提高了准确率,降低了漏报率.实验表明,该技术是一种有效的脆弱性分析方法. 展开更多
关键词 污点分析 控制流 数据流 脆弱性
在线阅读 下载PDF
一种适用于软件雷达系统的数据流驱动机制 被引量:15
15
作者 周鸣昕 汤俊 +1 位作者 彭应宁 苏炳宇 《系统工程与电子技术》 EI CSCD 北大核心 2002年第10期112-115,共4页
针对雷达信号处理各功能模块之间显著的流水性特征 ,结合一个通用的雷达信号处理系统———由清华大学研制的通用高速实时雷达信号处理系统的实验样机DSM(dataflow ,sharedmemoryandmultiplebusinterconnec tion) ,在研究现有静态、动... 针对雷达信号处理各功能模块之间显著的流水性特征 ,结合一个通用的雷达信号处理系统———由清华大学研制的通用高速实时雷达信号处理系统的实验样机DSM(dataflow ,sharedmemoryandmultiplebusinterconnec tion) ,在研究现有静态、动态数据流驱动机制特点的基础上 ,提出了一种新型的适用于软件雷达系统的进程间准动态数据流驱动机制 ,并针对一个雷达信号处理的范例程序说明了编译器数据流驱动表的生成和系统数据流驱动的过程。 展开更多
关键词 软件 雷达系统 数据流 驱动机制 编译器 雷达信号处理 并行处理
在线阅读 下载PDF
COStream:一种面向数据流的编程语言和编译器实现 被引量:10
16
作者 张维维 魏海涛 +3 位作者 于俊清 李鹤 黎昊 杨秋吉 《计算机学报》 EI CSCD 北大核心 2013年第10期1993-2006,共14页
数据流编程模型作为高效的并行编程模型被广泛应用于媒体处理和网络服务等应用中.然而,多/众核结构的底层计算、存储和通信的复杂性对数据流程序的性能提出了新的挑战,数据流程序在不同的多/众核结构上的可移植性和可编程性也为编译器... 数据流编程模型作为高效的并行编程模型被广泛应用于媒体处理和网络服务等应用中.然而,多/众核结构的底层计算、存储和通信的复杂性对数据流程序的性能提出了新的挑战,数据流程序在不同的多/众核结构上的可移植性和可编程性也为编译器提出了更高的要求.针对数据流程序所面临的问题,提出并设计实现一种数据流编程模型——COStream数据流编程语言及其编译系统,提高了数据流程序的可编程性.COStream在C语言文法的基础上加入表征数据流图的文法结构,文法结构清晰,具有良好的可重用性和可扩展性.COStream编译系统利用同步数据流图作为中间表示,根据目标系统的结构特点对数据流程序进行并行优化并构造流水线调度,进而生成高效的可并行执行的目标代码.在X86多核架构下实现了COStream编译系统,并对该领域的多个实验程序进行了测试,测试结果表明,COStream具有良好的可扩展性和高加速比. 展开更多
关键词 多核处理器 数据流 编译 COStream
在线阅读 下载PDF
事件触发并发数据流模型 被引量:17
17
作者 王瑞荣 汪乐宇 《软件学报》 EI CSCD 北大核心 2003年第3期409-414,共6页
DHDF(动态纯数据流)是许多图形化编程平台的核心.由于它的自然属性(数据驱动)与操作系统事件驱动模型不能很好地结合,导致了两个明显的不足:运行效率低,CPU占用率高;对外部事件响应速度慢,系统实时性差.提出了一种ECDF(事件触发并发数据... DHDF(动态纯数据流)是许多图形化编程平台的核心.由于它的自然属性(数据驱动)与操作系统事件驱动模型不能很好地结合,导致了两个明显的不足:运行效率低,CPU占用率高;对外部事件响应速度慢,系统实时性差.提出了一种ECDF(事件触发并发数据流)模型,并给出了该模型的文法描述以及调度算法.ECDF模型通过引入多优先级线程以及事件触发机制,在很大程度上提高了系统的实时性与运行效率.以测试系统为背景,对有关应用实例进行测试与分析,结果表明,与DHDF模型相比,ECDF模型使系统的性能在不同条件下都得到了相应的提高.该模型特别适用于处理突发性高速数据流,也适用于Reactive系统设计. 展开更多
关键词 数据流 图形化编程 虚拟仪器 实时系统 数据流可视化语言
在线阅读 下载PDF
一种路径敏感的静态缺陷检测方法 被引量:29
18
作者 肖庆 宫云战 +2 位作者 杨朝红 金大海 王雅文 《软件学报》 EI CSCD 北大核心 2010年第2期209-217,共9页
提出一种多项式复杂度的路径敏感静态缺陷检测算法.该方法采用变量的抽象取值范围来表示属性状态条件,通过属性状态条件中的变量抽象取值范围为空来判断不可达路径.在控制流图(control flow graph,简称CFG)中的汇合节点上合并相同属性... 提出一种多项式复杂度的路径敏感静态缺陷检测算法.该方法采用变量的抽象取值范围来表示属性状态条件,通过属性状态条件中的变量抽象取值范围为空来判断不可达路径.在控制流图(control flow graph,简称CFG)中的汇合节点上合并相同属性状态的状态条件,从而避免完整路径上下文分析的组合爆炸问题.该算法已应用于缺陷检测系统DTS(defect testing system).实际测试结果表明,该方法能够减少误报. 展开更多
关键词 缺陷检测 静态分析 路径敏感 数据流分析 程序分析
在线阅读 下载PDF
电网规划管理信息系统数据库的研究与实现 被引量:21
19
作者 杜旭 申刚 +2 位作者 刘中胜 刘玮 徐英虎 《电力系统及其自动化学报》 CSCD 北大核心 2013年第2期163-166,共4页
针对电网规划涉及的基础数据等一系列困难,结合电力信息系统的现状,应用系统学的分析方法和系统集成思路,研究并提出了电网规划基础数据库的设计思路,以及各类规划相关数据在系统中的信息流转流程。应用上述成果,完成了电网规划信息系... 针对电网规划涉及的基础数据等一系列困难,结合电力信息系统的现状,应用系统学的分析方法和系统集成思路,研究并提出了电网规划基础数据库的设计思路,以及各类规划相关数据在系统中的信息流转流程。应用上述成果,完成了电网规划信息系统数据库的搭建和高级功能的研发。实际应用表明,文中研究成果能够有效整合现有数据资源,保证规划基础数据的正确性和时效性,强力支撑规划高级功能的应用。 展开更多
关键词 规划管理信息系统 基础数据库 数据流 电网规划 时效性
在线阅读 下载PDF
两种网络安全管理系统的生存性定量分析方法 被引量:27
20
作者 包秀国 胡铭曾 +1 位作者 张宏莉 张绍瑞 《通信学报》 EI CSCD 北大核心 2004年第9期34-41,共8页
虽然通信网络生存性分析技术已经发展多年,但对大量的通信网络之上的各种分布式应用系统,如网络安全管理系统(NSMS)的生存性评估技术尚无有效的方法。本文提出两种评估NSMS生存性的方法。第一种方法建立基于数据流的图模型,通过图的连... 虽然通信网络生存性分析技术已经发展多年,但对大量的通信网络之上的各种分布式应用系统,如网络安全管理系统(NSMS)的生存性评估技术尚无有效的方法。本文提出两种评估NSMS生存性的方法。第一种方法建立基于数据流的图模型,通过图的连通性计算生存性。第二种方法建立基于数据流的过程模型,通过Monte Carlo实验数据的统计估算生存性。我们的经验表明:随着网格技术的发展,第二种方法用于复杂系统的生存性定量分析是可行的。 展开更多
关键词 生存性分析 网络安全管理 数据流 割集 Monte-Carlo
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部