期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
多核数字信号处理器并行矩阵转置算法优化 被引量:3
1
作者 裴向东 王庆林 +4 位作者 廖林玉 李荣春 梅松竹 刘杰 庞征斌 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期57-66,共10页
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强... 矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 展开更多
关键词 多核DSP 矩阵转置 并行算法 算法优化
在线阅读 下载PDF
多核数字信号处理器矩阵乘卷积算法性能评测 被引量:2
2
作者 王庆林 裴向东 +4 位作者 廖林玉 王浩旭 李荣春 梅松竹 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期86-94,共9页
矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提... 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv。该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能。实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速。 展开更多
关键词 多核数字信号处理器 卷积神经网络 卷积算法 算法优化
在线阅读 下载PDF
一种新型的抗DPA攻击可配置逻辑结构 被引量:3
3
作者 乐大珩 张民选 +2 位作者 李少青 孙岩 谷晓忱 《电子学报》 EI CAS CSCD 北大核心 2011年第2期453-457,共5页
DPA(Differential Power Analysis)攻击的强度取决于芯片电路功耗与所处理的数据之间的相关性以及攻击者对算法电路实现细节的了解程度.本文结合动态差分逻辑和可配置逻辑的特点,提出了一种具有抗DPA攻击能力的双端输出可配置逻辑(DRCL:... DPA(Differential Power Analysis)攻击的强度取决于芯片电路功耗与所处理的数据之间的相关性以及攻击者对算法电路实现细节的了解程度.本文结合动态差分逻辑和可配置逻辑的特点,提出了一种具有抗DPA攻击能力的双端输出可配置逻辑(DRCL:Dual-Rail Configurable Logic).该逻辑一方面具有与数据取值无关的信号翻转率和信号翻转时刻,因而能够实现很好的功耗恒定特性;另一方面去除了电路结构与电路功能之间的相关性,从而可以阻止攻击者通过版图逆向分析的方法窃取算法电路实现细节.实验结果表明,DRCL比典型的抗DPA攻击逻辑WDDL(Wave Dynamic Differential Logic)具有更好的功耗恒定性,因而具有更强的DPA攻击防护性能. 展开更多
关键词 安全芯片 旁路攻击 功耗分析攻击 动态差分逻辑 可配置逻辑
在线阅读 下载PDF
蛋白质相互作用网络的几种聚类方法综述 被引量:3
4
作者 王正华 董蕴源 王勇献 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第4期81-86,共6页
蛋白质相互作用网络是后基因组时代系统生物学研究的重要内容。针对蛋白质相互作用网络中的聚类问题,介绍了几种代表性的聚类分析方法,初步分析了这些方法的特点,指出了当前研究工作的困难与挑战,并对今后的研究方向作了展望。
关键词 蛋白质相互作用网络 谱聚类 信息流模拟聚类 整体聚类
在线阅读 下载PDF
基于LBDL逻辑的抗DPA攻击电路设计方法 被引量:3
5
作者 乐大珩 李少青 张民选 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第6期18-24,共7页
动态差分逻辑是一种典型的电路级差分功耗攻击(DPA)防护技术。这种技术通过使逻辑门保持恒定的翻转率来降低电路功耗与数据信号之间的相关性。介绍了一种新型的、基于查找表(Look-Up-Table,LUT)结构的动态差分逻辑(LBDL),以及基于这种... 动态差分逻辑是一种典型的电路级差分功耗攻击(DPA)防护技术。这种技术通过使逻辑门保持恒定的翻转率来降低电路功耗与数据信号之间的相关性。介绍了一种新型的、基于查找表(Look-Up-Table,LUT)结构的动态差分逻辑(LBDL),以及基于这种逻辑的集成电路设计方法。该设计方法仅需在传统的半定制设计流程中添加少量的替换操作就可以实现,因而比其他完全需要全定制设计的动态差分逻辑具有更好的实用性。而相对同样适用于半定制实现的动态差分逻辑WDDL(Wave Dynamic Differential Logic),LBDL逻辑解决了逻辑门翻转时刻与数据信号之间的相关性,从而比WDDL逻辑具有更好的功耗恒定性。实验结果表明,该设计方法能够有效实现具有抗DPA攻击性能的电路。 展开更多
关键词 安全芯片 DPA攻击 动态差分逻辑
在线阅读 下载PDF
适合可变剪接研究的转录组序列分析策略 被引量:1
6
作者 王正志 李稚锋 +4 位作者 杭兴宜 毛逸清 骆志刚 赵东升 张成岗 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第4期37-42,共6页
规模化基因表达实验所产生的大量与生物组织特定时空状态相关的cDNA和表达序列标签(EST)等信息可用于新基因的发现、基因表达模式分析和基因组的注释,从而可为转录组研究提供实验设计和结果分析的参考标准。真核基因可变剪接的普遍性及... 规模化基因表达实验所产生的大量与生物组织特定时空状态相关的cDNA和表达序列标签(EST)等信息可用于新基因的发现、基因表达模式分析和基因组的注释,从而可为转录组研究提供实验设计和结果分析的参考标准。真核基因可变剪接的普遍性及其在机体生理与病理过程中的重要作用,使得可变剪接的系统分析已成为功能基因组研究中的热点之一。在面临海量表达数据的指数增长和不断有新的基因组获得测序的情况下,实现转录组序列分析的规模化、自动化计算迫在眉睫。讨论不同转录组分析系统中的数据分析算法及其计算需求,并提出适用于大规模可变剪接分析的策略。 展开更多
关键词 转录组 EST聚类 EST装配 可变剪接 高性能计算
在线阅读 下载PDF
一种支持负载平衡的常数度DHT ID分配方法
7
作者 王小海 彭宇行 李东升 《电子学报》 EI CAS CSCD 北大核心 2010年第11期2649-2654,共6页
能够支持负载均衡的ID分配方法是实现与维护DHT overlay的基础,已有常数度DHT多采用纯集中式或纯分布式方法,不能很好地解决拓扑信息维护开销与拓扑平衡程度这一矛盾.针对这一不足,在分析拓扑中通用树结构的基础上,本文提出了基于内在结... 能够支持负载均衡的ID分配方法是实现与维护DHT overlay的基础,已有常数度DHT多采用纯集中式或纯分布式方法,不能很好地解决拓扑信息维护开销与拓扑平衡程度这一矛盾.针对这一不足,在分析拓扑中通用树结构的基础上,本文提出了基于内在结构Routing Forest的ID分配方法RFIDAM,通过规律性地聚合局部平衡信息来指导新节点的加入以实现拓扑平衡.实验表明,通过引入少量维护与路由开销,该方法使得拓扑达到节点ID长度差小于2的最优平衡目标. 展开更多
关键词 P2P DHT ID分配 常数度拓扑 负载平衡 ROUTING FOREST
在线阅读 下载PDF
DSF:一种时序约束下的快速数据分发算法
8
作者 吴吉庆 彭宇行 刘锋 《电子学报》 EI CAS CSCD 北大核心 2012年第2期365-370,共6页
时序约束下的大规模数据分发在互联网环境下有着越来越广泛的应用.现有的系统大多采用mesh结构组织结点,并通过运行在请求结点的调度算法来控制数据的分发.但请求结点只依据自身的需求来调度数据,并不能保证系统的整体服务效果.本文以... 时序约束下的大规模数据分发在互联网环境下有着越来越广泛的应用.现有的系统大多采用mesh结构组织结点,并通过运行在请求结点的调度算法来控制数据的分发.但请求结点只依据自身的需求来调度数据,并不能保证系统的整体服务效果.本文以改善整体服务效果为目标,提出一种面向服务结点的调度算法———时序约束下的快速分发算法DSF(Deadline Sensitive Fast distribution).该算法的基本思想是:当服务结点面临多个邻居结点的多个数据请求时,选择系统最迫切需要的数据,优先传输给继续服务能力较强的结点,以达到减少迟到数据比例、提高数据传输率、优化系统持续服务能力的目的.实验结果表明,与面向请求结点的调度算法相比,DSF在流传输质量、分发速率、负载均衡等方面均具有较好的特性. 展开更多
关键词 数据分发 时序约束 调度
在线阅读 下载PDF
双重非均匀子群参数制作研究
9
作者 黄冬 袁媛 +2 位作者 张乾 李颂 梁越超 《原子能科学技术》 EI CAS CSCD 北大核心 2022年第1期22-30,共9页
弥散颗粒燃料元件中燃料颗粒以随机形式弥散在基体中,难以获得确定几何。同时由于共振自屏现象的存在,呈现出一种双重非均匀系统。当前均匀系统产生的共振积分在双重非均匀系统中使用时,会在较低的共振能群产生一定的共振计算误差。为... 弥散颗粒燃料元件中燃料颗粒以随机形式弥散在基体中,难以获得确定几何。同时由于共振自屏现象的存在,呈现出一种双重非均匀系统。当前均匀系统产生的共振积分在双重非均匀系统中使用时,会在较低的共振能群产生一定的共振计算误差。为满足现有组件计算程序直接进行双重非均匀性共振计算的需求。基于Sanchez-Pomraning模型下的特征线固定源计算方法,建立一套双重非均匀共振积分表,最后结合子群方法实现随机介质燃料元件的共振计算。数值结果表明,考虑双重非均匀性产生的积分表,在相同的输运条件下和积分表的适用范围内,由子群共振部分对k_(eff)计算带来的绝对偏差能保持在200 pcm内。该工作的意义是对于一些不宜改动的传统组件程序,如HELIOS,通过在线修改共振积分表和子群参数,从而使其直接进行弥散颗粒燃料问题的计算成为可能。 展开更多
关键词 弥散颗粒燃料 共振自屏 双重非均匀积分表 Sanchez模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部