期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
多核数字信号处理器并行矩阵转置算法优化 被引量:6
1
作者 裴向东 王庆林 +4 位作者 廖林玉 李荣春 梅松竹 刘杰 庞征斌 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期57-66,共10页
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强... 矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 展开更多
关键词 多核DSP 矩阵转置 并行算法 算法优化
在线阅读 下载PDF
多核数字信号处理器矩阵乘卷积算法性能评测 被引量:2
2
作者 王庆林 裴向东 +4 位作者 廖林玉 王浩旭 李荣春 梅松竹 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期86-94,共9页
矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提... 矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor,DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv。该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能。实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速。 展开更多
关键词 多核数字信号处理器 卷积神经网络 卷积算法 算法优化
在线阅读 下载PDF
面向飞腾多核处理器的Winograd快速卷积算法优化 被引量:10
3
作者 王庆林 李东升 +2 位作者 梅松竹 赖志权 窦勇 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1140-1151,共12页
随着深度学习的快速发展,卷积神经网络已广泛应用于计算机视觉、自然语言处理等人工智能领域中.Winograd快速卷积算法因能有效降低卷积神经网络中卷积操作的计算复杂度而受到广泛关注.随着国防科技大学自主研制的飞腾多核处理器在智能... 随着深度学习的快速发展,卷积神经网络已广泛应用于计算机视觉、自然语言处理等人工智能领域中.Winograd快速卷积算法因能有效降低卷积神经网络中卷积操作的计算复杂度而受到广泛关注.随着国防科技大学自主研制的飞腾多核处理器在智能领域的推广应用,对面向飞腾多核处理器的高性能卷积实现提出了强烈需求.针对飞腾多核处理器的体系结构特征与Wingorad快速卷积算法的计算特点,提出了一种高性能并行Winograd快速卷积算法.该算法不依赖通用矩阵乘库函数,由卷积核转换、输入特征图转换、逐元素乘、输出特征图逆变换等4个部分构成,融合设计了4个部分的数据操作,并设计了与之配套的数据布局、多级并行数据转换算法与多级并行矩阵乘算法,实现访存性能以及算法整体性能的提升.在两款飞腾多核处理器上的测试结果显示,与开源库ACL和NNPACK中的Winograd快速卷积实现相比,该算法分别能获得1.05~16.11倍与1.66~16.90倍的性能加速;集成到开源框架Mxnet后,该算法使得VGG16网络的前向计算获得了3.01~6.79倍的性能加速. 展开更多
关键词 多核CPU 深度学习 卷积神经网络 Winograd算法 并行算法
在线阅读 下载PDF
大规模集群硬盘故障预测可迁移性研究
4
作者 胡思源 徐尔茨 +2 位作者 李东升 刘锋 张一鸣 《小型微型计算机系统》 CSCD 北大核心 2024年第2期505-512,共8页
硬盘驱动器(HDD)仍然是大型数据中心与超算中心主要和重要的存储部件,而存储集群规模地持续扩大对硬盘故障预测的研究不断提出挑战.当前,前人已使用统计学、机器学习和深度学习等不同类型的故障预测方法用于大规模存储集群的硬盘故障预... 硬盘驱动器(HDD)仍然是大型数据中心与超算中心主要和重要的存储部件,而存储集群规模地持续扩大对硬盘故障预测的研究不断提出挑战.当前,前人已使用统计学、机器学习和深度学习等不同类型的故障预测方法用于大规模存储集群的硬盘故障预测,并取得不俗的研究结果.但是,对于故障模型的迁移性与数据集差异的相关研究还较少.我们收集了多种类型的HDD数据集与基于不同策略的模型,对其进行交叉实验验证,在模型迁移性、数据集预处理和模型参数方面获得了相关实验结果,例如:数据集在回溯时间与平衡度上的设置显著影响一定程度的预测模型性能,而模型参数设置则并不敏感;模型在不同数据集之间的可迁移性强弱不定,而数据集特征类型和数量的选择更影响预测模型性能. 展开更多
关键词 硬盘故障 故障预测 机器学习与深度学习 迁移性 数据集处理
在线阅读 下载PDF
基于RefSeq数据库的人类标准转录数据集的构建 被引量:6
5
作者 李稚锋 李玉鉴 +4 位作者 赵东升 杭兴宜 王正志 骆志刚 张成岗 《遗传》 CAS CSCD 北大核心 2006年第3期329-333,共5页
美国国家生物信息技术中心(NCBI)提供了具有生物意义上的非冗余的基因和蛋白质序列的RefSeq参考序列数据库。然而,由于基因普遍存在的多态性以及不同实验室对于序列测定的质量控制存在差异等原因,已发现RefSeq数据库可能存在部分质量问... 美国国家生物信息技术中心(NCBI)提供了具有生物意义上的非冗余的基因和蛋白质序列的RefSeq参考序列数据库。然而,由于基因普遍存在的多态性以及不同实验室对于序列测定的质量控制存在差异等原因,已发现RefSeq数据库可能存在部分质量问题。文章基于“中心法则”提出“标准转录数据集”的概念,以人类基因和基因组序列为例,利用BLAT、Sim4和自行设计的EIparser等基因结构解析程序分析了RefSeq人类基因转录数据(2005-4-18)与目前所公布的人类标准基因组(2005-4-20)的对应关系。对于有实验证据支持的标记为NM_和NR_的记录,多种程序分析结果表明,其与标准基因组完全相对应的记录为9 771个;符合多个程序修订标准的记录有10 943个;而与标准基因组有较大差异的记录为203个,多种程序分析结果不一致的记录为2 676个,提示研究人员在使用此非标准转录组数据时,必须考虑到其存在非标准转录的原因甚至存在错误的可能性。此文为基于标准、高质量转录数据集的生物信息学数据分析、分子生物学实验设计、基因多样性和遗传变异分析等提供了重要的参考标准。相关结果可通过http://biocompute.bmi.ac.cn/transcriptome/index.htm访问。 展开更多
关键词 RefSeq数据库 转录组 质量控制 人类标准转录数据集
在线阅读 下载PDF
一种新型的抗DPA攻击可配置逻辑结构 被引量:3
6
作者 乐大珩 张民选 +2 位作者 李少青 孙岩 谷晓忱 《电子学报》 EI CAS CSCD 北大核心 2011年第2期453-457,共5页
DPA(Differential Power Analysis)攻击的强度取决于芯片电路功耗与所处理的数据之间的相关性以及攻击者对算法电路实现细节的了解程度.本文结合动态差分逻辑和可配置逻辑的特点,提出了一种具有抗DPA攻击能力的双端输出可配置逻辑(DRCL:... DPA(Differential Power Analysis)攻击的强度取决于芯片电路功耗与所处理的数据之间的相关性以及攻击者对算法电路实现细节的了解程度.本文结合动态差分逻辑和可配置逻辑的特点,提出了一种具有抗DPA攻击能力的双端输出可配置逻辑(DRCL:Dual-Rail Configurable Logic).该逻辑一方面具有与数据取值无关的信号翻转率和信号翻转时刻,因而能够实现很好的功耗恒定特性;另一方面去除了电路结构与电路功能之间的相关性,从而可以阻止攻击者通过版图逆向分析的方法窃取算法电路实现细节.实验结果表明,DRCL比典型的抗DPA攻击逻辑WDDL(Wave Dynamic Differential Logic)具有更好的功耗恒定性,因而具有更强的DPA攻击防护性能. 展开更多
关键词 安全芯片 旁路攻击 功耗分析攻击 动态差分逻辑 可配置逻辑
在线阅读 下载PDF
蛋白质相互作用网络的几种聚类方法综述 被引量:3
7
作者 王正华 董蕴源 王勇献 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第4期81-86,共6页
蛋白质相互作用网络是后基因组时代系统生物学研究的重要内容。针对蛋白质相互作用网络中的聚类问题,介绍了几种代表性的聚类分析方法,初步分析了这些方法的特点,指出了当前研究工作的困难与挑战,并对今后的研究方向作了展望。
关键词 蛋白质相互作用网络 谱聚类 信息流模拟聚类 整体聚类
在线阅读 下载PDF
基于LBDL逻辑的抗DPA攻击电路设计方法 被引量:3
8
作者 乐大珩 李少青 张民选 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第6期18-24,共7页
动态差分逻辑是一种典型的电路级差分功耗攻击(DPA)防护技术。这种技术通过使逻辑门保持恒定的翻转率来降低电路功耗与数据信号之间的相关性。介绍了一种新型的、基于查找表(Look-Up-Table,LUT)结构的动态差分逻辑(LBDL),以及基于这种... 动态差分逻辑是一种典型的电路级差分功耗攻击(DPA)防护技术。这种技术通过使逻辑门保持恒定的翻转率来降低电路功耗与数据信号之间的相关性。介绍了一种新型的、基于查找表(Look-Up-Table,LUT)结构的动态差分逻辑(LBDL),以及基于这种逻辑的集成电路设计方法。该设计方法仅需在传统的半定制设计流程中添加少量的替换操作就可以实现,因而比其他完全需要全定制设计的动态差分逻辑具有更好的实用性。而相对同样适用于半定制实现的动态差分逻辑WDDL(Wave Dynamic Differential Logic),LBDL逻辑解决了逻辑门翻转时刻与数据信号之间的相关性,从而比WDDL逻辑具有更好的功耗恒定性。实验结果表明,该设计方法能够有效实现具有抗DPA攻击性能的电路。 展开更多
关键词 安全芯片 DPA攻击 动态差分逻辑
在线阅读 下载PDF
适合可变剪接研究的转录组序列分析策略 被引量:1
9
作者 王正志 李稚锋 +4 位作者 杭兴宜 毛逸清 骆志刚 赵东升 张成岗 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第4期37-42,共6页
规模化基因表达实验所产生的大量与生物组织特定时空状态相关的cDNA和表达序列标签(EST)等信息可用于新基因的发现、基因表达模式分析和基因组的注释,从而可为转录组研究提供实验设计和结果分析的参考标准。真核基因可变剪接的普遍性及... 规模化基因表达实验所产生的大量与生物组织特定时空状态相关的cDNA和表达序列标签(EST)等信息可用于新基因的发现、基因表达模式分析和基因组的注释,从而可为转录组研究提供实验设计和结果分析的参考标准。真核基因可变剪接的普遍性及其在机体生理与病理过程中的重要作用,使得可变剪接的系统分析已成为功能基因组研究中的热点之一。在面临海量表达数据的指数增长和不断有新的基因组获得测序的情况下,实现转录组序列分析的规模化、自动化计算迫在眉睫。讨论不同转录组分析系统中的数据分析算法及其计算需求,并提出适用于大规模可变剪接分析的策略。 展开更多
关键词 转录组 EST聚类 EST装配 可变剪接 高性能计算
在线阅读 下载PDF
从Docker容器看容器技术的发展:一种系统文献综述的视角 被引量:29
10
作者 吴逸文 张洋 +1 位作者 王涛 王怀民 《软件学报》 EI CSCD 北大核心 2023年第12期5527-5551,共25页
近些年,软件构造、运行和演化过程面临着诸多新需求,例如开发测试环境需要高效切换或配置、应用隔离、减少资源消耗、提高测试和部署效率等,给开发人员开发和维护软件带来了巨大的负担.容器技术有希望将开发人员从繁重的开发运维负担中... 近些年,软件构造、运行和演化过程面临着诸多新需求,例如开发测试环境需要高效切换或配置、应用隔离、减少资源消耗、提高测试和部署效率等,给开发人员开发和维护软件带来了巨大的负担.容器技术有希望将开发人员从繁重的开发运维负担中解脱出来,尤其是Docker作为目前工业界的容器行业标准,近年来逐渐成为学术界一个热门的研究领域.为了帮助研究人员全面准确地理解当前Docker容器研究的现状和趋势,使用系统文献综述(systematic literature review)的方法搜集了75篇该领域最新的高水平论文,进行了详细的分析和总结.首先,使用定量研究方法调查了Docker容器研究的基本现状,包括研究数量、研究质量、研究领域和研究方式.其次,首次提出了面向Docker容器研究的分类框架,分别从核心、平台和支持3个方面对当前研究进行了系统性地归纳和梳理.最后,讨论了Docker容器技术的发展趋势并总结了7个未来的研究方向. 展开更多
关键词 容器 DOCKER 系统文献综述
在线阅读 下载PDF
基于嵌入模型的混合式相关缺陷关联方法
11
作者 张洋 王涛 +2 位作者 吴逸文 尹刚 王怀民 《软件学报》 EI CSCD 北大核心 2019年第5期1407-1421,共15页
社交化编程使得开源社区中的知识可以快速被传播,其中,缺陷报告作为一类重要的软件开发知识,会含有特定的语义信息.通常,开发者会人工地将相关的缺陷报告关联起来.在一个软件项目中,发现并关联相关的缺陷报告可以为开发者提供更多的资... 社交化编程使得开源社区中的知识可以快速被传播,其中,缺陷报告作为一类重要的软件开发知识,会含有特定的语义信息.通常,开发者会人工地将相关的缺陷报告关联起来.在一个软件项目中,发现并关联相关的缺陷报告可以为开发者提供更多的资源和信息去解决目标缺陷,从而提高缺陷修复效率.然而,现有人工关联缺陷报告的方法是十分耗费时间的,它在很大程度上取决于开发者自身的经验和知识.因此,研究如何及时、高效地关联相关缺陷是对于提高软件开发效率十分有意义的工作.将这类关联相关缺陷的问题视为推荐问题,并提出了一种基于嵌入模型的混合式相关缺陷关联方法,将传统的信息检索技术(TF-IDF)与深度学习中的嵌入模型(词嵌入模型和文档嵌入模型)结合起来.实验结果表明,该方法能够有效地提高传统方法的性能,且具有较强的应用扩展性. 展开更多
关键词 软件缺陷报告 信息检索 深度学习 嵌入模型 开源软件
在线阅读 下载PDF
基于深度学习可视化的恶意软件家族分类 被引量:17
12
作者 陈小寒 魏书宁 覃正泽 《计算机工程与应用》 CSCD 北大核心 2021年第22期131-138,共8页
计算机网络技术的快速发展,导致恶意软件数量不断增加。针对恶意软件家族分类问题,提出一种基于深度学习可视化的恶意软件家族分类方法。该方法采用恶意软件操作码特征图像生成的方式,将恶意软件操作码转化为可直视的灰度图像。使用递... 计算机网络技术的快速发展,导致恶意软件数量不断增加。针对恶意软件家族分类问题,提出一种基于深度学习可视化的恶意软件家族分类方法。该方法采用恶意软件操作码特征图像生成的方式,将恶意软件操作码转化为可直视的灰度图像。使用递归神经网络处理操作码序列,不仅考虑了恶意软件的原始信息,还考虑了将原始代码与时序特征相关联的能力,增强分类特征的信息密度。利用SimHash将原始编码与递归神经网络的预测编码融合,生成特征图像。基于相同族的恶意代码图像比不同族的具有更明显相似性的现象,针对传统分类模型无法解决自动提取分类特征的问题,使用卷积神经网络对特征图像进行分类。实验部分使用10868个样本(包含9个恶意家族)对深度学习可视化进行有效性验证,分类精度达到98.8%,且能够获得有效的、信息增强的分类特征。 展开更多
关键词 恶意软件家族 恶意代码可视化 递归神经网络(RNN) 卷积神经网络(CNN) SimHash
在线阅读 下载PDF
一种支持负载平衡的常数度DHT ID分配方法
13
作者 王小海 彭宇行 李东升 《电子学报》 EI CAS CSCD 北大核心 2010年第11期2649-2654,共6页
能够支持负载均衡的ID分配方法是实现与维护DHT overlay的基础,已有常数度DHT多采用纯集中式或纯分布式方法,不能很好地解决拓扑信息维护开销与拓扑平衡程度这一矛盾.针对这一不足,在分析拓扑中通用树结构的基础上,本文提出了基于内在结... 能够支持负载均衡的ID分配方法是实现与维护DHT overlay的基础,已有常数度DHT多采用纯集中式或纯分布式方法,不能很好地解决拓扑信息维护开销与拓扑平衡程度这一矛盾.针对这一不足,在分析拓扑中通用树结构的基础上,本文提出了基于内在结构Routing Forest的ID分配方法RFIDAM,通过规律性地聚合局部平衡信息来指导新节点的加入以实现拓扑平衡.实验表明,通过引入少量维护与路由开销,该方法使得拓扑达到节点ID长度差小于2的最优平衡目标. 展开更多
关键词 P2P DHT ID分配 常数度拓扑 负载平衡 ROUTING FOREST
在线阅读 下载PDF
一种基于GPU实现的自适应八叉树纹理绘画算法
14
作者 李航 党岗 +1 位作者 程志全 金士尧 《工程图学学报》 CSCD 北大核心 2010年第4期39-44,共6页
当前,虽然基于二维图像映射定义的传统二维纹理已得到广泛应用。但是它有很多局限性。这是因为很多三维模型在纹理空间中进行参数化是非常困难的,例如隐式表面、细分表面和高密度或高细节的多边形网格。基于八叉树纹理定义,提出了一种... 当前,虽然基于二维图像映射定义的传统二维纹理已得到广泛应用。但是它有很多局限性。这是因为很多三维模型在纹理空间中进行参数化是非常困难的,例如隐式表面、细分表面和高密度或高细节的多边形网格。基于八叉树纹理定义,提出了一种新型的自适应八叉树纹理绘画算法。和传统的八叉树纹理映射算法相比,不但占用更少的存储空间,而且实现了基于GPU的纹理查询,有更快的查找速度。 展开更多
关键词 计算机应用 纹理绘画算法 自适应八叉树 自适应八叉树纹理 纹理查询
在线阅读 下载PDF
一种空间BRDF的编辑算法
15
作者 王志前 李航 +1 位作者 程志全 党岗 《工程图学学报》 CSCD 北大核心 2010年第4期32-38,共7页
双向反射分布函数(BRDF)一直是图形学中物体表面外观表现最通用的方法,空间BRDF是目前最优的一种BRDF,它只比标准RGB纹理多占用很小的存储空间,却达到了更加逼真的效果。但是,SBRDF的获取过程极为复杂和烦琐。该文提出了一种手工编辑SB... 双向反射分布函数(BRDF)一直是图形学中物体表面外观表现最通用的方法,空间BRDF是目前最优的一种BRDF,它只比标准RGB纹理多占用很小的存储空间,却达到了更加逼真的效果。但是,SBRDF的获取过程极为复杂和烦琐。该文提出了一种手工编辑SBRDF的算法,它不仅可以处理测量获取的SBRDF纹理,也可以利用标准的数字图像来实现SBRDF并进行更改。最后,通过实例渲染效果展示了该编辑工具的功效。 展开更多
关键词 计算机应用 纹理映射 空间BRDF 编辑算法
在线阅读 下载PDF
DSF:一种时序约束下的快速数据分发算法
16
作者 吴吉庆 彭宇行 刘锋 《电子学报》 EI CAS CSCD 北大核心 2012年第2期365-370,共6页
时序约束下的大规模数据分发在互联网环境下有着越来越广泛的应用.现有的系统大多采用mesh结构组织结点,并通过运行在请求结点的调度算法来控制数据的分发.但请求结点只依据自身的需求来调度数据,并不能保证系统的整体服务效果.本文以... 时序约束下的大规模数据分发在互联网环境下有着越来越广泛的应用.现有的系统大多采用mesh结构组织结点,并通过运行在请求结点的调度算法来控制数据的分发.但请求结点只依据自身的需求来调度数据,并不能保证系统的整体服务效果.本文以改善整体服务效果为目标,提出一种面向服务结点的调度算法———时序约束下的快速分发算法DSF(Deadline Sensitive Fast distribution).该算法的基本思想是:当服务结点面临多个邻居结点的多个数据请求时,选择系统最迫切需要的数据,优先传输给继续服务能力较强的结点,以达到减少迟到数据比例、提高数据传输率、优化系统持续服务能力的目的.实验结果表明,与面向请求结点的调度算法相比,DSF在流传输质量、分发速率、负载均衡等方面均具有较好的特性. 展开更多
关键词 数据分发 时序约束 调度
在线阅读 下载PDF
双重非均匀子群参数制作研究
17
作者 黄冬 袁媛 +2 位作者 张乾 李颂 梁越超 《原子能科学技术》 EI CAS CSCD 北大核心 2022年第1期22-30,共9页
弥散颗粒燃料元件中燃料颗粒以随机形式弥散在基体中,难以获得确定几何。同时由于共振自屏现象的存在,呈现出一种双重非均匀系统。当前均匀系统产生的共振积分在双重非均匀系统中使用时,会在较低的共振能群产生一定的共振计算误差。为... 弥散颗粒燃料元件中燃料颗粒以随机形式弥散在基体中,难以获得确定几何。同时由于共振自屏现象的存在,呈现出一种双重非均匀系统。当前均匀系统产生的共振积分在双重非均匀系统中使用时,会在较低的共振能群产生一定的共振计算误差。为满足现有组件计算程序直接进行双重非均匀性共振计算的需求。基于Sanchez-Pomraning模型下的特征线固定源计算方法,建立一套双重非均匀共振积分表,最后结合子群方法实现随机介质燃料元件的共振计算。数值结果表明,考虑双重非均匀性产生的积分表,在相同的输运条件下和积分表的适用范围内,由子群共振部分对k_(eff)计算带来的绝对偏差能保持在200 pcm内。该工作的意义是对于一些不宜改动的传统组件程序,如HELIOS,通过在线修改共振积分表和子群参数,从而使其直接进行弥散颗粒燃料问题的计算成为可能。 展开更多
关键词 弥散颗粒燃料 共振自屏 双重非均匀积分表 Sanchez模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部