期刊文献+
共找到720篇文章
< 1 2 36 >
每页显示 20 50 100
国密算法SM9的计算性能改进方法 被引量:1
1
作者 谢振杰 刘奕明 +1 位作者 罗友强 尹小康 《信息安全研究》 北大核心 2025年第1期5-11,共7页
针对国密算法SM9的计算性能改进问题,提出2维Comb固定基模幂算法、预计算标量乘的拓展应用、针对常用ID优化等计算性能改进方法,理论分析和实验测试表明,所提方法通过预计算并增加可以接受的存储开销,能有效提升固定底数模幂、SM9算法3... 针对国密算法SM9的计算性能改进问题,提出2维Comb固定基模幂算法、预计算标量乘的拓展应用、针对常用ID优化等计算性能改进方法,理论分析和实验测试表明,所提方法通过预计算并增加可以接受的存储开销,能有效提升固定底数模幂、SM9算法3个常见步骤等组件的计算性能.综合运用上述改进方法后,SM9数字签名的生成与验证、密钥交换、密钥封装、加密5项算法的性能提升幅度为14%~116%. 展开更多
关键词 国密算法 SM9 计算性能 预计算 Comb固定基
在线阅读 下载PDF
面向RISC-V的基础数学库实现 被引量:2
2
作者 李飞 郭绍忠 +3 位作者 郝江伟 侯明 宋广辉 许瑾晨 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1633-1647,共15页
RISC-V指令集架构(Instruction Set Architecture,ISA)作为一种新兴的精简ISA,因免费、开源、自由等特点而得到快速发展.由于国内外对RISC-V的研究主要集中在硬件开发,软件生态相较于成熟ISA还很薄弱,实现一套RISC-V指令集高性能基础数... RISC-V指令集架构(Instruction Set Architecture,ISA)作为一种新兴的精简ISA,因免费、开源、自由等特点而得到快速发展.由于国内外对RISC-V的研究主要集中在硬件开发,软件生态相较于成熟ISA还很薄弱,实现一套RISC-V指令集高性能基础数学库可以进一步丰富RISC-V软件生态.本文基于自动化移植技术实现申威数学库到RISC-V的移植,为RISC-V指令架构提供首个使用向量指令优化的基础数学库系统.本文提出向量寄存器自动分支查表法与路径标记插入法,重点解决不同架构间寄存器映射过程中的寄存器复用问题,实现寄存器正确高效映射,并依据不同指令等价转换策略自动化移植数学函数69个.测试结果表明,RISC-V基础数学库函数可实现正确计算,最大误差为1.90ULP,函数性能平均为157.03节拍. 展开更多
关键词 RISC-V 申威 汇编 向量 数学库 自动化移植
在线阅读 下载PDF
基于多类型计算重写的浮点表达式精度优化方法 被引量:1
3
作者 郝江伟 杨鸿儒 +3 位作者 夏媛媛 刘毅 许瑾晨 庞建民 《计算机科学》 CSCD 北大核心 2024年第4期86-94,共9页
表达式重写是精度优化领域的新兴方法,其核心思想是在不改变表达式精度类型的前提下,将其变换为语义上等价的表达式以尝试提升精度。然而,面对庞大的变换规则和变换空间,如何选取合适的变换策略成为了重写方法的问题所在。针对上述问题... 表达式重写是精度优化领域的新兴方法,其核心思想是在不改变表达式精度类型的前提下,将其变换为语义上等价的表达式以尝试提升精度。然而,面对庞大的变换规则和变换空间,如何选取合适的变换策略成为了重写方法的问题所在。针对上述问题,提出了一个基于多类型计算重写的浮点表达式精度优化方法,支持包括函数计算、四则运算的表达式,并实现了表达式重写工具exprAuto。区别于其他精度优化工具侧重于对子表达式的替换,exprAuto更注重对表达式运算顺序的变换。exprAuto在对表达式化简和数学变换后,通过多项式变换获取不同的计算顺序,并尝试减少运算次数以提升精度,最终生成一个包含不同计算顺序的等价表达式集合,通过排序筛选和误差检测从中选出最终的精度优化结果。文中选取41个FPBench标准集中的表达式和18个常见数学函数的近似多项式作为测试用例,在经exprAuto优化后,所提方法相比原式最大误差降低了45.92%,平均误差降低了34.98%;针对其中的18个近似多项式,相比原式最大误差降低了58.35%,平均误差降低了43.73%。实验结果表明,exprAuto可以有效提升表达式尤其是多项式的精度。 展开更多
关键词 浮点计算 精度优化 重写变换
在线阅读 下载PDF
基于知识图谱增强的恶意代码分类方法
4
作者 夏冰 何取东 +2 位作者 刘文博 楚世豪 庞建民 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期61-68,共8页
针对应用程序接口(application programming interface,API)序列识别的恶意代码分类方法存在特征描述能力弱和调用关系缺失的问题,提出一种基于知识图谱增强的恶意代码分类方法。首先,基于函数调用图抽取恶意代码所含的API实体及其调用... 针对应用程序接口(application programming interface,API)序列识别的恶意代码分类方法存在特征描述能力弱和调用关系缺失的问题,提出一种基于知识图谱增强的恶意代码分类方法。首先,基于函数调用图抽取恶意代码所含的API实体及其调用关系,在此基础上构建恶意代码API知识图谱。其次,使用Word2Vec技术计算携带上下文调用语义的API序列向量,借助TransE技术捕获API知识图谱中的API实体向量,将这两个向量的融合结果作为API特征。最后,将恶意代码所含的API表示为特征矩阵,输入TextCNN进行分类模型训练。在恶意代码家族分类任务中,与基线模型相比,所提方法的准确率有较大提升,达到93.8%,表明知识图谱可以有效增强恶意代码家族分类效果。同时,通过可解释性实验证实了所提方法具有应用价值。 展开更多
关键词 恶意代码 API序列 语义抽取 知识图谱 可解释性
在线阅读 下载PDF
高非线性四谱值和五谱值布尔函数的构造 被引量:1
5
作者 郭飞 王子龙 段明 《通信学报》 北大核心 2025年第3期144-150,共7页
四谱值和五谱值布尔函数对于密码学应用具有特殊的意义,通过修改Maiorana-McFarland类bent函数,给出了一种偶数元四谱值和五谱值布尔函数的构造,确定了所构造函数的Walsh谱分布,证明其非线性度和半bent函数一样高,为2^(n-1)-2^(n/2)(n... 四谱值和五谱值布尔函数对于密码学应用具有特殊的意义,通过修改Maiorana-McFarland类bent函数,给出了一种偶数元四谱值和五谱值布尔函数的构造,确定了所构造函数的Walsh谱分布,证明其非线性度和半bent函数一样高,为2^(n-1)-2^(n/2)(n为变元数),代数次数能取到3和理论上界n/2+1之间的任意值。并深入研究了该构造的一个子类,包含的函数具有五谱值和最高的代数次数n/2+1,且不存在非零线性结构。 展开更多
关键词 布尔函数 四谱值函数 五谱值函数 非线性度 代数次数
在线阅读 下载PDF
一个浮点数学函数库测试平台 被引量:12
6
作者 许瑾晨 黄永忠 +2 位作者 郭绍忠 周蓓 赵捷 《软件学报》 EI CSCD 北大核心 2015年第6期1306-1321,共16页
数学函数库作为CPU软件的重要组成部分,对于高性能计算机平台上的科学计算、工程数值计算起着极为关键的作用.现有的测试工具只能片面地对函数库进行测试,没有从正确性、精度和函数性能这3方面加以考虑,而且往往只针对一类目标体系结构... 数学函数库作为CPU软件的重要组成部分,对于高性能计算机平台上的科学计算、工程数值计算起着极为关键的作用.现有的测试工具只能片面地对函数库进行测试,没有从正确性、精度和函数性能这3方面加以考虑,而且往往只针对一类目标体系结构,适用性有限.针对现有测试工具的缺陷,提出了面向多目标体系结构、全面可复用的一体化测试平台BMltest(basic math library test).测试平台结合函数特征值、IEEE-754特殊数以及利用浮点数生成规则实现的全浮点域指数分布的IEEE-754规范数构造了测试集,有效提高了测试集浮点数的覆盖率;提出了基于多精度库MPFR(multiple-precision floating-point reliable library)的精度测试方法,提高了精度测试的可靠性;提出了基于代码隔离的性能测试方法,最大限度地降低了外部环境对性能测试的干扰.针对大量的浮点测试结果,给出了合理的结果评价方案.测试平台使用的测试集数据与函数做到了相关性的极大分离,保证了测试方法的普适性.通过对包括GNU,Open64及Mlib函数库内所有855个函数的测试结果表明:BMltest平台的测试数据集更全面、有效,精度测试方法更可靠;与其他测试平台相比,性能测试结果更准确、稳定. 展开更多
关键词 数学函数库 测试平台 IEEE-754 精度测试 性能测试
在线阅读 下载PDF
浮点数学函数异常处理方法 被引量:7
7
作者 许瑾晨 郭绍忠 +2 位作者 黄永忠 王磊 周蓓 《软件学报》 EI CSCD 北大核心 2015年第12期3088-3103,共16页
异常会造成程序错误,实现完全没有异常的浮点计算软件也很艰难,因此,实现有效的异常处理方法很重要.但现有的异常处理并不针对浮点运算,并且研究重点都集中在整数溢出错误上,而浮点类型运算降低了整数溢出存在的可能.针对上述现象,面向... 异常会造成程序错误,实现完全没有异常的浮点计算软件也很艰难,因此,实现有效的异常处理方法很重要.但现有的异常处理并不针对浮点运算,并且研究重点都集中在整数溢出错误上,而浮点类型运算降低了整数溢出存在的可能.针对上述现象,面向基于汇编实现的数学函数,提出了一种针对浮点运算的分段式异常处理方法.通过将异常类型映射为64位浮点数,以核心运算为中心,将异常处理过程分为3个阶段:输入参数检测(处理INV异常)、特定代码检测(处理DZE异常和INF异常)以及输出结果检测(处理FPF异常和DNO异常),并从数学运算的角度对该方法采用分段式处理的原因进行了证明.实验将该方法应用于Mlib浮点函数库,对库中600多个面向不同平台的浮点函数进行了测试.测试结果表明:该方法能够将出现浮点异常即中断的函数个数从90%降到0%.同时,实验结果验证了该方法的高效性. 展开更多
关键词 浮点数 数学函数 异常处理
在线阅读 下载PDF
面向异构众核从核的数学函数库访存优化方法 被引量:6
8
作者 许瑾晨 郭绍忠 +1 位作者 黄永忠 王磊 《计算机科学》 CSCD 北大核心 2014年第6期12-17,共6页
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求。为了有效解决此问题,提出了一种... 数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求。为了有效解决此问题,提出了一种基于访存指令的调度策略,亦即将访存延迟有效地隐藏于计算延迟中,以提高基于汇编实现的数学函数库的函数性能;结合动态调用方式,利用从核本地局部数据存储空间LDM(local data memory),提出了一种提高访存速度的ldm_call算法。两种优化技术在共享存储结构下具有普遍适用性,并能够有效减少函数访存开销,提高访存速度。实验表明,两种技术分别能够平均提高函数性能16.08%和37.32%。 展开更多
关键词 异构众核 数学函数库 访存优化 指令调度 局部数据存储空间
在线阅读 下载PDF
大语言模型微调方法研究综述 被引量:2
9
作者 吴春志 赵玉龙 +3 位作者 刘鑫 司念文 张鲁飞 范昊 《中文信息学报》 北大核心 2025年第2期1-26,共26页
近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决... 近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决下游任务的能力。该文全面回顾了2019—2024年间50余种主要的大语言模型微调方法,从全新的角度进行了系统性的整理和概括,分为全参数微调、部分参数微调、新增参数微调和无参数微调方法,对每种方法的原理、微调位置及方法特点作了总结归纳和比较;接着,从计算的视角出发,着重分析比较了各类方法的参数量、内存消耗和计算量;最后,基于该文的微调方法调研及相关的参数微调实践,对大语言模型微调策略给出建议,以促进该领域的发展。 展开更多
关键词 人工智能 大语言模型 微调 ADAPTER LoRA
在线阅读 下载PDF
面向边缘计算环境的密码技术研究综述 被引量:8
10
作者 程庆丰 李钰汀 +1 位作者 李兴华 姜奇 《计算机科学》 CSCD 北大核心 2020年第11期10-18,共9页
边缘设备数量的急剧增加导致数据量的爆炸式增长,以云计算模型为代表的集中式数据处理模型因其存储特点与传输带宽的限制已经无法满足数据处理的实时性和高效性需求。在此背景下,边缘计算模型开始进入公众视野。由于设备轻量化、架构异... 边缘设备数量的急剧增加导致数据量的爆炸式增长,以云计算模型为代表的集中式数据处理模型因其存储特点与传输带宽的限制已经无法满足数据处理的实时性和高效性需求。在此背景下,边缘计算模型开始进入公众视野。由于设备轻量化、架构异构性等新特点,边缘计算在发展过程中面临着安全方面的巨大挑战。密码技术作为保护信息安全的关键手段,对应对边缘计算安全挑战有重要意义。传统的较为成熟和完备的密码技术方案,需要针对边缘计算的特点做出相应调整以适应新架构的需求。文中从边缘计算架构面临的安全挑战入手,重点分析了可应用于数据安全领域和应用安全领域的密码技术,通过与已有的研究方案进行比较,展示了不同密码技术在边缘计算安全保护中的优势,为面向边缘计算的密码技术应用提供了新的思路。 展开更多
关键词 边缘计算 密码技术 安全防护 身份认证 密钥协商
在线阅读 下载PDF
基于国密算法SM9的可追踪环签名方案 被引量:1
11
作者 谢振杰 尹小康 +1 位作者 蔡瑞杰 张耀 《通信学报》 北大核心 2025年第3期199-211,共13页
为解决数字签名用户的隐私保护问题,并防止恶意用户滥用完全匿名性,提出一种基于国密算法SM9的可追踪环签名方案。国密算法SM9是我国自主研发的标识密码算法,具有较高的安全性和良好的性能,避免了公钥基础设施的建设成本和证书管理开销... 为解决数字签名用户的隐私保护问题,并防止恶意用户滥用完全匿名性,提出一种基于国密算法SM9的可追踪环签名方案。国密算法SM9是我国自主研发的标识密码算法,具有较高的安全性和良好的性能,避免了公钥基础设施的建设成本和证书管理开销。通过引入密码累加器,环签名的生成和验证过程的计算量以及签名数据大小均降低至常数级。在随机预言机模型下,基于q-SDH困难问题证明了该方案具有EUF-CMIA安全性,并证明了在出现争议时可追踪实际签名者的条件匿名性。理论分析和测试结果表明,该方案的签名和验证效率分别达到现有同类方案的7.3倍和3.3倍,签名数据大小约为其1/5,在计算效率和通信开销方面具有显著优势。 展开更多
关键词 可追踪环签名 国密算法 SM9算法 密码累加器 基于标识的密码
在线阅读 下载PDF
基于影像学参数的老年人群早期衰弱预测模型的构建
12
作者 张海宇 闫宇涛 +5 位作者 岳玮 周刚 曹选超 李谊 赵媛媛 马骅 《郑州大学学报(医学版)》 北大核心 2025年第3期390-393,共4页
目的:基于影像学参数建立老年人群早期衰弱预测模型并评价其临床应用价值。方法:选取60岁以上老年人群(正常598人,早期衰弱292人)心脑肺影像学数据,早期衰弱的评价参照Fried衰弱标准。利用主成分分析筛选影响老年人群早期衰弱的重要影... 目的:基于影像学参数建立老年人群早期衰弱预测模型并评价其临床应用价值。方法:选取60岁以上老年人群(正常598人,早期衰弱292人)心脑肺影像学数据,早期衰弱的评价参照Fried衰弱标准。利用主成分分析筛选影响老年人群早期衰弱的重要影像学特征,建立Logistic回归模型、随机森林模型、K近邻模型及支持向量机模型预测早期衰弱,并根据特异度、敏感度、准确率及AUC(95%CI)等对老年人群早期衰弱预测模型的临床效果进行评价。结果:支持向量机模型预测效能最高,其测试集AUC(95%CI)为0.893(0.663~1.000),随机森林模型、Logistic回归模型、K近邻模型分别为0.447(0.378~1.000)、0.498(0.300~1.000)、0.598(0.501~1.000)。支持向量机模型预测测试集早期衰弱的特异度、敏感度及准确率分别为85.01%、81.79%及84.23%。结论:基于影像学参数建立的支持向量机模型用于预测老年人群早期衰弱具有较高的准确性。 展开更多
关键词 影像学 早期衰弱 老年人群 预测模型
在线阅读 下载PDF
可验证授权计算研究综述
13
作者 孙奕 陈性元 +1 位作者 杜学绘 徐建 《计算机科学》 CSCD 北大核心 2015年第11期1-7,共7页
为了解决外包数据和授权计算的安全性问题,近年来可验证授权计算理论又重新受到人们的关注和青睐。文中重点描述了在不可信环境下可验证授权计算技术是如何解决外包数据和授权计算的可验证性问题,并给出了可验证授权计算方案的形式化定... 为了解决外包数据和授权计算的安全性问题,近年来可验证授权计算理论又重新受到人们的关注和青睐。文中重点描述了在不可信环境下可验证授权计算技术是如何解决外包数据和授权计算的可验证性问题,并给出了可验证授权计算方案的形式化定义。首先采用不同分类方法对现有研究方案进行总结与归纳,指出现有研究方案的特点、所采用关键技术及不足之处;然后从功能和性能两个方面对方案进行对比分析;最后结合应用热点,从不同应用方向展望了该领域的研究趋势和发展前景。 展开更多
关键词 可验证授权计算 云计算 安全外包数据 同态加密 同态认证码 可认证数据结构
在线阅读 下载PDF
基于深度学习的信息传播微观预测综述
14
作者 黄宁博 周刚 +2 位作者 章梦礼 张萌 朱秀宝 《中文信息学报》 北大核心 2025年第3期1-19,共19页
信息传播预测旨在预测信息在用户网络中的演化趋势,对舆情管控、市场营销、定向广告等应用具有重要意义。传统的信息传播预测方法依赖于特定的传播模型,这些模型的预测性能和通用性较差。近年来,深度学习技术迅速发展,得益于其对序列、... 信息传播预测旨在预测信息在用户网络中的演化趋势,对舆情管控、市场营销、定向广告等应用具有重要意义。传统的信息传播预测方法依赖于特定的传播模型,这些模型的预测性能和通用性较差。近年来,深度学习技术迅速发展,得益于其对序列、网络、文本等数据强大的表征能力,基于深度学习的信息传播预测研究显著提高了预测的性能。然而,当前关于信息传播预测的综述都是针对传统传播预测方法或流行度预测展开的。因此,该文着重对当前基于深度学习的信息传播微观预测技术进行了总结、梳理和归纳。根据模型挖掘的特征类型,将其划分为基于传播路径的方法以及融合社会关系和信息内容的方法。此外,对信息传播微观预测中常用的数据集和评估指标进行了归纳总结。最后,该文对当前研究现状进行了总结,分析了当前基于深度学习的信息传播微观预测研究中存在的普遍性问题,并对未来可能的研究趋势进行了展望。 展开更多
关键词 信息传播预测 信息级联 深度学习 表示学习 神经网络
在线阅读 下载PDF
SW-IntraCC:一种面向申威智能加速卡内部的集合通信机制
15
作者 赵玉龙 顾燕卿 +6 位作者 田松涛 吴春志 汤凌韬 张鲁飞 秦晓军 刘鑫 陈左宁 《计算机研究与发展》 北大核心 2025年第6期1333-1346,共14页
大规模语言模型参数量呈指数级增长趋势,对加速卡算力密度与通信效率提出更高要求,推动单卡多芯粒、多芯片及多通信实体等新型架构的快速发展.申威智能加速卡采用4个核组片上环网架构,但在大模型训练中,数据通信量大和卡内传统Ring集合... 大规模语言模型参数量呈指数级增长趋势,对加速卡算力密度与通信效率提出更高要求,推动单卡多芯粒、多芯片及多通信实体等新型架构的快速发展.申威智能加速卡采用4个核组片上环网架构,但在大模型训练中,数据通信量大和卡内传统Ring集合通信方式面临单核组显存容量与传输带宽双重限制、卡内集合通信效率低、通信计算无法重叠等核心瓶颈.采用软硬协同设计理念提出SW-IntraCC(Sunway-intra collective communication)的优化框架,通过三级存储架构突破上述限制.首先,基于片上高速环网构建三级存储架构,单核组显存容量最高扩大至4倍,主机-加速卡传输带宽提升2.5倍;其次,设计采用交叉共享访存的片内高效CSC(cross shared communication)通信算法,实现面向大模型训练的典型通信算子CSC-AG(CSC-AllGather)和CSC-RS(CSC-ReduceScatter),通信效率是传统方式的2.15倍;最后,提出双向算子融合的通信计算重叠方法,实现通信与计算重叠,优化后通信性能提升59%. 展开更多
关键词 集合通信 申威智能加速卡 SW-IntraCC 通信优化 环形网络
在线阅读 下载PDF
椭圆曲线离散对数求解量子算法的线路优化
16
作者 刘建美 王洪 +3 位作者 马智 段乾恒 费洋扬 孟祥栋 《计算机应用与软件》 北大核心 2025年第6期311-316,共6页
该文借助加窗技术和整数取模的陪集表示技术,在加法的近似编码表示基础上给出了椭圆曲线群上离散对数求解量子线路的整体优化和资源估计,并对设计的量子线路进行了仿真实验。借助加窗技术和整数取模的陪集表示技术可以有效降低T门的数... 该文借助加窗技术和整数取模的陪集表示技术,在加法的近似编码表示基础上给出了椭圆曲线群上离散对数求解量子线路的整体优化和资源估计,并对设计的量子线路进行了仿真实验。借助加窗技术和整数取模的陪集表示技术可以有效降低T门的数目以及T门深度,其中T门数目为32 n^(3)+O(n^(2)log n)、T门深度为12 n^(3)+O(n^(2)log n)。由于采用加窗的半经典傅里叶变换,使得空间资源代价为8 n+O(log n)个量子比特。该文在增加少量近似误差(误差可以随着填充数目增加呈指数降低)的前提下,实现了时间空间资源代价的折中。 展开更多
关键词 椭圆曲线 离散对数 量子线路
在线阅读 下载PDF
一种计算旋转对称布尔函数的汉明重量和非线性度的新方法
17
作者 张习勇 祁应红 +1 位作者 高光普 李玉娟 《电子与信息学报》 EI CSCD 北大核心 2015年第11期2691-2696,共6页
旋转对称布尔函数是一类重要的密码学函数,研究其重量和非线性度等密码学性质具有很好的理论价值。区别于已有的计算方法,该文利用特定的正规基把这些布尔函数的问题转化为有限域上的指数和问题,得到了4?n和2sn=时一些二次旋转对称布尔... 旋转对称布尔函数是一类重要的密码学函数,研究其重量和非线性度等密码学性质具有很好的理论价值。区别于已有的计算方法,该文利用特定的正规基把这些布尔函数的问题转化为有限域上的指数和问题,得到了4?n和2sn=时一些二次旋转对称布尔函数的重量和非线性度的新结果。使用所提的方法,可以计算几乎全部的二次旋转对称布尔函数的重量和非线性度。所提的新方法对于研究一般的旋转对称布尔函数具有一定的参考意义。 展开更多
关键词 密码学 旋转对称布尔函数 非线性度 汉明重量 正规基
在线阅读 下载PDF
面向Stencil计算的自动混合精度优化 被引量:3
18
作者 宋广辉 郭绍忠 +3 位作者 赵捷 陶小涵 李飞 许瑾晨 《软件学报》 EI CSCD 北大核心 2023年第12期5704-5723,共20页
混合精度在深度学习和精度调整与优化方面取得了许多进展,广泛研究表明,面向Stencil计算的混合精度优化也是一个很有挑战性的方向.同时,多面体模型在自动并行化领域取得的一系列研究成果表明,该模型为循环嵌套提供很好的数学抽象,可以... 混合精度在深度学习和精度调整与优化方面取得了许多进展,广泛研究表明,面向Stencil计算的混合精度优化也是一个很有挑战性的方向.同时,多面体模型在自动并行化领域取得的一系列研究成果表明,该模型为循环嵌套提供很好的数学抽象,可以在其基础上进行一系列的循环变换.基于多面体编译技术设计并实现了一个面向Stencil计算的自动混合精度优化器,通过在中间表示层进行迭代空间划分、数据流分析和调度树转换,首次实现了源到源的面向Stencil计算的混合精度优化代码自动生成.实验表明,经过自动混合精度优化之后的代码,在减少精度冗余的基础上能够充分发挥其并行潜力,提升程序性能.以高精度计算为基准,在x86平台上最大加速比是1.76,几何平均加速比是1.15;在新一代国产申威平台上最大加速比是1.64,几何平均加速比是1.20. 展开更多
关键词 自动混合精度 Stencil计算 多面体模型 循环嵌套 调度树
在线阅读 下载PDF
基于拟态计算的大数据高效能平台设计方法 被引量:12
19
作者 李斌 周清雷 +1 位作者 斯雪明 聂凯 《计算机应用研究》 CSCD 北大核心 2019年第7期2059-2064,共6页
针对当前大数据应用主要以通用处理器为计算核心,且系统结构单一、能效比低,无法充分满足大数据的计算需求,基于拟态计算模型,提出了一种大数据高效能平台的设计方法。以算粒为基本研究对象,深入剖析大数据应用算法的特征,合理划分各计... 针对当前大数据应用主要以通用处理器为计算核心,且系统结构单一、能效比低,无法充分满足大数据的计算需求,基于拟态计算模型,提出了一种大数据高效能平台的设计方法。以算粒为基本研究对象,深入剖析大数据应用算法的特征,合理划分各计算子任务;其次,构造体系结构匹配矩阵,将子任务分配到合理的处理部件上;最后,利用动态电压/频率调节技术和数据布局算法实现非关键任务的电压控制,并优化关键任务的结构布局。实验结果表明,拟态计算能深度融合各异构计算部件,建立具有灵活、可拓展的体系结构,充分发挥系统整体执行效率,降低功耗,提高能效比。 展开更多
关键词 大数据 拟态计算 算粒 匹配矩阵 能效比
在线阅读 下载PDF
云计算环境下基于属性加密的信息流控制及实现 被引量:11
20
作者 杜远志 杜学绘 杨智 《计算机工程》 CAS CSCD 北大核心 2018年第3期27-36,共10页
传统的信息流控制技术受限于其基于单机环境的研究,难以有效保护云计算中数据的安全性。为此,提出一种基于属性加密的信息流控制机制。将基于属性的加密技术与信息流控制技术相结合,通过对用户私钥和访问树的生成方法重新设计,在减少用... 传统的信息流控制技术受限于其基于单机环境的研究,难以有效保护云计算中数据的安全性。为此,提出一种基于属性加密的信息流控制机制。将基于属性的加密技术与信息流控制技术相结合,通过对用户私钥和访问树的生成方法重新设计,在减少用户制定访问策略工作的同时,使得该机制能够对云中数据进行有效的信息流控制,从而消除安全隐患。性能测试结果表明,该机制能够抵抗基于共享内存的侧通道攻击,保护静态虚拟域中敏感数据安全性。 展开更多
关键词 信息流控制 基于属性加密 云计算 信息安全 权限管理
在线阅读 下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部