期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一个浮点数学函数库测试平台 被引量:12
1
作者 许瑾晨 黄永忠 +2 位作者 郭绍忠 周蓓 赵捷 《软件学报》 EI CSCD 北大核心 2015年第6期1306-1321,共16页
数学函数库作为CPU软件的重要组成部分,对于高性能计算机平台上的科学计算、工程数值计算起着极为关键的作用.现有的测试工具只能片面地对函数库进行测试,没有从正确性、精度和函数性能这3方面加以考虑,而且往往只针对一类目标体系结构... 数学函数库作为CPU软件的重要组成部分,对于高性能计算机平台上的科学计算、工程数值计算起着极为关键的作用.现有的测试工具只能片面地对函数库进行测试,没有从正确性、精度和函数性能这3方面加以考虑,而且往往只针对一类目标体系结构,适用性有限.针对现有测试工具的缺陷,提出了面向多目标体系结构、全面可复用的一体化测试平台BMltest(basic math library test).测试平台结合函数特征值、IEEE-754特殊数以及利用浮点数生成规则实现的全浮点域指数分布的IEEE-754规范数构造了测试集,有效提高了测试集浮点数的覆盖率;提出了基于多精度库MPFR(multiple-precision floating-point reliable library)的精度测试方法,提高了精度测试的可靠性;提出了基于代码隔离的性能测试方法,最大限度地降低了外部环境对性能测试的干扰.针对大量的浮点测试结果,给出了合理的结果评价方案.测试平台使用的测试集数据与函数做到了相关性的极大分离,保证了测试方法的普适性.通过对包括GNU,Open64及Mlib函数库内所有855个函数的测试结果表明:BMltest平台的测试数据集更全面、有效,精度测试方法更可靠;与其他测试平台相比,性能测试结果更准确、稳定. 展开更多
关键词 数学函数库 测试平台 IEEE-754 精度测试 性能测试
在线阅读 下载PDF
面向异构众核从核的数学函数库访存优化方法 被引量:6
2
作者 许瑾晨 郭绍忠 +1 位作者 黄永忠 王磊 《计算机科学》 CSCD 北大核心 2014年第6期12-17,共6页
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求。为了有效解决此问题,提出了一种... 数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求。为了有效解决此问题,提出了一种基于访存指令的调度策略,亦即将访存延迟有效地隐藏于计算延迟中,以提高基于汇编实现的数学函数库的函数性能;结合动态调用方式,利用从核本地局部数据存储空间LDM(local data memory),提出了一种提高访存速度的ldm_call算法。两种优化技术在共享存储结构下具有普遍适用性,并能够有效减少函数访存开销,提高访存速度。实验表明,两种技术分别能够平均提高函数性能16.08%和37.32%。 展开更多
关键词 异构众核 数学函数库 访存优化 指令调度 局部数据存储空间
在线阅读 下载PDF
C240X系列DSP定点数学函数库的应用 被引量:1
3
作者 王笑一 李军旺 +1 位作者 张洛平 祁金光 《河南科技大学学报(自然科学版)》 CAS 2005年第5期49-51,共3页
定点DSP在做浮点运算时效率不高,影响了定点DSP的应用。TI公司推出针对C24X系列DSP的qmath数学函数库,用定点算法优化实现了常用的一些数学函数。本文介绍了该数学函数库的使用方法和要注意的问题,并在相同硬件条件下进行了执行定点函... 定点DSP在做浮点运算时效率不高,影响了定点DSP的应用。TI公司推出针对C24X系列DSP的qmath数学函数库,用定点算法优化实现了常用的一些数学函数。本文介绍了该数学函数库的使用方法和要注意的问题,并在相同硬件条件下进行了执行定点函数和浮点函数的对比实验,结果表明合理使用定点数学函数可以显著提升C语言DSP程序的执行效率,对定点DSP应用系统的高级语言开发有很大帮助。 展开更多
关键词 数字信号处理 定点 浮点 数学函数库
在线阅读 下载PDF
VC++与Matlab混合编程的图像处理 被引量:2
4
作者 潘华志 王艳 +1 位作者 耿则勋 马军 《海洋测绘》 2006年第4期63-65,共3页
主要讨论了VC++与M atlab混合编程的两种常规方式,给出了利用M atlab数学函数库混合编程的实现方法,指出了常规方式存在不足的同时,提出了另外两种方法,实现了利用M atlab数学函数库和编译器结合VC++混合编程的新方法,充分发挥了VC++有... 主要讨论了VC++与M atlab混合编程的两种常规方式,给出了利用M atlab数学函数库混合编程的实现方法,指出了常规方式存在不足的同时,提出了另外两种方法,实现了利用M atlab数学函数库和编译器结合VC++混合编程的新方法,充分发挥了VC++有效运算速率与M atlab强大矩阵运算的优点。实验结果说明本文所提方案可行,适用于图像处理。 展开更多
关键词 图像处理 VC++ 混合编程 数学函数库 编译器
在线阅读 下载PDF
开放型CAD系统的设计和开发 被引量:3
5
作者 何援军 钮晓鸣 《工程图学学报》 CSCD 2003年第2期1-6,共6页
介绍了开放型CAD系统的设计思想,它的总体结构、功能以及进行CAD集成、应用集成和Windows集成的策略。可利用它进行交互设计,也可以用它提供的应用接口程序API(Application Interface)中的图形函数库、数学函数库和工具函数库等作为CAD... 介绍了开放型CAD系统的设计思想,它的总体结构、功能以及进行CAD集成、应用集成和Windows集成的策略。可利用它进行交互设计,也可以用它提供的应用接口程序API(Application Interface)中的图形函数库、数学函数库和工具函数库等作为CAD软件的图形开发工具,开发不同的图示化应用系统。根据这一思想,一个开放型的二、三维交互式图形系统——KereCAD系统已经开发成功,并已投入实际应用。 展开更多
关键词 开放型CAD系统 系统结构 计算机辅助设计 交互式CAD系统 系统功能 开发平台 图形工具 数学函数库 界面设计 应用集成 数据接口 Windows集成
在线阅读 下载PDF
基于ARM V8平台的向量算法库实现与优化 被引量:8
6
作者 王晶 张云泉 梁军 《计算机工程》 CAS CSCD 北大核心 2019年第6期82-88,共7页
基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8... 基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8平台上的优化。实验结果表明,该方案在ARMV8计算平台上实现的向量算法库性能提升可达到10%~300%。 展开更多
关键词 数学函数库 ARMV8架构 向量算法库 单指令流多数据 访存优化
在线阅读 下载PDF
Intel MKL在Bernese GNSS数据处理中的应用 被引量:2
7
作者 孔垚 孙保琪 +1 位作者 张小贞 王源昕 《大地测量与地球动力学》 CSCD 北大核心 2020年第7期736-740,共5页
为提高Bernese GNSS software数据处理效率,将英特尔数学核心函数库(math kernel library,MKL)应用于Bernese精密定轨数据处理,对比分析多个MKL矩阵求逆函数与Bernese原有程序的计算效率。使用2019-03全球200个测站北斗/GNSS数据进行实... 为提高Bernese GNSS software数据处理效率,将英特尔数学核心函数库(math kernel library,MKL)应用于Bernese精密定轨数据处理,对比分析多个MKL矩阵求逆函数与Bernese原有程序的计算效率。使用2019-03全球200个测站北斗/GNSS数据进行实验分析,结果表明,采用参数预消除策略时,参数预消除步骤消耗时间明显大于矩阵求逆,使用MKL处理数据效率提升不明显;而未采用参数预消除策略时,使用MKL矩阵求逆函数可显著提高矩阵求逆效率,其中dpotri函数矩阵求逆计算效率最高,消耗时间平均值为133 s,相比Bernese原有程序计算速度可提高13倍。 展开更多
关键词 Bernese GNSS software 数学核心函数库 精密定轨 矩阵求逆
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部