题名 面向国产高性能众核处理器的编程模型
被引量:1
1
作者
陈虎
周鹏灵
机构
华南理工大学软件学院
广东省高性能计算重点实验室
出处
《计算机应用》
CSCD
北大核心
2023年第11期3517-3526,共10页
基金
国家自然科学基金重点项目(U1836207)
广东省高性能计算重点实验室开放课题。
文摘
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。
关键词
国产众核处理器
单指令多数据流
并行编程模型
SW26010
消息队列模型
Keywords
domestic many-core processor
Single Instruction Multiple Data(SIMD)
parallel programming model
SW26010
message queue model
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
题名 广东省大型科研仪器共享现状及对策
被引量:15
2
作者
陈树敏
方少亮
李莎
罗俊博
薛露
机构
广东省 科技基础条件平台中心
出处
《实验室研究与探索》
CAS
北大核心
2021年第2期266-269,共4页
基金
广东省自然科学基金(2017A030313637)
广东省自然科学基金(2018A030313311)
+2 种基金
广东省自然科学基金(2018A030313238)
广东省自然科学基金(2019A1515011376)
广州市科技计划项目(202002030300)。
文摘
介绍国外大型科研仪器共享在法制保障、支撑服务人员等方面的特点,以及国内兄弟省市共享局势和特色,包括新购查重、评价考核、平台区域化等,分享北京和上海的所有权与经营权分离模式。分析广东省共享的制度体系、平台建设、体制机制创新、粤港澳资源共享等情况以及问题,以及在疫情防控中的作用。最后提出共享服务体系优化完善、省市联动体系建设、推动粤港澳大湾区资源共享等对策建议。
关键词
科研仪器
开放共享
服务体系
奖惩机制
省市联动
粤港澳
Keywords
scientific instruments
open sharing
service system
mechanism of reward and punishment
provincial and municipal linkage
Guangdong Hong Kong and Macao
分类号
G482.0
[文化科学—教育技术学]
题名 基于网络表示学习与随机游走的链路预测算法
被引量:28
3
作者
刘思
刘海
陈启买
贺超波
机构
华南师范大学计算 机学院
广东省高性能计算重点实验室
仲恺农业工程学院信息科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2017年第8期2234-2239,共6页
基金
广东省自然科学基金自由申请项目(2016A030313441)
广东省科技计划项目(2015B010129009
+4 种基金
2016A030303058
2016A090922008
2015A020209178)
广东省高性能计算重点实验室开放课题项目(T191527)
广州市科技计划项目(201604016035)~~
文摘
现有的基于随机游走链路预测指标在无权网络上的转移过程存在较强随机性,没有考虑在网络结构上不同邻居节点间的相似性对转移概率的作用。针对此问题,提出一种基于网络表示学习与随机游走的链路预测算法。首先,通过基于深度学习的网络表示学习算法——Deep Walk学习网络节点的潜在结构特征,将网络中的各节点表征到低维向量空间;然后,在重启随机游走(RWR)和局部随机游走(LRW)算法的随机游走过程中融合各邻居节点在向量空间上的相似性,重新定义出邻居节点间的转移概率;最后,在5个真实数据集上进行大量实验验证。实验结果表明:相比8种具有代表性的基于网络结构的链路预测基准算法,所提算法链路预测结果的AUC值均有提升,最高达3.34%。
关键词
链路预测
相似性
重启随机游走
局部随机游走
网络表示学习
Keywords
link prediction
similarity
Random Walk with Restart(RWR)
Local Random Walk(LRW)
network representation learning
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 DXF在排样切割中的应用
被引量:5
4
作者
陈树敏
刘强
方少亮
林珠
机构
广东省 计算 中心广东省高性能计算重点实验室
广东 工业大学机械电子工程学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第5期143-146,187,共5页
基金
广东省高性能计算重点实验建设项目(2008A060301003)
文摘
通过分析AutoCAD图形的DXF(Drawing Interchange File)文件,提取坐标信息,并将几何实体进行分类整合,实现一个Java程序接口对不同版本的DXF文件的解析。介绍了最小矩形包络方法的实现过程和切割路径的生成过程,同时生成排样结果的NC代码。实例验证了上述方法的可行性和有效性,提高了工业原料的利用率和企业的生产效率,对DXF在排样切割的应用起到了重要的启迪作用,对中小型五金企业具有一定的实用价值。
关键词
DXF
实体
解析
包络矩形
排样
切割路径
NC代码
Keywords
DXF(Drawing Interchange File) Entity Parse Rectangular envelope Layout Cutting path NC code
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 物联网及其应用剖析
被引量:33
5
作者
徐迪威
蔡建新
机构
广东省 计算 中心总工室
广东省高性能计算重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2011年第15期229-231,248,共4页
基金
2008年广东省科技计划项目(No.2008A060301003)
文摘
物联网被称为是继计算机和互联网之后的第三次信息技术革命,物联网应用无处不在。提出了物联网的技术层次结构和关键技术,描绘了物联网的应用愿景,认为形成行业标准是我国发展物联网的重要举措。
关键词
物联网
层次结构
关键技术
应用
Keywords
Intemet of Things (IoT)
hierarchy
key technology
application
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
题名 基于CT图像序列的膝关节三维重建
被引量:1
6
作者
雷钧
何汉武
李晋芳
机构
广东 工业大学机电工程学院
广东省高性能计算重点实验室
出处
《科学技术与工程》
北大核心
2012年第9期2069-2073,共5页
基金
广州市科技计划项目(2010J-D00341)资助
文摘
良好的手术操作对象的几何模型能提高虚拟手术系统的沉浸感。为了获得逼真的股骨、胫骨和髌骨的几何模型,对膝关节的CT图像进行分析。根据灰度直方图选取合适的阈值进行阈值分割,并结合区域生长做进一步的处理,最后进行三维重建。结果表明建立了更精确的几何模型。
关键词
CT图像
阈值分割
区域生长
三维重建
Keywords
CT images thresholding segmentation region growing three dimensional reconstruction
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 ARM架构云服务器的CPU功耗模型研究
被引量:3
7
作者
金育妍
余天豪
王松波
林伟伟
潘宇聪
机构
华南理工大学计算 机科学与工程学院
广东省高性能计算重点实验室
鹏程实验室
出处
《计算机科学》
CSCD
北大核心
2022年第10期59-65,共7页
基金
国家自然科学基金(62072187)
广东省重点研发计划(2021B0101420002)
+4 种基金
广东省基础与应用基础研究重大项目(2019B030302002)
广州市科技计划(202007040002)
广州市开发区国际合作项目(2020GH10)
广东省高性能计算重点实验室2019年课题资助
鹏程实验室重大任务项目(PCL2012A09)。
文摘
云服务器的功耗模型是云数据中心能耗优化研究的重要内容之一。CPU功耗模型是云服务器功耗模型的重要组成部分,然而现有CPU功耗模型没有考虑CPU的异构性,如缺乏对ARM架构服务器CPU功耗模型的研究。在调研分析现有的ARM架构CPU功耗模型的基础上,提出了一种面向ARM架构的新CPU功耗模型——基于混合建模的CPU功耗模型(Hybrid Based Model, HBM)。该功耗模型综合考虑了CPU利用率和CPU性能事件等建模特征,相比现有的测算精度很高的基于性能计数器的CPU功耗模型,HBM的测算精度与其相近且模型训练成本更低,更适合ARM服务器的CPU功耗建模。文中使用Sysbench负载工具对所提HBM进行实验验证,实验结果表明,HBM的平均相对误差(MRE)在1%以内,具有良好的测算精度。此外,还针对x86和ARM架构服务器进行了交叉实验,实验结果表明不同架构服务器的CPU功耗行为相异,应当使用不同的CPU功耗建模方法。
关键词
能耗优化
功耗模型
CPU异构性
ARM架构
Keywords
Energy consumption optimization
Power model
CPU heterogeneity
ARM architecture
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 粤港澳大湾区大型科研仪器开放共享机制的研究
被引量:6
8
作者
林珠
赵晓萌
方少亮
周俊杰
陈树敏
机构
广东省 科技基础条件平台中心广东省高性能计算重点实验室
出处
《实验室研究与探索》
CAS
北大核心
2021年第3期268-273,296,共7页
基金
广东省自然科学基金(2019A1515011376)
广东省高性能计算重点实验室开放课题项目广东省自然科学基金项目(2017A030313637)
+1 种基金
广州市科技计划项目(202002030300)
信息不对称条件下用户需求驱动的科技资源价值表征与匹配模式研究——以科学仪器为例(2020A1515010418)。
文摘
粤港澳大湾区是国家建设世界级城市群和参与全球竞争的重要空间载体,区域内大型科研仪器等科技资源存量丰富,能够支撑和促进科技活动和创新创业开展,研究其开放共享机制具有重要的意义。通过文献调查、现场调研、归纳总结和关联分析等方法,梳理粤港澳大湾区内大型科研仪器开放共享现状、机制现状,进一步归纳总结湾区内大型科研仪器开放共享的特征,根据需求、现状、特征从组织体系、制度体系、共享模式和技术支撑机制等方面提出粤港澳大型科研仪器机制,对推进湾区内大型科研仪器开放共享工作具有促进作用和重要意义。
关键词
粤港澳大湾区
科研仪器
开放共享
机制研究
Keywords
Guangdong,Hong Kong,Macao Bay area
scientific research instruments
opening and sharing
mechanism research
分类号
G311
[文化科学]