期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向远程内存图数据库的应用感知分离式存储设计
1
作者
李纯羽
邓龙
+1 位作者
李永坤
许胤龙
《计算机科学》
北大核心
2025年第1期151-159,共9页
图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注.对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素.随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数...
图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注.对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素.随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数据库在拓展性和资源利用率方面受到挑战.基于RDMA的远程内存系统的引入为克服这些挑战提供了一种新的选择,通过分离计算和存储资源,实现了更为灵活的内存使用方式.然而,在使用远程内存的情况下如何最大程度地优化图查询性能成为了当前研究的重点问题.文中首先分析了利用操作系统分页机制透明使用远程内存构建图数据库存在的问题,并在应用层次上设计了远程内存图数据库的存储模型.根据不同数据的特点和访问模式,设计了属性图在远程内存中的存储结构,优化了数据布局和访问路径.实验结果表明,在本地内存受限的情况下,与透明使用远程内存相比,应用感知的设计方式的端到端性能最高提升了12倍.
展开更多
关键词
图查询
图数据库
图存储
远程内存
属性图模型
在线阅读
下载PDF
职称材料
基于两种子结构感知的社交网络Graphlets采样估计算法
被引量:
1
2
作者
赵倩倩
吕敏
许胤龙
《计算机科学》
CSCD
北大核心
2019年第3期314-320,共7页
graphlets是指大规模网络中节点数目较少的连通诱导子图,在社交网络和生物信息学领域有着广泛的应用。由于精确计数的计算成本较高,目前大多采用随机游走采样算法来近似估计graphlets的频率。随着节点数目的增多,graphlets的种类数增长...
graphlets是指大规模网络中节点数目较少的连通诱导子图,在社交网络和生物信息学领域有着广泛的应用。由于精确计数的计算成本较高,目前大多采用随机游走采样算法来近似估计graphlets的频率。随着节点数目的增多,graphlets的种类数增长迅速且结构变化复杂,快速估计大规模网络中所有种类的graphlets的频率是一项挑战。文中提出了基于两种子结构的随机游走采样算法CSRW2来估计graphlets频率,即给定graphlets节点数k(k=4,5),通过采样k-graphlets的子结构(k-1)-path和3-star得到两种样本,之后用比例放大法综合,以高效估计graphlets并适应graphlets结构的复杂变化。实验结果表明,CSRW2能以统一的框架估计所有k-graphlets类型的频率,其估计精度优于现有代表性算法,更适用于频率较低且结构较稠密的graphlets。例如,用CSRW2估计真实网络sofb-Penn94中的5-graphlets,当样本数为2万时,标准均方根误差的平均值由WRW算法的0.8降低至CSRW2算法的0.22左右。
展开更多
关键词
社交网络
Graphlet
Graphlet频率
随机游走
采样算法
无偏估计
在线阅读
下载PDF
职称材料
HXDSP异构计算框架的设计与优化
被引量:
4
3
作者
宁成明
蔡恒雨
+1 位作者
郑启龙
耿锐
《小型微型计算机系统》
CSCD
北大核心
2022年第1期179-185,共7页
由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多H...
由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多HXDSP设备并行计算的能力,本文设计了基于OpenCL的HXDSP异构计算框架.本文根据计算任务的特性设计了不同的OpenCL设备映射方式,使得HXDSP异构计算框架能适应不同的应用场景,充分利用HXDSP的计算资源并节省能耗.本文在HXDSP异构计算框架设计完成的基础上针对HXDSP异构计算应用程序进行优化,包括数据传输优化和数据访问优化.最后本文通过实验分析了HXDSP异构计算框架的程序性能,验证了HXDSP异构计算框架的可行性以及有效性.
展开更多
关键词
HXDSP
异构计算
OPENCL
程序性能优化
在线阅读
下载PDF
职称材料
基于深度学习的循环自动调度研究
被引量:
2
4
作者
胡煜霄
郑启龙
《小型微型计算机系统》
CSCD
北大核心
2024年第7期1770-1777,共8页
循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索...
循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索算法对循环调度空间进行高效的搜索,在搜索样本评估阶段,本文利用深度学习技术为循环调度构建了基于Tree-LSTM的代价模型对搜索过程进行指导以加速搜索过程.经实验验证,本文提出的自动调度框架能够达到优于前沿的启发式循环优化编译器Polly的优化效果,同时本文构建的代价模型能够在10%以内的调度性能损失的前提下显著提升调度搜索过程的效率.
展开更多
关键词
自动调度
编译优化
蒙特卡洛树搜索
深度学习
长短期记忆网络
在线阅读
下载PDF
职称材料
基于整数线性规划的VLIW DSP指令分簇调度
被引量:
3
5
作者
周鹏
刘纯纲
郑启龙
《计算机应用研究》
CSCD
北大核心
2022年第10期3078-3083,共6页
在分簇VLIW DSP上,指令分簇是一项对程序性能有重要影响的编译优化,但现有的指令分簇算法只能处理顺序的程序区域,且难以获得最佳的分簇方案。针对这些问题,提出一种基于整数线性规划的统一指令分簇与指令调度的方法。该方法使用0-1决...
在分簇VLIW DSP上,指令分簇是一项对程序性能有重要影响的编译优化,但现有的指令分簇算法只能处理顺序的程序区域,且难以获得最佳的分簇方案。针对这些问题,提出一种基于整数线性规划的统一指令分簇与指令调度的方法。该方法使用0-1决策变量表示函数中指令的分簇、指令的局部调度以及簇间传输指令的全局调度,并将指令之间的依赖关系和对处理器资源的竞争关系构造为线性约束,最终得到一个以最小化函数的估计执行时间为目标的整数线性规划模型。实验结果表明,求解该模型得到的分簇调度方案对程序性能的优化显著强于现有算法,并且求解模型所耗费的时间是可接受的。
展开更多
关键词
数字信号处理器
超长指令字
指令分簇
指令调度
整数线性规划
在线阅读
下载PDF
职称材料
基于图神经网络的BWDSP指令选择方法优化研究
被引量:
2
6
作者
侯璇
凤维杰
郑启龙
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2672-2679,共8页
现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也...
现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也亟需一种新型且有效、可拓展、可移植的指令选择策略.近些年图神经网络GNN在处理非欧氏数据上取得了很多的突破.本文将GNN应用于基于BWDSP平台编译器后端的指令选择的处理过程中,基于图节点的分类、边属性的预测和图分类提出一种低耦合性的指令选择模型,通过实验验证并对比这种方法与传统方法的有效性.并且证明了一个高效的指令选择策略能够充分利用BWDSP的资源,降低程序执行的代价.在提高BWDSP指令选择能力的同时,也期望能将该方法应用到不同平台的指令集,或者编译优化的其它子领域和不同的编译器中.
展开更多
关键词
指令选择
图神经网络
BWDSP平台
编译优化
在线阅读
下载PDF
职称材料
题名
面向远程内存图数据库的应用感知分离式存储设计
1
作者
李纯羽
邓龙
李永坤
许胤龙
机构
中国科学技术大学
计算
机科学与技术学院
高性能计算安徽省重点实验室
出处
《计算机科学》
北大核心
2025年第1期151-159,共9页
基金
国家自然科学基金(62172382)。
文摘
图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注.对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素.随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数据库在拓展性和资源利用率方面受到挑战.基于RDMA的远程内存系统的引入为克服这些挑战提供了一种新的选择,通过分离计算和存储资源,实现了更为灵活的内存使用方式.然而,在使用远程内存的情况下如何最大程度地优化图查询性能成为了当前研究的重点问题.文中首先分析了利用操作系统分页机制透明使用远程内存构建图数据库存在的问题,并在应用层次上设计了远程内存图数据库的存储模型.根据不同数据的特点和访问模式,设计了属性图在远程内存中的存储结构,优化了数据布局和访问路径.实验结果表明,在本地内存受限的情况下,与透明使用远程内存相比,应用感知的设计方式的端到端性能最高提升了12倍.
关键词
图查询
图数据库
图存储
远程内存
属性图模型
Keywords
Graph query
Graph database
Graph storage
Remote memory
Property graph model
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于两种子结构感知的社交网络Graphlets采样估计算法
被引量:
1
2
作者
赵倩倩
吕敏
许胤龙
机构
中国科学技术大学
计算
机科学与技术学院
高性能计算安徽省重点实验室
出处
《计算机科学》
CSCD
北大核心
2019年第3期314-320,共7页
基金
国家自然科学基金面上项目(61672486)资助
文摘
graphlets是指大规模网络中节点数目较少的连通诱导子图,在社交网络和生物信息学领域有着广泛的应用。由于精确计数的计算成本较高,目前大多采用随机游走采样算法来近似估计graphlets的频率。随着节点数目的增多,graphlets的种类数增长迅速且结构变化复杂,快速估计大规模网络中所有种类的graphlets的频率是一项挑战。文中提出了基于两种子结构的随机游走采样算法CSRW2来估计graphlets频率,即给定graphlets节点数k(k=4,5),通过采样k-graphlets的子结构(k-1)-path和3-star得到两种样本,之后用比例放大法综合,以高效估计graphlets并适应graphlets结构的复杂变化。实验结果表明,CSRW2能以统一的框架估计所有k-graphlets类型的频率,其估计精度优于现有代表性算法,更适用于频率较低且结构较稠密的graphlets。例如,用CSRW2估计真实网络sofb-Penn94中的5-graphlets,当样本数为2万时,标准均方根误差的平均值由WRW算法的0.8降低至CSRW2算法的0.22左右。
关键词
社交网络
Graphlet
Graphlet频率
随机游走
采样算法
无偏估计
Keywords
Social network
Graphlet
Graphlet concentration
Random walk
Sampling algorithm
Unbiased estimation
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
HXDSP异构计算框架的设计与优化
被引量:
4
3
作者
宁成明
蔡恒雨
郑启龙
耿锐
机构
中国科学技术大学
计算
机科学与技术学院
中国科学技术大学
高性能计算安徽省重点实验室
安徽
芯纪元科技有限公司
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第1期179-185,共7页
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
文摘
由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多HXDSP设备并行计算的能力,本文设计了基于OpenCL的HXDSP异构计算框架.本文根据计算任务的特性设计了不同的OpenCL设备映射方式,使得HXDSP异构计算框架能适应不同的应用场景,充分利用HXDSP的计算资源并节省能耗.本文在HXDSP异构计算框架设计完成的基础上针对HXDSP异构计算应用程序进行优化,包括数据传输优化和数据访问优化.最后本文通过实验分析了HXDSP异构计算框架的程序性能,验证了HXDSP异构计算框架的可行性以及有效性.
关键词
HXDSP
异构计算
OPENCL
程序性能优化
Keywords
HXDSP
heterogeneous computing
OpenCL
program performance optimization
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于深度学习的循环自动调度研究
被引量:
2
4
作者
胡煜霄
郑启龙
机构
中国科学技术大学
计算
机科学与技术学院
中国科学技术大学
高性能计算安徽省重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第7期1770-1777,共8页
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助.
文摘
循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索算法对循环调度空间进行高效的搜索,在搜索样本评估阶段,本文利用深度学习技术为循环调度构建了基于Tree-LSTM的代价模型对搜索过程进行指导以加速搜索过程.经实验验证,本文提出的自动调度框架能够达到优于前沿的启发式循环优化编译器Polly的优化效果,同时本文构建的代价模型能够在10%以内的调度性能损失的前提下显著提升调度搜索过程的效率.
关键词
自动调度
编译优化
蒙特卡洛树搜索
深度学习
长短期记忆网络
Keywords
auto-schedule
compilation optimization
Monte Carlo tree search
deep learning
long-short term memory
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于整数线性规划的VLIW DSP指令分簇调度
被引量:
3
5
作者
周鹏
刘纯纲
郑启龙
机构
中国科学技术大学
计算
机科学与技术学院
中国科学技术大学
高性能计算安徽省重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2022年第10期3078-3083,共6页
基金
国家核高基重大专项资助项目(2012ZX01034-001-001)。
文摘
在分簇VLIW DSP上,指令分簇是一项对程序性能有重要影响的编译优化,但现有的指令分簇算法只能处理顺序的程序区域,且难以获得最佳的分簇方案。针对这些问题,提出一种基于整数线性规划的统一指令分簇与指令调度的方法。该方法使用0-1决策变量表示函数中指令的分簇、指令的局部调度以及簇间传输指令的全局调度,并将指令之间的依赖关系和对处理器资源的竞争关系构造为线性约束,最终得到一个以最小化函数的估计执行时间为目标的整数线性规划模型。实验结果表明,求解该模型得到的分簇调度方案对程序性能的优化显著强于现有算法,并且求解模型所耗费的时间是可接受的。
关键词
数字信号处理器
超长指令字
指令分簇
指令调度
整数线性规划
Keywords
digital signal processor(DSP)
very long instruction word(VLIW)
cluster assignment
instruction scheduling
integer linear programming
分类号
TP314 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于图神经网络的BWDSP指令选择方法优化研究
被引量:
2
6
作者
侯璇
凤维杰
郑启龙
机构
中国科学技术大学
计算
机科学与技术学院
中国科学技术大学
高性能计算安徽省重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2672-2679,共8页
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
文摘
现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也亟需一种新型且有效、可拓展、可移植的指令选择策略.近些年图神经网络GNN在处理非欧氏数据上取得了很多的突破.本文将GNN应用于基于BWDSP平台编译器后端的指令选择的处理过程中,基于图节点的分类、边属性的预测和图分类提出一种低耦合性的指令选择模型,通过实验验证并对比这种方法与传统方法的有效性.并且证明了一个高效的指令选择策略能够充分利用BWDSP的资源,降低程序执行的代价.在提高BWDSP指令选择能力的同时,也期望能将该方法应用到不同平台的指令集,或者编译优化的其它子领域和不同的编译器中.
关键词
指令选择
图神经网络
BWDSP平台
编译优化
Keywords
instruction selection
graph neural network
BWDSP platform
compilation optimization
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向远程内存图数据库的应用感知分离式存储设计
李纯羽
邓龙
李永坤
许胤龙
《计算机科学》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于两种子结构感知的社交网络Graphlets采样估计算法
赵倩倩
吕敏
许胤龙
《计算机科学》
CSCD
北大核心
2019
1
在线阅读
下载PDF
职称材料
3
HXDSP异构计算框架的设计与优化
宁成明
蔡恒雨
郑启龙
耿锐
《小型微型计算机系统》
CSCD
北大核心
2022
4
在线阅读
下载PDF
职称材料
4
基于深度学习的循环自动调度研究
胡煜霄
郑启龙
《小型微型计算机系统》
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
5
基于整数线性规划的VLIW DSP指令分簇调度
周鹏
刘纯纲
郑启龙
《计算机应用研究》
CSCD
北大核心
2022
3
在线阅读
下载PDF
职称材料
6
基于图神经网络的BWDSP指令选择方法优化研究
侯璇
凤维杰
郑启龙
《小型微型计算机系统》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部