针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher,HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可...针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher,HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可由用户定义,满足图计算应用对海量低延迟细粒度数据访问的需求。同时,HCPF扩展了基于内存语义的跨计算节点定制互连技术,支持远程内存的细粒度直接访问,为后续实现分布式图计算框架提供技术基础。结合上述两个核心研究内容,基于流水线RISC-V处理器核,设计并实现了可支持HCPF的RISC-V片上系统(System-on-Chip,SoC)架构,搭建基于FPGA的原型验证平台,并使用自研测试程序对HCPF进行初步性能评测。实验结果表明,HCPF相比原有访存通路,最高可将基于数组和随机地址的两种随机内存访问性能分别提升至3.5倍和2.7倍。远程内存直接访问4 Byte数据的延时仅为1.63μs。展开更多
全球华人计算机教育应用大会(Global Chinese Conference on Computers in Education,GCCCE)汇聚世界各地教育政策制定者、学者、教育工作者、校长及一线教师,互相交流与分享有关计算机教育应用的最新研究工作与成果。第二十九届GCCCE...全球华人计算机教育应用大会(Global Chinese Conference on Computers in Education,GCCCE)汇聚世界各地教育政策制定者、学者、教育工作者、校长及一线教师,互相交流与分享有关计算机教育应用的最新研究工作与成果。第二十九届GCCCE由江南大学与香港理工大学共同举办,会议议程包括主旨演讲、论文报告、工作坊、博士生论坛、中小学教师论坛与企业参展等。展开更多
文摘针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher,HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可由用户定义,满足图计算应用对海量低延迟细粒度数据访问的需求。同时,HCPF扩展了基于内存语义的跨计算节点定制互连技术,支持远程内存的细粒度直接访问,为后续实现分布式图计算框架提供技术基础。结合上述两个核心研究内容,基于流水线RISC-V处理器核,设计并实现了可支持HCPF的RISC-V片上系统(System-on-Chip,SoC)架构,搭建基于FPGA的原型验证平台,并使用自研测试程序对HCPF进行初步性能评测。实验结果表明,HCPF相比原有访存通路,最高可将基于数组和随机地址的两种随机内存访问性能分别提升至3.5倍和2.7倍。远程内存直接访问4 Byte数据的延时仅为1.63μs。
文摘全球华人计算机教育应用大会(Global Chinese Conference on Computers in Education,GCCCE)汇聚世界各地教育政策制定者、学者、教育工作者、校长及一线教师,互相交流与分享有关计算机教育应用的最新研究工作与成果。第二十九届GCCCE由江南大学与香港理工大学共同举办,会议议程包括主旨演讲、论文报告、工作坊、博士生论坛、中小学教师论坛与企业参展等。