期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于差分和神经网络的同步辐射光源图像压缩方法 被引量:3
1
作者 符世园 汪璐 +1 位作者 程耀东 陈刚 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第5期53-62,共10页
针对常见的图像无损压缩方法效果不佳问题,提出了一种基于图像差分和神经网络的同步辐射光源图像无损压缩方法。通过图像差分以减少图像序列内部的线性相关性,训练神经网络模型以学习图像序列内部的非线性相关性,得到预测概率分布,结合... 针对常见的图像无损压缩方法效果不佳问题,提出了一种基于图像差分和神经网络的同步辐射光源图像无损压缩方法。通过图像差分以减少图像序列内部的线性相关性,训练神经网络模型以学习图像序列内部的非线性相关性,得到预测概率分布,结合算术编码压缩。为加速预测和编码过程,将像素值按位分裂为两部分进行并行处理。基于上海同步辐射光源图像的测试表明,相较于便携式网络图形、JPEG2000和自由无损图像格式等,该方法可将压缩率提升20%以上,像素位分裂可以缩短30%的模型预测和编码时间。 展开更多
关键词 图像压缩 无损 神经网络 图像差分 像素位分裂
在线阅读 下载PDF
ARM处理器上的格点QCD计算与优化 被引量:1
2
作者 孙玮 毕玉江 程耀东 《计算机科学》 CSCD 北大核心 2023年第6期52-57,共6页
格点量子色动力学(格点QCD)是高能物理领域中需要大规模并行计算的最主要应用之一,相关研究通常需要消耗大量计算资源,核心是求解大规模稀疏线性方程组。文中基于国产鲲鹏920 ARM处理器,研究了格点QCD的计算热点Dslash,并将其扩展到64... 格点量子色动力学(格点QCD)是高能物理领域中需要大规模并行计算的最主要应用之一,相关研究通常需要消耗大量计算资源,核心是求解大规模稀疏线性方程组。文中基于国产鲲鹏920 ARM处理器,研究了格点QCD的计算热点Dslash,并将其扩展到64个节点(6 144核),展示了格点QCD计算的线性扩展性。基于roofline性能分析模型,发现格点QCD是典型的内存限制应用,并通过将Dslash中的3×3复幺正矩阵根据对称性压缩,将其性能提升约22%。对于大规模稀疏线性方程的求解,在ARM处理器上探索了常用的Krylov子空间迭代算法BiCGStab,以及近年来发展起来的前沿的multigrid算法,发现即使考虑预处理时间,在实际物理计算中使用multigrid算法相比BiCGStab依然有几倍至一个数量级的加速。此外,还考虑了鲲鹏920处理器上的NEON向量化指令,发现将其用于multigrid计算时可以带来约20%的加速。因此,在ARM处理器上使用multigrid算法能极大地加速实际的物理研究。 展开更多
关键词 格点QCD ARM架构 多重网格算法 鲲鹏920 NEON向量化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部