稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可...稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍.展开更多
相比均匀线阵(Uniform Linear Array,ULA),相同阵元数目下稀疏线阵(Sparse Linear Array,SLA)的抗耦合效应更好,阵列孔径更大,到达方向(Direction of Arrival,DOA)估计的自由度(Degrees Of Freedom,DOF)更高,因而近年来得到了广泛的研...相比均匀线阵(Uniform Linear Array,ULA),相同阵元数目下稀疏线阵(Sparse Linear Array,SLA)的抗耦合效应更好,阵列孔径更大,到达方向(Direction of Arrival,DOA)估计的自由度(Degrees Of Freedom,DOF)更高,因而近年来得到了广泛的研究。为了可以进行高DOF的DOA估计,学者们开始研究SLA的差分虚拟阵元,差分虚拟阵元对应的协方差矩阵相比原阵元对应的协方差矩阵维度更大,因而估计的DOF更高。当SLA的差分虚拟阵元连续取值时,可以利用已有阵元的接收信息,得到SLA的协方差矩阵,在该矩阵的基础之上构建差分虚拟阵元的协方差矩阵进而进行DOA估计。然而,当SLA的差分虚拟阵元存在孔洞时,即差分虚拟阵元不能连续取值时,不能直接利用重构的协方差矩阵进行DOA估计,需要恢复完全增广协方差矩阵的信息再进行DOA估计。对于该问题,本文基于矢量化后原协方差矩阵和虚拟差分阵协方差矩阵的误差分布情况,并结合完全增广协方差矩阵的低秩特性和半正定特性来构建优化问题。通过求解该问题来恢复维度更高的完全增广协方差矩阵。最后对该矩阵进行奇异值分解,利用多重信号分类(Multiple Signal Classification,MUSIC)算法就可以获得多源的空间谱。本文最后通过数值仿真试验验证了所提算法可以实现高DOF的DOA估计,并且相比于现有算法,本文所提算法对欠定DOA估计的效果更好,多源DOA估计的精度更高,产生的误差更小。展开更多
文摘稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍.
文摘相比均匀线阵(Uniform Linear Array,ULA),相同阵元数目下稀疏线阵(Sparse Linear Array,SLA)的抗耦合效应更好,阵列孔径更大,到达方向(Direction of Arrival,DOA)估计的自由度(Degrees Of Freedom,DOF)更高,因而近年来得到了广泛的研究。为了可以进行高DOF的DOA估计,学者们开始研究SLA的差分虚拟阵元,差分虚拟阵元对应的协方差矩阵相比原阵元对应的协方差矩阵维度更大,因而估计的DOF更高。当SLA的差分虚拟阵元连续取值时,可以利用已有阵元的接收信息,得到SLA的协方差矩阵,在该矩阵的基础之上构建差分虚拟阵元的协方差矩阵进而进行DOA估计。然而,当SLA的差分虚拟阵元存在孔洞时,即差分虚拟阵元不能连续取值时,不能直接利用重构的协方差矩阵进行DOA估计,需要恢复完全增广协方差矩阵的信息再进行DOA估计。对于该问题,本文基于矢量化后原协方差矩阵和虚拟差分阵协方差矩阵的误差分布情况,并结合完全增广协方差矩阵的低秩特性和半正定特性来构建优化问题。通过求解该问题来恢复维度更高的完全增广协方差矩阵。最后对该矩阵进行奇异值分解,利用多重信号分类(Multiple Signal Classification,MUSIC)算法就可以获得多源的空间谱。本文最后通过数值仿真试验验证了所提算法可以实现高DOF的DOA估计,并且相比于现有算法,本文所提算法对欠定DOA估计的效果更好,多源DOA估计的精度更高,产生的误差更小。
文摘稀疏阵列布阵灵活,增大阵列孔径的同时还能减少阵元间耦合,但基于稀疏阵列的传统波达方向估计会导致角度模糊混叠,带来估计精度差和稳健性不足的问题。针对以上问题,提出一种适用于稀疏阵列波达方向估计的加权截断奇异值投影(weighted truncated singular value projection,WT-SVP)的鲁棒矩阵填充算法。在填充迭代过程中根据奇异值的大小分配权重,突出大奇异值包含的阵列信息,减少小奇异值中不必要的噪声信息,从而优化传统奇异值投影算法。该算法可以实现稀疏阵列的孔洞信息恢复,对不连续阵元充分利用,同时WT-SVP填充算法实现了稀疏阵列波达方向估计的高精度、高分辨以及在低信噪比、低快拍时的高鲁棒性。