稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可...稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍.展开更多
针对稀疏线阵波达方向估计精度较低问题,提出一种稀疏线阵双迭代傅里叶优化方法。基于阵列孔径原理,利用阵列因子与阵元激励间的傅里叶变换关系,构建稀疏线阵构型优化目标函数;提出双迭代傅里叶变换算法,制定合理的旁瓣阈值和旁瓣约束条...针对稀疏线阵波达方向估计精度较低问题,提出一种稀疏线阵双迭代傅里叶优化方法。基于阵列孔径原理,利用阵列因子与阵元激励间的傅里叶变换关系,构建稀疏线阵构型优化目标函数;提出双迭代傅里叶变换算法,制定合理的旁瓣阈值和旁瓣约束条件,依据稀疏率和阵元数将孔径自适应分区,以阵列峰值旁瓣和孔径为约束,由双层嵌套循环迭代优化阵列麦克风数量和位置,获得更低的阵列峰值旁瓣电平。数值仿真和实验结果表明,根据该方法获得的49.5λ孔径、23%稀疏率的稀疏阵列峰值旁瓣电平为-21.59 dB,主瓣宽度为1.03°,角度分辨率为1°,估计误差小于0.01。与其他方法对比,峰值旁瓣低1 d B,优化效率提升50%,由此可证明该方法的有效性和快速性。展开更多
The performances of repaired image depend on the local information in the repaired area and the consistency between the repair directions with structural content.Image repair algorithm with texture information perform...The performances of repaired image depend on the local information in the repaired area and the consistency between the repair directions with structural content.Image repair algorithm with texture information performs well in repairing seriously damaged images,but it has bad performances when the images have the abundant structure information.The dual optimization image repair algorithm based on the linear structure and the optimal texture is proposed.The algorithm uses the double-constraint sparse model to reconstruct the missed information in large area in order to improve the clarity of repaired images.After adopting the preference of Criminisi priority,the image repair algorithm of self-similarity characteristics is proposed to improve the fault and fuzzy distortion phenomena in the repaired image.The results show that the proposed algorithm has more clarity in the image texture and structure and better effectiveness,and the peak signal-to-noise ratio of the repaired images by proposed algorithm is superior to that by other algorithms.展开更多
针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on sha...针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on shared neighbors,SN-WLLE)算法,并用于滚动轴承故障诊断.该算法首先使用余弦距离划分样本邻域;其次计算样本邻域对相似度用以评估样本共享近邻信息,并结合样本的6种邻居分布修正局部结构挖掘,提高多共享近邻的k近邻重构准确性;接着从多流形的角度评估样本点与近邻点间的稀疏分布一致性,以获得样本的重要性指标,并在低维空间保持该信息,进而提取准确的鉴别特征;最后结合KNN分类器构建出完备的轴承故障诊断模型.采用凯斯西储大学轴承数据集和实验室测试平台轴承数据集,从可视化评估、定量聚类评估、故障识别精度评估及鲁棒性评估等方面进行分析.结果表明:SN-WLLE算法的F值保持在108以上水准,平均故障识别精度最低可达0.9734,不仅具有较好的类内紧致性与类间可分性,还对近邻参数k具有低敏感性.展开更多
相比均匀线阵(Uniform Linear Array,ULA),相同阵元数目下稀疏线阵(Sparse Linear Array,SLA)的抗耦合效应更好,阵列孔径更大,到达方向(Direction of Arrival,DOA)估计的自由度(Degrees Of Freedom,DOF)更高,因而近年来得到了广泛的研...相比均匀线阵(Uniform Linear Array,ULA),相同阵元数目下稀疏线阵(Sparse Linear Array,SLA)的抗耦合效应更好,阵列孔径更大,到达方向(Direction of Arrival,DOA)估计的自由度(Degrees Of Freedom,DOF)更高,因而近年来得到了广泛的研究。为了可以进行高DOF的DOA估计,学者们开始研究SLA的差分虚拟阵元,差分虚拟阵元对应的协方差矩阵相比原阵元对应的协方差矩阵维度更大,因而估计的DOF更高。当SLA的差分虚拟阵元连续取值时,可以利用已有阵元的接收信息,得到SLA的协方差矩阵,在该矩阵的基础之上构建差分虚拟阵元的协方差矩阵进而进行DOA估计。然而,当SLA的差分虚拟阵元存在孔洞时,即差分虚拟阵元不能连续取值时,不能直接利用重构的协方差矩阵进行DOA估计,需要恢复完全增广协方差矩阵的信息再进行DOA估计。对于该问题,本文基于矢量化后原协方差矩阵和虚拟差分阵协方差矩阵的误差分布情况,并结合完全增广协方差矩阵的低秩特性和半正定特性来构建优化问题。通过求解该问题来恢复维度更高的完全增广协方差矩阵。最后对该矩阵进行奇异值分解,利用多重信号分类(Multiple Signal Classification,MUSIC)算法就可以获得多源的空间谱。本文最后通过数值仿真试验验证了所提算法可以实现高DOF的DOA估计,并且相比于现有算法,本文所提算法对欠定DOA估计的效果更好,多源DOA估计的精度更高,产生的误差更小。展开更多
近几年局部流形学习算法研究得到了广泛的关注,如局部线性嵌入以及局部切空间排列算法等.这些算法都是基于局部可线性化的假设而提出的,但局部是否可线性化的问题没有得到很好有效的解决,使得目前的降维算法对自然数据效果不佳.自然数...近几年局部流形学习算法研究得到了广泛的关注,如局部线性嵌入以及局部切空间排列算法等.这些算法都是基于局部可线性化的假设而提出的,但局部是否可线性化的问题没有得到很好有效的解决,使得目前的降维算法对自然数据效果不佳.自然数据中有很多是稀疏的,对稀疏数据的降维是局部线性嵌入算法所面临的一个问题.基于对数据自然属性的考虑,利用数据的统计信息动态确定局部线性化范围,依据数据的分布提出一种排列的稀疏局部线性嵌入算法(Sparse local linear embedding algorithm,SLLEA).在数据集稀疏的情况下,该算法能够很好地把握数据的局部和整体信息.将该算法应用于手工流形及图像检索等试验中,验证了该算法的有效性.展开更多
基于网络编码(network coding,NC)的网络通信,其中间节点首先对来自源节点的信包进行编码,然后再转发,目标节点通过反编码得到源节点的原始信息.大量的理论结果表明,网络编码可以提高整个网络的吞吐量和稳定性.为了研究网络编码在P2P(pe...基于网络编码(network coding,NC)的网络通信,其中间节点首先对来自源节点的信包进行编码,然后再转发,目标节点通过反编码得到源节点的原始信息.大量的理论结果表明,网络编码可以提高整个网络的吞吐量和稳定性.为了研究网络编码在P2P(peer to peer)网络中的优越性,设计并实现了一个基于稀疏线性编码技术的P2P内容分发系统.实验结果表明,基于网络编码的系统在平均下载时间、总分发时间、整体吞吐量等几个方面都优于无编码的内容分发系统.展开更多
文摘稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍.
文摘针对稀疏线阵波达方向估计精度较低问题,提出一种稀疏线阵双迭代傅里叶优化方法。基于阵列孔径原理,利用阵列因子与阵元激励间的傅里叶变换关系,构建稀疏线阵构型优化目标函数;提出双迭代傅里叶变换算法,制定合理的旁瓣阈值和旁瓣约束条件,依据稀疏率和阵元数将孔径自适应分区,以阵列峰值旁瓣和孔径为约束,由双层嵌套循环迭代优化阵列麦克风数量和位置,获得更低的阵列峰值旁瓣电平。数值仿真和实验结果表明,根据该方法获得的49.5λ孔径、23%稀疏率的稀疏阵列峰值旁瓣电平为-21.59 dB,主瓣宽度为1.03°,角度分辨率为1°,估计误差小于0.01。与其他方法对比,峰值旁瓣低1 d B,优化效率提升50%,由此可证明该方法的有效性和快速性。
基金Project(12GJ6055)supported by the Natural Science Foundation of Hunan Province,ChinaProject(2010FJ4107)supported by Hunan Provincial Science and Technology Department,China
文摘The performances of repaired image depend on the local information in the repaired area and the consistency between the repair directions with structural content.Image repair algorithm with texture information performs well in repairing seriously damaged images,but it has bad performances when the images have the abundant structure information.The dual optimization image repair algorithm based on the linear structure and the optimal texture is proposed.The algorithm uses the double-constraint sparse model to reconstruct the missed information in large area in order to improve the clarity of repaired images.After adopting the preference of Criminisi priority,the image repair algorithm of self-similarity characteristics is proposed to improve the fault and fuzzy distortion phenomena in the repaired image.The results show that the proposed algorithm has more clarity in the image texture and structure and better effectiveness,and the peak signal-to-noise ratio of the repaired images by proposed algorithm is superior to that by other algorithms.
文摘针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on shared neighbors,SN-WLLE)算法,并用于滚动轴承故障诊断.该算法首先使用余弦距离划分样本邻域;其次计算样本邻域对相似度用以评估样本共享近邻信息,并结合样本的6种邻居分布修正局部结构挖掘,提高多共享近邻的k近邻重构准确性;接着从多流形的角度评估样本点与近邻点间的稀疏分布一致性,以获得样本的重要性指标,并在低维空间保持该信息,进而提取准确的鉴别特征;最后结合KNN分类器构建出完备的轴承故障诊断模型.采用凯斯西储大学轴承数据集和实验室测试平台轴承数据集,从可视化评估、定量聚类评估、故障识别精度评估及鲁棒性评估等方面进行分析.结果表明:SN-WLLE算法的F值保持在108以上水准,平均故障识别精度最低可达0.9734,不仅具有较好的类内紧致性与类间可分性,还对近邻参数k具有低敏感性.
文摘相比均匀线阵(Uniform Linear Array,ULA),相同阵元数目下稀疏线阵(Sparse Linear Array,SLA)的抗耦合效应更好,阵列孔径更大,到达方向(Direction of Arrival,DOA)估计的自由度(Degrees Of Freedom,DOF)更高,因而近年来得到了广泛的研究。为了可以进行高DOF的DOA估计,学者们开始研究SLA的差分虚拟阵元,差分虚拟阵元对应的协方差矩阵相比原阵元对应的协方差矩阵维度更大,因而估计的DOF更高。当SLA的差分虚拟阵元连续取值时,可以利用已有阵元的接收信息,得到SLA的协方差矩阵,在该矩阵的基础之上构建差分虚拟阵元的协方差矩阵进而进行DOA估计。然而,当SLA的差分虚拟阵元存在孔洞时,即差分虚拟阵元不能连续取值时,不能直接利用重构的协方差矩阵进行DOA估计,需要恢复完全增广协方差矩阵的信息再进行DOA估计。对于该问题,本文基于矢量化后原协方差矩阵和虚拟差分阵协方差矩阵的误差分布情况,并结合完全增广协方差矩阵的低秩特性和半正定特性来构建优化问题。通过求解该问题来恢复维度更高的完全增广协方差矩阵。最后对该矩阵进行奇异值分解,利用多重信号分类(Multiple Signal Classification,MUSIC)算法就可以获得多源的空间谱。本文最后通过数值仿真试验验证了所提算法可以实现高DOF的DOA估计,并且相比于现有算法,本文所提算法对欠定DOA估计的效果更好,多源DOA估计的精度更高,产生的误差更小。
文摘近几年局部流形学习算法研究得到了广泛的关注,如局部线性嵌入以及局部切空间排列算法等.这些算法都是基于局部可线性化的假设而提出的,但局部是否可线性化的问题没有得到很好有效的解决,使得目前的降维算法对自然数据效果不佳.自然数据中有很多是稀疏的,对稀疏数据的降维是局部线性嵌入算法所面临的一个问题.基于对数据自然属性的考虑,利用数据的统计信息动态确定局部线性化范围,依据数据的分布提出一种排列的稀疏局部线性嵌入算法(Sparse local linear embedding algorithm,SLLEA).在数据集稀疏的情况下,该算法能够很好地把握数据的局部和整体信息.将该算法应用于手工流形及图像检索等试验中,验证了该算法的有效性.
文摘基于网络编码(network coding,NC)的网络通信,其中间节点首先对来自源节点的信包进行编码,然后再转发,目标节点通过反编码得到源节点的原始信息.大量的理论结果表明,网络编码可以提高整个网络的吞吐量和稳定性.为了研究网络编码在P2P(peer to peer)网络中的优越性,设计并实现了一个基于稀疏线性编码技术的P2P内容分发系统.实验结果表明,基于网络编码的系统在平均下载时间、总分发时间、整体吞吐量等几个方面都优于无编码的内容分发系统.