高斯过程通过概率建模能够有效地捕捉数据中的复杂关系,并提供关于预测结果的不确定性评估,是一个强大而灵活的工具.但由于矩阵求逆的较高计算复杂度,限制了模型在其他领域内的应用.本文针对高斯过程模型的矩阵求逆问题,提出了一种基于...高斯过程通过概率建模能够有效地捕捉数据中的复杂关系,并提供关于预测结果的不确定性评估,是一个强大而灵活的工具.但由于矩阵求逆的较高计算复杂度,限制了模型在其他领域内的应用.本文针对高斯过程模型的矩阵求逆问题,提出了一种基于球谐函数的高斯过程近似模型(Variational Sparse Gaussian Processes based on Spherical Harmonic,SHVSGP),通过球谐函数将数据映射到超球面上,在一个不同于数据原始输入域的空间中寻找一个更紧凑的输入特征代表集,使得产生的稀疏高斯过程模型能够包含有更丰富的信息特征,同时获得诱导变量相关的对角协方差矩阵,这极大简化了矩阵运算的复杂度,节省了计算成本.本文将SHVSGP模型与当下流行的其他近似方法在大规模数据集上进行比较,结果表明SHVSGP模型可以获得高效且精确的预测.展开更多
由于SSOR预条件共轭梯度算法中预条件方程求解需要前推和回代,导致算法迁移到GPU平台上并行效率不高.为此,基于诺依曼多项式分解技术,提出了一种GPU加速的SSOR稀疏近似逆预条件子(GSSORSAI).它不仅保持了原线性系统系数矩阵的稀疏和对...由于SSOR预条件共轭梯度算法中预条件方程求解需要前推和回代,导致算法迁移到GPU平台上并行效率不高.为此,基于诺依曼多项式分解技术,提出了一种GPU加速的SSOR稀疏近似逆预条件子(GSSORSAI).它不仅保持了原线性系统系数矩阵的稀疏和对称正定特性,而且预条件方程求解仅需一次稀疏矩阵矢量乘运算,避免了前推和回代过程.实验结果表明:在NVIDIA Tesla C2050GPU上,对比使用Python在单个CPU上SSOR稀疏近似逆预条件子实现方法,GSSORSAI平均快将近100倍;应用到并行的PCG算法中,相比无预条件的CG算法,平均提高了算法的3倍的收敛速度.展开更多
随着信息时代的来临,互联网产生的大规模高维数据呈现几何级数增长,对其进行谱聚类在计算时间和内存使用上都存在瓶颈问题,尤其是求Laplacian矩阵特征向量分解。鉴于Hadoop MapReduce并行编程模型对密集型数据处理的优势,基于t最近邻稀...随着信息时代的来临,互联网产生的大规模高维数据呈现几何级数增长,对其进行谱聚类在计算时间和内存使用上都存在瓶颈问题,尤其是求Laplacian矩阵特征向量分解。鉴于Hadoop MapReduce并行编程模型对密集型数据处理的优势,基于t最近邻稀疏化近似相似Laplacian矩阵,设计Hadoop MapReduce并行近似谱聚类算法,以期解决上述瓶颈问题。实验使用UCI Bag of Words数据集验证所设计算法的正确性和有效性,结果显示该并行设计在谱聚类质量和性能方面达到了一定的预期效果。展开更多
文摘高斯过程通过概率建模能够有效地捕捉数据中的复杂关系,并提供关于预测结果的不确定性评估,是一个强大而灵活的工具.但由于矩阵求逆的较高计算复杂度,限制了模型在其他领域内的应用.本文针对高斯过程模型的矩阵求逆问题,提出了一种基于球谐函数的高斯过程近似模型(Variational Sparse Gaussian Processes based on Spherical Harmonic,SHVSGP),通过球谐函数将数据映射到超球面上,在一个不同于数据原始输入域的空间中寻找一个更紧凑的输入特征代表集,使得产生的稀疏高斯过程模型能够包含有更丰富的信息特征,同时获得诱导变量相关的对角协方差矩阵,这极大简化了矩阵运算的复杂度,节省了计算成本.本文将SHVSGP模型与当下流行的其他近似方法在大规模数据集上进行比较,结果表明SHVSGP模型可以获得高效且精确的预测.
文摘由于SSOR预条件共轭梯度算法中预条件方程求解需要前推和回代,导致算法迁移到GPU平台上并行效率不高.为此,基于诺依曼多项式分解技术,提出了一种GPU加速的SSOR稀疏近似逆预条件子(GSSORSAI).它不仅保持了原线性系统系数矩阵的稀疏和对称正定特性,而且预条件方程求解仅需一次稀疏矩阵矢量乘运算,避免了前推和回代过程.实验结果表明:在NVIDIA Tesla C2050GPU上,对比使用Python在单个CPU上SSOR稀疏近似逆预条件子实现方法,GSSORSAI平均快将近100倍;应用到并行的PCG算法中,相比无预条件的CG算法,平均提高了算法的3倍的收敛速度.
文摘随着信息时代的来临,互联网产生的大规模高维数据呈现几何级数增长,对其进行谱聚类在计算时间和内存使用上都存在瓶颈问题,尤其是求Laplacian矩阵特征向量分解。鉴于Hadoop MapReduce并行编程模型对密集型数据处理的优势,基于t最近邻稀疏化近似相似Laplacian矩阵,设计Hadoop MapReduce并行近似谱聚类算法,以期解决上述瓶颈问题。实验使用UCI Bag of Words数据集验证所设计算法的正确性和有效性,结果显示该并行设计在谱聚类质量和性能方面达到了一定的预期效果。