期刊文献+
共找到132篇文章
< 1 2 7 >
每页显示 20 50 100
基于Tensor Cores的新型GPU架构的高性能Cholesky分解
1
作者 石璐 邹高远 +1 位作者 伍思琦 张少帅 《计算机工程与科学》 北大核心 2025年第7期1170-1180,共11页
稠密矩阵乘法(GEMMs)在Tensor Cores上可以实现高度优化。然而,现有的Cholesky分解的实现由于其有限的并行性无法达到Tensor Cores大部分的峰值性能。研究使用一种递归Cholesky分解的算法,通过将对角线块的递归细分,将原本的对称矩阵秩... 稠密矩阵乘法(GEMMs)在Tensor Cores上可以实现高度优化。然而,现有的Cholesky分解的实现由于其有限的并行性无法达到Tensor Cores大部分的峰值性能。研究使用一种递归Cholesky分解的算法,通过将对角线块的递归细分,将原本的对称矩阵秩K更新(SYRK)和三角方程组求解(TRSM)操作转化为大量的通用矩阵乘法(GEMMs),从而更充分地发挥Tensor Cores的峰值性能。实验结果表明,提出的递归Cholesky分解算法在FP32和FP16上分别比MAGMA/cuSOLVER算法提高了1.72倍和1.62倍。 展开更多
关键词 cholesky分解 高性能计算 数值线性代数 通用图形处理器(GPGPU)
在线阅读 下载PDF
面向国产芯片的可复现矩阵分解
2
作者 唐滔 姜浩 +2 位作者 彭林 漆海俊 鲁轻风 《计算机工程与科学》 北大核心 2025年第5期761-774,共14页
浮点程序的可复现性是指相同的浮点程序在多次不同的运行中得到按位完全相同的数值结果,这对程序调试或数值结果的正确性检验具有重要意义,在数值仿真模拟领域应用广泛。然而,浮点计算的结果往往受到计算顺序的影响,因而指令的动态调度... 浮点程序的可复现性是指相同的浮点程序在多次不同的运行中得到按位完全相同的数值结果,这对程序调试或数值结果的正确性检验具有重要意义,在数值仿真模拟领域应用广泛。然而,浮点计算的结果往往受到计算顺序的影响,因而指令的动态调度和乱序执行使得浮点计算的精确可复现成为一个挑战。矩阵分解算法在数值仿真应用中有着非常广泛的应用背景,基于可复现的矩阵分解算法可有效提升精度敏感的数值仿真应用的调试和结果分析的效率。基于无误差变换技术,在可复现BLAS库的基础上实现了分块LU分解、Cholesky分解和QR分解3个可复现矩阵分解算法,并在国产处理器上进行了验证。实验结果表明,可复现矩阵分解算法具备良好的数值精确性和可复现性。 展开更多
关键词 可复现 LU分解 cholesky分解 QR分解
在线阅读 下载PDF
基于Cholesky分解法的LHS放射性废物处置场安全不确定性分析 被引量:2
3
作者 赵润才 玉宇 陈涛 《原子能科学技术》 EI CAS CSCD 北大核心 2024年第4期731-741,共11页
放射性废物处置是一项与国土环境、公众安全、核工业健康以及可持续发展有关的重大问题。安全全过程系统分析是保障放射性废物处置设施从选址、建设、运行到关闭后安全性的重要手段,不确定性分析是其中重要一环。环境变化、人员行为等... 放射性废物处置是一项与国土环境、公众安全、核工业健康以及可持续发展有关的重大问题。安全全过程系统分析是保障放射性废物处置设施从选址、建设、运行到关闭后安全性的重要手段,不确定性分析是其中重要一环。环境变化、人员行为等事前无法控制的外部因素都将对放射性废物处置设施的安全产生重大影响,需要对其进行不确定性评估。在放射性废物处置库的不确定性分析中,参数不确定性分析的计算过程相较于常见的蒙特卡罗模拟的运用场景,其涉及输入的随机参数多、运用模型庞杂,势必需求更小的抽样样本以减少运算时间、提高抽样效率。拉丁超立方抽样(LHS)是不确定性分析中常用的方法,但该方法应用于多维抽样时由于排序质量较低,使得小样本条件下的相关性要求不能得到满足。本文采用Cholesky分解法对拉丁超立方抽样过程中的排列构造过程进行了改进,通过对排列矩阵各行向量进行解耦,以最小化其各维度间的相关性。此改进方案显著降低了拉丁超立方抽样对样本相关性的影响,加速了计算结果的收敛速度。在本文的使用场景下,改进后的抽样方法只需要使用改进前所需样本规模的1/10,提高了计算效率。 展开更多
关键词 不确定性分析 cholesky分解 拉丁超立方抽样 放射性废物处置
在线阅读 下载PDF
基于多时间尺度Cholesky分解AEKF的锂电池SOC估计 被引量:2
4
作者 徐洁玉 王冬青 《电工电能新技术》 CSCD 北大核心 2024年第3期49-55,共7页
建立可靠的锂电池荷电状态估算模型,获取精确估算值已成为锂离子电池组能源和安全管理的核心。选择锂离子电池的二阶等效电路模型为研究对象,提出了一种基于Cholesky分解优化多时间尺度自适应扩展卡尔曼滤波算法。状态方程中,对应不同... 建立可靠的锂电池荷电状态估算模型,获取精确估算值已成为锂离子电池组能源和安全管理的核心。选择锂离子电池的二阶等效电路模型为研究对象,提出了一种基于Cholesky分解优化多时间尺度自适应扩展卡尔曼滤波算法。状态方程中,对应不同状态变量子方程,选择不同采样周期,解决不同状态变量的不同时间尺度问题。考虑噪声变化,在扩展卡尔曼滤波的基础上,引入噪声的迭代估计,实现噪声的自适应矫正,结合Cholesky分解方法以克服计算的舍入误差问题。在不同工况下,选用不同型号的锂电池进行实验验证,验证该算法的普适性和有效性。 展开更多
关键词 锂离子电池 多时间尺度 荷电状态 cholesky分解 扩展卡尔曼滤波
在线阅读 下载PDF
纵向数据下精度矩阵的替代的修正Cholesky分解 被引量:1
5
作者 芦飞 曾宇婷 《中国科学技术大学学报》 CAS CSCD 北大核心 2024年第3期46-61,I0008,共17页
纵向数据下相关系数矩阵可能具有科学意义。然而,在精度矩阵具有典型结构时,很少有文献同时关注对模型误识别稳健的相关系数矩阵估计和对于数据中离群值的稳健性。本文中我们为纵向数据的精度矩阵提出了一种替代的修正Cholesky分解(alte... 纵向数据下相关系数矩阵可能具有科学意义。然而,在精度矩阵具有典型结构时,很少有文献同时关注对模型误识别稳健的相关系数矩阵估计和对于数据中离群值的稳健性。本文中我们为纵向数据的精度矩阵提出了一种替代的修正Cholesky分解(alternative modified Cholesky decomposition, AMCD),从而得到了关于新息方差模型误识别稳健的相关系数矩阵估计。我们建立了基于多元正态分布和AMCD的联合均值-协方差模型,发展了拟Fisher得分算法,证明了其极大似然估计的相合性和渐近正态性。进一步,我们建立了基于多元Laplace分布和AMCD的双稳健联合建模方法,为其极大似然估计发展了拟Newton算法。模拟研究和实际数据分析验证了所提AMCD方法的有效性。 展开更多
关键词 cholesky分解 精度矩阵 相关系数矩阵 多元Laplace分布 稳健性
在线阅读 下载PDF
纵向数据分析中使用滑动平均Cholesky分解对回归均值和协方差矩阵进行同时半参数建模(英文) 被引量:2
6
作者 邢昕 刘梅梅 张伟平 《中国科学技术大学学报》 CAS CSCD 北大核心 2013年第8期607-621,共15页
近年来,对纵向数据分析中回归均值和协方差矩阵同时进行建模研究得到越来越多的关注.为满足协方差矩阵的正定性约束,文献中常考虑对其逆矩阵进行某种分解.本文使用一种Cholesky分解方法对协方差矩阵本身进行分解,得到的参数没有取值限... 近年来,对纵向数据分析中回归均值和协方差矩阵同时进行建模研究得到越来越多的关注.为满足协方差矩阵的正定性约束,文献中常考虑对其逆矩阵进行某种分解.本文使用一种Cholesky分解方法对协方差矩阵本身进行分解,得到的参数没有取值限制且有着明确的统计意义.具体地,分解后的参数可以视为滑动平均序列的系数和对数更新方差,且在整个实轴上取值无限制.考虑到模型的稳健性和推断的有效性,提出了一种对回归均值和协方差矩阵同时进行半参数建模的方法,并利用广义估计方程和B样条给出了半参数模型的估计方法,得到了参数部分估计的渐近正态性以及非参数部分估计的最优收敛速度.最后通过模拟和实例分析对所提方法进行了数值研究. 展开更多
关键词 纵向数据 半参数模型 广义估计方程 修改的cholesky分解 滑动平均 B样条
在线阅读 下载PDF
基于三维动画镜头数据和Cholesky分解的水印算法 被引量:3
7
作者 李亚琴 方立刚 +1 位作者 廖黎莉 杨元峰 《计算机应用与软件》 北大核心 2019年第11期301-305,共5页
三维动画因生动逼真、高信息量的优点,被广泛应用于影视广告及虚拟展示等领域.但随之引发的下载、拷贝,甚至修改作者、篡改信息等恶意行为越来越严重,给中国动漫行业在国际上的声望造成了极坏的影响.提出一种数字水印算法,将数字水印这... 三维动画因生动逼真、高信息量的优点,被广泛应用于影视广告及虚拟展示等领域.但随之引发的下载、拷贝,甚至修改作者、篡改信息等恶意行为越来越严重,给中国动漫行业在国际上的声望造成了极坏的影响.提出一种数字水印算法,将数字水印这种信息安全方法应用到三维动画领域,以保护三维动画的版权,水印的嵌入载体选择的是动画中的镜头数据.收集一部三维动画中的镜头数据,形成一个矩阵,对此矩阵进行Cholesky分解,得到一个下三角矩阵;把水印信息矩阵LU分解后的元素嵌入到下三角矩阵中,完成水印的嵌入;用更新后的下三角矩阵重构镜头数据矩阵;用新的镜头数据重新约束动画中的镜头,从而得到嵌入了水印的三维动画.通过对三维动画进行修改镜头、修改环境效果等攻击,验证得出算法具有较高的水印嵌入量、良好的隐藏性和抗攻击性,可以推广使用. 展开更多
关键词 数字水印 三维动画 版权保护 镜头数据 cholesky分解 LU分解
在线阅读 下载PDF
Cholesky分解细粒度并行算法 被引量:6
8
作者 邬贵明 窦勇 王淼 《计算机工程与科学》 CSCD 北大核心 2010年第9期102-106,164,共6页
本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16... 本文提出了一种Cholesky分解细粒度流水线并行算法,该算法可以处理任意规模的数据,可以充分开发FP-GA加速器提供的细粒度并行。实验表明,该算法具有很好的可扩展性,在Xilinx XC5 VLX330 FPGA上能够集成36个处理单元(PE),当矩阵的阶为16384、运行频率为200MHz时性能达到14.3GFLOPS。 展开更多
关键词 cholesky分解 细粒度并行 FPGA
在线阅读 下载PDF
基于鱼群优化算法和Cholesky分解的RELM的基因表达数据分类 被引量:3
9
作者 陆慧娟 魏莎莎 +1 位作者 关伟 缪燕子 《计算机科学》 CSCD 北大核心 2014年第12期226-230,共5页
提出一种基于鱼群优化算法和Cholesky分解的改进的正则极限学习机算法(FSC-RELM)来对基因表达数据进行分类。FSC-RELM算法中,首先用鱼群优化算法对RELM输入层权值进行优化,其中目标函数定义为误差函数的倒数;再对RELM输出层权值矩阵进... 提出一种基于鱼群优化算法和Cholesky分解的改进的正则极限学习机算法(FSC-RELM)来对基因表达数据进行分类。FSC-RELM算法中,首先用鱼群优化算法对RELM输入层权值进行优化,其中目标函数定义为误差函数的倒数;再对RELM输出层权值矩阵进行分解,采用Cholesky分解法进行优化,以提高算法速度,减少训练时间。为了评价算法性能,对若干标准基因数据集进行了实验,结果表明,FSC-RELM算法在较短的时间内可以获得较高的分类精度,性能优异。 展开更多
关键词 鱼群优化 正则极限学习机 cholesky分解 基因表达数据
在线阅读 下载PDF
基于Cholesky分解的改进的随机子空间法研究 被引量:11
10
作者 刘兴汉 王跃宇 《宇航学报》 EI CAS CSCD 北大核心 2007年第3期608-612,652,共6页
基于数据的随机子空间法是计算精度较高的环境激励下结构模态参数辨识方法之一。该方法的缺点是当响应数据量很大时,对Hankel矩阵(Y矩阵)进行QR分解的计算效率不够理想。对YYT矩阵元素进行合理简化,再对YYT简化矩阵进行乔利斯基(Choles... 基于数据的随机子空间法是计算精度较高的环境激励下结构模态参数辨识方法之一。该方法的缺点是当响应数据量很大时,对Hankel矩阵(Y矩阵)进行QR分解的计算效率不够理想。对YYT矩阵元素进行合理简化,再对YYT简化矩阵进行乔利斯基(Cholesky)分解。理论推导和算例分析结果均表明在不降低计算精度的同时,新方法的计算效率至少提高10倍。 展开更多
关键词 环境激励 模态参数辨识 随机子空间法 cholesky分解
在线阅读 下载PDF
基于质量阵Cholesky分解的发动机悬置系统优化 被引量:4
11
作者 郝慧荣 张慧杰 《计算力学学报》 EI CAS CSCD 北大核心 2018年第3期372-379,共8页
根据拉格朗日方程,建立发动机悬置系统的动力学模型;基于广义坐标下质量矩阵的Cholesky分解,设计正则模态矩阵;结合悬置系统的能量分布矩阵和工程约束条件,在最小二乘原则下,对支撑参数进行优化求解;在发动机的振动激励源分析的基础上,... 根据拉格朗日方程,建立发动机悬置系统的动力学模型;基于广义坐标下质量矩阵的Cholesky分解,设计正则模态矩阵;结合悬置系统的能量分布矩阵和工程约束条件,在最小二乘原则下,对支撑参数进行优化求解;在发动机的振动激励源分析的基础上,通过对悬置系统进行动力学仿真,证明了基于质量阵Cholesky分解的发动机悬置系统优化方法的可行性及有效性。 展开更多
关键词 发动机 悬置系统 动力学仿真 优化设计 cholesky分解
在线阅读 下载PDF
卷帘行存储下的一种并行 Cholesky分解及其在 P A R95 上的实现 被引量:3
12
作者 王顺绪 周树荃 《南京航空航天大学学报》 EI CAS CSCD 北大核心 1999年第4期428-433,共6页
  Cholesky 分解在科学与工程计算中占有重要的地位,串行的 Cholesky 分解已有成熟的方法,但并行的 Cholesky 分解方法要充分考虑机器体系的结构,在拥有共享内存的 M I M D 型多处理机、 S I M ...   Cholesky 分解在科学与工程计算中占有重要的地位,串行的 Cholesky 分解已有成熟的方法,但并行的 Cholesky 分解方法要充分考虑机器体系的结构,在拥有共享内存的 M I M D 型多处理机、 S I M D 型向量机系统上前人已有较好的工作,本文给出适用于 M P P 大规模并行计算机的卷帘行存储行格式的并行 Cholesky 分解算法,该算法使用了优先计算优先发送的策略,减少了结点机之间相互等待的时间,建立了结点机之间用于通讯的通讯数组,避免了使用撒播这一通讯模式,减少了通讯时间,通过在 P A R95 上的数值试验表明,随着问题规模的扩大,并行效率越来越高,并且该法容易推广到多行卷帘存储的形式。 展开更多
关键词 并行处理 cholesky分解 卷帘存储 MPP处理机
在线阅读 下载PDF
Cholesky分解更新算法及其在多用户检测算法中的应用 被引量:2
13
作者 卢光跃 邵朝 刘强 《信号处理》 CSCD 2003年第2期170-173,共4页
对用户归—化的互相关矩阵进行Cholesky分解是解相关判决反馈多用户检测算法(DDFB)的基础。本文针对实际信道的动态性,如用户的随机接入或离开信道,研究Cholesky分解的更新算法以避免对相关矩阵的实时Cholesky分解,对算法的复杂度进行分... 对用户归—化的互相关矩阵进行Cholesky分解是解相关判决反馈多用户检测算法(DDFB)的基础。本文针对实际信道的动态性,如用户的随机接入或离开信道,研究Cholesky分解的更新算法以避免对相关矩阵的实时Cholesky分解,对算法的复杂度进行分析,结果表明,在动态信道中,更新算法可以有效地降低算法的复杂度。 展开更多
关键词 信号检测 cholesky分解更新算法 多用户检测算法 反馈检测算法
在线阅读 下载PDF
Cholesky分解递归算法与改进 被引量:11
14
作者 陈建平 Jerzy Wasniew ski 《计算机研究与发展》 EI CSCD 北大核心 2001年第8期923-926,共4页
递归算法是计算稠密线性代数的一种新的有效方法 .递归产生自动、变化的矩阵分块 ,能充分发挥当今分级存储高性能计算机的效率 .对 Cholesky分解递归算法进行了研究 ,给出了算法的详细推导过程 ,用具有递归功能的 Fortran 90实现了算法 ... 递归算法是计算稠密线性代数的一种新的有效方法 .递归产生自动、变化的矩阵分块 ,能充分发挥当今分级存储高性能计算机的效率 .对 Cholesky分解递归算法进行了研究 ,给出了算法的详细推导过程 ,用具有递归功能的 Fortran 90实现了算法 ,并通过矩阵元素顺序重排的方法 ,进一步提高了递归算法的运算速度 .研究产生的算法比目前常用的分块算法快 15 %~ 2 5 % . 展开更多
关键词 数值计算 矩阵分块 分级存储 cholesky分解 递归算法 计算机
在线阅读 下载PDF
基于序贯重点采样粒子滤波和Cholesky分解的分布估计算法 被引量:2
15
作者 张建华 曾建潮 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1978-1985,共8页
连续域分布估计算法一般假设数据服从Gauss分布,而且大多采用了单峰的概率模型,但是对于一些复杂的优化问题,单峰的Gauss分布模型不能有效地描述解在空间的分布.提出一种基于序贯重点采样粒子滤波的分布估计算法,采用带权粒子描述优选... 连续域分布估计算法一般假设数据服从Gauss分布,而且大多采用了单峰的概率模型,但是对于一些复杂的优化问题,单峰的Gauss分布模型不能有效地描述解在空间的分布.提出一种基于序贯重点采样粒子滤波的分布估计算法,采用带权粒子描述优选集样本服从的概率分布,Cholesky分解法分解收缩的协方差矩阵并利用其产生下一代样本,不需要假设样本服从Gauss分布.算法采用的概率模型是多峰的.变量之间的相关性通过采样时利用群体的协方差矩阵显式地予以考虑,并对协方差矩阵为零矩阵的情况进行了处理.仿真实验结果验证了方法的正确性和有效性. 展开更多
关键词 序贯重点采样 粒子滤波 cholesky分解 分布估计算法 多峰概率模型
在线阅读 下载PDF
稀疏化递归Cholesky分解预条件技术加速PO-MoM迭代求解 被引量:2
16
作者 牛臻弋 徐金平 《应用科学学报》 CAS CSCD 北大核心 2006年第5期479-484,共6页
提出了一种新的稀疏化递归Cholesky分解预条件技术,并应用于加速物理光学和矩量法(PO-MoM)混合方法分析大型复杂载体上线天线的辐射问题.基于积分方程积分核的物理意义,忽略MoM区与PO区的耦合,构造出一个PO-MoM混合方法系数矩阵的稀疏... 提出了一种新的稀疏化递归Cholesky分解预条件技术,并应用于加速物理光学和矩量法(PO-MoM)混合方法分析大型复杂载体上线天线的辐射问题.基于积分方程积分核的物理意义,忽略MoM区与PO区的耦合,构造出一个PO-MoM混合方法系数矩阵的稀疏近似阵.然后采用Cholesky分解方法将该稀疏阵的逆阵进行递归分解,得到一个矩阵连乘形式的预条件阵.将该预条件阵用于预条件广义最小留数(GMRES)法迭代求解线性方程组,应用该技术对卫星和舰船两个电大尺寸复杂载体模型上天线辐射问题进行了求解.结果表明,采用这种新的预条件技术可以大大加快方程组迭代求解的收敛速度,明显提高计算效率. 展开更多
关键词 cholesky分解 预条件 物理光学和矩量法 线天线 复杂载体
在线阅读 下载PDF
基于GPU的并行Cholesky分解及其应用 被引量:1
17
作者 沈雁 戴瑜兴 《计算机工程》 CAS CSCD 北大核心 2019年第2期284-289,共6页
在OpenCL并行计算框架的clMAGMA库中,Cholesky分解算法采用大尺寸分块并行方法,不能充分利用GPU的高速局部存储器,且在计算过程中存在多次GPU-CPU间的数据传递。为此,提出采用小尺寸分块并行方法,充分利用GPU中的高速局部存储器,使矩阵... 在OpenCL并行计算框架的clMAGMA库中,Cholesky分解算法采用大尺寸分块并行方法,不能充分利用GPU的高速局部存储器,且在计算过程中存在多次GPU-CPU间的数据传递。为此,提出采用小尺寸分块并行方法,充分利用GPU中的高速局部存储器,使矩阵子块的逆矩阵得到复用,完成对称正定矩阵的高效Cholesky分解,并且其能够应用于三维视觉光束平差问题中的大型正定矩阵的分解。实验结果表明,该方法的Cholesky分解速度比clMAGMA提升50%以上,针对光束平差问题,比Ceres Solver中使用的Eigen库速度提升约38倍。 展开更多
关键词 正定系统 cholesky分解 并行计算 OpenCL框架 光束平差
在线阅读 下载PDF
用于快速P/G网分析的Cholesky分解法图模型
18
作者 竺红卫 马琪 +1 位作者 李春强 严晓浪 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第8期1080-1084,共5页
通过对Cholesky分解法求解线性方程组的分析 ,建立Cholesky分解法三角化对称正定阵的图模型 ,并基于该模型及Mesh结构P/G网络的自身特点 ,提出一个P/G网快速分析算法 实验证明 。
关键词 P/G网分析 cholesky分解 MESH结构 对称正定阵
在线阅读 下载PDF
基于修正的Cholesky分解高维图模型贝叶斯估计
19
作者 李凡群 杨桂元 《统计与决策》 CSSCI 北大核心 2017年第22期75-78,共4页
文章针对高维图模型的参数估计与模型恢复问题,提出了压缩贝叶斯估计。通过构造多层贝叶斯模型,对协方差矩阵进行Colesky分解,方便地得到了重新参数化后的新参数的满足条件分布。利用Gibbs抽样,得到参数的贝叶斯估计。通过计算后验包含... 文章针对高维图模型的参数估计与模型恢复问题,提出了压缩贝叶斯估计。通过构造多层贝叶斯模型,对协方差矩阵进行Colesky分解,方便地得到了重新参数化后的新参数的满足条件分布。利用Gibbs抽样,得到参数的贝叶斯估计。通过计算后验包含概率,进行模型选择。随机模拟结果表明,在高斯分布和t分布场合,压缩贝叶斯估计都有较好的稳定的表现。 展开更多
关键词 高维图模型 协方差矩阵 精确矩阵 压缩贝叶斯估计 cholesky分解
在线阅读 下载PDF
长方形Toeplliz-块矩阵的快速逆Cholesky分解
20
作者 郑慧娆 方云兰 +1 位作者 张莉 王治平 《数学物理学报(A辑)》 CSCD 北大核心 1998年第1期41-47,共7页
该文对m×n阶长方形Toeplitz-块矩阵A,提出了一种ATA进行逆Cholesky分解的快速算法.该算法乘法运算次数只有O(mn)次.
关键词 长方形Toeplitz-块矩阵 cholesky分解
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部