期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向天河新一代超算系统的大规模精确对角化方法
1
作者 李彪 刘杰 王庆林 《计算机研究与发展》 北大核心 2025年第6期1347-1362,共16页
精确对角化(exact diagonalization)方法是一种在量子物理、凝聚态物理等领域广泛应用的数值计算方法,是最直接求得量子系统基态的数值方法.仅从哈密顿矩阵的对称性出发,利用无矩阵(matrix-free)方法、分层通信模型以及适配于MT-3000的... 精确对角化(exact diagonalization)方法是一种在量子物理、凝聚态物理等领域广泛应用的数值计算方法,是最直接求得量子系统基态的数值方法.仅从哈密顿矩阵的对称性出发,利用无矩阵(matrix-free)方法、分层通信模型以及适配于MT-3000的数据级并行算法,提出了面向天河新一代超算系统上的超大稀疏哈密顿矩阵向量乘异构并行算法,可以实现基于一维Hubbard模型的大规模精确对角化.提出的并行算法在天河新一代超算系统上进行了测试,其中在1400亿维度矩阵规模上,8192进程相比256进程强扩展效率为55.27%,而弱扩展到7300亿维度矩阵规模上,13740个进程相比64进程的弱扩展效率保持在51.25%以上. 展开更多
关键词 精确对角化 HUBBARD模型 异构并行计算 MT-3000处理器 量子多体系统
在线阅读 下载PDF
基于多窗口划分集成学习的多维时间序列异常检测
2
作者 王泽南 王意洁 +1 位作者 周小晖 熊旭东 《计算机研究与发展》 北大核心 2025年第12期2962-2973,共12页
大语言模型时代下,大语言模型的训练和推理需要算力资源的支撑,其中针对算力资源指标数据的异常检测能够有效保障大语言模型的正常训练和推理.随着大语言模型参数的增加,大语言模型使用的算力资源规模日益扩大,其中反映算力运行状态的... 大语言模型时代下,大语言模型的训练和推理需要算力资源的支撑,其中针对算力资源指标数据的异常检测能够有效保障大语言模型的正常训练和推理.随着大语言模型参数的增加,大语言模型使用的算力资源规模日益扩大,其中反映算力运行状态的多类指标数据随着时间推移呈现出更复杂的时序周期性变化.现有的多维时序异常检测方法通常采用预设的窗口大小对多维时序数据进行滑动切片,但忽略不同维度周期特性的统一窗口划分会截断部分维度时序数据的完整周期性模式,阻碍了异常检测模型对多维时序数据正常模式的学习,导致异常检测效果变差.为了解决这一问题,提出了一种基于多窗口划分集成学习的无监督多维时序异常检测方法SELAD.具体地,首先利用傅里叶变换提取多维时序数据中各维度的周期性模式,并鉴于此信息进行多窗口划分,以保留各维度数据的完整周期性模式.在模型训练过程中,大语言模型参数量巨大的特点可以解决传统模型在滑动窗口增大后出现记忆瓶颈导致的学习效果变差的问题.通过设计一种混合专家模型将保留完整周期划分的时序数据输入融合大模型和LSTM模型的集成学习框架进行训练,以学习并重构各维度的正常时序模式.最终,基于重构误差检测多维时间序列数据中的异常.通过在4个多维时间序列数据集上实验,SELAD在平均F1分数上相比现有方法提升了17.87~90.77个百分点. 展开更多
关键词 多维时间序列 无监督异常检测 多窗口划分 集成学习 大语言模型
在线阅读 下载PDF
面向存算联调的跨云纠删码自适应数据访问方法 被引量:5
3
作者 张凯鑫 王意洁 +1 位作者 包涵 阚浚晖 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期571-588,共18页
日益旺盛的跨云存算联调需求对跨云数据访问速度提出较高要求.因此,跨云数据访问速度较高的基于数据冗余技术(纠删码和多副本)的跨云数据访问方法逐渐受到关注.其中,基于纠删码的跨云数据访问方法因其存储开销较低、容错性较高而成为当... 日益旺盛的跨云存算联调需求对跨云数据访问速度提出较高要求.因此,跨云数据访问速度较高的基于数据冗余技术(纠删码和多副本)的跨云数据访问方法逐渐受到关注.其中,基于纠删码的跨云数据访问方法因其存储开销较低、容错性较高而成为当前研究热点.为通过缩短编码块传输用时以提高数据访问速度,现有基于纠删码的跨云数据访问方法尝试引入缓存技术并优化编码数据访问方案.然而,由于现有方法的缓存管理粒度较粗且未协同优化缓存管理与编码数据访问方案,导致其存在缓存命中量低、缓存命中增效低、低传输速度编码块访问量大等问题,使得其编码块传输用时仍较长.为此,首先提出了一种基于星际文件系统(interplanetary file system,IPFS)的跨云存储系统框架(IPFS-based cross-cloud storage system framework,IBCS),可基于IPFS数据分片管理机制实现细粒度的缓存管理,从而可提高缓存命中量.然后,提出一种面向存算联调的跨云纠删码自适应数据访问方法(adaptive erasure-coded data access method for cross-cloud collaborative scheduling of storage and computation,AECAM).AECAM以编码块(含缓存编码块)与数据访问节点的分布为依据评估数据访问过程中各编码块的传输速度,并据此制定可避免访问低传输速度编码块的编码数据访问方案.此外,AECAM可识别出其制定编码数据访问方案时易选中且实际传输速度较低的编码块,并将其缓存在数据访问节点附近,从而可同时提高缓存命中量和命中增效.最后,基于IBCS和AECAM构建了面向跨云存算联调的存储系统(cross-cloud storage system for collaborative scheduling of storage and computation,C2S2).跨云环境下的实验表明,相较于现有引入缓存的基于纠删码的存储系统,C2S2可以将数据访问速度提高75.22%~81.29%. 展开更多
关键词 跨云存算联调 纠删码 数据访问技术 星际文件系统 缓存
在线阅读 下载PDF
低跨云数据中心修复流量的纠删码的快速构造方法 被引量:3
4
作者 包涵 王意洁 《计算机研究与发展》 EI CSCD 北大核心 2023年第10期2418-2439,共22页
近年来,云数据中心故障频发,因而各大机构纷纷采用跨云数据中心多副本技术对数据进行容灾存储.与跨云数据中心多副本技术相比,跨云数据中心纠删码技术可靠性更高、冗余度更低.但是,现有跨云数据中心纠删码技术无法同时满足低跨云数据中... 近年来,云数据中心故障频发,因而各大机构纷纷采用跨云数据中心多副本技术对数据进行容灾存储.与跨云数据中心多副本技术相比,跨云数据中心纠删码技术可靠性更高、冗余度更低.但是,现有跨云数据中心纠删码技术无法同时满足低跨云数据中心修复流量、高编码参数适应性和高纠删码构造效率,因而尚未在生产系统中得到普遍应用.提出一种低跨云数据中心修复流量的纠删码的快速构造方法(fast construction method of the erasure code with small cross-cloud data center repair traffic,FMEL),该方法可在不同编码参数下快速构造具有低跨云数据中心修复流量的纠删码.具体而言,FMEL首先将纠删码修复组分布方案及用户指定的编码参数转换为定长特征向量,并基于支持向量机对各特征向量进行快速分类以检验其对应纠删码修复组分布方案和编码参数的匹配性--某特征向量属于正类表示其对应纠删码修复组分布方案与编码参数相匹配.而后,FMEL用一种并行搜索算法从所有通过检验的纠删码修复组分布方案中选出平均跨云数据中心修复流量较小的一个方案,并用一种试错算法将其转换为具有低跨云数据中心修复流量的纠删码的生成矩阵.跨云数据中心环境中的实验表明,与现有的可在不同编码参数下构造出能达到平均跨云数据中心修复流量下限的最优码的工作相比,FMEL可将纠删码构造用时缩短89%,且在大部分编码参数下,二者构造的纠删码的跨云数据中心修复流量相同.此外,与其他几类常用纠删码相比,FMEL构造的纠删码可将跨云数据中心修复流量降低42.9%~56.0%. 展开更多
关键词 跨云数据中心存储 纠删码 容灾 容错 修复流量
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部