期刊文献+
共找到843篇文章
< 1 2 43 >
每页显示 20 50 100
基于Matrix Core的高性能多维FFT设计与优化 被引量:1
1
作者 陆璐 祝松祥 +2 位作者 田卿燕 林海山 郭逸劼 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期20-30,共11页
快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利... 快速傅里叶变换(FFT)算法广泛应用于科学计算等领域。为了充分挖掘图形处理器(GPU)的计算能力并进一步提高FFT的计算效率,该文针对矩阵形式的Stockham FFT,提出了一种基于Matrix Core的高性能多维FFT计算方案。在计算优化方面,该方案利用Matrix Core加速FFT计算中的矩阵乘运算,同时通过编译器内部指令完成小粒度的矩阵乘加,使得Matrix Core支持更多尺寸的FFT计算。在内存优化方面,该方案使用2层迭代策略,以充分利用共享内存,减少与全局内存的数据交换;根据Matrix Core的矩阵数据在各个线程寄存器中的分布规律,直接在寄存器上完成FFT计算中大量存在的矩阵逐元素乘操作;通过对共享内存中的数据进行重排来缓解存储体冲突,并采用双缓冲策略缓解访存瓶颈。该文还提出了高效的矩阵转置策略,以加速多维FFT计算。在AMD MI250 GPU平台上将该方案与GPU上主流的高性能FFT计算库rocFFT和VkFFT进行了比较实验,结果表明:该方案在AMD MI250上的1维、2维和3维FFT平均计算效率均优于rocFFT和VkFFT,3维FFT的平均计算效率为rocFFT的1.5倍,为VkFFT的2.0倍,具有较好的性能提升;mcFFT的计算精度与rocFFT和VkFFT保持在相同水平。 展开更多
关键词 图形处理器 matrix Core 快速傅里叶变换 矩阵乘法
在线阅读 下载PDF
基于Matrix Core的小尺寸批量矩阵乘法设计与优化
2
作者 陆璐 赵容 +1 位作者 梁志宏 索思亮 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期48-58,共11页
通用矩阵乘法(GEMM)是线性代数中最重要的运算,来自不同科学领域的许多应用程序都将其关键部分转换为使用GEMM的形式。GEMM广泛应用于大模型、机器学习、科学计算和信号处理等领域。特别是半精度的批处理GEMM(即FP16)一直是许多深度学... 通用矩阵乘法(GEMM)是线性代数中最重要的运算,来自不同科学领域的许多应用程序都将其关键部分转换为使用GEMM的形式。GEMM广泛应用于大模型、机器学习、科学计算和信号处理等领域。特别是半精度的批处理GEMM(即FP16)一直是许多深度学习框架的核心操作。目前AMD GPU上半精度批处理GEMM的访存和计算利用率不足,急需优化。为此,该文提出了一种半精度批处理GEMM(HGEMM)的图形处理器(GPU)优化方案。分块策略方面,根据输入矩阵块大小为线程分配相同的访存量和计算量,同时线程计算多个矩阵乘法,以提高计算单元的利用率。访存优化方面,以多读数据为代价,为每个线程分配相同访存量以便于编译器优化,保证访存和计算时间相互掩盖。对于矩阵尺寸小于16的极小尺寸批处理HGEMM,该文利用4×4×4的Matrix Core及其对应的分块方案,在提升访存性能的同时减少Matrix Core计算资源的浪费,并提供是否使用共享内存的选项来达到最高性能。在AMD GPU MI210平台上,将该方案与rocBLAS的2个算子进行性能对比,结果表明:该方案在AMD GPU MI210上的平均性能为rocBLASHGEMMBatched的4.14倍,rocBLASGEMMExBatched的4.96倍;对于极小尺寸批处理HGEMM,平均性能为rocBLASHGEMMBatched的18.60倍,rocBLASGEMMExBatched的14.02倍。 展开更多
关键词 图形处理器 matrix Core 矩阵乘法 访存优化
在线阅读 下载PDF
Launch dynamics modeling and simulation of box-type multiple launch rocket system considering plane clearance contact
3
作者 Jinxin Tang Guoping Wang +3 位作者 Genyang Wu Yutian Sun Lilin Gu Xiaoting Rui 《Defence Technology(防务技术)》 2025年第5期105-123,共19页
As the performance of the box-type multiple launch rocket system(BMLRS)improves,its mechanical structures,particularly the plane clearance design between the slider on the rocket and the guide inside the launch canist... As the performance of the box-type multiple launch rocket system(BMLRS)improves,its mechanical structures,particularly the plane clearance design between the slider on the rocket and the guide inside the launch canister,have grown increasingly complex.However,deficiencies still exist in the current launch modeling theory for BMLRS.In this study,a multi-rigid-flexible-body launch dynamics model coupling the launch platform and rocket was established using the multibody system transfer matrix method and the Newton-Euler formulation.Furthermore,considering the bending of the launch canister,a detection algorithm for slider-guide plane clearance contact was proposed.To quantify the contact force and friction effect between the slider and guide,the contact force model and modified Coulomb model were introduced.Both the modal and launch tests were conducted.Additionally,the modal convergence was verified.By comparing the modal experiments and simulation results,the maximum relative error of the eigenfrequency is 3.29%.thereby verifying the accuracy of the developed BMLRS dynamics model.Furthermore,the launch test validated the proposed plane clearance contact model.Moreover,the study investigated the influence of various model parameters on the dynamic characteristics of BMLRS,including launch canister bending stiffness,slider and guide material,slider-guide clearance,slider length and layout.This analysis of influencing factors provides a foundation for future optimization in BMLRS design. 展开更多
关键词 Box-type multiple launch rocket system Launch dynamics Plane clearance contact Contact detection algorithm Multibody system transfer matrix method(MSTMM)
在线阅读 下载PDF
Method for multiple attribute decision making based on incomplete linguistic judgment matrix 被引量:4
4
作者 Zhang Yao Fan Zhiping 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第2期298-303,共6页
With respect to the multiple attribute decision making problems with linguistic preference relations on alternatives in the form of incomplete linguistic judgment matrix, a method is proposed to analyze the decision p... With respect to the multiple attribute decision making problems with linguistic preference relations on alternatives in the form of incomplete linguistic judgment matrix, a method is proposed to analyze the decision problem. The incomplete linguistic judgment matrix is transformed into incomplete fuzzy judgment matrix and an optimization model is developed on the basis of incomplete fuzzy judgment matrix provided by the decision maker and the decision matrix to determine attribute weights by Lagrange multiplier method. Then the overall values of all alternatives are calculated to rank them. A numerical example is given to illustrate the feasibility and practicality of the proposed method. 展开更多
关键词 multiple attribute decision making incomplete linguistic judgment matrix decision matrix optimization model alternative ranking.
在线阅读 下载PDF
Multiple extended target tracking algorithm based on Gaussian surface matrix 被引量:2
5
作者 Jinlong Yang Peng Li +1 位作者 Zhihua Li Le Yang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第2期279-289,共11页
In this paper, we consider the problem of irregular shapes tracking for multiple extended targets by introducing the Gaussian surface matrix(GSM) into the framework of the random finite set(RFS) theory. The Gaussi... In this paper, we consider the problem of irregular shapes tracking for multiple extended targets by introducing the Gaussian surface matrix(GSM) into the framework of the random finite set(RFS) theory. The Gaussian surface function is constructed first by the measurements, and it is used to define the GSM via a mapping function. We then integrate the GSM with the probability hypothesis density(PHD) filter, the Bayesian recursion formulas of GSM-PHD are derived and the Gaussian mixture implementation is employed to obtain the closed-form solutions. Moreover, the estimated shapes are designed to guide the measurement set sub-partition, which can cope with the problem of the spatially close target tracking. Simulation results show that the proposed algorithm can effectively estimate irregular target shapes and exhibit good robustness in cross extended target tracking. 展开更多
关键词 multiple extended target tracking irregular shape Gaussian surface matrix(GSM) probability hypothesis density(PHD)
在线阅读 下载PDF
基于监督学习的稀疏矩阵乘算法优选
6
作者 彭林 张鹏 +2 位作者 陈俊峰 唐滔 黄春 《计算机工程与科学》 北大核心 2025年第3期381-391,共11页
稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了... 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。 展开更多
关键词 稀疏矩阵乘 SpGEMM SPA算法 HASH算法 ESC算法 机器学习
在线阅读 下载PDF
基于缓存数据重用的稀疏矩阵向量乘序列优化
7
作者 徐传福 邱昊中 车永刚 《计算机研究与发展》 北大核心 2025年第6期1434-1442,共9页
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可... 稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍. 展开更多
关键词 稀疏矩阵向量乘 矩阵幂函数 缓存数据重用 数据依赖 稀疏线性方程组求解
在线阅读 下载PDF
一种基于极值特征值差与特征值几何平均的多主用户频谱感知算法
8
作者 杨喜 王思宇 +4 位作者 雷可君 张耿 张银行 谭哲雯 王仁纬 《中南大学学报(自然科学版)》 北大核心 2025年第7期2767-2776,共10页
单主用户信号的出现主要引起多天线接收信号取样协方差矩阵中极值特征值的变化,而多主用户信号的出现则会同时扰动取样协方差矩阵极值特征值和其他特征值,此时,经典的极值特征值检测算法则会表现出次佳的检测性能。针对这一问题,本研究... 单主用户信号的出现主要引起多天线接收信号取样协方差矩阵中极值特征值的变化,而多主用户信号的出现则会同时扰动取样协方差矩阵极值特征值和其他特征值,此时,经典的极值特征值检测算法则会表现出次佳的检测性能。针对这一问题,本研究设计了一种基于极值特征值差与特征值几何平均(difference of extreme eigenvalues and geometric average of eigenvalues,DEEGAE)的多主用户信号检测判决规则;提出了一种基于Wishart矩阵特征值统计分布理论的感知判决门限的闭式求解方法。该算法在频谱感知过程中直接利用认知用户的多天线接收数据构造判决规则并实施感知判决,具有全盲检测的优点;通过融合2种极限特征值门限分析结果,提高了非渐近感知条件下感知结果的准确性。Monte-Carlo仿真试验表明,新算法具有比经典的最大最小特征值之比算法和协方差绝对值检测算法更优的多主用户信号检测性能,同时能获得比传统基于最大最小特征值之差及其改进算法更为可靠的检测结果;与此同时,新算法的检测性能随着样本数目以及天线数目的增大而显著提升。 展开更多
关键词 认知无线电 多主用户信号 盲频谱感知算法 中心Wishart随机矩阵 特征值分布
在线阅读 下载PDF
某丙烷脱氢装置大型管道高频振动特性分析
9
作者 贺佳 梁浩华 +3 位作者 张国华 杨玉强 胡美妃 陈政清 《振动与冲击》 北大核心 2025年第4期144-150,共7页
大型石化管道服役期间,受复杂工作环境影响,可能发生高频剧烈振动,影响结构正常使用,并存在较大的安全隐患,因此,很有必要对此类振动现象开展相关研究。以某丙烷脱氢装置的大型管道为对象,基于现场实测数据,分析了管道振动特性,并利用... 大型石化管道服役期间,受复杂工作环境影响,可能发生高频剧烈振动,影响结构正常使用,并存在较大的安全隐患,因此,很有必要对此类振动现象开展相关研究。以某丙烷脱氢装置的大型管道为对象,基于现场实测数据,分析了管道振动特性,并利用传递矩阵法,获取了管道内部不同工况下的气柱固有频率。研究发现:管道振动的加速度幅值大、位移幅值小,振动频率较高,且卓越频率之间存在明显的倍数关系,即倍频现象,如26 Hz和52 Hz;气柱固有频率与管道固有频率接近,结合压缩机的激励频率,引发了管道的共振现象。该研究采用的方法简便高效,可用于分析丙烷脱氢装置大型管道的振动特性,探求管道振动的原因,并为类似管道的性能评估和减振方案设计提供参考依据。 展开更多
关键词 管道振动 倍频现象 气柱固有频率 传递矩阵法
在线阅读 下载PDF
多约束鲁棒非负矩阵分解的冲击特征频带自适应分解方法
10
作者 梁霖 崔旭军 +1 位作者 胡文昊 代普淼 《西安交通大学学报》 北大核心 2025年第4期171-179,192,共10页
针对非负矩阵分解(NMF)在轴承故障的冲击振动频带分解中存在能量导向引起的频带混叠问题,提出了一种面向冲击故障频带自适应分解的多约束鲁棒非负矩阵分解方法。首先,采用β散度自适应加权的误差函数来避免信号未知分布引起的风险,以信... 针对非负矩阵分解(NMF)在轴承故障的冲击振动频带分解中存在能量导向引起的频带混叠问题,提出了一种面向冲击故障频带自适应分解的多约束鲁棒非负矩阵分解方法。首先,采用β散度自适应加权的误差函数来避免信号未知分布引起的风险,以信号频带数量作为分解秩的选择参考,通过对基矩阵施加正交约束实现自适应频带划分;其次,结合周期冲击响应时频谱的光滑频域和稀疏时域的特性,引入具有良好物理意义的光滑、稀疏约束,构建了面向振动时频谱的多约束鲁棒非负矩阵分解模型;最后,借助正则化技术和Stiefel流形优化方法设计了求解算法。仿真和实验结果表明,与多种NMF方法和典型频带选择方法相比,在面对缺陷引起的微弱冲击时,低频区间中往往存在着多种干扰源影响,所提分解模型能准确提取出高频区间的冲击响应频带,避免了能量导向的传统频带分解方式不足,约束项的引入则有效地提升了NMF的求解结果,增强了NMF方法在冲击特征频带微弱时的辨识能力。 展开更多
关键词 冲击特征频带 非负矩阵分解 多约束 频带分解
在线阅读 下载PDF
核心组件变更驱动的机械系统架构创新设计方法
11
作者 于菲 耿梦露 +1 位作者 刘智光 刘明晶 《机械设计》 北大核心 2025年第6期205-211,共7页
为解决架构创新驱动组件不明确与架构变更范围不清晰的问题,基于变更预测方法确定架构创新的驱动组件;通过多域矩阵确定架构变更范围,形成核心组件变更驱动的机械系统架构创新设计过程模型;以DF900D双导梁式架桥机架构创新设计方案验证... 为解决架构创新驱动组件不明确与架构变更范围不清晰的问题,基于变更预测方法确定架构创新的驱动组件;通过多域矩阵确定架构变更范围,形成核心组件变更驱动的机械系统架构创新设计过程模型;以DF900D双导梁式架桥机架构创新设计方案验证此模型的有效性。研究结果表明:采用此模型提出的创新设计方案能显著降低机械系统运行所需的时间和经济成本,较大程度提升系统性能。上述研究可为确定机械系统架构创新驱动组件和架构变更范围提供一定参考。 展开更多
关键词 架构创新 架构变更范围 变更预测方法 多域矩阵 导梁式架桥机
在线阅读 下载PDF
超长指令字DSP上的多方向Sobel算法实现与优化
12
作者 唐俊龙 段美竹 时洋 《湖南大学学报(自然科学版)》 北大核心 2025年第8期130-139,共10页
VLIW(very long instruction word)架构的DSP在图像处理和计算机视觉等实时性应用场景得到广泛应用,高并行性的多方向Sobel算法是这些应用领域的重要算法之一,面向VLIW DSP实现和优化多方向Sobel算法具有重要意义.本文提出了基于VLIW的... VLIW(very long instruction word)架构的DSP在图像处理和计算机视觉等实时性应用场景得到广泛应用,高并行性的多方向Sobel算法是这些应用领域的重要算法之一,面向VLIW DSP实现和优化多方向Sobel算法具有重要意义.本文提出了基于VLIW的数据重排Im2col(image to column)加矩阵乘GEMM(general matrix multiplication)优化卷积计算的方法,并采用DMA(direct memory access)双缓冲机制实现数据传输与内核计算的并行,减少了等待数据传输的时间开销,使用该方法在FT-Matrix DSP上实现并优化了多方向Sobel算法.实验结果显示,优化后的算法相比于OpenCV图像库中算法,实现了4.96~8.76倍的加速;比TMS320C6678处理器提升了3.26~6.60倍.这些结果表明,采用VLIW架构的DSP在密集型数据处理方面具有显著优势,在VLIW DSP上实现与优化的图像检测算法具有广阔应用前景. 展开更多
关键词 超长指令字(VLIW) 多方向Sobel算法 数据重排 矩阵乘 DMA双缓冲
在线阅读 下载PDF
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
13
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量乘 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
全双工中继和速率分割协同的安全传输方案
14
作者 魏明生 端思轶 +2 位作者 李世党 高全学 李春国 《西安电子科技大学学报》 北大核心 2025年第2期13-24,共12页
针对传统网络框架存在的诸如覆盖范围受限、系统容量偏低等固有缺陷,考虑具有不可信用户中继与速率分割协作通信中的安全问题,构建了远端用户的平均保密率与公共信息可达速率的加权和的最大化问题。首次将速率分割多址技术与协作中继技... 针对传统网络框架存在的诸如覆盖范围受限、系统容量偏低等固有缺陷,考虑具有不可信用户中继与速率分割协作通信中的安全问题,构建了远端用户的平均保密率与公共信息可达速率的加权和的最大化问题。首次将速率分割多址技术与协作中继技术相结合,同时考虑了公共消息广播特性可能引发的公共信息泄露风险。由于该问题中存在变量的耦合和非线性约束,导致其非凸特性,无法直接求解,因此考虑基站和中继设备的功率预算的约束下,联合优化预编码矩阵、公共信息分割和设备到设备的发射功率,采用连续凸逼近的方法,引入松弛变量,线性化处理非凸约束,将该非凸问题转换为易求解的凸问题,进而设计了一种全双工协作速率分割的迭代优化算法,避免了时间资源的浪费。仿真结果证明了所提方案的优越性:相比已有半双工速率分割多址方案,所提方案具有更良好的收敛性,硬件配置实时性有相应改善;同时相比不协作速率分割多址方案,可以实现更高的安全传输速率,为远端用户提供切实的安全保障。 展开更多
关键词 协作通信 优化算法 安全速率 预编码 速率分割多址
在线阅读 下载PDF
关于Boolean矩阵的加权广义逆 被引量:4
15
作者 张荣娥 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2007年第3期241-244,共4页
对Boolean矩阵的各种加权广义逆进行了研究,主要研究了Boolean矩阵A的加权最小二乘广义逆(AM)l-和加权极小范数广义逆(AN)m-存在的几个等价条件,并用(AM)l-和(AN)m-给出了Boolean矩阵A的加权Moore-Penrose逆AM+N存在的几个条件和若干等... 对Boolean矩阵的各种加权广义逆进行了研究,主要研究了Boolean矩阵A的加权最小二乘广义逆(AM)l-和加权极小范数广义逆(AN)m-存在的几个等价条件,并用(AM)l-和(AN)m-给出了Boolean矩阵A的加权Moore-Penrose逆AM+N存在的几个条件和若干等价刻画. 展开更多
关键词 boolean矩阵 广义逆 加权广义逆
在线阅读 下载PDF
基于维护信息更新的海上风电场预测性机会维护策略
16
作者 符杨 应飞祥 +2 位作者 黄玲玲 刘阳 张开华 《中国电机工程学报》 北大核心 2025年第10期3836-3847,I0020-I0022,共15页
为实现海上风电场的经济高效维护,提出一种基于维护信息动态更新的海上风电场多机多部件预测性机会维护(predictive opportunity maintenance,PdOM)策略。针对PdOM策略制定过程中面临的两方面问题,即如何处理维护信息的动态更新过程、... 为实现海上风电场的经济高效维护,提出一种基于维护信息动态更新的海上风电场多机多部件预测性机会维护(predictive opportunity maintenance,PdOM)策略。针对PdOM策略制定过程中面临的两方面问题,即如何处理维护信息的动态更新过程、如何在PdOM策略中建立维护信息与维护机会间的复杂耦合关系,首先,建立动态维护信息矩阵处理维护决策建模优化中维护信息的输入与动态更新。其次,基于经济相关性、风速及可及性带来的维护机会,考虑多维信息与维护机会之间的复杂相互关系,建立海上风电场PdOM策略目标函数与约束条件;基于动态维护信息矩阵更新维护信息,根据更新后得到的维护信息对PdOM策略进行动态调整,从而实现无限期的PdOM。最后,以一个含56台风机的海上风电场为例进行分析。结果表明:所提PdOM策略能够充分利用维护信息与维护机会,实现海上风电场多机多部件经济高效维护;同时,可根据维护信息的变化及时更新维护条件,并对维护策略进行动态调整,避免非必要的维护,进一步确保维护的经济性。 展开更多
关键词 海上风电场 多机多部件 预测性机会维护 维护信息矩阵 动态维护决策
在线阅读 下载PDF
基于改进自适应交互式多模型无迹卡尔曼滤波算法的车辆目标跟踪
17
作者 南奔洋 匡兵 景晖 《科学技术与工程》 北大核心 2025年第11期4605-4611,共7页
为解决传统交互式多模型(interactive multiple model, IMM)算法在车辆目标跟踪中存在模型概率变化不明显和跟踪精度不足问题,提出一种改进的自适应IMM-UKF(unscented Kalman filter)算法。首先采用匀速直线、匀加速直线和匀速转弯来建... 为解决传统交互式多模型(interactive multiple model, IMM)算法在车辆目标跟踪中存在模型概率变化不明显和跟踪精度不足问题,提出一种改进的自适应IMM-UKF(unscented Kalman filter)算法。首先采用匀速直线、匀加速直线和匀速转弯来建立车辆的运动模型,并通过无迹卡尔曼滤波对车辆目标进行跟踪。然后将子模型概率变化率作为IMM算法修正参数,对马尔可夫矩阵主对角线和非主对角线元素采用不同的修正策略。最后设置判定窗修正归一化后的马尔可夫矩阵主对角线元素,以扩大匹配模型的概率。结果表明,改进算法模型概率变化更加明显,位置和速度均方根误差均要小于原有算法,有效地提高了跟踪精度。 展开更多
关键词 目标跟踪 交互式多模型 自适应 马尔可夫矩阵 无迹卡尔曼滤波
在线阅读 下载PDF
一种改进的交互多模型算法在机场运动目标跟踪中的应用
18
作者 鲁其兴 汤新民 +1 位作者 齐鸣 管祥民 《电子与信息学报》 北大核心 2025年第7期2225-2236,共12页
为了提高场面监视效率,实现场面运动目标精准跟踪,考虑到传统交互多模型由于固定马尔可夫转移概率矩阵导致模型跟踪精度降低,该文提出一种转移概率自适应改进的交互多模型滤波算法。该算法利用观测数据和滤波残差数据,结合模糊推理算法... 为了提高场面监视效率,实现场面运动目标精准跟踪,考虑到传统交互多模型由于固定马尔可夫转移概率矩阵导致模型跟踪精度降低,该文提出一种转移概率自适应改进的交互多模型滤波算法。该算法利用观测数据和滤波残差数据,结合模糊推理算法,构建机动强弱模糊推理系统,推理出观测数据与隐马尔可夫显状态集合的映射关系,得到显状态集下的状态序列;根据隐马尔可夫模型中的Baum-Welch算法实时求解状态转移矩阵和更新观测概率矩阵,优化状态转移概率矩阵自适应更新策略;将机动强弱模糊推理系统和隐马尔可夫模型融入交互多模型算法中,构成机动目标实时估计的模糊隐马尔可夫-交互多模型算法,以提高跟踪精度;最后,基于实际场面ADS-B轨迹数据进行了验证,验证结果显示,改进后的交互多模型能够在非等间隔预测条件下实现参数的自适应调整,且在双维度4项统计指标中,位置跟踪精度方面分别提高了63.5%,54.3%,40.3%,22.7%,速度和加速度的轨迹拟合精度均得到了提高,验证了改进算法的优越性。 展开更多
关键词 目标跟踪 交互多模型 ADS-B 转移概率矩阵 跟踪误差
在线阅读 下载PDF
输入感知的通用矩阵-向量乘算法在Hygon DCU的自适应性能优化
19
作者 李庆 贾海鹏 +1 位作者 张云泉 张思佳 《计算机科学》 北大核心 2025年第4期291-300,共10页
GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEM... GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEMV应用领域的不断扩大,GEMV的输入特征体现出多样化的趋势。在这种背景下,单纯靠一种优化方法,无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能。因此,在访存优化、指令重排、并行规约、共享内存、线程排布等传统优化手段的基础上,提出了一种输入感知的性能自适应优化方法,其能够根据输入矩阵的不同规模和形状自动调整计算kernel的实现方式以达到最佳性能,显著提高了GEMV在Hygon DCU上的性能。实验结果表明,在Hygon DCU Z100SM上,输入感知的通用矩阵-向量乘算法的整体性能明显优于RocBLAS库中的相关算法,对于不同的矩阵输入规模,性能最大提升为RocBLAS库中对应算法的3.0203倍。 展开更多
关键词 通用矩阵-向量乘法 DCU 基础线性代数子程序函数库 自适应调优 性能优化
在线阅读 下载PDF
基于数据聚类的CSI反馈Transformer网络简化实现方法
20
作者 还冬锐 张逸帆 姜明 《数据采集与处理》 北大核心 2025年第2期431-445,共15页
为应对大规模多输入多输出(Multiple⁃input multiple⁃output,MIMO)系统中信道状态信息(Channel state information,CSI)反馈开销的日益增长,基于深度学习的CSI反馈网络(如Transformer网络)受到了广泛的关注,是一种非常有应用前景的智能... 为应对大规模多输入多输出(Multiple⁃input multiple⁃output,MIMO)系统中信道状态信息(Channel state information,CSI)反馈开销的日益增长,基于深度学习的CSI反馈网络(如Transformer网络)受到了广泛的关注,是一种非常有应用前景的智能传输技术。为此,本文提出了一种基于数据聚类的CSI反馈Transformer网络的简化方法,采用基于聚类的近似矩阵乘法(Approximate matrix multiplication,AMM)技术,以降低反馈过程中Transformer网络的计算复杂度。本文主要对Transformer网络的全连接层计算(等效为矩阵乘法),应用乘积量化(Product quantization,PQ)和MADDNESS等简化方法,分析了它们对计算复杂度和系统性能的影响,并针对神经网络数据的特点进行了算法优化。仿真结果表明,在适当的参数调整下,基于MADDNESS方法的CSI反馈网络性能接近精确矩阵乘法方法,同时可大幅降低计算复杂度。 展开更多
关键词 信道状态信息反馈 多输入多输出 神经网络 近似矩阵乘法 聚类计算
在线阅读 下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部