期刊文献+
共找到297篇文章
< 1 2 15 >
每页显示 20 50 100
Nonlinear industrial process fault diagnosis with latent label consistency and sparse Gaussian feature learning
1
作者 LI Xian-ling ZHANG Jian-feng +2 位作者 ZHAO Chun-hui DING Jin-liang SUN You-xian 《Journal of Central South University》 SCIE EI CAS CSCD 2022年第12期3956-3973,共18页
With the increasing complexity of industrial processes, the high-dimensional industrial data exhibit a strong nonlinearity, bringing considerable challenges to the fault diagnosis of industrial processes. To efficient... With the increasing complexity of industrial processes, the high-dimensional industrial data exhibit a strong nonlinearity, bringing considerable challenges to the fault diagnosis of industrial processes. To efficiently extract deep meaningful features that are crucial for fault diagnosis, a sparse Gaussian feature extractor(SGFE) is designed to learn a nonlinear mapping that projects the raw data into the feature space with the fault label dimension. The feature space is described by the one-hot encoding of the fault category label as an orthogonal basis. In this way, the deep sparse Gaussian features related to fault categories can be gradually learned from the raw data by SGFE. In the feature space,the sparse Gaussian(SG) loss function is designed to constrain the distribution of features to multiple sparse multivariate Gaussian distributions. The sparse Gaussian features are linearly separable in the feature space, which is conducive to improving the accuracy of the downstream fault classification task. The feasibility and practical utility of the proposed SGFE are verified by the handwritten digits MNIST benchmark and Tennessee-Eastman(TE) benchmark process,respectively. 展开更多
关键词 nonlinear fault diagnosis multiple multivariate Gaussian distributions sparse Gaussian feature learning Gaussian feature extractor
在线阅读 下载PDF
Low complexity MIMO sonar imaging using a virtual sparse linear array
2
作者 Xionghou Liu Chao Sun +2 位作者 Yixin Yang Jie Zhuo Yina Han 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第2期370-378,共9页
A multiple-input multiple-output(MIMO) sonar can synthesize a large-aperture virtual uniform linear array(ULA) from a small number of physical elements. However, the large aperture is obtained at the cost of a gre... A multiple-input multiple-output(MIMO) sonar can synthesize a large-aperture virtual uniform linear array(ULA) from a small number of physical elements. However, the large aperture is obtained at the cost of a great number of matched filters with much heavy computation load. To reduce the computation load, a MIMO sonar imaging method using a virtual sparse linear array(SLA) is proposed, which contains the offline and online processing. In the offline processing, the virtual ULA of the MIMO sonar is thinned to a virtual SLA by the simulated annealing algorithm, and matched filters corresponding to inactive virtual elements are removed. In the online processing, outputs of matched filters corresponding to active elements are collected for further multibeam processing and hence, the number of matched filters in the echo processing procedure is effectively reduced. Numerical simulations show that the proposed method can reduce the computation load effectively while obtaining a similar imaging performance as the traditional method. 展开更多
关键词 multiple-input multiple-output(MIMO) sonar simulated annealing sonar imaging sparse arrays
在线阅读 下载PDF
联合功率域与码域NOMA‑OTFS系统研究 被引量:1
3
作者 周围 陈黎 +2 位作者 向曾 黎飞雨 余明明 《南京邮电大学学报(自然科学版)》 北大核心 2025年第2期13-19,共7页
正交时频空(OTFS)调制是一种新的6G候选波形,可在高移动性场景中提供可靠通信。为了更好地满足未来6G的需求,需要在高移动性场景中兼顾高频谱效率。然而现有功率域NOMA⁃OTFS(PD⁃NOMA⁃OTFS)和码域NOMA⁃OTFS(SCMA⁃OTFS)系统存在和速率低... 正交时频空(OTFS)调制是一种新的6G候选波形,可在高移动性场景中提供可靠通信。为了更好地满足未来6G的需求,需要在高移动性场景中兼顾高频谱效率。然而现有功率域NOMA⁃OTFS(PD⁃NOMA⁃OTFS)和码域NOMA⁃OTFS(SCMA⁃OTFS)系统存在和速率低、过载率(用户数/资源数)低和可支持用户数量少的问题。针对此问题,提出了联合功率域与码域NOMA⁃OTFS(PD⁃SCMA⁃OTFS)系统。该系统在发射端,根据信道增益高低将用户分为强、弱用户组,组内用户使用传统SCMA方式叠加,组间用户使用功率域NOMA思想叠加。在接收端,使用消息传递算法(MPA)和串行干扰消除(SIC)进行联合检测。通过对不同系统进行对比,结果表明,所提系统拥有更高的和速率,并且过载率是传统SCMA⁃OTFS和PD⁃NOMA⁃OTFS系统的1.5~2倍,可支持用户数量是传统系统的1.2~6倍。 展开更多
关键词 正交时频空 功率域非正交多址接入 稀疏码多址接入 和速率 过载率
在线阅读 下载PDF
基于监督学习的稀疏矩阵乘算法优选
4
作者 彭林 张鹏 +2 位作者 陈俊峰 唐滔 黄春 《计算机工程与科学》 北大核心 2025年第3期381-391,共11页
稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了... 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。 展开更多
关键词 稀疏矩阵乘 SpGEMM SPA算法 HASH算法 ESC算法 机器学习
在线阅读 下载PDF
多视角SAR图像联合决策的目标识别方法
5
作者 姚培娟 赵小龙 +3 位作者 李思逸 邵开丽 付辉 张亚娟 《探测与控制学报》 北大核心 2025年第5期137-143,共7页
以多视角SAR图像为输入提出一种自适应加权决策融合的合成孔径雷达(SAR)目标识别方法。采用联合稀疏表示对参与识别的多视角进行表征,得到相对应的重构误差矢量。基于熵理论对不同视角的误差矢量进行分析,评估其不确定性,据此定义对应... 以多视角SAR图像为输入提出一种自适应加权决策融合的合成孔径雷达(SAR)目标识别方法。采用联合稀疏表示对参与识别的多视角进行表征,得到相对应的重构误差矢量。基于熵理论对不同视角的误差矢量进行分析,评估其不确定性,据此定义对应的权值。利用自适应权值对不同视角的误差矢量进行加权融合,进而根据最终误差分布确定多视角SAR图像所属目标类别。自适应权值可更好发挥不同视角对于正确决策的贡献因而有利于提升SAR目标识别性能。基于MSTAR数据集设置4类场景开展对比实验,结果验证了提出方法的有效性。 展开更多
关键词 合成孔径雷达目标识别 自适应权值 多视角 联合稀疏表示
在线阅读 下载PDF
基于缓存数据重用的稀疏矩阵向量乘序列优化
6
作者 徐传福 邱昊中 车永刚 《计算机研究与发展》 北大核心 2025年第6期1434-1442,共9页
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可... 稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍. 展开更多
关键词 稀疏矩阵向量乘 矩阵幂函数 缓存数据重用 数据依赖 稀疏线性方程组求解
在线阅读 下载PDF
基于块压缩感知的大规模免授权多址接入方案
7
作者 张晶 马林 何艳 《南京邮电大学学报(自然科学版)》 北大核心 2025年第2期20-29,共10页
针对大规模机器终端零星突发传输场景,提出一种基于块压缩感知和自适应匹配追踪的大规模免授权多址接入方案。首先,将上行多址信号建模为逐帧稀疏结构压缩感知方程。然后,将上行多址信号重构问题转变为块稀疏结构的压缩感知多用户检测... 针对大规模机器终端零星突发传输场景,提出一种基于块压缩感知和自适应匹配追踪的大规模免授权多址接入方案。首先,将上行多址信号建模为逐帧稀疏结构压缩感知方程。然后,将上行多址信号重构问题转变为块稀疏结构的压缩感知多用户检测。最后,提出一种块稀疏模型自适应匹配追踪算法,完成多址信号检测,引入动态步长、动态剪枝和动态迭代3种自适应策略,提高多用户信号检测重构性能。仿真结果表明,所提方案极大降低了上行免授权多址接入传输的误码率,提高了无线网络的过载接入能力。 展开更多
关键词 大规模机器类型通信 免授权多址接入 压缩感知多用户检测 块稀疏模型 自适应匹配追踪
在线阅读 下载PDF
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
8
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量乘 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
面向语义通信的稀疏码分多址技术
9
作者 王秋实 秦天柱 +1 位作者 韩凯宁 胡剑浩 《信号处理》 北大核心 2025年第10期1614-1623,共10页
语义通信专注于传输语义含义,从而提高传输效率,其显著特征是传输信息的不同重要性,旨在通过传输信息的意义而非传统的比特流,来提高通信效率和系统性能。在语义通信中,不再是精确地传递每个比特,而是通过理解和解释信息的内容,从而减... 语义通信专注于传输语义含义,从而提高传输效率,其显著特征是传输信息的不同重要性,旨在通过传输信息的意义而非传统的比特流,来提高通信效率和系统性能。在语义通信中,不再是精确地传递每个比特,而是通过理解和解释信息的内容,从而减少冗余和噪声的影响。稀疏码分多址(Sparse Code Multiple Access, SCMA)是一种基于码域叠加的代表性非正交多址(Non-Orthogonal Multiple Access, NOMA)技术,它将低密度码和高维调制技术相结合,通过联合优化设计来提升无线通信系统的接入和承载能力。相比于传统的正交接入技术,SCMA在相同物理资源条件下通过动态过载的方式可以支持更多的用户连接和更高的系统容量。此外,SCMA还能够为未来移动通信系统提供免调度接入的特性,降低系统资源调度的时延开销,为反映物理层语义重要性提供了一种有效的方法。本文中提出了一种基于SCMA的语义通信框架,通过SCMA的分层传输可以和分层语义信息有效结合。消息传递算法(Message-Passing Algorithm, MPA)是SCMA最常用的检测方法,但其计算复杂度随着码本大小的增大而显著增加。为了解决这个问题,本文介绍了一种用于语义映射的改进SCMA码本,这种方法根据语义信息的重要性调整每个SCMA信息层的传输质量,同时显著降低码本大小,以降低检测复杂度。此外,本文提出了一种低复杂度检测方法,称为Proj-IQS MPA算法,以及其对应的对数域算法Proj-IQS Max-Log MPA。仿真结果表明,改进后的码本在多尺度结构相似性(Multi-Scale Structural Similarity, MS-SSIM)中优于传统的设计,在低信噪下能够有效恢复语义信息,并显著降低检测复杂度。 展开更多
关键词 语义通信 稀疏码分多址 语义映射 消息传递算法
在线阅读 下载PDF
基于算力动态分配的稀疏卷积加速器
10
作者 秦学毅 陈桂林 +3 位作者 魏祥麟 于龙 范建华 刘恒 《计算机工程与应用》 北大核心 2025年第15期178-188,共11页
稀疏化卷积计算是降低卷积神经网络计算复杂度的重要手段。当前设计的稀疏化卷积加速器仍然面临两方面的问题:一是非零元素位置不固定导致索引逻辑复杂,索引计算时间长;二是简单地跳过零值元素导致计算资源闲置浪费。为解决这两个问题,... 稀疏化卷积计算是降低卷积神经网络计算复杂度的重要手段。当前设计的稀疏化卷积加速器仍然面临两方面的问题:一是非零元素位置不固定导致索引逻辑复杂,索引计算时间长;二是简单地跳过零值元素导致计算资源闲置浪费。为解决这两个问题,设计了一种基于算力动态分配的稀疏卷积加速器。设计了一种动态非零值索引,降低了索引的计算时间和内存需求。提出了一种算力动态分配算法,将多个通道卷积跳零后的数据分配至一组乘法器,降低非零数据配对难度,避免资源闲置。在Xilinx XC7V2000平台上的仿真评估结果显示,在进行稀疏卷积计算时,所设计加速器的性能达438.3 GOPs,DSP效率达到了0.43 GOPs/DSP,与6种现有卷积加速器相比,DSP效率提升了1.26倍至2.86倍。 展开更多
关键词 稀疏卷积 神经网络 硬件加速 多通道
在线阅读 下载PDF
红外多目标跟踪的稀疏多假设匹配和模型优化
11
作者 徐长琦 王好贤 +1 位作者 王军 周志权 《红外与激光工程》 北大核心 2025年第2期216-228,共13页
伴随海洋经济的不断发展,目标跟踪作为海洋安全的重要部分,需要兼顾高实时性与高准确性。针对多目标跟踪过程中常出现模糊匹配错误以及深度学习目标检测器推理速度慢的问题,提出了一种基于稀疏多假设匹配的轻量化红外多目标跟踪算法。首... 伴随海洋经济的不断发展,目标跟踪作为海洋安全的重要部分,需要兼顾高实时性与高准确性。针对多目标跟踪过程中常出现模糊匹配错误以及深度学习目标检测器推理速度慢的问题,提出了一种基于稀疏多假设匹配的轻量化红外多目标跟踪算法。首先,从定量角度分析费用矩阵的匹配过程,结合深度级联匹配算法与多假设跟踪算法,设计并实现了稀疏多假设匹配算法,在稀疏化费用矩阵、减少匹配过程计算量的同时,提高了费用矩阵匹配精度;其次,针对深度学习模型参数多、存在冗余参数的问题,采用层自适应剪枝算法对YOLOv8s模型进行剪枝,在不牺牲模型准确度的同时,减少模型的参数量与浮点运算量,使得YOLOv8s模型能够在更广泛的场景下部署。在视频序列跟踪实验中,MOTA指标较其他算法提高了0.2%~1.2%,证明稀疏多假设匹配算法提升了目标跟踪效果;在剪枝实验中,相比于原模型,剪枝后的YOLOv8s模型的平均精度(mAP@50)提升了0.1%,参数量下降为42.0%,浮点运算量下降为66.4%,实现了推理准确度与推理速度的提升。 展开更多
关键词 红外多目标跟踪 稀疏多假设匹配 伪深度信息 层自适应幅度剪枝
在线阅读 下载PDF
光纤点式分布式多传感信号重构方法研究
12
作者 常海龙 张丕状 《传感技术学报》 北大核心 2025年第5期864-870,共7页
由于点式光纤传感器节点分布较为随机,存在强噪声干扰,导致重构效果不好。为此,提出一种光纤点式分布式多传感信号重构方法。基于多维函数稀疏表示的剪切波变换策略,实现信号二维稀疏化表示和压缩,去除信号中的强背景噪声。将去噪处理... 由于点式光纤传感器节点分布较为随机,存在强噪声干扰,导致重构效果不好。为此,提出一种光纤点式分布式多传感信号重构方法。基于多维函数稀疏表示的剪切波变换策略,实现信号二维稀疏化表示和压缩,去除信号中的强背景噪声。将去噪处理后的信号局部状态估计结果传输到中心节点,进行局部的状态估计,并使用平均一致性策略取得信号的局部信息量,推断出信号的全局信息量,得到信号全局状态估计结果,实现分布式多传感信号重构。结果表明,所提方法可较为完整地呈现了初始信号的时间信息与频率信息,拟合度在0.96以上,均方根误差均值在0.004 W/m^(2)以下,平均峰值信噪比值为38.74 dB,平均重构时间仅为10.52 s,能有效去除大部分干扰噪声,快速完成多传感信号的重构。 展开更多
关键词 点式分布式光纤传感器 多传感信号 稀疏化表示与压缩 平均一致性策略 信号重构
在线阅读 下载PDF
基于端信息完全跳扩混合技术的多用户接入机制研究
13
作者 张祚铭 李方晓 +1 位作者 罗胜瀚 石乐义 《电信科学》 北大核心 2025年第5期107-120,共14页
随着网络攻击日益频繁,传统网络防御技术已经无法满足当前需求。主动防御凭借其动态随机的特性,成为当前应对网络攻击的有效方法之一。端信息完全跳扩混合技术是一种主动防御技术,通过动态随机地调整端信息,使系统在端口关闭的情况下仍... 随着网络攻击日益频繁,传统网络防御技术已经无法满足当前需求。主动防御凭借其动态随机的特性,成为当前应对网络攻击的有效方法之一。端信息完全跳扩混合技术是一种主动防御技术,通过动态随机地调整端信息,使系统在端口关闭的情况下仍能保持通信,从而具有良好的隐蔽性和安全性。然而,该技术在传输速率和用户容量方面存在不足,仅支持一对一通信。为了解决上述问题,提出了一种新的网络通信策略,即将端信息完全跳扩混合技术和稀疏码分多址接入(sparse code multiple access,SCMA)相结合,以提高系统的接入用户容量和整体传输速率。理论分析和实验结果表明,在保证良好的隐蔽性和安全性情况下,该策略提高了系统的用户数量和传输速率。 展开更多
关键词 网络安全 端信息完全跳扩混合技术 主动网络防御 稀疏码分多址接入
在线阅读 下载PDF
成像引信二维稀疏MIMO阵列设计
14
作者 贺旭 李玉钊 +2 位作者 赵康 黄立峰 张梦宇 《现代防御技术》 北大核心 2025年第3期150-158,共9页
针对MIMO阵列雷达在成像引信上的应用,对引信近场成像中存在的等效相位中心误差进行分析并给出基于泰勒展开的二次项误差补偿方法。围绕弹上空间有限的前提条件,考虑收发天线耦合的影响,结合天线波束方向图的性能,给出收发阵元的半径分... 针对MIMO阵列雷达在成像引信上的应用,对引信近场成像中存在的等效相位中心误差进行分析并给出基于泰勒展开的二次项误差补偿方法。围绕弹上空间有限的前提条件,考虑收发天线耦合的影响,结合天线波束方向图的性能,给出收发阵元的半径分布区间作为有效集。在有效集的基础上提出基于分步粒子群(two-step particle swarm optimization,TS-PSO)算法的稀疏MIMO阵列优化方法,得到优化后的二维稀疏MIMO阵列。在此基础上,基于其接收的回波信号实现对等效相位中心误差和运动误差进行补偿,从而获取成像结果。由仿真结果可知,基于TS-PSO设计的二维稀疏MIMO阵列能够满足引信近场成像对分辨率和成像质量的需求,为下一步的实际应用奠定理论基础。 展开更多
关键词 多输入多输出 稀疏阵列 分步粒子群算法 近场成像 成像引信
在线阅读 下载PDF
基于MCS-SBL算法的配电网故障定位方法 被引量:3
15
作者 周群 刘梓琳 +2 位作者 冷敏瑞 印月 何川 《电力系统及其自动化学报》 CSCD 北大核心 2024年第3期30-38,共9页
配电网拓扑结构复杂,传统方法往往需要大量测点信息且难以实现快速有效的故障定位,本文提出基于少量测点信息的故障定位方法。首先,利用等效原理建立一个欠定的故障节点电压方程;其次,利用多重测量向量模型的贝叶斯压缩感知算法求解方程... 配电网拓扑结构复杂,传统方法往往需要大量测点信息且难以实现快速有效的故障定位,本文提出基于少量测点信息的故障定位方法。首先,利用等效原理建立一个欠定的故障节点电压方程;其次,利用多重测量向量模型的贝叶斯压缩感知算法求解方程,根据重构稀疏电流矩阵的非零元素位置求解故障区域,实现故障定位;最后,在IEEE33节点配电系统上进行仿真实验,结果表明,所提方法仅需要少量测点的故障前后正序电压分量便可有效定位故障,计算速度较快,并且基本不受故障类型、过渡电阻的影响,同时适用于单故障和多重故障的场景,具有较强的抗噪能力。 展开更多
关键词 配电网 故障定位 多重测量向量模型 稀疏电流 压缩感知
在线阅读 下载PDF
基于XGboost-DF的电力系统暂态稳定评估方法 被引量:3
16
作者 李楠 张家恒 《电测与仪表》 北大核心 2024年第10期119-127,共9页
针对现代互联电网扰动后失稳模式不再单一,多摆失稳频频发生的现象,文中提出一种基于极限梯度提升-深度森林的暂态稳定评估方法。利用母线电压轨迹簇构建人工特征集,通过极限梯度提升方法对特征集进行监督特征编码;利用深度森林对监督... 针对现代互联电网扰动后失稳模式不再单一,多摆失稳频频发生的现象,文中提出一种基于极限梯度提升-深度森林的暂态稳定评估方法。利用母线电压轨迹簇构建人工特征集,通过极限梯度提升方法对特征集进行监督特征编码;利用深度森林对监督编码后的稀疏矩阵进行三分类,进而建立起大规模数据集和失稳模式的映射关系;在IEEE 39节点和IEEE 140节点系统上进行仿真分析,所提方法具有很高的准确率和抗噪性能,能有效降低多摆失稳的误判率,并且在同步相量测量单元缺失情况下仍有较强的鲁棒性。 展开更多
关键词 暂态稳定评估 多摆失稳 极限梯度提升 深度森林 稀疏矩阵
在线阅读 下载PDF
TEB:GPU上矩阵分解重构的高效SpMV存储格式 被引量:2
17
作者 王宇华 张宇琪 +2 位作者 何俊飞 徐悦竹 崔环宇 《计算机科学与探索》 CSCD 北大核心 2024年第4期1094-1108,共15页
稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的... 稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的计算冗余,节约存储空间,但存在着负载不均衡的问题,浪费了计算资源。针对上述问题,对近年来效果良好的存储格式进行了研究,提出了一种逐行分解重组存储格式——TEB(threshold-exchangeorder block)格式。该格式采用启发式阈值选择算法确定合适分割阈值,并结合基于重排序的行归并算法,对稀疏矩阵进行重构分解,使得块与块之间非零元个数尽可能得相近,其次结合CUDA(computer unified device architecture)线程技术,提出了基于TEB存储格式的子块间并行SpMV算法,能够合理分配计算资源,解决负载不均衡问题,从而提高SpMV并行计算效率。为了验证TEB存储格式的有效性,在NVIDIA Tesla V100平台上进行实验,结果表明TEB相较于PBC(partition-block-CSR)、AMF-CSR(adaptive multi-row folding of CSR)、CSR-Scalar(compressed sparse row-scalar)和CSR5(compressed sparse row 5)存储格式,在SpMV的时间性能方面平均可提升3.23、5.83、2.33和2.21倍;在浮点计算性能方面,平均可提高3.36、5.95、2.29和2.13倍。 展开更多
关键词 稀疏矩阵向量乘法(SpMV) 重新排序 CSR格式 负载均衡 存储格式 图形处理器(GPU)
在线阅读 下载PDF
基于近似消息传递的NOMA系统信道和脉冲噪声联合估计方法 被引量:1
18
作者 李有明 马冲亚 +1 位作者 吴永宏 国强 《电信科学》 北大核心 2024年第9期44-53,共10页
针对非高斯脉冲噪声背景下的非正交多址接入(non-orthogonal multiple access,NOMA)系统的信道估计问题,利用信道和脉冲噪声的稀疏特性,提出一种基于近似消息传递的信道和脉冲噪声联合估计方法。首先构建全子载波的压缩感知方程,然后基... 针对非高斯脉冲噪声背景下的非正交多址接入(non-orthogonal multiple access,NOMA)系统的信道估计问题,利用信道和脉冲噪声的稀疏特性,提出一种基于近似消息传递的信道和脉冲噪声联合估计方法。首先构建全子载波的压缩感知方程,然后基于稀疏贝叶斯学习理论提出一种信道、脉冲噪声和数据符号的联合估计优化问题。为解决这一超参量非线性非凸问题,设计了一种基于高斯广义近似消息传递和稀疏贝叶斯学习理论的期望最大化实现算法。仿真结果表明,与基于期望最大化的稀疏贝叶斯学习方法相比,所提算法在信道和脉冲噪声估计的均方误差、误码率等方面性能虽略有下降,但算法复杂度降低了1个数量级。 展开更多
关键词 非正交多址接入 信道估计 脉冲噪声估计 稀疏贝叶斯学习 近似消息传递
在线阅读 下载PDF
基于稀疏正则化的加权叠加集成多标签分类
19
作者 肖建芳 刘缅芳 《计算机应用与软件》 北大核心 2024年第5期286-297,共12页
为了充分挖掘成对标签的相关性以及分类器权重与分类器选择之间的关系,提出一种基于稀疏正则化的加权叠加集成多标签分类方法。提出一个稀疏正则化的加权叠加集成模型,以便于多标签分类器的选择和集成成员的构建。利用分类器权值和标签... 为了充分挖掘成对标签的相关性以及分类器权重与分类器选择之间的关系,提出一种基于稀疏正则化的加权叠加集成多标签分类方法。提出一个稀疏正则化的加权叠加集成模型,以便于多标签分类器的选择和集成成员的构建。利用分类器权值和标签相关性来提高分类性能。进一步提出基于加速近端梯度和块坐标下降技术的优化算法来有效地获得最优解。在多个数据集上的实验结果表明,该方法能够有效实现较高精度的多标签分类。 展开更多
关键词 多标签分类 相关性 稀疏正则化 权值
在线阅读 下载PDF
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
20
作者 姜晶菲 何源宏 +2 位作者 许金伟 许诗瑶 钱希福 《计算机工程与科学》 CSCD 北大核心 2024年第7期1141-1150,共10页
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产... 深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产异构向量处理器FT-M7032为智能模型处理中的数据并行和指令并行开发提供了较大空间。针对N∶M半结构化稀疏模型计算稀疏模式多样性,提出了一种面向FT-M7032的可灵活配置的稀疏矩阵乘算法NM-SpMM。NM-SpMM设计了一种高效的压缩偏移地址稀疏编码格式COA,避免了半结构化参数配置对稀疏数据访存计算的影响。基于COA编码,NM-SpMM对不同维度稀疏矩阵计算进行了细粒度优化。在FT-M7032单核上的实验结果表明,相较于稠密矩阵乘,NM-SpMM能获得1.73~21.00倍的加速,相较于采用CuSPARSE稀疏计算库的NVIDIA V100 GPU,能获得0.04~1.04倍的加速。 展开更多
关键词 深度神经网络 图形处理器 向量处理器 稀疏矩阵乘 流水线
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部