期刊文献+
共找到287篇文章
< 1 2 15 >
每页显示 20 50 100
Nonlinear industrial process fault diagnosis with latent label consistency and sparse Gaussian feature learning
1
作者 LI Xian-ling ZHANG Jian-feng +2 位作者 ZHAO Chun-hui DING Jin-liang SUN You-xian 《Journal of Central South University》 SCIE EI CAS CSCD 2022年第12期3956-3973,共18页
With the increasing complexity of industrial processes, the high-dimensional industrial data exhibit a strong nonlinearity, bringing considerable challenges to the fault diagnosis of industrial processes. To efficient... With the increasing complexity of industrial processes, the high-dimensional industrial data exhibit a strong nonlinearity, bringing considerable challenges to the fault diagnosis of industrial processes. To efficiently extract deep meaningful features that are crucial for fault diagnosis, a sparse Gaussian feature extractor(SGFE) is designed to learn a nonlinear mapping that projects the raw data into the feature space with the fault label dimension. The feature space is described by the one-hot encoding of the fault category label as an orthogonal basis. In this way, the deep sparse Gaussian features related to fault categories can be gradually learned from the raw data by SGFE. In the feature space,the sparse Gaussian(SG) loss function is designed to constrain the distribution of features to multiple sparse multivariate Gaussian distributions. The sparse Gaussian features are linearly separable in the feature space, which is conducive to improving the accuracy of the downstream fault classification task. The feasibility and practical utility of the proposed SGFE are verified by the handwritten digits MNIST benchmark and Tennessee-Eastman(TE) benchmark process,respectively. 展开更多
关键词 nonlinear fault diagnosis multiple multivariate Gaussian distributions sparse Gaussian feature learning Gaussian feature extractor
在线阅读 下载PDF
Low complexity MIMO sonar imaging using a virtual sparse linear array
2
作者 Xionghou Liu Chao Sun +2 位作者 Yixin Yang Jie Zhuo Yina Han 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第2期370-378,共9页
A multiple-input multiple-output(MIMO) sonar can synthesize a large-aperture virtual uniform linear array(ULA) from a small number of physical elements. However, the large aperture is obtained at the cost of a gre... A multiple-input multiple-output(MIMO) sonar can synthesize a large-aperture virtual uniform linear array(ULA) from a small number of physical elements. However, the large aperture is obtained at the cost of a great number of matched filters with much heavy computation load. To reduce the computation load, a MIMO sonar imaging method using a virtual sparse linear array(SLA) is proposed, which contains the offline and online processing. In the offline processing, the virtual ULA of the MIMO sonar is thinned to a virtual SLA by the simulated annealing algorithm, and matched filters corresponding to inactive virtual elements are removed. In the online processing, outputs of matched filters corresponding to active elements are collected for further multibeam processing and hence, the number of matched filters in the echo processing procedure is effectively reduced. Numerical simulations show that the proposed method can reduce the computation load effectively while obtaining a similar imaging performance as the traditional method. 展开更多
关键词 multiple-input multiple-output(MIMO) sonar simulated annealing sonar imaging sparse arrays
在线阅读 下载PDF
联合功率域与码域NOMA‑OTFS系统研究 被引量:1
3
作者 周围 陈黎 +2 位作者 向曾 黎飞雨 余明明 《南京邮电大学学报(自然科学版)》 北大核心 2025年第2期13-19,共7页
正交时频空(OTFS)调制是一种新的6G候选波形,可在高移动性场景中提供可靠通信。为了更好地满足未来6G的需求,需要在高移动性场景中兼顾高频谱效率。然而现有功率域NOMA⁃OTFS(PD⁃NOMA⁃OTFS)和码域NOMA⁃OTFS(SCMA⁃OTFS)系统存在和速率低... 正交时频空(OTFS)调制是一种新的6G候选波形,可在高移动性场景中提供可靠通信。为了更好地满足未来6G的需求,需要在高移动性场景中兼顾高频谱效率。然而现有功率域NOMA⁃OTFS(PD⁃NOMA⁃OTFS)和码域NOMA⁃OTFS(SCMA⁃OTFS)系统存在和速率低、过载率(用户数/资源数)低和可支持用户数量少的问题。针对此问题,提出了联合功率域与码域NOMA⁃OTFS(PD⁃SCMA⁃OTFS)系统。该系统在发射端,根据信道增益高低将用户分为强、弱用户组,组内用户使用传统SCMA方式叠加,组间用户使用功率域NOMA思想叠加。在接收端,使用消息传递算法(MPA)和串行干扰消除(SIC)进行联合检测。通过对不同系统进行对比,结果表明,所提系统拥有更高的和速率,并且过载率是传统SCMA⁃OTFS和PD⁃NOMA⁃OTFS系统的1.5~2倍,可支持用户数量是传统系统的1.2~6倍。 展开更多
关键词 正交时频空 功率域非正交多址接入 稀疏码多址接入 和速率 过载率
在线阅读 下载PDF
基于监督学习的稀疏矩阵乘算法优选
4
作者 彭林 张鹏 +2 位作者 陈俊峰 唐滔 黄春 《计算机工程与科学》 北大核心 2025年第3期381-391,共11页
稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了... 稀疏矩阵乘算法中主流的row-by-row计算公式上的SPA、HASH、ESC 3种稀疏矩阵乘实现算法,在对不同的稀疏矩阵进行计算时性能差异显著,在不同非零元规模上单一算法不总是能取得最佳性能,而且单一算法与最优选择存在明显差距。为此,提出了一种基于机器学习的最优稀疏矩阵乘算法选择模型,以给定矩阵集作为数据源,抽取稀疏矩阵的特征,并使用SPA、HASH、ESC计算获得的性能数据进行训练和验证,获得的模型能够仅使用稀疏矩阵的特征即可完成对新数据集的算法优选。实验结果表明,该模型可以获得91%以上的预测准确率,平均性能达到最优选择的98%,是单一算法性能的1.55倍以上,并且可在实际库函数中使用,具有良好的泛化能力和实用价值。 展开更多
关键词 稀疏矩阵乘 SpGEMM SPA算法 HASH算法 ESC算法 机器学习
在线阅读 下载PDF
基于缓存数据重用的稀疏矩阵向量乘序列优化
5
作者 徐传福 邱昊中 车永刚 《计算机研究与发展》 北大核心 2025年第6期1434-1442,共9页
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可... 稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍. 展开更多
关键词 稀疏矩阵向量乘 矩阵幂函数 缓存数据重用 数据依赖 稀疏线性方程组求解
在线阅读 下载PDF
基于块压缩感知的大规模免授权多址接入方案
6
作者 张晶 马林 何艳 《南京邮电大学学报(自然科学版)》 北大核心 2025年第2期20-29,共10页
针对大规模机器终端零星突发传输场景,提出一种基于块压缩感知和自适应匹配追踪的大规模免授权多址接入方案。首先,将上行多址信号建模为逐帧稀疏结构压缩感知方程。然后,将上行多址信号重构问题转变为块稀疏结构的压缩感知多用户检测... 针对大规模机器终端零星突发传输场景,提出一种基于块压缩感知和自适应匹配追踪的大规模免授权多址接入方案。首先,将上行多址信号建模为逐帧稀疏结构压缩感知方程。然后,将上行多址信号重构问题转变为块稀疏结构的压缩感知多用户检测。最后,提出一种块稀疏模型自适应匹配追踪算法,完成多址信号检测,引入动态步长、动态剪枝和动态迭代3种自适应策略,提高多用户信号检测重构性能。仿真结果表明,所提方案极大降低了上行免授权多址接入传输的误码率,提高了无线网络的过载接入能力。 展开更多
关键词 大规模机器类型通信 免授权多址接入 压缩感知多用户检测 块稀疏模型 自适应匹配追踪
在线阅读 下载PDF
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
7
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量乘 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
基于算力动态分配的稀疏卷积加速器
8
作者 秦学毅 陈桂林 +3 位作者 魏祥麟 于龙 范建华 刘恒 《计算机工程与应用》 北大核心 2025年第15期178-188,共11页
稀疏化卷积计算是降低卷积神经网络计算复杂度的重要手段。当前设计的稀疏化卷积加速器仍然面临两方面的问题:一是非零元素位置不固定导致索引逻辑复杂,索引计算时间长;二是简单地跳过零值元素导致计算资源闲置浪费。为解决这两个问题,... 稀疏化卷积计算是降低卷积神经网络计算复杂度的重要手段。当前设计的稀疏化卷积加速器仍然面临两方面的问题:一是非零元素位置不固定导致索引逻辑复杂,索引计算时间长;二是简单地跳过零值元素导致计算资源闲置浪费。为解决这两个问题,设计了一种基于算力动态分配的稀疏卷积加速器。设计了一种动态非零值索引,降低了索引的计算时间和内存需求。提出了一种算力动态分配算法,将多个通道卷积跳零后的数据分配至一组乘法器,降低非零数据配对难度,避免资源闲置。在Xilinx XC7V2000平台上的仿真评估结果显示,在进行稀疏卷积计算时,所设计加速器的性能达438.3 GOPs,DSP效率达到了0.43 GOPs/DSP,与6种现有卷积加速器相比,DSP效率提升了1.26倍至2.86倍。 展开更多
关键词 稀疏卷积 神经网络 硬件加速 多通道
在线阅读 下载PDF
红外多目标跟踪的稀疏多假设匹配和模型优化
9
作者 徐长琦 王好贤 +1 位作者 王军 周志权 《红外与激光工程》 北大核心 2025年第2期216-228,共13页
伴随海洋经济的不断发展,目标跟踪作为海洋安全的重要部分,需要兼顾高实时性与高准确性。针对多目标跟踪过程中常出现模糊匹配错误以及深度学习目标检测器推理速度慢的问题,提出了一种基于稀疏多假设匹配的轻量化红外多目标跟踪算法。首... 伴随海洋经济的不断发展,目标跟踪作为海洋安全的重要部分,需要兼顾高实时性与高准确性。针对多目标跟踪过程中常出现模糊匹配错误以及深度学习目标检测器推理速度慢的问题,提出了一种基于稀疏多假设匹配的轻量化红外多目标跟踪算法。首先,从定量角度分析费用矩阵的匹配过程,结合深度级联匹配算法与多假设跟踪算法,设计并实现了稀疏多假设匹配算法,在稀疏化费用矩阵、减少匹配过程计算量的同时,提高了费用矩阵匹配精度;其次,针对深度学习模型参数多、存在冗余参数的问题,采用层自适应剪枝算法对YOLOv8s模型进行剪枝,在不牺牲模型准确度的同时,减少模型的参数量与浮点运算量,使得YOLOv8s模型能够在更广泛的场景下部署。在视频序列跟踪实验中,MOTA指标较其他算法提高了0.2%~1.2%,证明稀疏多假设匹配算法提升了目标跟踪效果;在剪枝实验中,相比于原模型,剪枝后的YOLOv8s模型的平均精度(mAP@50)提升了0.1%,参数量下降为42.0%,浮点运算量下降为66.4%,实现了推理准确度与推理速度的提升。 展开更多
关键词 红外多目标跟踪 稀疏多假设匹配 伪深度信息 层自适应幅度剪枝
在线阅读 下载PDF
光纤点式分布式多传感信号重构方法研究
10
作者 常海龙 张丕状 《传感技术学报》 北大核心 2025年第5期864-870,共7页
由于点式光纤传感器节点分布较为随机,存在强噪声干扰,导致重构效果不好。为此,提出一种光纤点式分布式多传感信号重构方法。基于多维函数稀疏表示的剪切波变换策略,实现信号二维稀疏化表示和压缩,去除信号中的强背景噪声。将去噪处理... 由于点式光纤传感器节点分布较为随机,存在强噪声干扰,导致重构效果不好。为此,提出一种光纤点式分布式多传感信号重构方法。基于多维函数稀疏表示的剪切波变换策略,实现信号二维稀疏化表示和压缩,去除信号中的强背景噪声。将去噪处理后的信号局部状态估计结果传输到中心节点,进行局部的状态估计,并使用平均一致性策略取得信号的局部信息量,推断出信号的全局信息量,得到信号全局状态估计结果,实现分布式多传感信号重构。结果表明,所提方法可较为完整地呈现了初始信号的时间信息与频率信息,拟合度在0.96以上,均方根误差均值在0.004 W/m^(2)以下,平均峰值信噪比值为38.74 dB,平均重构时间仅为10.52 s,能有效去除大部分干扰噪声,快速完成多传感信号的重构。 展开更多
关键词 点式分布式光纤传感器 多传感信号 稀疏化表示与压缩 平均一致性策略 信号重构
在线阅读 下载PDF
基于端信息完全跳扩混合技术的多用户接入机制研究
11
作者 张祚铭 李方晓 +1 位作者 罗胜瀚 石乐义 《电信科学》 北大核心 2025年第5期107-120,共14页
随着网络攻击日益频繁,传统网络防御技术已经无法满足当前需求。主动防御凭借其动态随机的特性,成为当前应对网络攻击的有效方法之一。端信息完全跳扩混合技术是一种主动防御技术,通过动态随机地调整端信息,使系统在端口关闭的情况下仍... 随着网络攻击日益频繁,传统网络防御技术已经无法满足当前需求。主动防御凭借其动态随机的特性,成为当前应对网络攻击的有效方法之一。端信息完全跳扩混合技术是一种主动防御技术,通过动态随机地调整端信息,使系统在端口关闭的情况下仍能保持通信,从而具有良好的隐蔽性和安全性。然而,该技术在传输速率和用户容量方面存在不足,仅支持一对一通信。为了解决上述问题,提出了一种新的网络通信策略,即将端信息完全跳扩混合技术和稀疏码分多址接入(sparse code multiple access,SCMA)相结合,以提高系统的接入用户容量和整体传输速率。理论分析和实验结果表明,在保证良好的隐蔽性和安全性情况下,该策略提高了系统的用户数量和传输速率。 展开更多
关键词 网络安全 端信息完全跳扩混合技术 主动网络防御 稀疏码分多址接入
在线阅读 下载PDF
成像引信二维稀疏MIMO阵列设计
12
作者 贺旭 李玉钊 +2 位作者 赵康 黄立峰 张梦宇 《现代防御技术》 北大核心 2025年第3期150-158,共9页
针对MIMO阵列雷达在成像引信上的应用,对引信近场成像中存在的等效相位中心误差进行分析并给出基于泰勒展开的二次项误差补偿方法。围绕弹上空间有限的前提条件,考虑收发天线耦合的影响,结合天线波束方向图的性能,给出收发阵元的半径分... 针对MIMO阵列雷达在成像引信上的应用,对引信近场成像中存在的等效相位中心误差进行分析并给出基于泰勒展开的二次项误差补偿方法。围绕弹上空间有限的前提条件,考虑收发天线耦合的影响,结合天线波束方向图的性能,给出收发阵元的半径分布区间作为有效集。在有效集的基础上提出基于分步粒子群(two-step particle swarm optimization,TS-PSO)算法的稀疏MIMO阵列优化方法,得到优化后的二维稀疏MIMO阵列。在此基础上,基于其接收的回波信号实现对等效相位中心误差和运动误差进行补偿,从而获取成像结果。由仿真结果可知,基于TS-PSO设计的二维稀疏MIMO阵列能够满足引信近场成像对分辨率和成像质量的需求,为下一步的实际应用奠定理论基础。 展开更多
关键词 多输入多输出 稀疏阵列 分步粒子群算法 近场成像 成像引信
在线阅读 下载PDF
TEB:GPU上矩阵分解重构的高效SpMV存储格式 被引量:2
13
作者 王宇华 张宇琪 +2 位作者 何俊飞 徐悦竹 崔环宇 《计算机科学与探索》 CSCD 北大核心 2024年第4期1094-1108,共15页
稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的... 稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的计算冗余,节约存储空间,但存在着负载不均衡的问题,浪费了计算资源。针对上述问题,对近年来效果良好的存储格式进行了研究,提出了一种逐行分解重组存储格式——TEB(threshold-exchangeorder block)格式。该格式采用启发式阈值选择算法确定合适分割阈值,并结合基于重排序的行归并算法,对稀疏矩阵进行重构分解,使得块与块之间非零元个数尽可能得相近,其次结合CUDA(computer unified device architecture)线程技术,提出了基于TEB存储格式的子块间并行SpMV算法,能够合理分配计算资源,解决负载不均衡问题,从而提高SpMV并行计算效率。为了验证TEB存储格式的有效性,在NVIDIA Tesla V100平台上进行实验,结果表明TEB相较于PBC(partition-block-CSR)、AMF-CSR(adaptive multi-row folding of CSR)、CSR-Scalar(compressed sparse row-scalar)和CSR5(compressed sparse row 5)存储格式,在SpMV的时间性能方面平均可提升3.23、5.83、2.33和2.21倍;在浮点计算性能方面,平均可提高3.36、5.95、2.29和2.13倍。 展开更多
关键词 稀疏矩阵向量乘法(SpMV) 重新排序 CSR格式 负载均衡 存储格式 图形处理器(GPU)
在线阅读 下载PDF
基于XGboost-DF的电力系统暂态稳定评估方法 被引量:2
14
作者 李楠 张家恒 《电测与仪表》 北大核心 2024年第10期119-127,共9页
针对现代互联电网扰动后失稳模式不再单一,多摆失稳频频发生的现象,文中提出一种基于极限梯度提升-深度森林的暂态稳定评估方法。利用母线电压轨迹簇构建人工特征集,通过极限梯度提升方法对特征集进行监督特征编码;利用深度森林对监督... 针对现代互联电网扰动后失稳模式不再单一,多摆失稳频频发生的现象,文中提出一种基于极限梯度提升-深度森林的暂态稳定评估方法。利用母线电压轨迹簇构建人工特征集,通过极限梯度提升方法对特征集进行监督特征编码;利用深度森林对监督编码后的稀疏矩阵进行三分类,进而建立起大规模数据集和失稳模式的映射关系;在IEEE 39节点和IEEE 140节点系统上进行仿真分析,所提方法具有很高的准确率和抗噪性能,能有效降低多摆失稳的误判率,并且在同步相量测量单元缺失情况下仍有较强的鲁棒性。 展开更多
关键词 暂态稳定评估 多摆失稳 极限梯度提升 深度森林 稀疏矩阵
在线阅读 下载PDF
基于稀疏正则化的加权叠加集成多标签分类
15
作者 肖建芳 刘缅芳 《计算机应用与软件》 北大核心 2024年第5期286-297,共12页
为了充分挖掘成对标签的相关性以及分类器权重与分类器选择之间的关系,提出一种基于稀疏正则化的加权叠加集成多标签分类方法。提出一个稀疏正则化的加权叠加集成模型,以便于多标签分类器的选择和集成成员的构建。利用分类器权值和标签... 为了充分挖掘成对标签的相关性以及分类器权重与分类器选择之间的关系,提出一种基于稀疏正则化的加权叠加集成多标签分类方法。提出一个稀疏正则化的加权叠加集成模型,以便于多标签分类器的选择和集成成员的构建。利用分类器权值和标签相关性来提高分类性能。进一步提出基于加速近端梯度和块坐标下降技术的优化算法来有效地获得最优解。在多个数据集上的实验结果表明,该方法能够有效实现较高精度的多标签分类。 展开更多
关键词 多标签分类 相关性 稀疏正则化 权值
在线阅读 下载PDF
基于近似消息传递的NOMA系统信道和脉冲噪声联合估计方法
16
作者 李有明 马冲亚 +1 位作者 吴永宏 国强 《电信科学》 北大核心 2024年第9期44-53,共10页
针对非高斯脉冲噪声背景下的非正交多址接入(non-orthogonal multiple access,NOMA)系统的信道估计问题,利用信道和脉冲噪声的稀疏特性,提出一种基于近似消息传递的信道和脉冲噪声联合估计方法。首先构建全子载波的压缩感知方程,然后基... 针对非高斯脉冲噪声背景下的非正交多址接入(non-orthogonal multiple access,NOMA)系统的信道估计问题,利用信道和脉冲噪声的稀疏特性,提出一种基于近似消息传递的信道和脉冲噪声联合估计方法。首先构建全子载波的压缩感知方程,然后基于稀疏贝叶斯学习理论提出一种信道、脉冲噪声和数据符号的联合估计优化问题。为解决这一超参量非线性非凸问题,设计了一种基于高斯广义近似消息传递和稀疏贝叶斯学习理论的期望最大化实现算法。仿真结果表明,与基于期望最大化的稀疏贝叶斯学习方法相比,所提算法在信道和脉冲噪声估计的均方误差、误码率等方面性能虽略有下降,但算法复杂度降低了1个数量级。 展开更多
关键词 非正交多址接入 信道估计 脉冲噪声估计 稀疏贝叶斯学习 近似消息传递
在线阅读 下载PDF
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
17
作者 姜晶菲 何源宏 +2 位作者 许金伟 许诗瑶 钱希福 《计算机工程与科学》 CSCD 北大核心 2024年第7期1141-1150,共10页
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产... 深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产异构向量处理器FT-M7032为智能模型处理中的数据并行和指令并行开发提供了较大空间。针对N∶M半结构化稀疏模型计算稀疏模式多样性,提出了一种面向FT-M7032的可灵活配置的稀疏矩阵乘算法NM-SpMM。NM-SpMM设计了一种高效的压缩偏移地址稀疏编码格式COA,避免了半结构化参数配置对稀疏数据访存计算的影响。基于COA编码,NM-SpMM对不同维度稀疏矩阵计算进行了细粒度优化。在FT-M7032单核上的实验结果表明,相较于稠密矩阵乘,NM-SpMM能获得1.73~21.00倍的加速,相较于采用CuSPARSE稀疏计算库的NVIDIA V100 GPU,能获得0.04~1.04倍的加速。 展开更多
关键词 深度神经网络 图形处理器 向量处理器 稀疏矩阵乘 流水线
在线阅读 下载PDF
SpMV计算的ARM和FPGA异构加速器设计
18
作者 朱明达 薛济擎 艾纯瑶 《电讯技术》 北大核心 2024年第2期302-309,共8页
针对稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)在边缘端实施效率不高的问题,以稀疏矩阵的存储格式、SpMV的现场可编程门阵列(Field Programmable Gate Array,FPGA)加速为研究对象,提出了一种多端口改进的行压缩存储格... 针对稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)在边缘端实施效率不高的问题,以稀疏矩阵的存储格式、SpMV的现场可编程门阵列(Field Programmable Gate Array,FPGA)加速为研究对象,提出了一种多端口改进的行压缩存储格式(Modified Compressed Sparse Row Format,MCSR)与ARM+FPGA架构任务级数据级硬件优化相结合的加速方法。使用多个端口并行存取数据来提高计算并行度;使用数据流、循环流水实现循环间、循环内的并行加速;使用数组分割、流传输实现数据的细粒度并行缓存与计算;使用ARM+FPGA架构,ARM完成对系统的控制,将计算卸载到FPGA并行加速。实验结果表明,并行加速优化后的ARM+FPGA方案相较于单ARM方案最高可达10倍的加速效果,而且增加的资源消耗在可接受范围内,矩阵规模越大非零值越多加速效果越明显。研究成果在边缘端实施SpMV计算方面有一定实用价值。 展开更多
关键词 稀疏矩阵向量乘(SpMV) 异构加速器 硬件加速
在线阅读 下载PDF
时空图卷积网络的骨架识别硬件加速器设计
19
作者 谭会生 严舒琪 杨威 《电子测量技术》 北大核心 2024年第11期36-43,共8页
随着人工智能技术的不断发展,神经网络的数据规模逐渐扩大,神经网络的计算量也迅速攀升。为了减少时空图卷积神经网络的计算量,降低硬件实现的资源消耗,提升人体骨架识别时空图卷积神经网络(ST-GCN)实际应用系统的处理速度,利用现场可... 随着人工智能技术的不断发展,神经网络的数据规模逐渐扩大,神经网络的计算量也迅速攀升。为了减少时空图卷积神经网络的计算量,降低硬件实现的资源消耗,提升人体骨架识别时空图卷积神经网络(ST-GCN)实际应用系统的处理速度,利用现场可编程门阵列(FPGA),设计开发了一个基于时空图卷积神经网络的骨架识别硬件加速器。通过对原网络模型进行结构优化与数据量化,减少了FPGA实现约75%的计算量;利用邻接矩阵稀疏性的特点,提出了一种稀疏性矩阵乘加运算的优化方法,减少了约60%的乘法器资源消耗。经过对人体骨架识别实验验证,结果表明,在时钟频率100 MHz下,相较于CPU,FPGA加速ST-GCN单元,加速比达到30.53;FPGA加速人体骨架识别,加速比达到6.86。 展开更多
关键词 人体骨架识别 时空图卷积神经网络(ST-GCN) 硬件加速器 现场可编程门阵列(FPGA) 稀疏矩阵乘加运算硬件优化
在线阅读 下载PDF
隐私保护的高效安全三方稀疏数据计算 被引量:2
20
作者 周丹钰 阎允雪 +2 位作者 张建栋 蒋瀚 徐秋亮 《计算机学报》 EI CAS CSCD 北大核心 2024年第5期1179-1193,共15页
如今,大数据与人工智能技术发展迅猛,基于海量数据进行精确训练的机器学习模型及其应用推动了生产力的提升,但同时也带来了严重的数据安全与隐私泄露问题,这一问题促进了隐私保护机器学习的研究.在实际应用中,机器学习算法常常在稀疏数... 如今,大数据与人工智能技术发展迅猛,基于海量数据进行精确训练的机器学习模型及其应用推动了生产力的提升,但同时也带来了严重的数据安全与隐私泄露问题,这一问题促进了隐私保护机器学习的研究.在实际应用中,机器学习算法常常在稀疏数据集上进行运算,明文下的模型训练存在高效计算方法,可以充分利用数据稀疏性,提高计算效率.为了保护数据隐私而引入的密码技术,将稀疏数据转化为稠密数据,从而使高效的稀疏数据运算变得复杂.现有的对于安全稀疏数据计算的相关研究都涉及大量公钥密码操作,计算效率不高,并且主要考虑两方的场景.实际上,稀疏数据的计算可简化为非零位置上相应元素的计算.为了充分利用这一特性以提高效率,本文将稀疏向量乘法问题分为了过滤和乘法计算两个模块来处理,并在三方联合计算的场景下进行协议设计.首先,基于三方加法复制秘密分享以及伪随机置换技术构建过滤协议,该协议能够实现对向量元素的过滤,筛选出向量中非零位置对应的元素.随后,在过滤协议的基础上引入加法同态加密技术,对非零元素进行安全乘法计算,实现一个隐私保护的安全三方稀疏向量乘法协议,并在半诚实敌手模型下,使用理想现实模拟范式证明了协议的安全性.最后,将隐私保护稀疏向量乘法协议应用到逻辑回归模型中,验证了其可用性.通过实验以及效率分析表明,相对于隐私保护稀疏矩阵乘法协议CAESAR,本文所提出的协议将主要计算开销由O(n)的密文运算次数,降低为O(m)次,其中n是向量的维数,m是向量中非零元素数量;在小批量的逻辑回归模型训练中,文本协议与通用安全多方计算框架ABY3相比有10%~30%的效率提升. 展开更多
关键词 安全多方计算 隐私保护机器学习 秘密分享 稀疏向量乘法 隐私计算
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部