期刊文献+
共找到1,231篇文章
< 1 2 62 >
每页显示 20 50 100
基于自注意力归因和剪枝的预训练语言模型去偏方法
1
作者 叶啟文 周栋 +1 位作者 王蒙蒙 曹步清 《中文信息学报》 北大核心 2025年第6期9-21,共13页
预训练语言模型编码了一系列社会偏见,应用在下游任务中可能会延续甚至放大对弱势群体的不公平对待。现有与任务无关的方法去偏效果迁移至下游任务中表现不佳,而与任务相关的方法主要依赖于下游微调数据标注的受保护属性标签。该文提出... 预训练语言模型编码了一系列社会偏见,应用在下游任务中可能会延续甚至放大对弱势群体的不公平对待。现有与任务无关的方法去偏效果迁移至下游任务中表现不佳,而与任务相关的方法主要依赖于下游微调数据标注的受保护属性标签。该文提出了基于自注意力归因和剪枝的预训练语言模型去偏方法,这是一种与任务相关但不需要依赖受保护属性标签的方法,适用于通用下游任务且具有可解释性。该方法将模型的决策归因于输入数据和自注意力头之间的信息交互,进而识别自注意力头对模型决策的重要性。通过权衡预测准确率和公平性,有选择地对偏见影响较大的头进行剪枝,从而实现模型去偏。该文在多个数据集上进行实验,实验结果表明,该方法可以有效缓解偏见且不损耗模型预测性能。 展开更多
关键词 预训练语言模型 公平性 去偏 自注意力归因
在线阅读 下载PDF
基于自注意力关联关系建模的医院招聘人岗智能匹配研究 被引量:1
2
作者 张茜 白琳 +1 位作者 杨丽娜 李陶深 《广西大学学报(自然科学版)》 北大核心 2025年第2期349-360,共12页
针对医院人才招聘中人岗匹配智能化程度不足的问题,提出一种基于自注意力深度学习与属性关联分析的人岗匹配模型。模型首先构建属性级的文本契合度预测模块,模块采用BERT技术获取细化的文本高级语义特征,提高简历与岗位需求说明书的属... 针对医院人才招聘中人岗匹配智能化程度不足的问题,提出一种基于自注意力深度学习与属性关联分析的人岗匹配模型。模型首先构建属性级的文本契合度预测模块,模块采用BERT技术获取细化的文本高级语义特征,提高简历与岗位需求说明书的属性级匹配预测准确性;其次,设计一种自注意力深度学习网络对多种属性的预测进行优化组合;然后基于深度全连接网络,建立从多种属性预测的优化组合到人岗匹配预测的非线性映射关系;最终实现基于多属性预测优化组合的人岗智能匹配。实验结果表明,所提模型在医学类招聘数据集上的精度达到86.2%,显著提高了人岗智能匹配的性能。 展开更多
关键词 智能招聘 人岗匹配 自注意力机制 属性关联关系建模 深度学习网络
在线阅读 下载PDF
基于自注意力机制和多尺度代价聚合的双目深度估计方法 被引量:1
3
作者 李恒宇 许晓俊 +2 位作者 杨小康 刘军 刘靖逸 《中国测试》 北大核心 2025年第8期122-130,共9页
针对无人系统在室外场景中细长、弱纹理等物体的深度估计困难问题,提出一种基于自注意力机制和多尺度代价聚合的双目深度估计方法。首先,利用可变形卷积和空洞金字塔卷积,改善特征提取模块的特征提取能力;其次,采用多尺度的匹配代价计算... 针对无人系统在室外场景中细长、弱纹理等物体的深度估计困难问题,提出一种基于自注意力机制和多尺度代价聚合的双目深度估计方法。首先,利用可变形卷积和空洞金字塔卷积,改善特征提取模块的特征提取能力;其次,采用多尺度的匹配代价计算,兼顾视差估计的全局连续性和细节信息;然后,匹配代价聚合模块引入自注意力机制,以解决代价体值分布不均的问题;之后,通过视差回归获得最终估计视差。最终,通过消融实验和对比实验对深度估计方法的性能进行验证。实验结果表明,在满足无人系统基本实时性的条件下,该方法使D1指标降低至1.28%,EPE指标降低至0.614像素,有效提升视差估计的精度。此外,定性评估显示,该方法在细长和低纹理物体的深度估计上取得不错的效果。 展开更多
关键词 深度估计 卷积网络 代价计算 自注意力
在线阅读 下载PDF
基于双向长短时记忆网络和自注意力机制的心音分类 被引量:1
4
作者 卢官明 李齐健 +4 位作者 卢峻禾 戚继荣 赵宇航 王洋 魏金生 《数据采集与处理》 北大核心 2025年第2期456-468,共13页
心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进... 心音听诊是早期筛查心脏病的有效诊断方法。为了提高异常心音检测性能,提出了一种基于双向长短时记忆(Bi⁃directional long short⁃term memory,Bi⁃LSTM)网络和自注意力机制(Self⁃attention mechanism,SA)的心音分类算法。对心音信号进行分帧处理,提取每帧心音信号的梅尔频率倒谱系数(Mel⁃frequency cepstral coefficients,MFCC)特征;将MFCC特征序列输入Bi⁃LSTM网络,利用Bi⁃LSTM网络提取心音信号的时域上下文特征;通过自注意力机制动态调整Bi⁃LSTM网络各时间步输出特征的权重,得到有利于分类的更具鉴别性的心音特征;通过Softmax分类器实现正常/异常心音的分类。在PhysioNet/CinC Challenge 2016心音数据集上对所提出的算法使用10折交叉验证法进行了评估,得到0.9425的灵敏度、0.9437的特异度、0.8367的精度、0.8865的F1得分和0.9434的准确率,优于对比的典型算法。实验结果表明,该算法在无需进行心音分段的基础上就能有效实现异常心音检测,具有潜在的临床应用前景。 展开更多
关键词 心音分类 梅尔频率倒谱系数 双向长短时记忆网络 自注意力机制
在线阅读 下载PDF
基于自注意力机制的高分遥感影像语义分割 被引量:2
5
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
融合稀疏图注意力的多元时间序列异常检测方法 被引量:1
6
作者 衡红军 代栋炜 《计算机工程与设计》 北大核心 2025年第3期841-849,共9页
为解决时序数据中时空依赖关系不明确而导致多元时间序列异常检测效果较差的问题,提出一种基于稀疏图注意力网络的异常检测模型PSGAT-AD(ProbSparse graph attention networks anomaly detection)。采用卷积神经网络(convolutional neur... 为解决时序数据中时空依赖关系不明确而导致多元时间序列异常检测效果较差的问题,提出一种基于稀疏图注意力网络的异常检测模型PSGAT-AD(ProbSparse graph attention networks anomaly detection)。采用卷积神经网络(convolutional neural networks,CNN)提取时间戳上下文信息并使用全局时间戳编码和Transformer位置编码增强序列之间的联系。利用稀疏自注意力关注重要的时间戳与特征,通过自注意力蒸馏(self-attention distillation)降低输入规模,使重要的特征更加突出,以学习时间和特征两个维度的复杂依赖关系,提升表示学习质量。通过构建基于预测和重构的综合损失函数,对模型参数进行优化。将综合损失误差作为异常得分实现异常判定。实验结果表明,PSGAT-AD模型在4个公开数据集上的F1得分提升1.47%~6.52%。 展开更多
关键词 异常检测 多元时间序列 注意力网络 时间戳编码 稀疏自注意力 自注意力蒸馏 综合损失误差
在线阅读 下载PDF
基于GRU和改进注意力机制的多信息融合的EMA故障诊断方法
7
作者 彭朝琴 李奇聪 +1 位作者 陈娟 马纪明 《北京航空航天大学学报》 北大核心 2025年第11期3734-3744,共11页
针对传统基于机器学习和深度学习的机电伺服系统(EMA)故障诊断方法存在时序特征丢失、故障信息丢失的问题,提出一种基于门控循环单元(GRU)和改进注意力机制的多信息融合的EMA故障诊断方法。将采集的不同传感器信号分为不同通道,通过GRU... 针对传统基于机器学习和深度学习的机电伺服系统(EMA)故障诊断方法存在时序特征丢失、故障信息丢失的问题,提出一种基于门控循环单元(GRU)和改进注意力机制的多信息融合的EMA故障诊断方法。将采集的不同传感器信号分为不同通道,通过GRU提取每个通道信号的时序特征,再引入自注意力机制进一步分辨信号不同时间点之间的重要关系,进一步引入多通道注意力机制自适应融合不同通道的特征,通过分类器实现故障诊断。基于测试试验台数据集的试验结果表明:所提方法与单传感器的模型相比,诊断准确率提升10%;与不引入注意力机制的模型相比,诊断准确率提升5.2%;与经典的机器学习、深度学习和近两年基于深度学习的改进算法相比,所提方法的诊断准确率在98.5%以上,诊断效果最优。 展开更多
关键词 门控循环单元 多源信息融合 自注意力机制 通道注意力机制 机电伺服系统 故障诊断
在线阅读 下载PDF
结合时空注意力的视触融合目标识别方法
8
作者 刘佳 栗文龙 +2 位作者 陈大鹏 张松 黄孝荣 《计算机工程与应用》 北大核心 2025年第18期175-186,共12页
针对目前智能机器人领域中,利用多帧连续视觉和触觉信息时,对时空信息和模态间的异构信息处理不足的问题,提出了一种结合时空注意力的视触融合目标识别方法。该方法利用Swin Transformer模块从视觉和触觉图像中分别提取特征,减轻模态间... 针对目前智能机器人领域中,利用多帧连续视觉和触觉信息时,对时空信息和模态间的异构信息处理不足的问题,提出了一种结合时空注意力的视触融合目标识别方法。该方法利用Swin Transformer模块从视觉和触觉图像中分别提取特征,减轻模态间的异构性;使用基于注意力瓶颈机制的时空Transformer模块,实现视觉和触觉特征信息的时空交互和跨模态交互;通过多头自注意力融合模块,实现视触觉特征中信息的自适应聚合,提高了算法对目标识别的准确性;通过全连接层获得目标识别的结果。该模型在The Touch and Go公共数据集上的精确率和F1分数分别为98.38%和96.83%,比效果最好的对比模型提高了0.90和0.63个百分点。此外,消融实验也验证了提出的各个模块的有效性。 展开更多
关键词 多模态融合 目标识别 视触融合 TRANSFORMER 自注意力 时空信息
在线阅读 下载PDF
基于循环DBSMOTE和多头注意力机制的风力发电机故障预警体系
9
作者 綦方中 蔡阮昊 曹柬 《太阳能学报》 北大核心 2025年第11期772-782,共11页
在结合传统卷积神经网络(CNN)和长短期记忆网络(LSTM)优势的基础上,提出一种基于循环DBSMOTE和多头注意力机制的风力发电机故障预警组合模型与应用体系。针对风力发电机运行数据集不平衡比率较高的问题,提出并使用一种循环DBSMOTE算法... 在结合传统卷积神经网络(CNN)和长短期记忆网络(LSTM)优势的基础上,提出一种基于循环DBSMOTE和多头注意力机制的风力发电机故障预警组合模型与应用体系。针对风力发电机运行数据集不平衡比率较高的问题,提出并使用一种循环DBSMOTE算法对数据集进行平衡处理。在组合预警模型中,使用CNN和LSTM算法来提取平衡处理后输入数据的空间维度特征和时间维度特征以增加数据挖掘的深度,同时引入多头注意力机制,极大地提升了模型的训练精度和预警性能。通过对采集自实际风场的风力发电机运行数据进行训练,模型在实验中实现了提前期长达32 h的故障预警能力。进一步地,通过消融实验、对比实验和十折交叉验证实验,表明所提出的组合预警模型具有较高的有效性和稳定性。 展开更多
关键词 风力发电机 故障预警 深度学习 循环DBSMOTE 多头自注意力机制
在线阅读 下载PDF
联合自注意力机制与权值共享的人体行为识别模型
10
作者 马仑 杨跃 +2 位作者 王迨贺 廖桂生 李幸 《系统仿真学报》 北大核心 2025年第9期2409-2419,共11页
随着可穿戴设备的普及,基于可穿戴传感器的人体行为识别已被广泛关注。如何从原始传感器数据中提取较为有效的行为信息并组成相应特征向量,是该领域的核心问题。目前,卷积和循环神经网络已广泛用于多传感器数据的特征提取,然而这些网络... 随着可穿戴设备的普及,基于可穿戴传感器的人体行为识别已被广泛关注。如何从原始传感器数据中提取较为有效的行为信息并组成相应特征向量,是该领域的核心问题。目前,卷积和循环神经网络已广泛用于多传感器数据的特征提取,然而这些网络难以站在全局角度关注到人体行为沿时间维度具有的重要特征。为此,在考虑到布设于人体不同部位传感器存在的逻辑相关性后,提出了一个基于自注意力机制与权值共享的多分支人体行为识别模型(Multi-CNN-BiLSTM-self attention,Multi-CBSA)。该模型使用架构统一且权值一致的子网络提取人体不同部位行为数据的特征,从而简化模型结构并减少模型训练参数。同时,每个子网络利用一维卷积将原始行为数据转换为由高级特征组成的短序列,通过双向长短期记忆网络获取短序列的前后向时序特征,利用自注意力机制将提取到的行为特征进行动态权值分配,获取具有代表性的关键特征,每个子网络输出将在融合层进行特征融合。消融实验表明:在引入自注意力机制后,Multi-CBSA在收敛速度、验证集损失、以及单类行为识别准确率上都有提升。对比实验表明,Multi-CBSA可以在减少训练参数量的基础上将MHEALTH和PAMAP2数据集的识别准确率提高到99.3%和96.4%,相较于近年表现较好的模型,识别准确率最大可以提高4.2%和4.4%。 展开更多
关键词 人体行为识别 可穿戴传感器 特征提取 自注意力机制 权值共享
在线阅读 下载PDF
双线性自注意力机制CAN总线入侵检测方法研究
11
作者 陈彦彬 刘桂雄 《电子测量技术》 北大核心 2025年第2期122-130,共9页
控制器局域网络(CAN)总线广泛应用于工业数据采集、车联网等领域,对其安全入侵检测非常重要。为全面提升检测方法性能,提出一种双线性自注意力机制CAN总线入侵检测方法,首先基于堆叠集成思想利用DNN、CNN和LSTM模型提取深度学习层特征;... 控制器局域网络(CAN)总线广泛应用于工业数据采集、车联网等领域,对其安全入侵检测非常重要。为全面提升检测方法性能,提出一种双线性自注意力机制CAN总线入侵检测方法,首先基于堆叠集成思想利用DNN、CNN和LSTM模型提取深度学习层特征;随后通过双线性层分别提取自注意力机制Transformer与FNet特征,再将其与深度学习层特征残差连接融合;最后通过全连接层入侵检测预测,体现高准确率、检测率和良好泛化性特点。在Car_Hacking公开数据集上实验表明,准确率、精确率、召回率、F1值和AUC值分别达0.951、0.996、0.997、0.960和0.984,且随着训练轮数增加其准确率、损失值误差分别保持在5%、10%以内,本文方法优于其他比较方法。应用于物联网实验装置评估结果显示,本文方法在异常攻击识别检测率达99.23%,对于提高测控系统安全性能具有重要推广价值。 展开更多
关键词 入侵检测系统 控制区域网络CAN 自注意力机制 FNet
在线阅读 下载PDF
基于自注意力特征交互的红外与可见光图像融合方法
12
作者 管芳景 蒋琦炜 +1 位作者 罗晓清 金琦淳 《红外技术》 北大核心 2025年第11期1406-1414,共9页
现有多传感器图像融合方法存在层次特征融合不充分、解耦的互补特征难以鉴别的问题,为此本文提出了一种基于自注意力特征交互的红外与可见光图像融合方法。该方法在孪生分支上约束深层特征的相似性,促使多层级多尺度的互补特征通过交互... 现有多传感器图像融合方法存在层次特征融合不充分、解耦的互补特征难以鉴别的问题,为此本文提出了一种基于自注意力特征交互的红外与可见光图像融合方法。该方法在孪生分支上约束深层特征的相似性,促使多层级多尺度的互补特征通过交互模块进行合理的交换与融合。具体地,交互模块利用跨模态注意力机制计算多模态图像之间的局部特征不相似度,并以此作为特征的交互系数实现上下分支特征的交互。但是不相似度量易受噪声、伪影等信息影响,误判其为互补信息。由于该类信息对于本模态图像较为孤立,本方法通过计算全局自注意力系数判别该类信息。最终的交互系数由跨模态注意力系数与全局自注意力系数两部分组成,可以有效地提取互补特征。同时,为了保证融合特征的完整性与一致性,本方法提出特征循环一致性损失对融合特征进行约束,促使融合图像具备更丰富的源图像信息。为适应融合场景的多样性,本文提出了一种基于掩码与池化的融合损失函数。通过在TNO、RoadScene等数据集上与其他State-of-the-Art方法进行主客观指标比较,检验了本文方法的优越性。 展开更多
关键词 特征相似性 特征交互 自注意力 孪生网络 红外与可见光 图像融合
在线阅读 下载PDF
结合倒残差自注意力机制的遥感图像目标检测
13
作者 赵文清 赵振寰 巩佳潇 《智能系统学报》 北大核心 2025年第1期64-72,共9页
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,... 针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。 展开更多
关键词 遥感图像 目标检测 倒残差 自注意力机制 多尺度 空间金字塔 特征提取 特征融合
在线阅读 下载PDF
基于BERT和自注意力SRU的AST级Webshell检测方法
14
作者 李道丰 宁梓桁 《信息网络安全》 北大核心 2025年第2期270-280,共11页
Webshell作为一种隐蔽性强、危害性大的网页后门,已在网络安全领域受到广泛关注。Webshell代码的混淆技术显著降低了传统检测方法的有效性,且许多传统检测模型未能有效应对高效处理大量数据的需求。因此,文章提出一种结合BERT词嵌入、双... Webshell作为一种隐蔽性强、危害性大的网页后门,已在网络安全领域受到广泛关注。Webshell代码的混淆技术显著降低了传统检测方法的有效性,且许多传统检测模型未能有效应对高效处理大量数据的需求。因此,文章提出一种结合BERT词嵌入、双向SRU网络结合自注意力机制的Webshell检测方法BAT-SRU。该方法通过抽象语法树提取代码特征,结合样本解混淆与危险函数统计提升特征质量,并采用BAT-SRU模型进行检测。现有方法如基于Word2Vec与双向GRU的检测方法、基于操作码序列与随机森林的分类方法以及基于Text-CNN的AST特征提取方法,存在特征表达不足和对复杂混淆代码适应性差的问题。相比上述方法,BAT-SRU在检测PHP Webshell上性能更优异,得到了准确率99.68%、精确率99.13%、召回率99.22%和F1值99.18%的实验结果。此外,与RNN及其变体模型相比,BAT-SRU在训练时间上可以节约23.47%,在推理时间上可以节省40.14%。 展开更多
关键词 PHP Webshell 抽象语法树 BERT词嵌入 SRU 自注意力
在线阅读 下载PDF
基于自注意力和域自适应的风电机组异常状态检测
15
作者 王晓霞 郑肖剑 +2 位作者 柳璞 王荣康 王涛 《振动与冲击》 北大核心 2025年第10期269-277,310,共10页
针对新建风电机组历史数据不足及不同机组间数据分布差异大的问题,提出一种结合自注意力机制与域自适应网络的风电机组异常状态检测方法。首先,采用编码器-解码器结构对源域和目标域风电机组运行数据进行特征重构,以捕捉潜在的风电模式... 针对新建风电机组历史数据不足及不同机组间数据分布差异大的问题,提出一种结合自注意力机制与域自适应网络的风电机组异常状态检测方法。首先,采用编码器-解码器结构对源域和目标域风电机组运行数据进行特征重构,以捕捉潜在的风电模式和领域信息。然后,设计自注意力模块,通过与域判别器的对抗学习提取跨域共享特征,根据跨域信息的匹配度自动加权不同机组的领域信息,实现动态特征重构,从而提升模型对不同机组数据分布变化的适应性。最后,计算重构误差作为异常分数用于异常检测。实际风电机组运行数据的结果表明,该方法在历史数据有限的条件下能够高效地识别风机异常状态,相较于其他深度学习和深度迁移学习方法,显著提升了检测精度。 展开更多
关键词 风电机组 异常检测 域自适应 自注意力机制 对抗训练
在线阅读 下载PDF
基于改进时域卷积网络与多头自注意力机制的间歇过程质量预测模型
16
作者 赵小强 柳勇勇 +1 位作者 惠永永 刘凯 《计算机应用》 北大核心 2025年第7期2245-2252,共8页
为提高时域卷积网络(TCN)在批量大小变化时的训练稳定性,并解决间歇过程质量预测在捕捉长期依赖性和全局关联性上存在不足而导致的预测准确度不高的问题,提出一种基于批量组规范化(BGN)和Mish激活函数改进残差结构的TCN(BMTCN)与多头自... 为提高时域卷积网络(TCN)在批量大小变化时的训练稳定性,并解决间歇过程质量预测在捕捉长期依赖性和全局关联性上存在不足而导致的预测准确度不高的问题,提出一种基于批量组规范化(BGN)和Mish激活函数改进残差结构的TCN(BMTCN)与多头自注意力机制(MHSA)的间歇过程质量预测模型(BMTCN-MHSA)。首先,将间歇过程的三维数据展开为二维矩阵形式,并对数据进行归一化处理,再引入奇异谱分析法(SSA)分解重构数据;其次,在时域卷积的残差部分融入BGN以降低网络模型在批量大小变化时的敏感度,引入Mish激活函数以提高模型的泛化能力,并利用多头自注意力机制对序列中不同位置的特征信息进行关联和权重分配,从而进一步提取序列中的关键特征信息和相互依赖关系,进而更好地捕捉间歇过程的动态特征;最后,使用青霉素仿真实验数据进行实验验证。实验结果表明,相较于TCN模型,BMTCN-MHSA模型的平均绝对误差(MAE)降低了56.86%,均方误差(MSE)降低了48.80%,而决定系数(R2)达到了99.48%,这表明BMTCN-MHSA模型提高了间歇过程质量预测的准确性。 展开更多
关键词 间歇过程 质量预测 奇异谱分析法 时域卷积网络 多头自注意力机制
在线阅读 下载PDF
嵌入自注意力机制的U型高分遥感影像语义分割网络
17
作者 杨军 张金影 《北京航空航天大学学报》 北大核心 2025年第5期1514-1527,共14页
针对高分辨率遥感影像小目标特征提取困难的问题,结合卷积结构和自注意力机制提出一种双编码器特征融合网络模型,适用于高分辨率遥感影像语义分割。设计一种双编码器结构,同时提取遥感影像的全局和局部细节信息,提高小目标地物的分割准... 针对高分辨率遥感影像小目标特征提取困难的问题,结合卷积结构和自注意力机制提出一种双编码器特征融合网络模型,适用于高分辨率遥感影像语义分割。设计一种双编码器结构,同时提取遥感影像的全局和局部细节信息,提高小目标地物的分割准确率;通过特征聚合模块在不同阶段聚合特征信息,以嵌入更多全局上下文信息;利用边缘细化损失模块提高模型对地物目标边缘信息的识别能力。在ISPRS Vaihingen和Potsdam数据集上的分割结果的F_(1)平均值m_(F1)分别达到了91.28%和93.16%,与目前主流算法相比,总体分割准确率及汽车类小目标的分割准确率均有提高。所提模型在一定程度上解决了高分辨率遥感影像语义分割中小目标及边缘信息分割不准确的问题。 展开更多
关键词 高分辨率遥感影像 语义分割 深度学习 自注意力机制 特征融合
在线阅读 下载PDF
基于自注意力机制的桥梁预应力数据分类
18
作者 刘恒洋 李中海 王俊婷 《计算机应用》 北大核心 2025年第S1期132-136,共5页
在桥梁预应力施工数据分类算法的领域中,实时准确地进行数据分类对提高生产效率以及排除安全隐患尤为重要。针对传统的桥梁预应力施工数据分类模型的分类不准确问题,构建一种基于自注意力机制的长短期记忆(LSTM)网络混合模型,以结合自... 在桥梁预应力施工数据分类算法的领域中,实时准确地进行数据分类对提高生产效率以及排除安全隐患尤为重要。针对传统的桥梁预应力施工数据分类模型的分类不准确问题,构建一种基于自注意力机制的长短期记忆(LSTM)网络混合模型,以结合自注意力机制和LSTM模型高效准确分类的优点。首先,引入时间绝对位置编码(tAPE)和高效的相对位置编码(eRPE);其次,使用伪高斯分布的概率运算,并且模型架构通过增量学习用新数据不断地完善。实验结果表明,所提混合模型在桥梁预应力施工数据分类数据集上的平均准确率达到了96.6%,相较于ConvTran和Inception_Time等对比模型,最少提升了6.1%。 展开更多
关键词 桥梁预应力 自注意力机制 长短期记忆网络 位置编码 伪高斯分布
在线阅读 下载PDF
基于注意力与图对比学习方法的社交影响预测方法
19
作者 江丽 《安徽大学学报(自然科学版)》 北大核心 2025年第3期20-26,共7页
近年来,通过引入自注意力机制,图注意力网络(graph attention networks,简称GAT)在社交网络影响力预测上取得较好的预测效果.然而,现有的基于图注意力网络的方法往往忽略了自注意力机制中多头信息之间的协同性和差异性,缺乏对多头信息... 近年来,通过引入自注意力机制,图注意力网络(graph attention networks,简称GAT)在社交网络影响力预测上取得较好的预测效果.然而,现有的基于图注意力网络的方法往往忽略了自注意力机制中多头信息之间的协同性和差异性,缺乏对多头信息的协同挖掘与有效利用.提出一种基于多头对比学习与图注意力神经网络模型的社交影响预测方法.该方法通过引入对比学习机制,实现多头自注意力机制的输出之间一致性与差异性的对比,提升多头图注意力神经网络模型的学习能力.实验结果表明,该方法能够进一步提高社交影响力的预测效果. 展开更多
关键词 注意力网络 多头自注意力机制 社交影响 对比学习
在线阅读 下载PDF
基于自注意力机制与高斯混合变分自编码器的飞行轨迹聚类方法研究
20
作者 张召悦 李莎 鲍水达 《河南科技大学学报(自然科学版)》 北大核心 2025年第1期25-33,M0003,M0004,共11页
为精确识别飞行轨迹的运行模式,提出了一种基于自注意力机制(SA)与高斯混合变分自编码器(GMVAE)的飞行轨迹聚类方法。SA-GMVAE是一种端到端的深度聚类方法,GMVAE利用变分推断估计每条轨迹的潜在分布,将输入的飞行轨迹数据映射到由多个... 为精确识别飞行轨迹的运行模式,提出了一种基于自注意力机制(SA)与高斯混合变分自编码器(GMVAE)的飞行轨迹聚类方法。SA-GMVAE是一种端到端的深度聚类方法,GMVAE利用变分推断估计每条轨迹的潜在分布,将输入的飞行轨迹数据映射到由多个高斯分布组成的潜在空间,同时依据轨迹分布特征进行聚类。考虑到GMVAE无法兼顾潜在特征的全局关键信息,将自注意力机制嵌入到编码器中,以便于在特征提取时能够捕获全局依赖关系并自动分配权重,突出关键特征,提升轨迹聚类效果。最后,以天津滨海国际机场的进场飞行轨迹数据集为例验证了模型的有效性,实验结果表明:SA-GMVAE相较于K-means、DBSCAN、DTW+HDBSCAN、AE+DP与AE+GMM 5种聚类方法,轮廓系数分别提高了27.6%、20.2%、18.2%、18.6%、15.7%;与未引入自注意力机制的GMVAE聚类模型相比,轮廓系数提高了9.5%,能够更准确地对飞行轨迹进行聚类。 展开更多
关键词 飞行轨迹 模式识别 变分自编码器 自注意力机制
在线阅读 下载PDF
上一页 1 2 62 下一页 到第
使用帮助 返回顶部