期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
结合LDA与Self-Attention的短文本情感分类方法 被引量:9
1
作者 陈欢 黄勃 +2 位作者 朱翌民 俞雷 余宇新 《计算机工程与应用》 CSCD 北大核心 2020年第18期165-170,共6页
在对短文本进行情感分类任务的过程中,由于文本长度过短导致数据稀疏,降低了分类任务的准确率。针对这个问题,提出了一种基于潜在狄利克雷分布(LDA)与Self-Attention的短文本情感分类方法。使用LDA获得每个评论的主题词分布作为该条评... 在对短文本进行情感分类任务的过程中,由于文本长度过短导致数据稀疏,降低了分类任务的准确率。针对这个问题,提出了一种基于潜在狄利克雷分布(LDA)与Self-Attention的短文本情感分类方法。使用LDA获得每个评论的主题词分布作为该条评论信息的扩展,将扩展信息和原评论文本一起输入到word2vec模型,进行词向量训练,使得该评论文本在高维向量空间实现同一主题的聚类,使用Self-Attention进行动态权重分配并进行分类。通过在谭松波酒店评论数据集上的实验表明,该算法与当前主流的短文本分类情感算法相比,有效地提高了分类性能。 展开更多
关键词 主题词 短文本 self-attention 潜在狄利克雷分布(LDA) word2vec
在线阅读 下载PDF
Aerial target threat assessment based on gated recurrent unit and self-attention mechanism 被引量:4
2
作者 CHEN Chen QUAN Wei SHAO Zhuang 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第2期361-373,共13页
Aerial threat assessment is a crucial link in modern air combat, whose result counts a great deal for commanders to make decisions. With the consideration that the existing threat assessment methods have difficulties ... Aerial threat assessment is a crucial link in modern air combat, whose result counts a great deal for commanders to make decisions. With the consideration that the existing threat assessment methods have difficulties in dealing with high dimensional time series target data, a threat assessment method based on self-attention mechanism and gated recurrent unit(SAGRU) is proposed. Firstly, a threat feature system including air combat situations and capability features is established. Moreover, a data augmentation process based on fractional Fourier transform(FRFT) is applied to extract more valuable information from time series situation features. Furthermore, aiming to capture key characteristics of battlefield evolution, a bidirectional GRU and SA mechanisms are designed for enhanced features.Subsequently, after the concatenation of the processed air combat situation and capability features, the target threat level will be predicted by fully connected neural layers and the softmax classifier. Finally, in order to validate this model, an air combat dataset generated by a combat simulation system is introduced for model training and testing. The comparison experiments show the proposed model has structural rationality and can perform threat assessment faster and more accurately than the other existing models based on deep learning. 展开更多
关键词 target threat assessment gated recurrent unit(GRU) self-attention(SA) fractional Fourier transform(FRFT)
在线阅读 下载PDF
基于相似日筛选与组合深度学习模型的日前电价预测方法 被引量:2
3
作者 艾雨 贾燕冰 韩肖清 《电网技术》 北大核心 2025年第1期242-251,I0088,共11页
准确的日前电价预测是市场运行和政策规划的基础,而市场披露信息是电价预测的重要依据。提出了引入Self-attention机制的CNN-GRU组合深度学习电价预测模型。首先,针对山西电力现货市场交易流程及日前电价形成机制,采用最大互信息系数法... 准确的日前电价预测是市场运行和政策规划的基础,而市场披露信息是电价预测的重要依据。提出了引入Self-attention机制的CNN-GRU组合深度学习电价预测模型。首先,针对山西电力现货市场交易流程及日前电价形成机制,采用最大互信息系数法对市场披露的日前边界条件等信息数据进行特征提取,以确定电价关键影响因素及其权重系数。其次,基于加权灰色关联度的历史相似日筛选方法生成电价预测历史数据集,并挖掘电价及其特征的内部变化规律。然后,基于历史数据集,采用引入Self-attention机制的CNN-GRU模型得到预测电价。最后,通过算例验证了所提预测方法的有效性及准确性。 展开更多
关键词 日前电价预测 边界条件 最大互信息系数 相似日筛选 self-attention机制
在线阅读 下载PDF
基于深度学习的岩石断口微观形貌识别
4
作者 张艳博 胡海伟 +2 位作者 王帅 陶志刚 来有邦 《科学技术与工程》 北大核心 2025年第24期10361-10373,共13页
岩石断口微观形貌识别对于揭示岩石断裂失效机理具有关键作用。深度学习在图像识别领域有显著成效,但其在岩石断口图像识别上仍面临主观性强和特征复杂等问题。为了提高岩石断口图像识别的准确性,提出一种改进的InceptionV3模型,该模型... 岩石断口微观形貌识别对于揭示岩石断裂失效机理具有关键作用。深度学习在图像识别领域有显著成效,但其在岩石断口图像识别上仍面临主观性强和特征复杂等问题。为了提高岩石断口图像识别的准确性,提出一种改进的InceptionV3模型,该模型融合了Self-Attention与双线性注意力机制,对局部和全局特征提取,结合特征拼接融合技术,提升模型有效特征的提取能力,实现岩石断口图像识别。以岩石断口数据集为例进行分析,结果表明:改进的InceptionV3模型在砂岩断口图像识别方面准确率达到98.27%,使用验证集对训练好的模型进行验证,Precision、Recall和F1-Score均达到85%,验证了模型的高效性和可靠性。研究成果为岩石断口图像的自动化、高精度识别提供了一种新的解决方案,有利于岩石断裂失效的判定,对岩体工程灾害的预防具有重要的指导意义。 展开更多
关键词 岩石断口 图像识别 InceptionV3 self-attention 特征融合
在线阅读 下载PDF
融合底层信息的电气工程领域神经机器翻译 被引量:3
5
作者 陈媛 陈红 《河南科技大学学报(自然科学版)》 CAS 北大核心 2023年第6期42-48,M0004,M0005,共9页
针对目前主流的神经机器翻译模型Transformer内部结构单元堆叠而造成的底层信息丢失和多层单元输出信息偏差不同的问题,对其结构进行了改进,提出了一种融合底层信息的神经机器翻译模型。采用多种网络结构对源语言进行底层信息的特征提取... 针对目前主流的神经机器翻译模型Transformer内部结构单元堆叠而造成的底层信息丢失和多层单元输出信息偏差不同的问题,对其结构进行了改进,提出了一种融合底层信息的神经机器翻译模型。采用多种网络结构对源语言进行底层信息的特征提取,并采用残差连接的方式实现底层信息的向上传递。实验结果显示:融合底层信息后的翻译模型在电气工程领域内的双语评估研究(BLEU)值最多提升了2.47个百分点。 展开更多
关键词 神经机器翻译 电气工程 底层信息 multi-head self-attention
在线阅读 下载PDF
Prediction of RNA m6A Methylation Sites in Multiple Tissues Based on Dual-branch Residual Network
6
作者 GUO Xiao-Tian GAO Wei +2 位作者 CHEN Dan LI Hui-Min TAN Xue-Wen 《生物化学与生物物理进展》 北大核心 2025年第11期2900-2915,共16页
Objective N6-methyladenosine(m6A),the most prevalent epigenetic modification in eukaryotic RNA,plays a pivotal role in regulating cellular differentiation and developmental processes,with its dysregulation implicated ... Objective N6-methyladenosine(m6A),the most prevalent epigenetic modification in eukaryotic RNA,plays a pivotal role in regulating cellular differentiation and developmental processes,with its dysregulation implicated in diverse pathological conditions.Accurate prediction of m6A sites is critical for elucidating their regulatory mechanisms and informing drug development.However,traditional experimental methods are time-consuming and costly.Although various computational approaches have been proposed,challenges remain in feature learning,predictive accuracy,and generalization.Here,we present m6A-PSRA,a dual-branch residual-network-based predictor that fully exploits RNA sequence information to enhance prediction performance and model generalization.Methods m6A-PSRA adopts a parallel dual-branch network architecture to comprehensively extract RNA sequence features via two independent pathways.The first branch applies one-hot encoding to transform the RNA sequence into a numerical matrix while strictly preserving positional information and sequence continuity.This ensures that the biological context conveyed by nucleotide order is retained.A bidirectional long short-term memory network(BiLSTM)then processes the encoded matrix,capturing both forward and backward dependencies between bases to resolve contextual correlations.The second branch employs a k-mer tokenization strategy(k=3),decomposing the sequence into overlapping 3-mer subsequences to capture local sequence patterns.A pre-trained Doc2vec model maps these subsequences into fixeddimensional vectors,reducing feature dimensionality while extracting latent global semantic information via context learning.Both branches integrate residual networks(ResNet)and a self-attention mechanism:ResNet mitigates vanishing gradients through skip connections,preserving feature integrity,while self-attention adaptively assigns weights to focus on sequence regions most relevant to methylation prediction.This synergy enhances both feature learning and generalization capability.Results Across 11 tissues from humans,mice,and rats,m6A-PSRA consistently outperformed existing methods in accuracy(ACC)and area under the curve(AUC),achieving>90%ACC and>95%AUC in every tissue tested,indicating strong cross-species and cross-tissue adaptability.Validation on independent datasets—including three human cell lines(MOLM1,HEK293,A549)and a long-sequence dataset(m6A_IND,1001 nt)—confirmed stable performance across varied biological contexts and sequence lengths.Ablation studies demonstrated that the dual-branch architecture,residual network,and self-attention mechanism each contribute critically to performance,with their combination reducing interference between pathways.Motif analysis revealed an enrichment of m6A sites in guanine(G)and cytosine(C),consistent with known regulatory patterns,supporting the model’s biological plausibility.Conclusion m6A-PSRA effectively captures RNA sequence features,achieving high prediction accuracy and robust generalization across tissues and species,providing an efficient computational tool for m6A methylation site prediction. 展开更多
关键词 N6-methyladenosine site Doc2vec BiLSTM dual-branch residual network self-attention
在线阅读 下载PDF
基于DMT-U^(2)-Net和回归算法的爆破眼痕识别及应用
7
作者 凌同华 谢长庚 +2 位作者 曹峰 廖逸轩 袁宇 《铁道科学与工程学报》 北大核心 2025年第9期4248-4259,共12页
隧道光面爆破设计时,往往需要光爆效果作为设计依据,以实现爆破安全施工并提高爆破效率。针对目前光爆眼痕识别过程中存在的现场环境复杂、检测困难等问题,提出基于DMT-U^(2)-Net与self-attention模块的复合算法模型进行爆破眼痕识别。... 隧道光面爆破设计时,往往需要光爆效果作为设计依据,以实现爆破安全施工并提高爆破效率。针对目前光爆眼痕识别过程中存在的现场环境复杂、检测困难等问题,提出基于DMT-U^(2)-Net与self-attention模块的复合算法模型进行爆破眼痕识别。采集爆破工程中常见的爆破眼痕图像样本,并对数据进行增强、三维重建与降噪处理,构建DMT-U^(2)-Net网络模型并改进损失函数对眼痕图像进行训练,获取DMT-U^(2)-Net眼痕分割模型;将DMT-U^(2)-Net模型处理后的分割图片与三维重建模型进行特征融合,构建基于self-attention模块的回归预测模型对融合特征进行训练,获取眼痕长度回归预测模型;将DMT-U^(2)-Net眼痕分割模型与基准U^(2)-Net,U-Net,DeepLab v3,FCN,LR-ASPP网络模型的眼痕分割结果进行对比,从而评估其训练效果;将回归预测模型与bp,GRU模型进行对比,并对输入参数进行敏感性分析,优化网络参数输入并评估网络训练效果。结果表明,DMT-U^(2)-Net网络模型分割可见眼痕的P_(DSC),P_(pre),P_(rec),P_(mIOU)分别为90.89%,91.11%,91.01%,91.59%,模型大小仅为19.76 MB,相较基准模型缩减88.2%。与其他模型相比,该模型在分割精度和模型大小,都具有较大优势;通过回归预测模型,可以实现对可见眼痕长度的精准预测,模型决定性系数高达0.992,模型大小仅为154.1 KB。将本文复合算法模型应用于隧道光面爆破可见眼痕的识别中,模型展现出较好的识别效果,基本实现了可见眼痕的端到端识别,为隧道的超欠挖识别与智能评价系统打下坚实基础。 展开更多
关键词 光面爆破 眼痕识别 DMT-U^(2)-Net网络 self-attention模块 回归预测模型
在线阅读 下载PDF
融合多头自注意力机制的中文分类方法 被引量:8
8
作者 熊漩 严佩敏 《电子测量技术》 2020年第10期125-130,共6页
中文文本分类任务中,深度学习神经网络方法具有自动提取特征、特征表达能力强的优势,但其模型可解释性不强。提出了一种Text-CNN+Multi-Head Attention模型,引入多头自注意力机制克服Text-CNN可解释性的不足。首先采用Text-CNN神经网络... 中文文本分类任务中,深度学习神经网络方法具有自动提取特征、特征表达能力强的优势,但其模型可解释性不强。提出了一种Text-CNN+Multi-Head Attention模型,引入多头自注意力机制克服Text-CNN可解释性的不足。首先采用Text-CNN神经网络,高效提取文本局部特征信息;然后通过引入多头自注意力机制,最大限度发挥Text-CNN的并行运算能力,强调文本序列全局信息的捕捉;最后在时间和空间上完成对文本信息的特征提取。实验结果表明,提出的模型较其他模型在保证运算速度的同时,准确率提升了1%~2%。 展开更多
关键词 中文文本分类 Text-CNN multi-head self-attention
在线阅读 下载PDF
基于站点实时关联度的短时公交客流预测方法 被引量:5
9
作者 王福建 俞佳浩 +1 位作者 赵锦焕 梅振宇 《交通运输系统工程与信息》 EI CSCD 北大核心 2021年第6期131-144,共14页
为探究公交站点之间的关联度并对公交客流进行更精准的实时预测,本文提出基于Attention的交通预测核心算法(Traffic Forecast Model Based Attention,TFMA),结合数据预处理和站点信息编码完成基于站点实时关联度的短时公交客流预测方法... 为探究公交站点之间的关联度并对公交客流进行更精准的实时预测,本文提出基于Attention的交通预测核心算法(Traffic Forecast Model Based Attention,TFMA),结合数据预处理和站点信息编码完成基于站点实时关联度的短时公交客流预测方法。该方法首先创新性地提出了站点实时关联度,可实现对目标站点客流量更精准的预测;其次,在公交站点的编码信息中融入线路站点信息、客流变化率、天气、日期等关联因素;接着,该方法依靠Attention机制计算站点实时关联度;核心算法中使用multi-headed机制、增加通道和残差连接进一步提升预测能力;最后,以苏州市公交数据进行验证。结果显示:在准确率上,对比多元线性回归的53.8%、GRU(Gated Recurrent Unit)的66.9%和LightGBM(Light Gradient Boosting Machine)的81.2%,本文提出的基于站点实时关联度的短时公交客流预测方法的准确率在90%以上,表明该方法具备优秀的短时公交客流预测能力。 展开更多
关键词 智能交通 短时公交客流预测方法 Attention机制 multi-headed机制 站点实时关联度 站点信息编码
在线阅读 下载PDF
基于自注意力机制和CNN-LSTM的空战目标机动轨迹预测 被引量:9
10
作者 李战武 张帅 +3 位作者 乔英峰 王强 姜勇 张飞 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第7期209-216,共8页
空战目标机动轨迹是有丰富时空特征的多维时间序列,具有高度复杂性和不确定性。针对现阶段轨迹预测运动学模型建立困难、时序预测的方法难以提取时空特征且只能单一的从T到T+1时刻的顺序式训练的问题,文中提出了一种自注意力机制(self-a... 空战目标机动轨迹是有丰富时空特征的多维时间序列,具有高度复杂性和不确定性。针对现阶段轨迹预测运动学模型建立困难、时序预测的方法难以提取时空特征且只能单一的从T到T+1时刻的顺序式训练的问题,文中提出了一种自注意力机制(self-attention,ATT)和卷积神经网络(convolutional neural network,CNN)-长短期记忆网络(long short-term memory,LSTM)结合的模型(CNN-LSTM-ATT)。离线状态下训练模型,获得的最优模型可以实现目标机动轨迹的高精度预测。文中模型与CNN-LSTM、LSTM模型进行单步预测对比分析,具有良好的单步预测和不同过载机动预测的能力。考虑到电磁干扰和复杂环境导致传输数据的误差和缺失,进行了目标轨迹的5步预测,预测结果和评价指标均优于CNN-LSTM、LSTM模型。 展开更多
关键词 机动轨迹预测 空战数据分析 多层次时间序列 self-attention 多步轨迹预测
在线阅读 下载PDF
BERT-TECNN模型的文本分类方法研究 被引量:25
11
作者 李铁飞 生龙 吴迪 《计算机工程与应用》 CSCD 北大核心 2021年第18期186-193,共8页
由于Bert-base,Chinese预训练模型参数巨大,在做分类任务微调时内部参数变化较小,易产生过拟合现象,泛化能力弱,且该模型是以字为单位进行的预训练,包含词信息量较少。针对这些问题,提出了BERT-TECNN模型,模型使用Bert-base,Chinese模... 由于Bert-base,Chinese预训练模型参数巨大,在做分类任务微调时内部参数变化较小,易产生过拟合现象,泛化能力弱,且该模型是以字为单位进行的预训练,包含词信息量较少。针对这些问题,提出了BERT-TECNN模型,模型使用Bert-base,Chinese模型作为动态字向量模型,输出包含深度特征信息的字向量,Transformerencoder层再次对数据进行多头自注意力计算,提取特征信息,以提高模型的泛化能力,CNN层利用不同大小卷积核,捕捉每条数据中不同长度词的信息,最后应用softmax进行分类。该模型与Word2Vec+CNN、Word2Vec+BiLSTM、Elmo+CNN、BERT+CNN、BERT+BiLSTM、BERT+Transformer等深度学习文本分类模型在三种数据集上进行对比实验,得到的准确率、精确率、召回率、F1测度值均为最高。实验表明该模型有效地提取了文本中字词的特征信息,优化了过拟合问题,提高了泛化能力。 展开更多
关键词 bert transformer ENCODER CNN 文本分类 fine-tuning self-attention 过拟合
在线阅读 下载PDF
多特征融合的中文短文本分类模型 被引量:14
12
作者 杨朝强 邵党国 +2 位作者 杨志豪 相艳 马磊 《小型微型计算机系统》 CSCD 北大核心 2020年第7期1421-1426,共6页
针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-feature fusion model,M FFM).首先,通过字词向量结合的方式构建新的文本表示;其次,通过BILSTM(Bi-directional Long ShortTerm M... 针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-feature fusion model,M FFM).首先,通过字词向量结合的方式构建新的文本表示;其次,通过BILSTM(Bi-directional Long ShortTerm Memory)、CNN(Convolutional Neural Networks)和CAPSNET(Capsule Network)模型对短文本进行不同层面的特征提取,并使用Self-attention模型动态调节各模型特征在最终特征构建中的权重系数.在实验部分,本文用MFFM方法与四个短文本分类经典模型(CNN、BILSTM、CAPSNET和CNN-BILSTM)在三个中文短文本数据集上进行验证,为了进一步验证数据融合(将三个中文短文本数据正负样本融合)对MFFM的影响,实验结果表明MFFM模型性能在四个评价指标(F1、Recall、Precision、Accuracy)下优于对比模型.总之,这可表明M FFM是短文本分类模型的一个有用框架. 展开更多
关键词 中文短文本分类 字词向量结合 特征融合 self-attention模型
在线阅读 下载PDF
基于自注意力机制的双向门控循环单元和卷积神经网络的芒果产量预测 被引量:13
13
作者 林靖皓 秦亮曦 +1 位作者 苏永秀 秦川 《计算机应用》 CSCD 北大核心 2020年第S01期51-55,共5页
针对影响芒果产量的相关气象要素繁多,它们与产量之间的关联关系复杂、难以用数学函数准确地描述的问题,提出一种基于自注意力机制具有长短期记忆功能的双向门控循环单元和卷积神经网络组合(Self-attention CBiGRU)模型。首先,利用CNN... 针对影响芒果产量的相关气象要素繁多,它们与产量之间的关联关系复杂、难以用数学函数准确地描述的问题,提出一种基于自注意力机制具有长短期记忆功能的双向门控循环单元和卷积神经网络组合(Self-attention CBiGRU)模型。首先,利用CNN卷积层(1D CNN)提取局部特征;其次将Self-attention机制用于进一步提取依赖特征,然后双向门控循环单元(BiGRU)会充分考虑年份之间的关联性,学习长期依赖特征;最后,利用广西某地3个气象站所收集到的24个芒果生产周期年份(从前一年第22旬到当年第21旬)每旬9个气象要素及芒果产量数据进行分析建模,建立了芒果产量预测Self-attention C-BiGRU模型。实验结果表明,Self-attention C-BiGRU模型预测的产量与实际产量的均方根误差为10.67,比支持向量回归(SVR)、误差后向传播神经网络(BPNN)、门控循环单元(GRU)、基于注意力机制的双向门控循环单元(BiGRU-Attention)、门控循环单元和卷积神经网络组合模型(GRU-CNN)、双向门控循环单元和卷积神经网络组合模型(C-BiGRU)分别平均降低了37.7%、42.1%、17.6%、4.1%、5.3%和5.9%。Selfattention C-BiGRU模型具有较高的预测准确性,对提升广西芒果产业发展、推进农业信息化有重要意义。 展开更多
关键词 芒果 产量预测 self-attention 双向门控循环单元 卷积神经网络 循环神经网络
在线阅读 下载PDF
面向方面记忆网络的IT产品细粒度情感分析 被引量:5
14
作者 李晋源 康雁 +2 位作者 杨其越 王沛尧 崔国荣 《计算机工程与应用》 CSCD 北大核心 2020年第3期159-164,共6页
以用户情感需求为导向进行产品的设计和营销定位已成为研究热点,细粒度的情感挖掘可进一步提高评论分析的效率。提出一种面向方面深度记忆网络模型进行细粒度情感分析。对京东等IT产品评论数据进行爬取,应用依存句法分析方法抽取评论中... 以用户情感需求为导向进行产品的设计和营销定位已成为研究热点,细粒度的情感挖掘可进一步提高评论分析的效率。提出一种面向方面深度记忆网络模型进行细粒度情感分析。对京东等IT产品评论数据进行爬取,应用依存句法分析方法抽取评论中的方面词,采用基于self-attention机制的深度记忆网络模型实现基于方面的细粒度情感分类。实验结果表明,面向方面深度记忆网络模型在英文数据集上的准确率相比一些经典模型有所提升,同时在京东等40000条IT的用户评价数据进行情感倾向分析也具有良好的效果。 展开更多
关键词 深度记忆网络 self-attention机制 细粒度情感分析 依存句法分析 情感需求
在线阅读 下载PDF
基于Attention-BP神经网络模型的邮轮客舱火灾危险等级分类研究 被引量:2
15
作者 熊正华 向波 陈斌 《中国航海》 CSCD 北大核心 2024年第1期9-17,共9页
为能够对邮轮客舱不同火灾危险源进行风险评估,提出一种可对舱室火灾危险等级实时分类的新型神经网络模型。通过火灾动态模拟器(FDS)建立邮轮客舱火灾物理模型,对发生火灾时的烟气温度、CO体积分数和能见度等安全指标进行数值模拟,并基... 为能够对邮轮客舱不同火灾危险源进行风险评估,提出一种可对舱室火灾危险等级实时分类的新型神经网络模型。通过火灾动态模拟器(FDS)建立邮轮客舱火灾物理模型,对发生火灾时的烟气温度、CO体积分数和能见度等安全指标进行数值模拟,并基于其对人体的影响程度将火灾危险等级划分为4个等级。通过设计一种新型的Attention-BP神经网络(BPNN)模型,结合self-Attention机制融合多个BPNN诊断结果,自适应地分配各个BPNN的权重,对采集的多源火灾信息进行分析和处理,实现对客舱火灾的风险评估并划分危险等级。试验证明:Attention-BPNN模型可有效地实现对火灾危险等级的预警,准确率可达97.32%。相对于其他机器学习算法,具有最高的稳定性和准确率,减少了对客舱火灾预警的不确定性。 展开更多
关键词 邮轮火灾 数值模拟 self-attention机制 BP神经网络
在线阅读 下载PDF
基于双分支多头注意力的场景图生成方法 被引量:1
16
作者 王立春 付芳玉 +2 位作者 徐凯 徐洪波 尹宝才 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1198-1205,共8页
针对已有场景图生成模型获取上下文信息有限的问题,提出一种有效的上下文融合模块,即双分支多头注意力(dual-stream multi-head attention, DMA)模块,并将DMA分别用于物体分类阶段和关系分类阶段,基于此提出基于双分支多头注意力的场景... 针对已有场景图生成模型获取上下文信息有限的问题,提出一种有效的上下文融合模块,即双分支多头注意力(dual-stream multi-head attention, DMA)模块,并将DMA分别用于物体分类阶段和关系分类阶段,基于此提出基于双分支多头注意力的场景图生成网络(dual-stream multi-head attention-based scene graph generation network, DMA-Net)。该网络由目标检测、物体语义解析和关系语义解析3个模块组成。首先,通过目标检测模块定位图像中的物体并提取物体特征;其次,使用物体语义解析模块中的节点双分支多头注意力(object dual-stream multi-head attention, O-DMA)获取融合了节点上下文的特征,该特征经过物体语义解码器获得物体类别标签;最后,通过关系语义解析模块中的边双分支多头注意力(relationship dual-stream multi-head attention, R-DMA)输出融合了边上下文的特征,该特征经过关系语义解码器输出关系类别标签。在公开的视觉基因组(visual genome, VG)数据集上分别计算了DMA-Net针对场景图检测、场景图分类和谓词分类3个子任务的图约束召回率和无图约束召回率,并与主流的场景图生成方法进行比较。实验结果表明,所提出的方法能够充分挖掘场景中的上下文信息,基于上下文增强的特征表示有效提升了场景图生成任务的精度。 展开更多
关键词 场景图生成 上下文融合 双分支多头注意力(dual-stream multi-head attention DMA) 目标检测 物体分类 关系分类
在线阅读 下载PDF
基于多网络融合的水体浊度预测方法
17
作者 林晓明 袁山 +2 位作者 季想 朱南阳 郭亚 《农业工程技术》 2022年第6期35-39,共5页
浊度是水产养殖中的重要水质指标,利用水质参数进行浊度预测对于水产养殖过程具有重要意义。该文提出一种基于改进的双向长短期记忆(BiLSTM)、残差网络(ResNet)和多头注意力机制网络(Multi-head Attention)相融合的浊度预测模型,并利用... 浊度是水产养殖中的重要水质指标,利用水质参数进行浊度预测对于水产养殖过程具有重要意义。该文提出一种基于改进的双向长短期记忆(BiLSTM)、残差网络(ResNet)和多头注意力机制网络(Multi-head Attention)相融合的浊度预测模型,并利用太湖水体数据进行验证。实验结果表明,该融合模型的R_(RMSE)、M_(MAPE)、M_(MAE)、N_(NSE)值分别为7.35NTU、12.34%、6.25NTU、0.74,相比单独使用BiLSTM模型降低了6.96 NTU、7.63%、6.34 NTU,N_(NSE)值提升了0.69,验证了使用多网络融合模型在水体浊度预测方面拟合效果更好,具有较好的精度。 展开更多
关键词 浊度 BiLSTM模型 ResNet multi-head Attention
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部