期刊文献+
共找到432篇文章
< 1 2 22 >
每页显示 20 50 100
Distributed Reduced-order Optimal Fusion Kalman Filters for Stochastic Singular Systems 被引量:2
1
作者 SUN Shu-Li MA Jing 《自动化学报》 EI CSCD 北大核心 2006年第2期286-290,共5页
Based on the optimal fusion algorithm weighted by matrices in the linear minimum variance (LMV) sense, a distributed full-order optimal fusion Kalman filter (DFFKF) is given for discrete-time stochastic singular syste... Based on the optimal fusion algorithm weighted by matrices in the linear minimum variance (LMV) sense, a distributed full-order optimal fusion Kalman filter (DFFKF) is given for discrete-time stochastic singular systems with multiple sensors, which involves the inverse of a high-dimension matrix to compute matrix weights. To reduce the computational burden, a distributed reduced-order fusion Kalman filter (DRFKF) is presented, which involves in parallel the inverses of two relatively low-dimension matrices to compute matrix weights. A simulation example shows the effectiveness. 展开更多
关键词 多传感器 信息融合 KALMAN滤波 随机奇异系统
在线阅读 下载PDF
基于特征交叉注意力机制融合的轴承故障诊断方法 被引量:1
2
作者 赵国超 刘崇德 +2 位作者 宋宇宁 金鑫 李伟华 《振动与冲击》 北大核心 2025年第12期228-237,共10页
为了解决轴承振动信号特征提取不充分导致故障诊断准确率低的问题,提出一种基于特征交叉注意力机制融合的轴承故障诊断方法,建立CNN-BiTCN-CA诊断模型。采用变分模态分解和快速傅里叶变换对原始信号进行重构,分别使用卷积神经网络(convo... 为了解决轴承振动信号特征提取不充分导致故障诊断准确率低的问题,提出一种基于特征交叉注意力机制融合的轴承故障诊断方法,建立CNN-BiTCN-CA诊断模型。采用变分模态分解和快速傅里叶变换对原始信号进行重构,分别使用卷积神经网络(convolutional neural network,CNN)和双向时间卷积网络(bidirectional temporal convolutional network,BiTCN)提取时频特征,通过交叉注意力机制(cross-attention mechanism,CA)融合时频特征的能力,充分提取原始信号故障特征,利用全连接层实现滚动轴承故障类型的精确诊断。试验研究表明:在含信噪比为9.32 dB、标准差为2.98的高斯白噪声的环境下,使用CNN-BiTCN-CA模型轴承故障分类准确率为99.88%,相较于使用CNN、BiTCN和结合自注意力机制的卷积神经网络(CNN with self-attention mechanism,CNN-SA)诊断轴承故障,准确率分别提升约22.79%、4.85%和4.19%;在引入信噪比为3.31 dB、标准差为5.96的高斯白噪声时,该模型仍然可以达到96.12%的诊断准确率。CNN-BiTCN-CA模型能够深入提取轴承信号中的故障特征,有效提高故障分类准确性。 展开更多
关键词 滚动轴承 故障诊断 双向时间卷积网络(BiTCN) 时频融合 交叉注意力机制(CA)
在线阅读 下载PDF
引入单模态监督对比学习的多视图讽刺检测
3
作者 张政 刘金硕 +1 位作者 邓娟 王丽娜 《计算机工程与应用》 北大核心 2025年第19期118-126,共9页
社交媒体上图像和文本数据的快速增长导致人们对多模态讽刺检测问题的关注不断提高。然而,现有基于特征提取融合的检测方法存在一些缺陷:一是大多数方法缺乏多模态检测所需的底层模态对齐能力,二是模态融合过程忽视了模态间的动态关系,... 社交媒体上图像和文本数据的快速增长导致人们对多模态讽刺检测问题的关注不断提高。然而,现有基于特征提取融合的检测方法存在一些缺陷:一是大多数方法缺乏多模态检测所需的底层模态对齐能力,二是模态融合过程忽视了模态间的动态关系,三是未能充分利用模态互补性。为此,提出一种基于单模态监督对比学习、多模态融合和多视图聚合预测的检测模型。以CLIP(contrastive language image pre-training)模型作为编码器来增强图像和文本底层编码的对齐效果。结合单模态监督对比学习方法,通过单模态预测来指导模态间的动态关系。然后,设计了全局-局部跨模态融合方法,利用每种模态的语义级表示作为全局多模态上下文与局部单模态特征进行交互,通过多个跨模态融合层提高模态融合效果,并减少了以往局部-局部跨模态融合方法的时间和空间成本。采用多视图聚合预测方法充分利用图像、文本和图文视图的互补性。总之,该模型能有效捕捉多模态讽刺数据的跨模态语义不一致性,在公开数据集MSD上取得了比现有最好方法DMSD-Cl更好的结果。 展开更多
关键词 讽刺检测 多模态 对比学习 跨模态融合
在线阅读 下载PDF
基于改进的YOLOv8算法的钢材缺陷检测
4
作者 彭菊红 张弛 +3 位作者 高谦 张光明 谈栋华 赵明俊 《计算机工程》 北大核心 2025年第7期152-160,共9页
在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此,提出一种改进的YOLOv8算法YOLOv8n-MDC。首先,在骨干网络中加入多尺度交叉融合网络(MCN),通过在特征层之间建立更紧密的连接,促进信息的均匀传递,减少跨层特... 在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此,提出一种改进的YOLOv8算法YOLOv8n-MDC。首先,在骨干网络中加入多尺度交叉融合网络(MCN),通过在特征层之间建立更紧密的连接,促进信息的均匀传递,减少跨层特征融合时的语义信息损失,从而增强模型对钢材缺陷的感知能力;其次,在模块中引入可变形卷积,自适应地改变卷积核的形状与位置,从而更灵活地捕捉不规则缺陷的边缘特征,减少信息丢失,提升检测的准确性;最后,加入坐标注意力(CA)机制,将位置信息嵌入到通道中,解决了位置信息丢失的问题,使模型能够更精确地感知缺陷的位置及其形态特征,从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明,YOLOv8n-MDC算法的mAP@0.5达到了81.0%,相比原基准网络提升了4.2百分点,该算法收敛速度较快、精度较高,更能满足实际工业生产的要求。 展开更多
关键词 多尺度交叉融合网络 YOLOv8网络 坐标注意力机制 钢材缺陷检测 可变形卷积
在线阅读 下载PDF
多模态特征融合的RGB-T目标跟踪网络
5
作者 金静 刘建琴 翟凤文 《光学精密工程》 北大核心 2025年第12期1940-1954,共15页
近年来,RGB-T跟踪方法因可见光与热红外图像的互补特性而在视觉跟踪领域得到广泛应用。然而,现有方法在模态互补信息利用方面仍存在局限,特别是基于Transformer的算法缺乏模态间的直接交互,难以充分挖掘RGB和TIR模态的语义信息。针对这... 近年来,RGB-T跟踪方法因可见光与热红外图像的互补特性而在视觉跟踪领域得到广泛应用。然而,现有方法在模态互补信息利用方面仍存在局限,特别是基于Transformer的算法缺乏模态间的直接交互,难以充分挖掘RGB和TIR模态的语义信息。针对这些问题,提出了一种多模态特征融合的RGB-T目标跟踪网络(Multi-Modal Feature Fusion Tracking Network for RGB-T,MMFFTN)。该网络首先在骨干网络提取初步特征后,引入通道特征融合模块(Channel Feature Fusion Module,CFFM),实现RGB和TIR通道特征的直接交互与融合。其次,针对RGB和TIR模态差异可能导致的融合效果不理想问题,设计了跨模态特征融合模块(Cross-Modal Feature Fusion Module,CMFM),通过自适应融合策略进一步融合RGB和TIR的全局特征,以提升跟踪的准确性。对本文提出的跟踪模型在GTOT,RGBT234和LasHeR三个数据集上进行了详细的实验评估。实验结果表明,与当前先进的基于Transformer的跟踪器ViPT相比,MMFFTN在成功率(Success Rate)和精确率(Precision Rate)上分别提升了3.0%和4.7%;与基于Transformer的跟踪器SDSTrack相比,成功率和精确率分别提升了2.4%和3.3%。 展开更多
关键词 RGB-T目标跟踪 TRANSFORMER 通道特征融合 跨模态特征融合
在线阅读 下载PDF
基于特征分块与域间融合的跨域足迹图像检索方法 被引量:2
6
作者 张艳 申多 +2 位作者 李增辉 朱明 粟娇娇 《计算机辅助设计与图形学学报》 北大核心 2025年第2期303-312,共10页
为了解决现有图像检索方法难以提取跨域足迹图像的高区分性域共享特征等问题,提出了一种基于特征分块与域间融合的跨域足迹图像检索方法.首先,以ResNet50为主干网络提取足迹图像全局特征;然后通过水平分块特征提取方法获取更具鉴别性的... 为了解决现有图像检索方法难以提取跨域足迹图像的高区分性域共享特征等问题,提出了一种基于特征分块与域间融合的跨域足迹图像检索方法.首先,以ResNet50为主干网络提取足迹图像全局特征;然后通过水平分块特征提取方法获取更具鉴别性的特征;最后,采用跨域特征融合方法提取域共享信息,并设计均衡损失以优化融合特征.在自行采集的200人跨域足迹图像数据集上进行实验,在光学检索压力及压力检索光学2种模式下Rank-1分别达到91.38%和84.50%,验证了所提方法的有效性. 展开更多
关键词 图像检索 跨域足迹 特征分块 特征融合 均衡损失
在线阅读 下载PDF
基于跨域交互注意力和对比学习引导的红外与可见光图像融合 被引量:1
7
作者 邸敬 梁婵 +1 位作者 刘冀钊 廉敬 《中国光学(中英文)》 北大核心 2025年第2期317-332,共16页
现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外... 现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外和可见光图像中分别提取和增强细节信息,并利用跳跃连接避免信息丢失,生成增强后的细节图像。接着,构建了联合双分支编码器和跨域交互注意力模块的图像融合网络,确保特征融合时充分进行特征交互,并通过解码器重建为最终的融合图像。然后,引入了通过对比学习块进行浅层和深层属性和内容的对比学习网络,优化特征表示,进一步提升图像融合网络的性能。最后,为了约束网络训练以保留源图像的固有特征,设计了一种基于对比约束的损失函数,以辅助融合过程对源图像信息的对比保留。将提出方法与前沿融合方法进行了定性和定量的分析比较。在TNO、MSRS、RoadSence数据集上的实验结果表明:本文方法的8项客观评价指标均较对比方法有显著提升。本文方法融合后图像具有丰富的细节纹理、显著的清晰度和对比度,有效提高了道路交通、安防监控等实际应用中的目标识别和环境感知能力。 展开更多
关键词 红外与可见光图像融合 对比学习 跨域交互注意力机制 对比约束损失
在线阅读 下载PDF
基于异构信息网络的多模态食谱表示学习方法
8
作者 张霄雁 江诗琪 孟祥福 《计算机科学与探索》 北大核心 2025年第10期2803-2814,共12页
当前食谱表示学习方法主要依赖于通过将食谱文本与图像进行对齐,或利用邻接矩阵捕捉食谱与其用料之间关系的方式,学习食谱的嵌入表示。然而,这些方法在信息融合处理上较为粗糙,未能深入挖掘不同模态之间的交叉信息,且难以有效地动态评... 当前食谱表示学习方法主要依赖于通过将食谱文本与图像进行对齐,或利用邻接矩阵捕捉食谱与其用料之间关系的方式,学习食谱的嵌入表示。然而,这些方法在信息融合处理上较为粗糙,未能深入挖掘不同模态之间的交叉信息,且难以有效地动态评估食谱组成要素之间的关联强度,导致模型的表示能力受限。针对上述问题,提出一种基于异构信息网络的多模态食谱表示学习模型(CookRec2vec)。将视觉、文本和关系信息集成到食谱嵌入中,通过自适应的邻接关系更加充分挖掘和量化食谱组成要素之间的关联信息及其强度,同时基于高阶共现矩阵的显式建模方法提供了互补信息且保留了原有特性,显著提高了食谱特征表达能力。实验结果表明,所提模型在食谱分类性能上优于现有主流方法,并在创新菜嵌入预测方面取得了显著进展。 展开更多
关键词 表示学习 图嵌入 异构信息网络 跨模态融合 对抗攻击 节点分类
在线阅读 下载PDF
基于双流特征交叉融合Efficient Transformer的人脸表情识别
9
作者 党宏社 孟饶辰 高宛蓉 《计算机工程与应用》 北大核心 2025年第15期251-257,共7页
面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet... 面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet分别提取人脸表情的图像和关键点的多尺度特征,同时采用通道注意力机制来增强关键特征并减少参数量;引入了交叉融合高效多头自注意力机制(cross fusion efficient multi-head self-attention,CFEMSA),对相同尺度的双流特征进行交叉融合,以突出面部显著特征;最后采用特征金字塔结构对不同尺度的交叉融合结果进行多尺度融合,以提高识别的准确性。提出的方法在RAF-DB、AffecNet-7和AffecNet-8数据集上的识别准确率分别为91.82%、67.46%和63.65%,实验结果证明该方法有效缓解了类间相似性和类内差异所引起的识别准确率低的问题。 展开更多
关键词 面部表情识别 Efficient Transformer 交叉融合 多尺度特征 特征融合
在线阅读 下载PDF
频域特征蒸馏的双尺度融合图像去雾网络
10
作者 陈清江 杨双 《光学精密工程》 北大核心 2025年第6期916-927,共12页
针对去雾图像边缘细节不够清晰,以及现有U-Net去雾网络大多对频域信息的挖掘不够充分、忽略了不同通道之间的信息交流从而导致结构模糊的问题,提出了频域特征蒸馏的双尺度融合网络来实现单幅图像的有效去雾。在粗尺度特征提取子网中采... 针对去雾图像边缘细节不够清晰,以及现有U-Net去雾网络大多对频域信息的挖掘不够充分、忽略了不同通道之间的信息交流从而导致结构模糊的问题,提出了频域特征蒸馏的双尺度融合网络来实现单幅图像的有效去雾。在粗尺度特征提取子网中采用大尺度的卷积核提取图像的纹理信息,利用残差注意力机制增强与雾霾相关的特征。在细尺度高频融合子网中,设计了高频特征蒸馏模块用来细化提取到的结构和边缘信息,并逐步恢复清晰的图像;同时采用交叉融合策略对不同通道的特征进行融合。实验结果表明,与MSTN(Efficient and Accurate Multi-Scale Topological Network)算法相比,在室外图像数据集上的峰值信噪比和结构相似度分别提高了9.98%和4.77%。在不同数据集上的实验结果均表明所提出的方法表现出了更良好的去雾性能。该方法可以有效提高去雾的效果,保留更多的结构信息,具有更好的颜色细节恢复能力。 展开更多
关键词 高频信息 特征蒸馏 图像去雾 交叉融合 残差注意力
在线阅读 下载PDF
基于双分支多尺度特征融合的跨模态语义分割算法
11
作者 陈广秋 任天蓉 +1 位作者 段锦 黄丹丹 《电子测量与仪器学报》 北大核心 2025年第5期144-154,共11页
针对单模态可见光RGB图像语义分割在夜晚或光线变化环境下存在分割效果差、目标边缘分割不清晰等问题,以及现有的跨模态语义分割在获取全局上下文信息和融合跨模态特征时还存在大量不足。为此提出了一种基于双分支多尺度特征融合的跨模... 针对单模态可见光RGB图像语义分割在夜晚或光线变化环境下存在分割效果差、目标边缘分割不清晰等问题,以及现有的跨模态语义分割在获取全局上下文信息和融合跨模态特征时还存在大量不足。为此提出了一种基于双分支多尺度特征融合的跨模态语义分割算法。采用Segformer作为主干网络提取特征,捕获长距离依赖关系,采用特征增强模块提升浅层特征图的对比度和边缘信息的判别性,利用有效注意力增强模块和跨模态特征融合模块,对不同模态特征图像素点间的关系进行建模,聚合互补信息,发挥跨模态特征优势。最后,采用轻量级的All-MLP解码器重建图像,预测分割结果。相比较于已有主流算法,该算法在MFNet城市街景数据集上的各项评估指标均为最优,平均准确率(mAcc)和平均交并比(mIoU)分别达到了76.9%和59.8%。实验结果表明,该算法在处理复杂场景时,能够有效改善目标边缘轮廓分割不清晰的问题,提高图像的分割精度。 展开更多
关键词 多模态深度学习 语义分割 特征融合 跨模态 Segformer
在线阅读 下载PDF
融合动态通道剪枝的轻量级CT图像肺结节检测网络设计
12
作者 易见兵 胡雅怡 +3 位作者 曹锋 李俊 彭鑫 陈鑫 《广西师范大学学报(自然科学版)》 北大核心 2025年第6期92-106,共15页
肺癌是全球致死率最高的肿瘤疾病,而肺结节是早期肺癌的主要表现,现有算法在检测小目标肺结节时存在漏检、误检且模型复杂度高等问题。针对以上问题,本文提出一种基于通道掩码和动态通道剪枝的肺结节检测算法。首先,利用跨层连接将浅层... 肺癌是全球致死率最高的肿瘤疾病,而肺结节是早期肺癌的主要表现,现有算法在检测小目标肺结节时存在漏检、误检且模型复杂度高等问题。针对以上问题,本文提出一种基于通道掩码和动态通道剪枝的肺结节检测算法。首先,利用跨层连接将浅层特征与深层特征进行融合,并且精简路径聚合网络,减少模型参数量的同时获得更丰富的特征。其次,在残差连接中引入SE通道注意力机制,通过自适应调整每个通道的权重,聚焦肺结节中的关键信息,以提高算法对肺结节的检测能力。最后,利用通道掩码对网络进行动态通道剪枝,使网络能够完整保留模块中的跳跃连接,以增强模型的特征表达能力。在LUNA16数据集上,本文算法比YOLOv8n模型权重小0.3 MiB,且召回率和mAP@0.5分别提升2.0和1.7个百分点。在Lung-PET-CT-Dx数据集上,本文算法比YOLOv8n模型权重小0.9 MiB,且召回率和mAP@0.5分别提升0.8和0.4个百分点。实验结果表明,本文模型具有较高的肺结节检测精度且参数量较少。 展开更多
关键词 肺结节检测 通道掩码 动态通道剪枝 跨层特征融合 通道注意力
在线阅读 下载PDF
基于多层注意力机制跨模态自适应融合的情感分析模型研究
13
作者 贺萍 祁铧颖 王诗怡 《计算机应用与软件》 北大核心 2025年第9期203-209,共7页
与面向文本、图像进行情感分析的研究相比,面向视频进行情感分析的研究较少,且不同模式之间跨模态关系抽取依然存在噪声与信息冗余的问题。因此,结合文本、视频两种数据模态提出一种基于多层注意力机制的跨模态自适应融合的情感分析模型... 与面向文本、图像进行情感分析的研究相比,面向视频进行情感分析的研究较少,且不同模式之间跨模态关系抽取依然存在噪声与信息冗余的问题。因此,结合文本、视频两种数据模态提出一种基于多层注意力机制的跨模态自适应融合的情感分析模型(MACSF)。该文将提取到的文本与视频特征在多头层次注意(MHA)下跨模态分层融合两次,得到具有交互语义的二次融合特征;将文本特征和二次融合的特征通过自适应跨模态集成得到最终融合特征;将融合特征输入多层感知机和Softmax函数得到情感分类结果。在公开数据集MOSI和MOSEI上实验验证,该文模型有效弥补了跨模态交互中存在的噪声问题,提高了情感分类的效果。 展开更多
关键词 跨模态 特征融合 情感分析 注意力机制
在线阅读 下载PDF
基于ConvNeXt和可变形交叉注意力的多模态3D目标检测方法
14
作者 周鹏 宋志强 +2 位作者 胡凯 宋利鹏 李明阳 《电子测量技术》 北大核心 2025年第12期63-70,共8页
近年来,随着新能源汽车的快速发展,3D目标检测作为自动驾驶技术的核心基础正变得愈发重要。融合雷达点云与图像等多模态信息的策略,能够显著提升目标检测的准确性与鲁棒性。受BEVDet启发,本研究提出了一种基于BEV(鸟瞰图)视角的改进多... 近年来,随着新能源汽车的快速发展,3D目标检测作为自动驾驶技术的核心基础正变得愈发重要。融合雷达点云与图像等多模态信息的策略,能够显著提升目标检测的准确性与鲁棒性。受BEVDet启发,本研究提出了一种基于BEV(鸟瞰图)视角的改进多模态融合3D目标检测方法。该方法采用ConvNeXt网络结合FPN-DCN结构高效提取图像特征,并通过可变形交叉注意力机制实现图像与点云数据的深度融合,从而进一步提升模型的检测精度。在nuScenes自动驾驶数据集上的实验表明,本研究模型性能优异,在测试集上的NDS达到了64.9%,显著超越了大多数现有检测方法。 展开更多
关键词 自动驾驶 3D目标检测 多模态融合 可变形交叉注意力机制
在线阅读 下载PDF
结合特征融合与混合注意力的细粒度图像分类
15
作者 潘卫华 魏明月 苏攀 《计算机应用与软件》 北大核心 2025年第9期210-219,共10页
为充分提取细粒度图像中的局部关键特征,提出特征融合与混合注意力相结合的细粒度图像分类算法。该文利用SE(Squeeze-and-Excitation Networks)引入通道注意力,提高特征提取能力;提出特征融合,充分融合跨通道交互后的低层和高层语义信息... 为充分提取细粒度图像中的局部关键特征,提出特征融合与混合注意力相结合的细粒度图像分类算法。该文利用SE(Squeeze-and-Excitation Networks)引入通道注意力,提高特征提取能力;提出特征融合,充分融合跨通道交互后的低层和高层语义信息;改进选择性稀疏采样(Selective Sparse Sampling,S3N)方法引入空间注意力获取显著采样图;构造一个能够端到端训练的两分支分类模型,以交叉验证的方式提高分类准确率。该算法在CUB-200-2011、FGVC-Aircraft和Stanford Cars数据集上分别达到了87.84%、93.59%和94.25%的分类准确率,优于骨干网络和当前主流算法。 展开更多
关键词 细粒度图像分类 通道注意力 空间采样 特征融合 交叉验证
在线阅读 下载PDF
基于特征交互的红外与可见光图像融合
16
作者 戴蓉 黄志勇 +2 位作者 王瑞 谢卫鑫 李建明 《激光与红外》 北大核心 2025年第9期1484-1491,共8页
红外和可见光图像融合旨在结合红外热辐射信息和可见光纹理,生成新图像。传统和深度学习方法通常将两种模态分开处理,限制了模态间的信息交互,难以有效区分互补与冗余信息,导致融合图像容易出现模糊、伪影和细节不清晰等问题。为了解决... 红外和可见光图像融合旨在结合红外热辐射信息和可见光纹理,生成新图像。传统和深度学习方法通常将两种模态分开处理,限制了模态间的信息交互,难以有效区分互补与冗余信息,导致融合图像容易出现模糊、伪影和细节不清晰等问题。为了解决此问题,本文设计了一个基于特征交互的融合网络模型,该模型利用特征交互模块FIM使模态间的特征信息能够进行交互。同时,为了使交互后的互补信息得到充分地利用,设计了交叉注意力融合模块CAFM。为验证所提方法性能,分别在3个数据集中与其他6种方法进行对比实验,实验结果表明,所提方法在视觉效果上纹理清晰,没有出现明显伪影,在定量评估中各指标排名都位于前列。 展开更多
关键词 图像融合 深度学习 特征交互 交叉注意力
在线阅读 下载PDF
基于细粒度图像-方面的情感增强方面级情感分析 被引量:1
17
作者 余本功 陈明玥 《计算机应用研究》 北大核心 2025年第4期1073-1079,共7页
为了缩小模态间的异质性差异并缓解多个方面词带来的情感混淆,提出一种基于细粒度图像-方面的情感增强多模态方面级情感分析。具体地,该模型经过文本图像编码后,首先利用形容词-名词对将与方面词相关的图像信息加入到文本方面词中,并通... 为了缩小模态间的异质性差异并缓解多个方面词带来的情感混淆,提出一种基于细粒度图像-方面的情感增强多模态方面级情感分析。具体地,该模型经过文本图像编码后,首先利用形容词-名词对将与方面词相关的图像信息加入到文本方面词中,并通过细粒度图像-方面跨模态注意力机制优化图像表征,得到细粒度方面词-图像特征;接着,基于句法结构引入情感得分,得到基于方面词的文本情感特征;最后,进行模态融合得到最终情感预测结果。在Twitter-2015和Twitter-2017数据集上,与基线模型TMSC相比,提出模型值准确率分别提高了0.25百分点和0.16百分点,充分证明了细粒度的图文匹配和情感增强操作有助于提高分类效果。 展开更多
关键词 多模态方面级情感分析 形容词-名词对 跨模态注意力机制 情感分数 模态融合
在线阅读 下载PDF
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
18
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 微表情识别 特征选择与融合 交叉注意力机制 视觉Transformer
在线阅读 下载PDF
夜间红外与可见光多尺度信息注入式图像融合
19
作者 杨艳春 李佳龙 +1 位作者 李毅 王泽煜 《光学精密工程》 北大核心 2025年第2期282-297,共16页
针对低光照条件下红外与可见光图像融合由于忽视光照而导致纹理细节不清晰、视觉感知较差等问题,本文提出了一种低光增强和语义注入式多尺度红外与可见光图像融合方法。首先,设计了一种适合低光增强的网络,通过残差模型反复迭代,实现夜... 针对低光照条件下红外与可见光图像融合由于忽视光照而导致纹理细节不清晰、视觉感知较差等问题,本文提出了一种低光增强和语义注入式多尺度红外与可见光图像融合方法。首先,设计了一种适合低光增强的网络,通过残差模型反复迭代,实现夜间场景下可见光图像的增强。然后,采用一种基于Nest架构的特征提取器作为网络的编码与解码器,其中深层特征能捕获图像的复杂结构和语义信息,设计了一种语义先验学习模块,通过交叉注意力进一步提取深层红外与可见光图像的语义信息,采用语义注入单元,将增强特征逐级注入了各个尺度。其次,设计了梯度增强分支,主流特征先通过混合注意力,再由主流分出Sobel算子流和Laplacian算子流,以此增强融合图像梯度。最后,通过解码器中同层之间的密集连接和不同层之间的跳跃连接,对各尺度特征进行重构。实验结果表明,本文在视觉信息保真度、互信息、差异相关系数和空间频率,较九种对比方法分别平均提高了23.1%,16.3%,18%,39.8%,有效提升了低光环境下融合图像的质量,有助于提升高级视觉任务的性能。 展开更多
关键词 红外与可见光图像融合 多尺度融合网络 低光增强 交叉注意力 语义注入
在线阅读 下载PDF
基于多期相增强CT的肾细胞癌病理分级深度学习算法
20
作者 陈皓中 刘军 +3 位作者 邓凯 梅习龙 彭德红 肖恩华 《中南大学学报(医学版)》 北大核心 2025年第4期651-663,共13页
目的:肾细胞癌(renal cell carcinoma,RCC)是一种肾恶性肿瘤,严重威胁患者健康,术前病理分级的准确判断对确定RCC的治疗方法具有重大意义。目前,深度学习技术已成为RCC病理分级的重要方法,但是现有方法主要基于单期相计算机断层扫描(com... 目的:肾细胞癌(renal cell carcinoma,RCC)是一种肾恶性肿瘤,严重威胁患者健康,术前病理分级的准确判断对确定RCC的治疗方法具有重大意义。目前,深度学习技术已成为RCC病理分级的重要方法,但是现有方法主要基于单期相计算机断层扫描(computed tomography,CT)影像进行分析与预测,仍存在微小病灶的漏诊、评估片面性和局部聚焦等方面的不足。本研究提出一种联合多期相增强CT影像和临床变量数据的多模态深度学习算法,以期为预测RCC病理分级提供依据。方法:首先,该算法以平扫期、动脉期、静脉期和延迟期4个期相增强CT影像与临床变量为输入模块;然后,使用嵌入编码模块提取临床变量中的异构信息,采用三维ResNet50模型捕捉多期相增强CT影像数据的空间信息;最后,使用Fusion模块将临床变量的特征信息与各期相CT影像的特征信息进行深度融合,并进一步利用交叉自注意力机制实现多期相特征融合,从而更全面捕捉患者数据中的深层次语义信息,充分利用多模态、多期相数据的信息互补优势。纳入1229例RCC患者的资料以验证该算法的有效性。结果:该算法在准确率(83.87%)、召回率(95.04%)和F1分数(82.23%)等指标上均优于传统的影像组学方法和其他深度学习算法。结论:本研究提出的算法具有较好的稳定性和敏感性,显著提升了RCC病理分级的预测能力,为RCC的精准诊断提供了新的思路和方法。 展开更多
关键词 病理分级 深度学习 跨模态融合 肾细胞癌 三维ResNet
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部