期刊文献+
共找到276篇文章
< 1 2 14 >
每页显示 20 50 100
A content-aware correlation filter with multi-feature fusion for RGB-T tracking
1
作者 FENG Zihang YAN Liping +2 位作者 BAI Jinglan XIA Yuanqing XIAO Bo 《Journal of Systems Engineering and Electronics》 CSCD 2024年第6期1357-1371,共15页
In challenging situations,such as low illumination,rain,and background clutter,the stability of the thermal infrared(TIR)spectrum can help red,green,blue(RGB)visible spectrum to improve tracking performance.However,th... In challenging situations,such as low illumination,rain,and background clutter,the stability of the thermal infrared(TIR)spectrum can help red,green,blue(RGB)visible spectrum to improve tracking performance.However,the high-level image information and the modality-specific features have not been sufficiently studied.The proposed correlation filter uses the fused saliency content map to improve filter training and extracts different features of modalities.The fused content map is intro-duced into the spatial regularization term of correlation filter to highlight the training samples in the content region.Furthermore,the fused content map can avoid the incompleteness of the con-tent region caused by challenging situations.Additionally,differ-ent features are extracted according to the modality characteris-tics and are fused by the designed response-level fusion stra-tegy.The alternating direction method of multipliers(ADMM)algorithm is used to solve the tracker training efficiently.Experi-ments on the large-scale benchmark datasets show the effec-tiveness of the proposed tracker compared to the state-of-the-art traditional trackers and the deep learning based trackers. 展开更多
关键词 visual tracking RED green blue(RGB)and thermal infrared(TIR)tracking correlation filter content perception multi-feature fusion
在线阅读 下载PDF
Hierarchical particle filter tracking algorithm based on multi-feature fusion 被引量:3
2
作者 Minggang Gan Yulong Cheng +1 位作者 Yanan Wang Jie Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第1期51-62,共12页
A hierarchical particle filter(HPF) framework based on multi-feature fusion is proposed.The proposed HPF effectively uses different feature information to avoid the tracking failure based on the single feature in a ... A hierarchical particle filter(HPF) framework based on multi-feature fusion is proposed.The proposed HPF effectively uses different feature information to avoid the tracking failure based on the single feature in a complicated environment.In this approach,the Harris algorithm is introduced to detect the corner points of the object,and the corner matching algorithm based on singular value decomposition is used to compute the firstorder weights and make particles centralize in the high likelihood area.Then the local binary pattern(LBP) operator is used to build the observation model of the target based on the color and texture features,by which the second-order weights of particles and the accurate location of the target can be obtained.Moreover,a backstepping controller is proposed to complete the whole tracking system.Simulations and experiments are carried out,and the results show that the HPF algorithm with the backstepping controller achieves stable and accurate tracking with good robustness in complex environments. 展开更多
关键词 particle filter corner matching multi-feature fusion local binary patterns(LBP) backstepping.
在线阅读 下载PDF
基于尺度交互蒸馏网络的薄壳山核桃品种识别方法 被引量:2
3
作者 赵宁 陈智坤 +3 位作者 杨朋飞 王瑞多 张计育 李永荣 《农业工程学报》 北大核心 2025年第5期209-216,共8页
薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习... 薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习薄壳山核桃的可判别性特征实现品种鉴定。研究选择波尼等12种薄壳山核桃,建立了9048张实拍图像的品种识别数据集;针对薄壳山核桃图片取样中距离变化导致的目标尺度多样性问题,设计了一种全局-局部特征协同学习方案,用于提取尺度不变特征;与此同时,该研究结合尺度知识蒸馏方案,通过训练提取的不同尺度数据进行预测保证模型训练的有效性。结果表明,通过训练该方法对上述12个品种的薄壳山核桃品种识别准确率均达到了96.98%,显著提高了薄壳山核桃的品种鉴定准确率。该研究开发的薄壳山核桃品种自动识别模型对于未来果实鉴定及产品分选提供了技术手段。 展开更多
关键词 薄壳山核桃 品种鉴定 尺度交互蒸馏 多尺度上下文注意融合 知识蒸馏
在线阅读 下载PDF
基于时空交互网络的人体行为检测方法研究 被引量:1
4
作者 田青 张浩然 +2 位作者 楚柏青 张正 豆飞 《计算机应用与软件》 北大核心 2025年第4期156-165,共10页
针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和... 针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和时间流网络中引入改进的空间变换网络和视觉注意力模型;设计基于像素筛选器的特征融合模块,用于重点区域时序信息相关性的计算和两类不同维度特征的聚合;对网络的损失函数进行了优化。在AVA数据集上的实验结果表明该方法在检测精度、速度以及泛化能力上具有优越性。 展开更多
关键词 时空交互网络 人体行为检测 视觉注意力 特征融合 损失函数
在线阅读 下载PDF
基于联合交互注意力的图文情感分析方法 被引量:1
5
作者 胡慧君 丁子毅 +1 位作者 张耀峰 刘茂福 《北京航空航天大学学报》 北大核心 2025年第7期2262-2270,共9页
社交媒体中的图文情感对于引导舆论走向具有重要意义,越来越受到自然语言处理(NLP)领域的广泛关注。当前,社交媒体图文情感分析的研究对象主要为单幅图像文本对,针对无时序性及多样性的图集文本对的研究相对较少,为有效挖掘图集中图像... 社交媒体中的图文情感对于引导舆论走向具有重要意义,越来越受到自然语言处理(NLP)领域的广泛关注。当前,社交媒体图文情感分析的研究对象主要为单幅图像文本对,针对无时序性及多样性的图集文本对的研究相对较少,为有效挖掘图集中图像与文本之间情感一致性信息,提出基于联合交互注意力的图文情感分析(SA-JIA)方法。该方法使用RoBERTa和双向门控循环单元(Bi-GRU)来提取文本表达特征,使用ResNet50获取图像视觉特征,利用联合注意力来找到图文情感信息表达一致的显著区域,获得新的文本和图像视觉特征,采用交互注意力关注模态间的特征交互,并进行多模态特征融合,进而完成情感分类任务。在IsTS-CN数据集和CCIR20-YQ数据集上进行了实验验证,结果表明:所提方法能够提升社交媒体图文情感分析的性能。 展开更多
关键词 社交媒体 图文情感分析 联合注意力 交互注意力 多模态融合
在线阅读 下载PDF
基于交互多模型的智能汽车环境感知信息统一融合方法研究 被引量:1
6
作者 贾鑫 李松霖 +1 位作者 佘远昇 洪峰 《汽车工程》 北大核心 2025年第6期1144-1154,共11页
针对当前智能汽车环境感知系统进行多传感信息融合时不同传感器往往分阶段融合、难以均衡发挥单一传感器精度优势和多源信息冗余优势的问题,提出了一种基于交互多模型的对象级并行结构多传感信息统一融合方法。对象级融合具有良好的模... 针对当前智能汽车环境感知系统进行多传感信息融合时不同传感器往往分阶段融合、难以均衡发挥单一传感器精度优势和多源信息冗余优势的问题,提出了一种基于交互多模型的对象级并行结构多传感信息统一融合方法。对象级融合具有良好的模块化以及封装性,并行结构能够充分利用信息冗余优势,交互多模型可以统一高效融合多源数据,弥补单一传感器的局限性。在对多源传感器数据时空对齐基础上,引入最邻近法和DS证据理论实现多传感器信息关联,并基于交互多模型进行动态统一融合。进行了实车搭载毫米波雷达和视觉系统环境感知试验,结果表明本方法能够有效提升目标车辆感知跟踪的可靠性和稳定性,提高了系统的适应能力。 展开更多
关键词 智能汽车 环境感知 对象级融合 并行滤波 交互多模型
在线阅读 下载PDF
基于视线引导的实时动态手势识别方法
7
作者 易月娥 李蔚清 胡鹏 《计算机工程与设计》 北大核心 2025年第8期2342-2349,共8页
针对手势识别技术在实际交互场景中存在模型参数量大、误触发率高等问题,提出一种基于视线引导的实时动态手势识别方法。利用视线追踪数据对手部骨架序列进行准确分割,同时对骨架数据从多个维度进行特征预处理,利用轻量级的多特征融合... 针对手势识别技术在实际交互场景中存在模型参数量大、误触发率高等问题,提出一种基于视线引导的实时动态手势识别方法。利用视线追踪数据对手部骨架序列进行准确分割,同时对骨架数据从多个维度进行特征预处理,利用轻量级的多特征融合识别网络进行手势识别。在多个公开数据集与模拟交互场景下进行测试,结果表明,该方法仅使用约0.15M的参数量和3 ms的推理时间,获得了超过主流方法的识别准确率。在模拟场景下的14类和28类动态手势识别任务中,Levenshtein精度分别为95.9%和94.5%,相对于主流方法提高约20%。 展开更多
关键词 动态手势识别 人机交互 视线引导 视线追踪 轻量级 多特征融合识别 交互场景
在线阅读 下载PDF
面向单目可见光环境的自适应双手重建网络
8
作者 廖国琼 黄龙杰 +2 位作者 李清新 辜勇 李海波 《图学学报》 北大核心 2025年第4期837-846,共10页
准确重建双手手部网格对于自然的人机交互体验来说是一个至关重要的过程,但由于双手的遮挡、户外收集双手交互数据集的复杂性和复杂的光照环境干扰等因素导致双手手部重建任务仍极具挑战性。目前已有的工作大多是在环境干扰比较小的实... 准确重建双手手部网格对于自然的人机交互体验来说是一个至关重要的过程,但由于双手的遮挡、户外收集双手交互数据集的复杂性和复杂的光照环境干扰等因素导致双手手部重建任务仍极具挑战性。目前已有的工作大多是在环境干扰比较小的实验室等场景下取得的的良好效果,而在复杂的光照场景中的重建效果仍不佳。为了解决上述问题,提出一种面向单目可见光环境的自适应手部重建网络。通过引入单手检测框和使用2D复杂光照场景数据集进行弱监督等策略使得模型得以对复杂光照场景产生泛化性;设计的双手特征交互器得以有效建立左右手特征的远距离依赖关系,缓解了单手检测框缺乏双手交互信息的问题;针对如何有效融合交互特征与单手特征的问题,设计了自适应融合的策略,增强了模型的鲁棒性。实验结果表明,在包含多个复杂光照场景的HIC数据集中取得了最佳的效果。 展开更多
关键词 复杂光照场景 手部网格 双手交互 弱监督 特征融合
在线阅读 下载PDF
一种双分支特征交互融合的高效红外图像彩色化方法
9
作者 陈宇 詹伟达 +2 位作者 蒋一纯 朱德鹏 韩登 《西安交通大学学报》 北大核心 2025年第8期211-222,共12页
针对现有的红外图像彩色化方法在全局特征捕获和计算复杂度方面存在显著局限性的问题,提出了一种双分支特征交互融合的高效红外图像彩色化方法。设计双分支编码器,通过局部特征提取分支获取局部空间上下文信息,确保细粒度特征的捕获,并... 针对现有的红外图像彩色化方法在全局特征捕获和计算复杂度方面存在显著局限性的问题,提出了一种双分支特征交互融合的高效红外图像彩色化方法。设计双分支编码器,通过局部特征提取分支获取局部空间上下文信息,确保细粒度特征的捕获,并通过全局特征提取分支获取全局特征,满足对长程依赖的需求。设计交互融合模块,对两个分支提取到的特征进行有效整合,显著增强了模型的整体性能。在解码器部分提出上下文聚合模块,进一步优化多尺度语义特征的聚合能力,改善了彩色化结果的边缘清晰度和细节表现力。在KAIST和FLIR数据集上进行广泛实验验证,结果表明:与现有方法相比,所提方法在两个数据集上均具有更高的彩色化质量,峰值信噪比分别达到28.645、30.459 dB,结构相似度达到0.507、0.725,均优于对比方法,且有效性和先进性也得到了验证。研究结果可为提升红外图像的可读性与可解释性以及提高夜视与恶劣环境下的观测能力提供参考。 展开更多
关键词 红外图像彩色化 细粒度特征 长程依赖 交互融合 上下文聚合
在线阅读 下载PDF
基于跨模态特征交互和多尺度重建的红外与可见光图像融合
10
作者 姚睿 王凯 +2 位作者 郭浩帆 胡文涛 田祥瑞 《红外与激光工程》 北大核心 2025年第8期259-270,共12页
针对弱光环境下红外与可见光图像融合存在的纹理细节丢失、视觉效果和实时性差等问题,提出了一种基于跨模态特征交互和多尺度重建(Cross-modal Feature Interaction and Multi-scale Reconstruction,CFIMR)的红外与可见光图像融合算法CF... 针对弱光环境下红外与可见光图像融合存在的纹理细节丢失、视觉效果和实时性差等问题,提出了一种基于跨模态特征交互和多尺度重建(Cross-modal Feature Interaction and Multi-scale Reconstruction,CFIMR)的红外与可见光图像融合算法CFIMRFusion。该算法构建了包括卷积注意力增强模块、编码器网络、跨模态特征交互融合模块和基于多尺度重建的解码器网络的四阶段融合框架。首先,设计卷积注意力增强模块提升弱可见光图像的对比度和纹理可见性,并利用编码器网络从红外图像和增强后的可见光图像中提取深层多尺度特征。然后,提出基于通道-空间注意力的跨模态特征交互融合模块,对红外显著特征和可见光细节特征进行互补融合。最后,为解决使用普通解码器重建图像时出现特征消失等问题,将融合得到的多尺度特征以跳跃连接的方式输入到解码器各级,重建高保真的融合图像。实验结果表明,CFIMRFusion融合图像的细节特征和整体视觉效果优于对比算法;且与最优对比算法相比,融合图像在TNO数据集中平均梯度、边缘强度分别提升了15.8%、18.2%,在LLVIP数据集中互信息、标准差分别提升了11.5%、9.5%,在MSRS数据集中边缘强度提升了10.1%;三个数据集上的融合速度分别为最快对比算法的24.1%、23.86%和25.2%。 展开更多
关键词 图像融合 图像增强 注意力机制 自编码网络 跨模态特征交互
在线阅读 下载PDF
基于跨域交互注意力和对比学习引导的红外与可见光图像融合
11
作者 邸敬 梁婵 +1 位作者 刘冀钊 廉敬 《中国光学(中英文)》 北大核心 2025年第2期317-332,共16页
现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外... 现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外和可见光图像中分别提取和增强细节信息,并利用跳跃连接避免信息丢失,生成增强后的细节图像。接着,构建了联合双分支编码器和跨域交互注意力模块的图像融合网络,确保特征融合时充分进行特征交互,并通过解码器重建为最终的融合图像。然后,引入了通过对比学习块进行浅层和深层属性和内容的对比学习网络,优化特征表示,进一步提升图像融合网络的性能。最后,为了约束网络训练以保留源图像的固有特征,设计了一种基于对比约束的损失函数,以辅助融合过程对源图像信息的对比保留。将提出方法与前沿融合方法进行了定性和定量的分析比较。在TNO、MSRS、RoadSence数据集上的实验结果表明:本文方法的8项客观评价指标均较对比方法有显著提升。本文方法融合后图像具有丰富的细节纹理、显著的清晰度和对比度,有效提高了道路交通、安防监控等实际应用中的目标识别和环境感知能力。 展开更多
关键词 红外与可见光图像融合 对比学习 跨域交互注意力机制 对比约束损失
在线阅读 下载PDF
基于导波多特征交互融合的复材板损伤演化追踪
12
作者 刘小峰 周曾亮 柏林 《仪器仪表学报》 北大核心 2025年第4期102-113,共12页
针对复合材料层压板疲劳损伤量化评估困难与其演化不确定性问题,提出了基于多特征交互融合的复材板疲劳损伤演化追踪方法。通过构建Lamb波信号多域特征交互融合的损伤指数观测方程,结合应变能释放模型与粒子滤波算法实现了复材板损伤状... 针对复合材料层压板疲劳损伤量化评估困难与其演化不确定性问题,提出了基于多特征交互融合的复材板疲劳损伤演化追踪方法。通过构建Lamb波信号多域特征交互融合的损伤指数观测方程,结合应变能释放模型与粒子滤波算法实现了复材板损伤状态的追踪。通过提取Lamb波信号的时频域特征、动态时间规整特征和传递熵特征等多域特征,全面表征复合材料板疲劳损伤状态,并以此作为损伤状态观测量,建立了复材板的损伤状态空间模型。在研究多域特征与复材板损伤程度的线性相关性的基础上,创新性地引入多变量交互预测模型,对多域损伤特征进行交互融合,建立了Lamb波信号特征与复材板损伤评价指数之间的映射关系,形成了损伤指数观测方程。在复材板应变能释放率模型基础上,综合考虑损伤演化的不确定性因素,利用粒子滤波算法实现了对复材板裂纹密度与脱层大小等损伤状态的追踪。通过有限元仿真及T700G单向碳纤维预浸料制成的复材板疲劳试验数据的分析,验证了所提出方法在追踪和预测复材板损伤状态方面的有效性与准确性。本研究不仅揭示了损伤指数的演化规律,还为复材板损伤的实时监测和演化预测提供了新的技术途径。 展开更多
关键词 复材板 特征交互融合 应变能释放率模型 粒子滤波 寿命预测
在线阅读 下载PDF
坐标增强与多源采样的脑肿瘤图像分割
13
作者 蒋占军 李洋 +1 位作者 廉敬 苗新法 《计算机应用》 北大核心 2025年第3期996-1002,共7页
针对脑肿瘤图像分割模型对肿瘤区域关注度不够及易丢失空间上下文信息,导致对肿瘤区域分割效果不佳的问题,提出一种融合坐标增强学习机制(CEL)与多源采样的TransUNet脑肿瘤分割网络。首先,提出一种CEL,结合ResNetv2作为模型的浅层特征... 针对脑肿瘤图像分割模型对肿瘤区域关注度不够及易丢失空间上下文信息,导致对肿瘤区域分割效果不佳的问题,提出一种融合坐标增强学习机制(CEL)与多源采样的TransUNet脑肿瘤分割网络。首先,提出一种CEL,结合ResNetv2作为模型的浅层特征提取网络,增加对脑肿瘤区域的关注度;其次,设计深层混合采样特征提取器,并利用可变形注意力与自注意力机制对脑肿瘤的全局与局部信息进行多源采样;最后,在编码器与解码器之间设计交互层级融合(ILF)模块,从而在实现深层与浅层特征信息交互的同时减少参数的计算量。在BraTS2018和BraTS2019数据集上的实验结果表明:相较于基准TransUNet,所提模型的平均相似性系数(mDice)、平均交并比(mIoU)、平均精度均值(mAP)和平均召回率(mRecall)分别提高4.84、7.21、3.83和3.15个百分点,模型大小降低了16.9 MB。 展开更多
关键词 图像分割 多模态信息 坐标增强学习机制 混合采样 交互层级融合模块
在线阅读 下载PDF
基于特征交互的红外与可见光图像融合
14
作者 戴蓉 黄志勇 +2 位作者 王瑞 谢卫鑫 李建明 《激光与红外》 北大核心 2025年第9期1484-1491,共8页
红外和可见光图像融合旨在结合红外热辐射信息和可见光纹理,生成新图像。传统和深度学习方法通常将两种模态分开处理,限制了模态间的信息交互,难以有效区分互补与冗余信息,导致融合图像容易出现模糊、伪影和细节不清晰等问题。为了解决... 红外和可见光图像融合旨在结合红外热辐射信息和可见光纹理,生成新图像。传统和深度学习方法通常将两种模态分开处理,限制了模态间的信息交互,难以有效区分互补与冗余信息,导致融合图像容易出现模糊、伪影和细节不清晰等问题。为了解决此问题,本文设计了一个基于特征交互的融合网络模型,该模型利用特征交互模块FIM使模态间的特征信息能够进行交互。同时,为了使交互后的互补信息得到充分地利用,设计了交叉注意力融合模块CAFM。为验证所提方法性能,分别在3个数据集中与其他6种方法进行对比实验,实验结果表明,所提方法在视觉效果上纹理清晰,没有出现明显伪影,在定量评估中各指标排名都位于前列。 展开更多
关键词 图像融合 深度学习 特征交互 交叉注意力
在线阅读 下载PDF
多尺度特征增强与交互融合的遥感小目标检测
15
作者 李云红 魏小双 +5 位作者 苏雪平 李丽敏 田谷丰 郝特吉 冯准若 李仕博 《西北大学学报(自然科学版)》 北大核心 2025年第2期277-285,共9页
针对遥感图像小目标检测任务中,存在目标细节纹理信息模糊导致特征提取与融合不佳、小目标漏检等问题,提出了一种基于多尺度特征增强与交互融合的遥感小目标检测算法。首先,采用跨层多分支连接结构的多尺度特征增强(multiscale feature ... 针对遥感图像小目标检测任务中,存在目标细节纹理信息模糊导致特征提取与融合不佳、小目标漏检等问题,提出了一种基于多尺度特征增强与交互融合的遥感小目标检测算法。首先,采用跨层多分支连接结构的多尺度特征增强(multiscale feature enhancement,MFE)模块,利用Split分流操作丰富和增强不同梯度获取的纹理特征信息,同时引入轻量级特征幻影模块Ghost进行通道线性变换,生成更多有效的特征细节信息流,以增强对图像中局部细节特征信息的关注;其次,构建特征交互融合(feature interaction fusion,FIF)模块,引入多分支串并行的卷积块与自适应机制的池化块,交互输入特征的通道语义信息和空间特征变换,捕获全局上下文信息,精确小目标的关键位置信息,加强特征信息之间的相关性,实现细粒度特征的多维度交互融合。使用公开的光学遥感数据集DIOR验证所提算法,改进后的网络模型平均精度值为87.6%,与NPMMR-Det、YOLOv7、YOLOv5等其他7种优秀算法相比均有提高,改进后的遥感图像小目标检测算法取得了更好的检测精度。 展开更多
关键词 遥感图像小目标检测 多尺度特征增强 Split分流 自适应机制 细节特征交互融合
在线阅读 下载PDF
结合CNN-Transformer特征交互的红外与可见光图像融合方法
16
作者 张德银 张裕尧 +1 位作者 李俊佟 吴章辉 《红外技术》 北大核心 2025年第7期813-822,共10页
针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合... 针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合网络设计了新的空间通道混合注意力机制以提升全局及局部特征的提取效率并得到混合特征块;其次,利用CNN-Transformer的特征交互获取融合混合特征块,并构建多尺度重构网络以实现图像特征重构输出;最后,使用TNO数据集将新融合网络与其它9种融合网络进行对比图像融合实验。实验结果表明,新融合网络获得的融合图像在视觉感知方面表现优异,既突出了红外特征和物体轮廓,又保留了丰富的背景纹理细节;网络在EN、SD、AG、SF、SCD以及VIF指标上相较于现有融合网络平均提高约64.73%、8.17%、69.05%、66.34%、15.39%和25.66%。消融实验证明了新模型的有效性。 展开更多
关键词 CNN-Transformer特征交互 全局特征 混合注意力 图像融合 局部特征
在线阅读 下载PDF
基于多模态融合大模型架构Agri-QA Net的作物知识问答系统
17
作者 吴华瑞 赵春江 李静晨 《智慧农业(中英文)》 2025年第1期1-10,共10页
[目的/意义]随着农业信息化和智能化的快速发展,多模态人机交互技术在农业领域的重要性日益凸显。本研究提出了一种基于多模态融合的大模型架构Agri-QA Net,旨在针对甘蓝作物的农业知识,设计多模态专业问答系统。[方法]该模型通过整合... [目的/意义]随着农业信息化和智能化的快速发展,多模态人机交互技术在农业领域的重要性日益凸显。本研究提出了一种基于多模态融合的大模型架构Agri-QA Net,旨在针对甘蓝作物的农业知识,设计多模态专业问答系统。[方法]该模型通过整合文本、音频和图片数据,利用预训练的BERT(Bidirectional Encoder Representations from Transformers)模型提取文本特征,声学模型提取音频特征,以及卷积神经网络提取图像特征,并采用基于Transformer的融合层来整合这些特征。此外,引入跨模态注意力机制和领域自适应技术,增强了模型对农业领域专业知识的理解和应用能力。本研究通过收集和预处理甘蓝种植相关的多模态数据,训练并优化了AgriQA Net模型。[结果和讨论]实验评估表明,该模型在甘蓝农业知识问答任务上表现出色,相较于传统的单模态或简单多模态模型,具有更高的准确率和更好的泛化能力。在多模态输入的支持下,其准确率达到了89.5%,精确率为87.9%,召回率为91.3%,F_(1)值为89.6%,均显著高于单一模态模型。[结论]案例研究展示了Agri-QA Net在实际农业场景中的应用效果,证明了其在帮助农民解决实际问题中的有效性。未来的工作将探索模型在更多农业场景中的应用,并进一步优化模型性能。 展开更多
关键词 多模态融合 人机交互 农业知识问答 甘蓝作物 大语言模型
在线阅读 下载PDF
基于改进时间融合Transformers的中国大豆需求预测方法
18
作者 刘佳佳 秦晓婧 +5 位作者 李乾川 许世卫 赵继春 王一罡 熊露 梁晓贺 《智慧农业(中英文)》 2025年第4期187-199,共13页
[目的/意义]精准预测大豆需求对保障国家粮食安全、优化产业决策与应对国际贸易变局有着重要的现实意义,而利用时间融合Transformers(Temporal Fusion Transformers,TFT)模型开展中国大豆需求预测时,在特征交互层与注意力权重分配等方... [目的/意义]精准预测大豆需求对保障国家粮食安全、优化产业决策与应对国际贸易变局有着重要的现实意义,而利用时间融合Transformers(Temporal Fusion Transformers,TFT)模型开展中国大豆需求预测时,在特征交互层与注意力权重分配等方面仍存在一定局限。为此,亟需探索一种基于改进TFT模型的预测方法,以提升需求预测的准确性与可解释性。[方法]本研究将深度学习的TFT模型应用到中国大豆需求预测中,提出了一种基于多层动态特征交互(Multi-layer Dynamic Feature Interaction,MDFI)与自适应注意力权重优化(Adaptive Attention Weight Optimization,AAWO)改进的MA-TFT(Improved TFT Model Based on MDFI and AAWO)模型。对包含1980—2024年4652个相关指标的中国大豆需求分析数据集进行数据预处理和特征工程,设计实验将MA-TFT模型分别与自回归差分移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)、长短期记忆网络(Long Short-Term Memory,LSTM)模型及TFT模型进行预测性能对比,进行了消融实验,同时利用SHAP(SHapley Additive exPlanations)工具可解释性分析影响中国大豆需求的关键特征变量,开展了未来10年的中国大豆需求量预测。[结果和讨论]MA-TFT模型的均方误差(Mean Squared Error,MSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)分别为0.036和5.89%,决定系数R^(2)为0.91,均高于对比模型,均方根误差(Root Mean Square Error,RMSE)和MAPE分别较基准模型TFT累计降低21.84%和3.44%,表明改进TFT的MA-TFT模型能够捕捉特征间复杂关系,提升预测性能;研究利用SHAP工具可解释性分析发现,MA-TFT模型对影响中国大豆需求关键特征变量的解释稳定性较高;预计2025、2030和2034年中国大豆需求量分别达到11799万吨、11033万吨和11378万吨。[结论]基于改进TFT的MA-TFT模型方法为解决现有大豆需求预测方法精度不足、可解释性不强的实际问题提供了解决思路,也为其他农产品时间序列预测的方法优化与应用提供了参考和借鉴。 展开更多
关键词 时间融合Transformers(TFT) 大豆需求预测 多层动态特征交互 自适应注意力权重优化 可解释性分析
在线阅读 下载PDF
基于孪生网络的特征融合位移RGB-T目标跟踪
19
作者 李海燕 曹永辉 +1 位作者 郎恂 李海江 《湖南大学学报(自然科学版)》 北大核心 2025年第4期68-78,共11页
为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多... 为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多模态目标跟踪框架,设计了改进步长的ResNet50作为特征提取网络,有效挖掘目标的深层次特征.随后,设计特征交互学习模块,利用一种模态的判别信息引导另一种模态的目标外观特征学习,挖掘特征空间和通道中的跨模态信息,增强网络对前景信息的关注.然后,设计多模特征融合模块计算输入的可见光图像和红外图像的特征融合度,对不同模态的重要特征进行空间融合以去除冗余信息,并采用级联融合策略重建多模态图像,增强目标特征表示.最后,设计特征空间位移模块,分割红外模态分支的特征图并向四个不同方向移位,增强热源目标特征的边缘表示.在两个RGB-T数据集上的实验验证了提出算法的有效性,消融实验证明了设计的单个模块的优越性. 展开更多
关键词 RGB-T跟踪 多模特征融合模块 特征空间位移模块 特征交互学习模块
在线阅读 下载PDF
面向煤矿井下场景的安全帽佩戴检测算法
20
作者 苗作华 李苗苗 +3 位作者 徐厚友 王梦婷 严蔚涵 陈勇 《安全与环境学报》 北大核心 2025年第5期1743-1751,共9页
煤矿井下弥漫着粉尘和雾气且多数区域为狭长巷道,仅依赖矿灯照明会导致视频监控图像出现细节模糊、局部过曝及目标尺寸多变等问题。这些因素增加了井下安全帽目标检测的难度,现有目标检测算法直接应用于煤矿井下场景时,通常面临精度不... 煤矿井下弥漫着粉尘和雾气且多数区域为狭长巷道,仅依赖矿灯照明会导致视频监控图像出现细节模糊、局部过曝及目标尺寸多变等问题。这些因素增加了井下安全帽目标检测的难度,现有目标检测算法直接应用于煤矿井下场景时,通常面临精度不足的挑战。针对这些问题,研究提出一种基于YOLOv8n(You Only Look Once version 8n)的煤矿井下安全帽检测算法。首先,采用空间到深度机制将YOLOv8n主干网络中的Conv模块重新构建为空间到深度卷积(Space-to-Depth Convolutional,SPDConv)模块,以便从特征图中充分提取浅层细节信息,提高模型对细节模糊图像中小目标安全帽的检测精度;其次,引入基于注意力机制的尺度内特征交互模块,减少局部过曝对安全帽特征提取的干扰,增强模型对目标区域的关注能力;最后,借鉴高层次筛选特征融合金字塔对YOLOv8n的颈部网络进行重设计,改善模型对不同尺寸安全帽的检测能力,进一步提升检测精度。试验结果显示,该算法在CUMT-Helme T数据集上的平均精度均值达91.7%,相较于YOLOv8n提升了3.2百分点,同时模型参数量减少了1.9×10^(5)。与单次多边框检测(Single Shot MultiBox Detector,SSD)、快速区域卷积神经网络(Region-based Convolutional Neural Networks,Faster RCNN)、YOLOv5s、YOLOv6n、YOLOv7及YOLOv7-tiny等当前主流目标检测算法相比,该算法的平均精度均值最高,且参数量和浮点运算量较低,在实现较高检测精度的同时还具备一定的轻量化特性。 展开更多
关键词 安全工程 煤矿井下 安全帽检测 YOLOv8n 空间到深度机制 尺度内特征交互 多尺度特征融合
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部