期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于图文关联与上下文引导的军事新闻图集描述生成方法
1
作者 梅运红 刘茂福 《计算机工程与科学》 CSCD 北大核心 2024年第9期1625-1634,共10页
传统的图像描述生成方法由于缺少现实世界的先验知识,生成的描述文本不具有解释性,同时在某些专业领域生成的描述文本准确性不高。针对上述问题,提出了军事新闻图集描述生成任务,还构建了军事新闻图集数据集。该任务存在2个关键挑战:描... 传统的图像描述生成方法由于缺少现实世界的先验知识,生成的描述文本不具有解释性,同时在某些专业领域生成的描述文本准确性不高。针对上述问题,提出了军事新闻图集描述生成任务,还构建了军事新闻图集数据集。该任务存在2个关键挑战:描述信息来源于整个图集和对应的新闻文本中,模型学习到的语义不够充分。进一步提出了一种基于图文关联与上下文引导的军事新闻图集描述生成方法ITRCG。基于ITRCG实现跨模态信息交互,引导模型学习更完整的语义,并通过标签清理辅助命名实体生成。在构建的军事新闻图集数据集上进行了验证实验,结果表明ITRCG能够有效提高描述文本的质量,在各项评价指标上均取得了提升。 展开更多
关键词 图像描述 图文关联注意力 上下文引导注意力 图集 新闻文本
在线阅读 下载PDF
语义增强和自适应多尺度特征融合的人体姿态估计
2
作者 张家波 何阿娟 唐上松 《计算机工程与应用》 2025年第23期212-223,共12页
由于关键点尺度较小且位置敏感,如何有效提取空间和语义信息一直是姿态估计任务的主要挑战。为此,提出了一种语义增强和自适应多尺度特征融合的人体姿态估计模型(SAMFFNet)。SAMFFNet以轻量级的Mobile-NetV2作为骨干网络构建特征金字塔... 由于关键点尺度较小且位置敏感,如何有效提取空间和语义信息一直是姿态估计任务的主要挑战。为此,提出了一种语义增强和自适应多尺度特征融合的人体姿态估计模型(SAMFFNet)。SAMFFNet以轻量级的Mobile-NetV2作为骨干网络构建特征金字塔,利用EfficientViT生成尺度感知的全局语义,在设计的深层语义注入模块中,利用上下文引导的注意力将全局语义与局部特征融合,增强关键点的语义表示。提出了自适应多尺度特征融合模块,该模块通过集成大型选择卷积核模块(LSK)和跨层交互机制,能根据输入特征动态地调节较大的空间感受野,并增强不同尺度特征之间的信息交互。实验结果表明,在COCO验证集上,SAMFFNet与使用的骨干网络相比,精度指标提升了6.1个百分点,达到70.7%,虽然比大模型SimpleBaseline的精度略低,但参数量减少了85.0%,计算量降低了78.3%。同样在MPII数据集上,与骨干网络相比也实现了2.3个百分点的精度提升。综合COCO与MPII数据集上的表现,充分证实了SAMFFNet在强化人体结构特征与特征融合策略上的有效性。 展开更多
关键词 人体姿态估计 语义增强 上下文引导注意力(CGA) 自适应特征融合 特征金字塔(FPN)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部