检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于Transformer网络多模态融合的密集视频描述方法被引量：2: 1; 作者李想桑海峰《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1061-1071,共11页; 针对目前的密集视频描述模型大多使用两阶段的方法存在效率较低、忽略音频及语义信息,描述结果不全面的问题。提出了一种基于Transformer网络多模态和语义信息融合的密集视频描述方法。提取自适应R(2+1)D网络提取视觉特征,设计了语义探... 展开更多; 关键词密集事件描述 Transformer网络语义信息多模态融合可变形注意力; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于Transformer网络多模态融合的密集视频描述方法	李想桑海峰	《系统仿真学报》 CAS CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析