期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于S-YOLO V5和Vision Transformer的视频内容描述算法 被引量:1
1
作者 徐鹏 李铁柱 职保平 《印刷与数字媒体技术研究》 CAS 北大核心 2023年第4期212-222,共11页
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于... 视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于神经网络模型KATNA提取关键帧,以最少帧数进行模型训练;其次,利用S-YOLO V5模型提取视频帧中的语义信息,并结合预训练ResNet101模型和预训练C3D模型提取视频静态视觉特征和动态视觉特征,并对两种模态特征进行融合;然后,基于ViT结构的强大长距离编码能力,构建模型编码器对融合特征进行长距离依赖编码;最后,将编码器的输出作为LSTM解码器的输入,依次输出预测词,生成最终的自然语言描述。通过在MSR-VTT数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为42.9、28.8、62.4和51.4;在MSVD数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为56.8、37.6、74.5以及98.5。与当前主流模型相比,本研究模型在多项评价指标上表现优异。 展开更多
关键词 视频内容描述 S-YOLO V5 Vision Transformer 多头注意力
在线阅读 下载PDF
模拟IC设计中性能参数的几何规划法建模
2
作者 徐鹏 李铁柱 职保平 《核电子学与探测技术》 CAS 北大核心 2023年第3期444-451,共8页
探讨了基于几何规划法的模拟集成电路优化设计中性能参数的建模方法。该方法利用间接拟合法计算电路性能的一组样本,对采样得到的性能数据拟合为一个二阶多项式模板模型并进行近似处理,使其成为正项式模型;然后利用直接拟合法,采用一种... 探讨了基于几何规划法的模拟集成电路优化设计中性能参数的建模方法。该方法利用间接拟合法计算电路性能的一组样本,对采样得到的性能数据拟合为一个二阶多项式模板模型并进行近似处理,使其成为正项式模型;然后利用直接拟合法,采用一种约束最小化算法将正项式拟合问题构建为一个单目标凸优化问题来拟合所需的正项式模型;实验结果表明,该建模方法不仅在模型生成时间、系数个数和稀疏性方面具有较好的性能,而且在生成模型质量方面也优于常用的多项式建模技术。 展开更多
关键词 核电子技术 模拟集成电路 性能建模 几何规划法 拟合 正项式 模型生成 偏差
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部