期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多级空洞金字塔网络的视频指令学习框架
1
作者 朱展模 陈俊洪 +1 位作者 杨振国 刘文印 《计算机应用与软件》 北大核心 2024年第5期118-125,146,共9页
为了从未修剪视频中生成操作指令,提出基于多级空洞金字塔网络(MS-APN)的视频指令学习框架。具体来说,使用空洞卷积金字塔模块捕捉视频多尺度动作特征,并采用多级网络结构优化分割结果,将未修剪视频分割成一系列视频片段并抽取动作特征... 为了从未修剪视频中生成操作指令,提出基于多级空洞金字塔网络(MS-APN)的视频指令学习框架。具体来说,使用空洞卷积金字塔模块捕捉视频多尺度动作特征,并采用多级网络结构优化分割结果,将未修剪视频分割成一系列视频片段并抽取动作特征。运用目标检测模型提取物体特征,并将其与动作特征进行融合,输入分类器识别主体和受体物体。通过定义指令四元组生成机器人指令。在MPII Cooking 2数据集上进行了实验,视频动作分割、操作物体分类、操作指令生成的准确率分别达到了84.1%、76.5%和62.4%,并成功将系统部署到Baxter机器人上进行验证。 展开更多
关键词 视频指令学习 机器人指令生成 动作分割 空洞卷积
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部