期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于尺度自适应局部时空特征的足球比赛视频中的多运动员行为表示
1
作者
王智文
蒋联源
+4 位作者
王宇航
王日凤
张灿龙
黄镇谨
王鹏涛
《计算机应用》
CSCD
北大核心
2016年第8期2134-2138,共5页
为提高足球比赛视频中的多运动员行为识别的准确率,提出一种基于尺度自适应局部时空特征的足球比赛视频中的多运动员行为表示方法,利用时空兴趣点来表示足球比赛视频中的多运动员行为。首先将足球比赛视频序列中的多运动员行为看作是三...
为提高足球比赛视频中的多运动员行为识别的准确率,提出一种基于尺度自适应局部时空特征的足球比赛视频中的多运动员行为表示方法,利用时空兴趣点来表示足球比赛视频中的多运动员行为。首先将足球比赛视频序列中的多运动员行为看作是三维空间中的时空兴趣点的集合,然后采用直方图量化技术将时空兴趣点集合量化为维数固定的直方图(即时空单词),最后采用K-means聚类算法生成时空码本。在聚类生成码本之前,对每个时空兴趣点都进行了归一化,以保证其缩放和平移不变性。实验结果表明,该方法能够大大减少足球比赛视频中的多运动员行为识别算法的计算量,显著提高识别的准确率。
展开更多
关键词
时空兴趣点
多
运动
员行为
表示
行为识别
K-MEANS聚类算法
时空特征检测操作数
在线阅读
下载PDF
职称材料
基于视觉的人的运动识别综述
被引量:
79
2
作者
杜友田
陈峰
+1 位作者
徐文立
李永彬
《电子学报》
EI
CAS
CSCD
北大核心
2007年第1期84-90,共7页
目前,基于视觉的人的运动分析是一个非常活跃的研究领域,而对人的运动进行理解和识别更是该领域内一个富有挑战性的研究方向,它在智能监控、感知接口和基于内容的视频检索等领域具有广泛的应用前景.本文对人的运动识别领域近年来的发展...
目前,基于视觉的人的运动分析是一个非常活跃的研究领域,而对人的运动进行理解和识别更是该领域内一个富有挑战性的研究方向,它在智能监控、感知接口和基于内容的视频检索等领域具有广泛的应用前景.本文对人的运动识别领域近年来的发展作了比较详细的论述,从人运动的类别、运动表示方法和运动识别方法三个方面分析了该方向的进展情况,并对当前该研究方向上亟待解决的问题做了比较详细的分析.
展开更多
关键词
计算机视觉
智能监控
运动表示
运动
识别
在线阅读
下载PDF
职称材料
基于CLIP的多模态融合视频描述生成
3
作者
王亮
夏舟勇
+1 位作者
胡营营
王军
《计算机工程与设计》
北大核心
2025年第2期384-391,共8页
为解决视频描述任务中2D的CLIP预训练模型缺乏时序关系与动作检测敏感性以及信息冗余问题,提出一种基于CLIP的结合注意力掩码与运动表示增强的多模态融合视频描述模型。采用可学习令牌整理冻结的CLIP特征、运动特征与音频特征中的关键信...
为解决视频描述任务中2D的CLIP预训练模型缺乏时序关系与动作检测敏感性以及信息冗余问题,提出一种基于CLIP的结合注意力掩码与运动表示增强的多模态融合视频描述模型。采用可学习令牌整理冻结的CLIP特征、运动特征与音频特征中的关键信息,优化多模态融合;引入关键词检测任务,提高关键信息提取能力;采用基于相关度的多头注意力掩码机制解决冗余问题;利用CLIP特征的向量差变换增强运动表示。实验结果表明,该模型性能优于现有视频描述生成方法,CIDEr指标在MSR-VTT数据集上提升了2.33%,在VATEX数据集上提升了3.12%。
展开更多
关键词
预训练模型
视频描述
多模态
特征融合
运动表示
注意力掩码
关键词检测
在线阅读
下载PDF
职称材料
机构自动化概念设计模型的研究
被引量:
2
4
作者
任工昌
黄勋
李耀宗
《陕西科技大学学报(自然科学版)》
2003年第3期90-92,100,共4页
设计模型的建立是机构概念设计的关键。作者在本文中提出了运动状态向量表示法 ,它将复杂运动方案的设计简化为运动功能匹配和约束检查的求解过程 ,由此建立起计算机能够识别的机械运动方案设计模式 。
关键词
机构概念设计
设计模型
运动
状态向量
表示
法
CAD
机械
运动
方案
在线阅读
下载PDF
职称材料
题名
基于尺度自适应局部时空特征的足球比赛视频中的多运动员行为表示
1
作者
王智文
蒋联源
王宇航
王日凤
张灿龙
黄镇谨
王鹏涛
机构
广西科技大学计算机科学与通信工程学院
桂林电子科技大学广西信息科学实验中心
桂林航天工业学院汽车与交通工程学院
广西师范大学计算机科学与信息工程学院
广西科技大学电气与信息工程学院
出处
《计算机应用》
CSCD
北大核心
2016年第8期2134-2138,共5页
基金
国家自然科学基金资助项目(61462008
61440017
+5 种基金
61365009)
广西自然科学基金项目(2013GXNSFAA019336
2014GXNSFAA118368)
广西信息科学实验中心开放基金项目(KF1403)
广西科技大学博士基金项目(院科博12Z14)
2015年广西科技大学创新团队项目~~
文摘
为提高足球比赛视频中的多运动员行为识别的准确率,提出一种基于尺度自适应局部时空特征的足球比赛视频中的多运动员行为表示方法,利用时空兴趣点来表示足球比赛视频中的多运动员行为。首先将足球比赛视频序列中的多运动员行为看作是三维空间中的时空兴趣点的集合,然后采用直方图量化技术将时空兴趣点集合量化为维数固定的直方图(即时空单词),最后采用K-means聚类算法生成时空码本。在聚类生成码本之前,对每个时空兴趣点都进行了归一化,以保证其缩放和平移不变性。实验结果表明,该方法能够大大减少足球比赛视频中的多运动员行为识别算法的计算量,显著提高识别的准确率。
关键词
时空兴趣点
多
运动
员行为
表示
行为识别
K-MEANS聚类算法
时空特征检测操作数
Keywords
spatial-temporal interest point
multi-athletes behavior representation
behavior recognition
K-means clustering algorithm
spatial-temporal feature detection operand
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于视觉的人的运动识别综述
被引量:
79
2
作者
杜友田
陈峰
徐文立
李永彬
机构
清华大学自动化系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2007年第1期84-90,共7页
基金
国家自然科学基金重点项目(No.60432030)
文摘
目前,基于视觉的人的运动分析是一个非常活跃的研究领域,而对人的运动进行理解和识别更是该领域内一个富有挑战性的研究方向,它在智能监控、感知接口和基于内容的视频检索等领域具有广泛的应用前景.本文对人的运动识别领域近年来的发展作了比较详细的论述,从人运动的类别、运动表示方法和运动识别方法三个方面分析了该方向的进展情况,并对当前该研究方向上亟待解决的问题做了比较详细的分析.
关键词
计算机视觉
智能监控
运动表示
运动
识别
Keywords
computer vision
intelligent surveillance
motion representation
motion recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于CLIP的多模态融合视频描述生成
3
作者
王亮
夏舟勇
胡营营
王军
机构
沈阳化工大学计算机科学与技术学院
沈阳化工大学辽宁省化工过程工业智能化技术重点实验室
出处
《计算机工程与设计》
北大核心
2025年第2期384-391,共8页
基金
国家外国专家项目计划基金项目(G2022006008L)
中国高校产学研创新基金项目(2021LD06009)
+3 种基金
辽宁省自然科学基金项目(2022-MS-291)
辽宁省教育厅科研基金项目(LJ2020024)
辽宁省教育厅基本科研基金项目(LJKMZ20220781)
辽宁省教育厅基本科研面上基金项目(JYTMS20231488)。
文摘
为解决视频描述任务中2D的CLIP预训练模型缺乏时序关系与动作检测敏感性以及信息冗余问题,提出一种基于CLIP的结合注意力掩码与运动表示增强的多模态融合视频描述模型。采用可学习令牌整理冻结的CLIP特征、运动特征与音频特征中的关键信息,优化多模态融合;引入关键词检测任务,提高关键信息提取能力;采用基于相关度的多头注意力掩码机制解决冗余问题;利用CLIP特征的向量差变换增强运动表示。实验结果表明,该模型性能优于现有视频描述生成方法,CIDEr指标在MSR-VTT数据集上提升了2.33%,在VATEX数据集上提升了3.12%。
关键词
预训练模型
视频描述
多模态
特征融合
运动表示
注意力掩码
关键词检测
Keywords
pre-training model
video caption
multimodal
feature fusion
motion representation
attention mask
keyword detection
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
机构自动化概念设计模型的研究
被引量:
2
4
作者
任工昌
黄勋
李耀宗
机构
陕西科技大学机电工程学院
咸阳师范学院物理系
出处
《陕西科技大学学报(自然科学版)》
2003年第3期90-92,100,共4页
文摘
设计模型的建立是机构概念设计的关键。作者在本文中提出了运动状态向量表示法 ,它将复杂运动方案的设计简化为运动功能匹配和约束检查的求解过程 ,由此建立起计算机能够识别的机械运动方案设计模式 。
关键词
机构概念设计
设计模型
运动
状态向量
表示
法
CAD
机械
运动
方案
Keywords
conceptual design
motion state vector
mechanism module
分类号
TH122 [机械工程—机械设计及理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于尺度自适应局部时空特征的足球比赛视频中的多运动员行为表示
王智文
蒋联源
王宇航
王日凤
张灿龙
黄镇谨
王鹏涛
《计算机应用》
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
2
基于视觉的人的运动识别综述
杜友田
陈峰
徐文立
李永彬
《电子学报》
EI
CAS
CSCD
北大核心
2007
79
在线阅读
下载PDF
职称材料
3
基于CLIP的多模态融合视频描述生成
王亮
夏舟勇
胡营营
王军
《计算机工程与设计》
北大核心
2025
0
在线阅读
下载PDF
职称材料
4
机构自动化概念设计模型的研究
任工昌
黄勋
李耀宗
《陕西科技大学学报(自然科学版)》
2003
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部