期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于时序感知潜在扩散模型的人体交互动作生成
1
作者
石旭
孙运莲
+1 位作者
骆岩林
张鸿文
《计算机学报》
北大核心
2025年第9期2226-2240,共15页
近年来,人体动作生成在计算机视觉和计算机图形学领域受到了广泛关注。随着需求的增加,人体交互动作生成逐渐成为一个新的研究热点。然而,相较于单人动作生成,人体交互动作生成尚处于起步阶段,尤其是在生成复杂的交互动作方面。虽然基...
近年来,人体动作生成在计算机视觉和计算机图形学领域受到了广泛关注。随着需求的增加,人体交互动作生成逐渐成为一个新的研究热点。然而,相较于单人动作生成,人体交互动作生成尚处于起步阶段,尤其是在生成复杂的交互动作方面。虽然基于文本条件的人体交互动作生成方法在生成符合文本描述的高质量人体交互动作方面已取得一定进展,但现有方法大多在原始动作序列上进行生成模型的学习,导致生成速度较慢。此外,它们普遍沿用对比语言-图像预训练(Contrastive Language-Image Pretraining,CLIP)模型的文本编码器作为动作生成模型的语言指导,这导致动作生成模型缺乏对动作的时序感知,影响了生成动作的质量。为了解决这些问题,针对人体交互动作生成,本文提出一种人体交互动作潜在扩散模型(Human interaction Latent Diffusion Model,HiLDM)。该扩散模型通过在学习到的人体交互动作序列潜在空间中进行去噪,大幅提升生成速度。同时,采用人体交互时序感知文本编码器(Temporal-aware Text Encoder,TTE)作为语言指导,使生成动作更具时序一致性。实验结果表明,在InterHuman数据集上的评估中,所提方法在生成速度和生成质量方面优于现有人体交互动作生成方法,生成速度比ComMDM快57倍,比InterGen快4倍;FID指标比ComMDM改善了36.7%,比InterGen改善了1.7%。
展开更多
关键词
潜在扩散模型
人体
动作生成
人体交互
动作生成
人工智能
生成
内容
在线阅读
下载PDF
职称材料
指令驱动的虚拟角色风格化动作生成
2
作者
梁玮
黄一帆
+1 位作者
沈雨欣
程杞元
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2024年第11期1199-1207,共9页
复杂场景下,指令驱动的动作生成任务存在着指令理解不准确、生成的动作与指令任务不相关等挑战.为了解决这个问题,提出了一种方法框架,通过结合指令和场景信息,风格化生成虚拟角色的动作.该方法框架分为指令解析和动作生成两个部分.方...
复杂场景下,指令驱动的动作生成任务存在着指令理解不准确、生成的动作与指令任务不相关等挑战.为了解决这个问题,提出了一种方法框架,通过结合指令和场景信息,风格化生成虚拟角色的动作.该方法框架分为指令解析和动作生成两个部分.方法首先预定义了一组有限的原子动作集合,在指令解析部分运用大模型,将文本指令解析成由原子动作组成的子任务,在动作生成部分,基于条件变分自编码器(conditional variational autoencoder,cVAE)设计了一个逐帧动作生成网络.在动作生成阶段,考虑不同的风格特征,例如角色的高矮胖瘦等属性和文本指令描述的开心、难过等特征,实现风格化动作生成任务.在卧室、公园、客厅和厨房等4个场景中进行了定性实验和用户研究,证明了方法的有效性、动作的真实性和风格的多样性.
展开更多
关键词
动作生成
指令驱动
风格化
动画
在线阅读
下载PDF
职称材料
基于动态频域分解的乐队指挥动作生成
3
作者
贺鑫
刘凡
+1 位作者
陈德龙
周睿志
《计算机应用研究》
CSCD
北大核心
2024年第3期923-927,955,共6页
近年来,音乐与人体动作之间的内在关联一直以来都在被广泛研究。然而,很少有人关注音乐驱动的乐队指挥动作生成这一任务,即以音乐为输入信号,生成与音乐节奏和语义相协调的乐队指挥动作。聚焦于这一任务,针对指挥动作多种语义成分时空...
近年来,音乐与人体动作之间的内在关联一直以来都在被广泛研究。然而,很少有人关注音乐驱动的乐队指挥动作生成这一任务,即以音乐为输入信号,生成与音乐节奏和语义相协调的乐队指挥动作。聚焦于这一任务,针对指挥动作多种语义成分时空重合的特性,提出基于动作动态频域分解(dynamic frequency-domain motion decomposition,DFMD)的指挥动作生成方法。具体地,首先利用节拍信息构建滤波器,将指挥动作分解成高频和低频分量;接着,通过深度卷积神经网络动态地学习这些分量;最后合成最终的指挥动作。在大规模指挥动作数据集ConductorMotion100上进行的实验中,基于DFMD的指挥动作生成方法得到的低频动作分量和高频动作分量的标准差分别达到了4.4579和9.6466,与真实动作十分接近。该方法突破了现有基于时域或空间域动作分解中连贯性与协调性不可兼得的局限,并有效避免了大幅值低频动作对小幅值高频动作的影响。可视化结果证明生成的动作自然、美观、多样,且与音乐信号紧密同步。为音乐与动作之间的关联提供了新的解释,并为音乐表演领域带来了创新的应用前景。
展开更多
关键词
跨模态
生成
人体
动作生成
频域分解
动作
分解
音乐驱动
生成
在线阅读
下载PDF
职称材料
虚拟手自然抓取动作生成研究
被引量:
7
4
作者
王晓媛
田浩
王长波
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2020年第9期1502-1508,共7页
在虚拟抓取规划中,生成稳定的抓取姿态非常重要,但是只考虑稳定性往往会导致抓取姿态不符合自然的人手抓取习惯.为了生成既满足物理约束又符合人手抓取习惯的自然抓取姿态,提出一种基于抓取分类理论的虚拟手自然抓取规划算法.首先根据...
在虚拟抓取规划中,生成稳定的抓取姿态非常重要,但是只考虑稳定性往往会导致抓取姿态不符合自然的人手抓取习惯.为了生成既满足物理约束又符合人手抓取习惯的自然抓取姿态,提出一种基于抓取分类理论的虚拟手自然抓取规划算法.首先根据人类抓取分类理论,基于人类行为构建物体形状与人手抓取姿态之间的映射关系,然后在动作规划中加入人手抓取姿态的引导,最终在虚拟手的位姿空间中找到一组自然的抓取姿态.对于复杂的多部件物体,先将其分割成可抓的部件,再对可抓部件进行自然抓取动作的生成.实验中展示了以人类抓取分类理论中的5种人手抓取姿态为指导,对常见的三维物体生成自然抓取姿态的结果,经用户评估,所提算法生成的抓取动作相比其他算法更符合人手抓取习惯.
展开更多
关键词
抓取分类理论
虚拟手
自然抓取
动作生成
在线阅读
下载PDF
职称材料
题名
基于时序感知潜在扩散模型的人体交互动作生成
1
作者
石旭
孙运莲
骆岩林
张鸿文
机构
南京理工大学计算机科学与工程学院
北京师范大学人工智能学院
出处
《计算机学报》
北大核心
2025年第9期2226-2240,共15页
基金
国家自然科学基金面上项目(62476131,62076131,62377004)
中央高校基本科研业务费项目(2233100028)资助。
文摘
近年来,人体动作生成在计算机视觉和计算机图形学领域受到了广泛关注。随着需求的增加,人体交互动作生成逐渐成为一个新的研究热点。然而,相较于单人动作生成,人体交互动作生成尚处于起步阶段,尤其是在生成复杂的交互动作方面。虽然基于文本条件的人体交互动作生成方法在生成符合文本描述的高质量人体交互动作方面已取得一定进展,但现有方法大多在原始动作序列上进行生成模型的学习,导致生成速度较慢。此外,它们普遍沿用对比语言-图像预训练(Contrastive Language-Image Pretraining,CLIP)模型的文本编码器作为动作生成模型的语言指导,这导致动作生成模型缺乏对动作的时序感知,影响了生成动作的质量。为了解决这些问题,针对人体交互动作生成,本文提出一种人体交互动作潜在扩散模型(Human interaction Latent Diffusion Model,HiLDM)。该扩散模型通过在学习到的人体交互动作序列潜在空间中进行去噪,大幅提升生成速度。同时,采用人体交互时序感知文本编码器(Temporal-aware Text Encoder,TTE)作为语言指导,使生成动作更具时序一致性。实验结果表明,在InterHuman数据集上的评估中,所提方法在生成速度和生成质量方面优于现有人体交互动作生成方法,生成速度比ComMDM快57倍,比InterGen快4倍;FID指标比ComMDM改善了36.7%,比InterGen改善了1.7%。
关键词
潜在扩散模型
人体
动作生成
人体交互
动作生成
人工智能
生成
内容
Keywords
latent diffusion model
human motion generation
human interaction generation
AIGC
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
指令驱动的虚拟角色风格化动作生成
2
作者
梁玮
黄一帆
沈雨欣
程杞元
机构
北京理工大学计算机学院
深圳北理莫斯科大学
广东省智能感知与计算重点实验室
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2024年第11期1199-1207,共9页
基金
国家自然科学基金资助项目(62172043)。
文摘
复杂场景下,指令驱动的动作生成任务存在着指令理解不准确、生成的动作与指令任务不相关等挑战.为了解决这个问题,提出了一种方法框架,通过结合指令和场景信息,风格化生成虚拟角色的动作.该方法框架分为指令解析和动作生成两个部分.方法首先预定义了一组有限的原子动作集合,在指令解析部分运用大模型,将文本指令解析成由原子动作组成的子任务,在动作生成部分,基于条件变分自编码器(conditional variational autoencoder,cVAE)设计了一个逐帧动作生成网络.在动作生成阶段,考虑不同的风格特征,例如角色的高矮胖瘦等属性和文本指令描述的开心、难过等特征,实现风格化动作生成任务.在卧室、公园、客厅和厨房等4个场景中进行了定性实验和用户研究,证明了方法的有效性、动作的真实性和风格的多样性.
关键词
动作生成
指令驱动
风格化
动画
Keywords
motion generation
instruction-driven
style
animation
分类号
TP37 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于动态频域分解的乐队指挥动作生成
3
作者
贺鑫
刘凡
陈德龙
周睿志
机构
河海大学计算机与信息学院
出处
《计算机应用研究》
CSCD
北大核心
2024年第3期923-927,955,共6页
基金
国家自然科学基金资助项目(62372155)
装备预研教育部联合基金资助项目
江苏高校“青蓝工程”资助项目。
文摘
近年来,音乐与人体动作之间的内在关联一直以来都在被广泛研究。然而,很少有人关注音乐驱动的乐队指挥动作生成这一任务,即以音乐为输入信号,生成与音乐节奏和语义相协调的乐队指挥动作。聚焦于这一任务,针对指挥动作多种语义成分时空重合的特性,提出基于动作动态频域分解(dynamic frequency-domain motion decomposition,DFMD)的指挥动作生成方法。具体地,首先利用节拍信息构建滤波器,将指挥动作分解成高频和低频分量;接着,通过深度卷积神经网络动态地学习这些分量;最后合成最终的指挥动作。在大规模指挥动作数据集ConductorMotion100上进行的实验中,基于DFMD的指挥动作生成方法得到的低频动作分量和高频动作分量的标准差分别达到了4.4579和9.6466,与真实动作十分接近。该方法突破了现有基于时域或空间域动作分解中连贯性与协调性不可兼得的局限,并有效避免了大幅值低频动作对小幅值高频动作的影响。可视化结果证明生成的动作自然、美观、多样,且与音乐信号紧密同步。为音乐与动作之间的关联提供了新的解释,并为音乐表演领域带来了创新的应用前景。
关键词
跨模态
生成
人体
动作生成
频域分解
动作
分解
音乐驱动
生成
Keywords
cross-model generation
human motion generation
frequency domain decomposition
motion decomposition
music-driven generation
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
虚拟手自然抓取动作生成研究
被引量:
7
4
作者
王晓媛
田浩
王长波
机构
华东师范大学计算机科学与技术学院
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2020年第9期1502-1508,共7页
基金
国家自然科学基金(61672237,61532002).
文摘
在虚拟抓取规划中,生成稳定的抓取姿态非常重要,但是只考虑稳定性往往会导致抓取姿态不符合自然的人手抓取习惯.为了生成既满足物理约束又符合人手抓取习惯的自然抓取姿态,提出一种基于抓取分类理论的虚拟手自然抓取规划算法.首先根据人类抓取分类理论,基于人类行为构建物体形状与人手抓取姿态之间的映射关系,然后在动作规划中加入人手抓取姿态的引导,最终在虚拟手的位姿空间中找到一组自然的抓取姿态.对于复杂的多部件物体,先将其分割成可抓的部件,再对可抓部件进行自然抓取动作的生成.实验中展示了以人类抓取分类理论中的5种人手抓取姿态为指导,对常见的三维物体生成自然抓取姿态的结果,经用户评估,所提算法生成的抓取动作相比其他算法更符合人手抓取习惯.
关键词
抓取分类理论
虚拟手
自然抓取
动作生成
Keywords
the GRASP taxonomy
virtual hand
natural grasps
grasp generation
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于时序感知潜在扩散模型的人体交互动作生成
石旭
孙运莲
骆岩林
张鸿文
《计算机学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
指令驱动的虚拟角色风格化动作生成
梁玮
黄一帆
沈雨欣
程杞元
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
基于动态频域分解的乐队指挥动作生成
贺鑫
刘凡
陈德龙
周睿志
《计算机应用研究》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
4
虚拟手自然抓取动作生成研究
王晓媛
田浩
王长波
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2020
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部