期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于生成对抗架构的目标检测增强算法 被引量:2
1
作者 张昀 黄橙 +4 位作者 施健 张玉瑶 黄经纬 于舒娟 黄丽亚 《计算机学报》 EI CAS CSCD 北大核心 2024年第3期647-661,共15页
目标检测网络的性能往往受制于特征提取网络的深度,而网络参数的大量增加只能带来检测系统性能的少量提升,同时需要引进许多额外的网络细节设计,这些都会导致训练难度的增加.本文提出了一种基于生成对抗训练的目标检测方法,它以减少特... 目标检测网络的性能往往受制于特征提取网络的深度,而网络参数的大量增加只能带来检测系统性能的少量提升,同时需要引进许多额外的网络细节设计,这些都会导致训练难度的增加.本文提出了一种基于生成对抗训练的目标检测方法,它以减少特征分布的EM距离(Wasserstein距离)为训练目标.具体来说,我们将检测网络从整个架构中提取出来,并对特征提取网络进行深入的对抗性训练.实验证明,本文提出的架构进一步提高了网络的特征提取能力,并且没有导致参数的增加.在MS COCO 2017数据集上,本文的架构将基于ResNet101的CenterNet网络性能从36.1%mAP提高到37.2%mAP,将基于Hourglass-104的mAP从42.2%提高到43.0%. 展开更多
关键词 计算机视觉 目标检测 生成对抗训练 特征提取 分类预测
在线阅读 下载PDF
基于人体姿态估计的敦煌舞三维动作数据集
2
作者 张跃洲 何向真 +9 位作者 孟祥和 李帅帅 王嘉欣 白雪 马梦迪 刘振杰 陈宁 王昊 吴林东 罗熙鸿 《中国科学数据(中英文网络版)》 2025年第2期524-542,共19页
敦煌舞是中华民族传统文化的艺术瑰宝,它来源于敦煌壁画,是敦煌文化的重要组成元素,它的数字化保存、展示与研究具有重要意义。为推进敦煌舞的数字化进程与发展,本研究提出将敦煌舞与三维人体姿态估计技术相结合,设计了一个敦煌舞三维... 敦煌舞是中华民族传统文化的艺术瑰宝,它来源于敦煌壁画,是敦煌文化的重要组成元素,它的数字化保存、展示与研究具有重要意义。为推进敦煌舞的数字化进程与发展,本研究提出将敦煌舞与三维人体姿态估计技术相结合,设计了一个敦煌舞三维人体姿态估计网络(Dun Huang Dance Pose Estimation,DHDPE),构建了一个敦煌舞三维动作数据集。敦煌舞蹈方面,将敦煌舞按人物形象划分、编排与采集,构建了敦煌舞视频动作数据集;姿态估计方面,以AMASS(Archive of Motion Capture as Surface Shapes)大规模三维人体运动捕捉数据集为基础作生成对抗训练,用Res Net提取图像特征,门控循环网络作为时间编码器,参数回归器回归出SMPL参数模型,用注意力机制来放大序列不同帧的贡献程度,以人体真实运动AMASS为基础,给出估计姿态是真或假的概率,进而构建敦煌舞三维动作数据集。本数据集将敦煌舞划分为7个主题,83个基础动作,16个长动作。在定量、定性、人工评估和双向随机遮挡敏感性分析方法中取得了较好的结果,为敦煌舞的保存、应用与发展奠定了基础;为敦煌文化的研究、弘扬与传承提供了新思路。后续利用本数据集可应用于生成式人工智能、敦煌舞文化数字展览与表演、敦煌舞的教育与研究、敦煌舞的数字媒体与娱乐等。 展开更多
关键词 敦煌舞数字化 姿态估计 三维动作 生成对抗训练
在线阅读 下载PDF
面向视频预测图像重建的感知损失函数
3
作者 涂思仪 黄劲松 《导航定位学报》 CSCD 北大核心 2024年第6期54-61,共8页
为了进一步提升视频预测网络重建场景图像的精确度,提出一种利用自编码器的多尺度判别器特征感知损失函数(MDF-AE):其核心是用一组面向不同尺度图像的判别器构成提取图像特征的损失网络;判别器网络通过单图像生成对抗网络(SinGAN)分阶... 为了进一步提升视频预测网络重建场景图像的精确度,提出一种利用自编码器的多尺度判别器特征感知损失函数(MDF-AE):其核心是用一组面向不同尺度图像的判别器构成提取图像特征的损失网络;判别器网络通过单图像生成对抗网络(SinGAN)分阶段训练得到,训练中以图像自编码器作为生成器,在生成图像中引入图像重建误差,为视频预测网络进行未来图像帧的重建提供更准确的感知约束。实验结果表明,利用MDF-AE训练视频预测网络可有助于从结构、纹理和色彩上提升网络所重建场景图像的质量和可视化效果。 展开更多
关键词 视频预测 感知损失 图像自编码器 单图像生成对抗网络 生成对抗训练
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部