期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于大规模预训练文本图像模型的虚拟试穿方法 被引量:3
1
作者 祖雅妮 张毅 《丝绸》 CAS CSCD 北大核心 2023年第8期99-106,共8页
现有的虚拟试穿技术需要用户提供人体图像和服装图像,且存在生成图像质量低、泛化性差等缺点。为了解决现有问题,文章提出了一种基于文本图像预训练模型的虚拟试穿方法。用户只需输入描述服装的文本,即可获取试穿效果。此外,通过编辑GAN... 现有的虚拟试穿技术需要用户提供人体图像和服装图像,且存在生成图像质量低、泛化性差等缺点。为了解决现有问题,文章提出了一种基于文本图像预训练模型的虚拟试穿方法。用户只需输入描述服装的文本,即可获取试穿效果。此外,通过编辑GAN-Inversion优化生成的隐向量,能够保障生成与输入图像质量上的一致性。定性实验结果表明,文章提出的方法能够有效地保留输入人体图像的特征,并生成与文本描述一致的服装。在定量实验中,该方法在语义信息、IoU和FID等评价指标上均优于现有方法。 展开更多
关键词 虚拟试穿 GAN-反转 预训练模型 CLIP GAN-编辑 文本图像模型
在线阅读 下载PDF
语义增强图像-文本预训练模型的零样本三维模型分类
2
作者 丁博 张立宝 +1 位作者 秦健 何勇军 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3314-3323,共10页
目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法... 目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法。该方法首先将3维模型表示成多视图;然后为了增强零样本学习对未知类别的识别能力,通过视觉语言生成模型获得每张视图及其类别的语义描述性文本,并将其作为视图和类别提示文本之间的语义桥梁,语义描述性文本采用图像字幕和视觉问答两种方式获取;最后微调语义编码器将语义描述性文本具化为类别的语义描述,其拥有丰富的语义信息和较好的可解释性,有效减小了视图和类别提示文本的语义鸿沟。实验表明,该文方法在ModelNet10和ModelNet40数据集上的分类性能优于现有的零样本分类方法。 展开更多
关键词 3维模型分类 零样本 基于对比学习的图像-文本预训练模型 语义描述性文本
在线阅读 下载PDF
基于DreamBooth的傣锦图案人工智能生成模型 被引量:3
3
作者 纪乐福 王永江 李启正 《服装学报》 CAS 北大核心 2024年第5期433-442,共10页
为推动传统文化引领下的现代纺织图案设计发展,提出了一种利用人工智能生成民族纺织图案的模型。以傣族织锦图案为例,对傣族织锦实物图案进行矢量化处理,为每张图片编写对应文本标签,并以此为训练集;选取适用于傣锦的预训练模型,使用Dre... 为推动传统文化引领下的现代纺织图案设计发展,提出了一种利用人工智能生成民族纺织图案的模型。以傣族织锦图案为例,对傣族织锦实物图案进行矢量化处理,为每张图片编写对应文本标签,并以此为训练集;选取适用于傣锦的预训练模型,使用DreamBooth方法微调现有的文本-图像模型。对模型训练效果进行分析,得出V1模型是一个具有良好拟合度和图像生成效果的文本-图像生成模型。 展开更多
关键词 模型微调 传统纺织图案 傣锦图案 DreamBooth方法 文本-图像生成模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部