检索结果-维普期刊中文期刊服务平台

基于大规模预训练文本图像模型的虚拟试穿方法被引量：4: 1; 作者祖雅妮张毅《丝绸》 CAS CSCD 北大核心 2023年第8期99-106,共8页; 现有的虚拟试穿技术需要用户提供人体图像和服装图像,且存在生成图像质量低、泛化性差等缺点。为了解决现有问题,文章提出了一种基于文本图像预训练模型的虚拟试穿方法。用户只需输入描述服装的文本,即可获取试穿效果。此外,通过编辑GAN... 展开更多; 关键词虚拟试穿 GAN-反转预训练模型 CLIP GAN-编辑文本图像模型; 在线阅读下载PDF 职称材料

语义增强图像-文本预训练模型的零样本三维模型分类: 2; 作者丁博张立宝 +1 位作者秦健何勇军《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3314-3323,共10页; 目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法... 展开更多; 关键词 3维模型分类零样本基于对比学习的图像-文本预训练模型语义描述性文本; 在线阅读下载PDF 职称材料

基于CLIP微调的扩散模型安全化: 3; 作者吴平林欣《华东师范大学学报(自然科学版)》北大核心 2025年第1期138-150,共13页; 扩散模型变革了文本–图像生成领域,使终端用户可以基于简单的自然语言提示生成高质量、多样化的图像艺术作品.然而,由于训练数据集庞大且未经过滤,文本–图像生成模型具有生成色情内容与暴力内容等不适当内容的能力.为更加安全地部署... 展开更多; 关键词文本–图像生成模型安全性数据集扩散模型; 在线阅读下载PDF 职称材料

基于DreamBooth的傣锦图案人工智能生成模型被引量：4: 4; 作者纪乐福王永江李启正《服装学报》 CAS 北大核心 2024年第5期433-442,共10页; 为推动传统文化引领下的现代纺织图案设计发展,提出了一种利用人工智能生成民族纺织图案的模型。以傣族织锦图案为例,对傣族织锦实物图案进行矢量化处理,为每张图片编写对应文本标签,并以此为训练集;选取适用于傣锦的预训练模型,使用Dre... 展开更多; 关键词模型微调传统纺织图案傣锦图案 DreamBooth方法文本-图像生成模型; 在线阅读下载PDF 职称材料

基于大模型微调范式的绘画风格模拟方法被引量：2: 5; 作者马诗洁徐华艺 +3 位作者李聪聪耿卫东沈华清李萌坚《计算机应用》 CSCD 北大核心 2024年第S01期268-272,共5页; 现有的微调大模型生成指定风格化图像的方法能力有限,存在布局风格、细节风格同目标风格不一致的问题,为了提高大模型风格模拟一致性能力,提出一种微调大模型部分注意力参数和低秩自适应(LoRA)相结合的方法并用于红色山水风格的绘画生... 展开更多; 关键词文本-图像大模型微调绘画风格少量样本图像生成 DreamBooth 低秩自适应; 在线阅读下载PDF 职称材料

多模态预训练模型综述被引量：11: 6; 作者王惠茹李秀红 +3 位作者李哲马春明任泽裕杨丹《计算机应用》 CSCD 北大核心 2023年第4期991-1004,共14页; 预训练模型(PTM)通过利用复杂的预训练目标和大量的模型参数,可以有效地获得无标记数据中的丰富知识。而在多模态中,PTM的发展还处于初期。根据具体模态的不同,将目前大多数的多模态PTM分为图像‒文本PTM和视频‒文本PTM;根据数据融合方... 展开更多; 关键词多模态预训练模型图像-文本预训练模型视频-文本预训练模型神经网络单流模型双流模型; 在线阅读下载PDF 职称材料

题名基于大规模预训练文本图像模型的虚拟试穿方法被引量：4: 1; 作者祖雅妮张毅; 机构江南大学设计学院; 出处《丝绸》 CAS CSCD 北大核心 2023年第8期99-106,共8页; 基金教育部人文社会科学研究一般项目(21YJA760096) 中国非物质文化遗产传承人群研修研习培训计划项目(文非遗发[2017]2号) 江苏省社会科学基金立项一般项目(19WMB040)。; 文摘现有的虚拟试穿技术需要用户提供人体图像和服装图像,且存在生成图像质量低、泛化性差等缺点。为了解决现有问题,文章提出了一种基于文本图像预训练模型的虚拟试穿方法。用户只需输入描述服装的文本,即可获取试穿效果。此外,通过编辑GAN-Inversion优化生成的隐向量,能够保障生成与输入图像质量上的一致性。定性实验结果表明,文章提出的方法能够有效地保留输入人体图像的特征,并生成与文本描述一致的服装。在定量实验中,该方法在语义信息、IoU和FID等评价指标上均优于现有方法。; 关键词虚拟试穿 GAN-反转预训练模型 CLIP GAN-编辑文本图像模型; Keywords virtual try-on GAN-inversion pre-training model CLIP GAN-editing text-image model; 分类号 TS941.2 [轻工技术与工程—服装设计与工程]; 在线阅读下载PDF 职称材料

题名语义增强图像-文本预训练模型的零样本三维模型分类: 2; 作者丁博张立宝秦健何勇军; 机构哈尔滨理工大学计算机科学与技术学院哈尔滨工业大学计算学部; 出处《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3314-3323,共10页; 基金国家自然科学基金(61673142) 黑龙江省自然科学基金(LH2022F029,JQ2019F002)。; 文摘目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法。该方法首先将3维模型表示成多视图;然后为了增强零样本学习对未知类别的识别能力,通过视觉语言生成模型获得每张视图及其类别的语义描述性文本,并将其作为视图和类别提示文本之间的语义桥梁,语义描述性文本采用图像字幕和视觉问答两种方式获取;最后微调语义编码器将语义描述性文本具化为类别的语义描述,其拥有丰富的语义信息和较好的可解释性,有效减小了视图和类别提示文本的语义鸿沟。实验表明,该文方法在ModelNet10和ModelNet40数据集上的分类性能优于现有的零样本分类方法。; 关键词 3维模型分类零样本基于对比学习的图像-文本预训练模型语义描述性文本; Keywords 3D shape classification Zero-shot Contrastive Language-Image Pre-training(CLIP) Semantic descriptive text; 分类号 TN911.7 [电子电信—通信与信息系统] TP391.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于CLIP微调的扩散模型安全化: 3; 作者吴平林欣; 机构华东师范大学计算机科学与技术学院; 出处《华东师范大学学报(自然科学版)》北大核心 2025年第1期138-150,共13页; 基金统计与数据科学前沿理论及应用教育部重点实验室开放项目上海市科委项目(21511100101)。; 文摘扩散模型变革了文本–图像生成领域,使终端用户可以基于简单的自然语言提示生成高质量、多样化的图像艺术作品.然而,由于训练数据集庞大且未经过滤,文本–图像生成模型具有生成色情内容与暴力内容等不适当内容的能力.为更加安全地部署此类模型,提出了一种基于CLIP (contrastive languageimage pre-training)方向性损失的微调(directional CLIP loss based fine-tuning, CLIF)算法,使用方向性的CLIP损失来微调模型,以抑制其生成不适当内容的能力. CLIF消耗的计算资源很少,并且具有强制生效的特点.为评估其抑制效果,提出了CTP (categorized toxic prompts)用于评估文本–图像生成模型的不适当内容生成能力.在CTP与COCO (common objects in context)上的实验结果表明, CLIF能够在抑制文本–图像扩散模型生成不安全内容的同时不影响其一般性生成能力.; 关键词文本–图像生成模型安全性数据集扩散模型; Keywords text-to-image generative models security datasets diffusion models; 分类号 TP391.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于DreamBooth的傣锦图案人工智能生成模型被引量：4: 4; 作者纪乐福王永江李启正; 机构浙江理工大学纺织科学与工程学院(国际丝绸学院); 出处《服装学报》 CAS 北大核心 2024年第5期433-442,共10页; 基金教育部产学合作协同育人项目(202102654037)。; 文摘为推动传统文化引领下的现代纺织图案设计发展,提出了一种利用人工智能生成民族纺织图案的模型。以傣族织锦图案为例,对傣族织锦实物图案进行矢量化处理,为每张图片编写对应文本标签,并以此为训练集;选取适用于傣锦的预训练模型,使用DreamBooth方法微调现有的文本-图像模型。对模型训练效果进行分析,得出V1模型是一个具有良好拟合度和图像生成效果的文本-图像生成模型。; 关键词模型微调传统纺织图案傣锦图案 DreamBooth方法文本-图像生成模型; Keywords model fine-tuning traditional textile patterns Dai brocade patterns DreamBooth method text-image genera-tion model; 分类号 TS941.26 [轻工技术与工程—服装设计与工程]; 在线阅读下载PDF 职称材料

题名基于大模型微调范式的绘画风格模拟方法被引量：2: 5; 作者马诗洁徐华艺李聪聪耿卫东沈华清李萌坚; 机构之江实验室; 出处《计算机应用》 CSCD 北大核心 2024年第S01期268-272,共5页; 基金之江实验室跨媒体智能短视频生成关键技术项目(108001‑AC2101)。; 文摘现有的微调大模型生成指定风格化图像的方法能力有限,存在布局风格、细节风格同目标风格不一致的问题,为了提高大模型风格模拟一致性能力,提出一种微调大模型部分注意力参数和低秩自适应(LoRA)相结合的方法并用于红色山水风格的绘画生成。首先,以少量绘画样本微调文生图大模型的部分注意力参数;其次,冻结文生图(文本-图像)大模型,结合LoRA微调方法在模型中注入可训练层进行训练;最后,将第2步中的可训练层插入第1步微调过的大模型中进行推理。实验结果表明,与目前流行的风格定制方法相比,所提方法在保证文本可控性的同时,不仅保证了绘画的整体布局与训练集图像风格一致,同时在绘画细节上也与目标风格具有高一致性。在红色山水画风格模拟方面的实验结果表明,生成的红色山水画更接近训练集的风格,并且生成的绘画风格更符合艺术从业者的风格一致性评价。目前,基于所提方法的红色山水画互动生成系统已经在中国共产党杭州历史馆对外开放展示。; 关键词文本-图像大模型微调绘画风格少量样本图像生成 DreamBooth 低秩自适应; Keywords text-to-image large model fine-tuning painting style few-shot image generation DreamBooth Low-Rank Adaption(LoRA); 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名多模态预训练模型综述被引量：11: 6; 作者王惠茹李秀红李哲马春明任泽裕杨丹; 机构新疆大学信息科学与工程学院香港理工大学电子及资讯工程学系; 出处《计算机应用》 CSCD 北大核心 2023年第4期991-1004,共14页; 基金国家语委重点研发项目(ZDI135-96)。; 文摘预训练模型(PTM)通过利用复杂的预训练目标和大量的模型参数,可以有效地获得无标记数据中的丰富知识。而在多模态中,PTM的发展还处于初期。根据具体模态的不同,将目前大多数的多模态PTM分为图像‒文本PTM和视频‒文本PTM;根据数据融合方式的不同,还可将多模态PTM分为单流模型和双流模型两类。首先,总结了常见的预训练任务和验证实验所使用的下游任务;接着,梳理了目前多模态预训练领域的常见模型,并用表格列出各个模型的下游任务以及模型的性能和实验数据比较;然后,介绍了M6(Multi-Modality to Multi-Modality Multitask Mega-transformer)模型、跨模态提示调优(CPT)模型、VideoBERT(Video Bidirectional Encoder Representations from Transformers)模型和AliceMind(Alibaba’s collection of encoder-decoders from Mind)模型在具体下游任务中的应用场景;最后,总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。; 关键词多模态预训练模型图像-文本预训练模型视频-文本预训练模型神经网络单流模型双流模型; Keywords multimodal Pre-Training Model(PTM) image-text pre-training model video-text pre-training model neural network single-stream model two-stream model; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于大规模预训练文本图像模型的虚拟试穿方法	祖雅妮张毅	《丝绸》 CAS CSCD 北大核心	2023	4	在线阅读下载PDF 职称材料
2	语义增强图像-文本预训练模型的零样本三维模型分类	丁博张立宝秦健何勇军	《电子与信息学报》 EI CAS CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
3	基于CLIP微调的扩散模型安全化	吴平林欣	《华东师范大学学报(自然科学版)》北大核心	2025	0	在线阅读下载PDF 职称材料
4	基于DreamBooth的傣锦图案人工智能生成模型	纪乐福王永江李启正	《服装学报》 CAS 北大核心	2024	4	在线阅读下载PDF 职称材料
5	基于大模型微调范式的绘画风格模拟方法	马诗洁徐华艺李聪聪耿卫东沈华清李萌坚	《计算机应用》 CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料
6	多模态预训练模型综述	王惠茹李秀红李哲马春明任泽裕杨丹	《计算机应用》 CSCD 北大核心	2023	11	在线阅读下载PDF 职称材料