-
题名人在环路的细分行业logo生成方法
- 1
-
-
作者
李纪远
管哲予
宋海川
谭鑫
马利庄
-
机构
华东师范大学计算机科学与技术学院
-
出处
《图学学报》
北大核心
2025年第2期382-392,共11页
-
基金
国家自然科学基金(62302167,62222602)
上海市青年科技英才扬帆计划(23YF1410500)。
-
文摘
logo图像相比于其他生成图像类型,有着高度抽象、设计多变、风格统一的特点,因此较难直接控制生成结果。为了实现符合各行业特点、满足多种设计构成形态需要的logo高效生成,提出了一种人在环路的细分领域logo生成方法。首先,基于Dreambooth微调文生图扩散模型,以网络公开资源搜集的logo作为数据集,将文生图模型Stable Diffusion XL作为基座模型训练出适用于基础logo生成的“雏形模型”。然后,构造出多组适用于各目标行业领域的文本提示词库,在提示词库指导下,通过雏形模型对各目标行业的logo进行生成。接着,通过人工介入对生成结果进行筛选,推演构造出符合行业需求的二次数据集。最后,利用得到二次数据集对模型基于LoRA进行迭代微调,得到生成logo的“成品模型”,并通过生成图像与提示词的余弦相似度以及人工问卷指标对成品模型的生成结果进行评估,验证了成品模型生成的logo图像在行业关联度、结构完整性以及美观程度等评价维度上相比于未经过上述处理的原模型直接生成的效果有可观提升。
-
关键词
图像生成
扩散模型
人在回路
训练集构造
文本合成图像
-
Keywords
image synthesis
diffusion model
human-in-the-loop
training set construction
text to image
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-