花1小时和5毛钱,你就能教会AI一种画风并打包成网页应用
训练自己的风格 LoRA,你需要 15–40 张风格一致的图片。每张图配一个纯描述内容的文本,不要描述画面风格。标注必须以一个虚构词开头 — 选一个不存在的单词作为触发词。
训练时别光盯着 loss 曲线,看样本图。大多数风格 LoRA 在 750–1500 步时视觉最好,走到最后反而容易过拟合。用基础版(base-4B)训练,推理时换成蒸馏版(4 步),效果通常更好,速度更快。
如果要做编辑 LoRA — 比如把黑白照片上色、去除水印 — 数据集需要成对(输入 + 输出),标注写的是指令,不是图片描述。通常需要 50–200 对,训练步数在 1000–1750 步时视觉最佳。配置上只需要在数据集部分加一行 control_path 指向参考文件夹,其他和风格 LoRA 一样。
模型许可证是 Apache 2.0,训练出来的东西可以商用和分发。部署到 Hugging Face 时需要留意:ZeroGPU Space 需要 HF PRO 订阅($9/月),否则只能在自己有 CUDA 的机器上跑。另外记得在 requirements.txt 里加上 peft,否则 load_lora_weights() 会报错。
如果你手头有 hackathon 项目,Build Small Hackathon 要求模型不超过 32B 参数,FLUX.2 klein 4B 完全在范围内,还能以 Gradio 应用形式直接丢到 Hugging Face Space 上。至于要不要自己训 LoRA — 如果社区里已经有你需要的风格,省下 1 小时和 0.5 美元就行。