跳过正文

Stable Diffusion 3.5 Medium 训练 - LoRA

Stable Diffusion AI绘画 StabilityAI ComfyUI 模型训练 LoRA Finetune
Luoqxi
作者
Luoqxi
洛琪希 神!
目录
StableDiffusion - 这篇文章属于一个选集。
§ 13: 本文

前提
#

作为经历过NovelAI等上古AI绘画时代的玩家,一直对此领域保持关注。最近StabilityAI发布了Stable Diffusion 3.5 Medium版本模型,区别于之前的3.5 Large,这里记录一下LoRA微调过程。

训练关键参数
#

$pretrained_model = "./Stable-diffusion/sd3.5_medium.safetensors" 
#SD3 训练相关参数
$clip_l = "./clip/clip_l.safetensors"
$clip_g = "./clip/clip_g.safetensors"
$t5xxl = "./clip/t5xxl_fp16.safetensors"
#diffuser 参数
$weighting_scheme = "uniform" # sigma_sqrt, logit_normal, mode, cosmap, uniform
$logit_mean = 0.0 # logit mean | logit 均值 默认0.0 只在logit_normal下生效
$logit_std = 1.0 # logit std | logit 标准差 默认1.0 只在logit_normal下生效
$mode_scale = 1.29 # mode scale | mode 缩放 默认1.29 只在mode下生效
# Train related params | 训练相关参数
$resolution = "1024,1024" # image resolution w,h. 图片分辨率,宽,高。支持非正方形,但必须是 64 倍数。
$batch_size = 2 # batch size 一次性训练图片批处理数量,根据显卡质量对应调高。
$max_train_epoches = 50 # max train epoches | 最大训练 epoch
$save_every_n_epochs = 1 # save every n epochs | 每 N 个 epoch 保存一次
# Learning rate | 学习率
$lr = "1e-5"
$unet_lr = "2e-4"
$text_encoder_lr = "2e-5"
$lr_scheduler = "warmup_stable_decay"
# optimizer | 优化器
$optimizer_type = "PagedAdamW8bit"
# Output settings | 输出设置
$output_name = "Lqx-LXL_SD35MLoRA_24111101" # output model name | 模型保存名称
$save_model_as = "safetensors" # model save ext | 模型保存格式 ckpt, pt, safetensors
$mixed_precision = "bf16" # 默认fp16,no,bf16可选
$save_precision = "bf16" # 默认fp16,fp32,bf16可选
$full_fp16 = 0 #开启全fp16模式,自动混合精度变为fp16,更节约显存
$full_bf16 = 1 #选择全bf16训练,必须30系以上显卡。
$fp8_base = 0 #开启fp8模式,更节约显存,实验性功能
$fp8_base_unet = 1 #开启fp8纯uent模式,更节约显存,实验性功能
# sd3 block layer,冻结一些层,不需要全部训练。
$enable_sd3_block = 1
$train_block_indices = "3-22" #3-19 for SD3.5M, 12-24,30-37 for SD3.5L

训练Loss日志
#

Loss Average

从Loss曲线,并不是一个很好的训练结果。

Loss Average

ComfyUI测试
#

启用SLG跳过部分层与不跳过的对比,区别不是很明显。

ComfyUI测试

比对工作流下载:SD35M_SLG+LoRA

总结
#

SD3.5M 2B的参数量属于比较适中,对训练设备要求不高,但是效果一言难尽,跟虽然是蒸馏模型的Flux Dev训练效果目前看完全没得比,肢体崩溃(尤其手部)很常见,下次试下全量Finetune。

参考资料
#

StableDiffusion - 这篇文章属于一个选集。
§ 13: 本文