Stable Diffusion 3.5 Medium 训练

StableDiffusion - 这篇文章属于一个选集。

§ 13: 本文

前提
#

作为经历过NovelAI等上古AI绘画时代的玩家，一直对此领域保持关注。最近StabilityAI发布了Stable Diffusion 3.5 Medium版本模型，区别于之前的3.5 Large，这里记录一下LoRA微调过程。

训练关键参数
#

$pretrained_model = "./Stable-diffusion/sd3.5_medium.safetensors" 
#SD3 训练相关参数
$clip_l = "./clip/clip_l.safetensors"
$clip_g = "./clip/clip_g.safetensors"
$t5xxl = "./clip/t5xxl_fp16.safetensors"

#diffuser 参数
$weighting_scheme = "uniform" # sigma_sqrt, logit_normal, mode, cosmap, uniform
$logit_mean = 0.0 # logit mean | logit 均值 默认0.0 只在logit_normal下生效
$logit_std = 1.0 # logit std | logit 标准差 默认1.0 只在logit_normal下生效
$mode_scale = 1.29 # mode scale | mode 缩放 默认1.29 只在mode下生效

# Train related params | 训练相关参数
$resolution = "1024,1024" # image resolution w,h. 图片分辨率，宽,高。支持非正方形，但必须是 64 倍数。
$batch_size = 2 # batch size 一次性训练图片批处理数量，根据显卡质量对应调高。
$max_train_epoches = 50 # max train epoches | 最大训练 epoch
$save_every_n_epochs = 1 # save every n epochs | 每 N 个 epoch 保存一次

# Learning rate | 学习率
$lr = "1e-5"
$unet_lr = "2e-4"
$text_encoder_lr = "2e-5"
$lr_scheduler = "warmup_stable_decay"
# optimizer | 优化器
$optimizer_type = "PagedAdamW8bit"

# Output settings | 输出设置
$output_name = "Lqx-LXL_SD35MLoRA_24111101" # output model name | 模型保存名称
$save_model_as = "safetensors" # model save ext | 模型保存格式 ckpt, pt, safetensors
$mixed_precision = "bf16" # 默认fp16,no,bf16可选
$save_precision = "bf16" # 默认fp16,fp32,bf16可选
$full_fp16 = 0 #开启全fp16模式，自动混合精度变为fp16，更节约显存
$full_bf16 = 1 #选择全bf16训练，必须30系以上显卡。
$fp8_base = 0 #开启fp8模式，更节约显存，实验性功能
$fp8_base_unet = 1 #开启fp8纯uent模式，更节约显存，实验性功能

# sd3 block layer，冻结一些层，不需要全部训练。
$enable_sd3_block = 1
$train_block_indices = "3-22" #3-19 for SD3.5M, 12-24,30-37 for SD3.5L

训练Loss日志
#

Loss Average

从Loss曲线，并不是一个很好的训练结果。

ComfyUI测试
#

启用SLG跳过部分层与不跳过的对比，区别不是很明显。

比对工作流下载：SD35M_SLG+LoRA

总结
#

SD3.5M 2B的参数量属于比较适中，对训练设备要求不高，但是效果一言难尽，跟虽然是蒸馏模型的Flux Dev训练效果目前看完全没得比，肢体崩溃（尤其手部）很常见，下次试下全量Finetune。

参考资料
#

Stable Diffusion 3.5 Medium

StableDiffusion - 这篇文章属于一个选集。

§ 13: 本文

§ 13: Kolors合并Lora并保存为Kolors Unet

前提 #

训练关键参数 #

训练Loss日志 #

ComfyUI测试 #

总结 #

参考资料 #