字节正式发布了文生图 SDXL-Lightning 微调模型, 采用了新的渐进式对抗蒸馏(Progressive Adversarial Distillation)技术,能将计算时间和成本降至此前的十分之一,SDXL-Lightning 能提速 10 倍在 2~4 步内生成高质量及高分辨率的图像。SDXL-Lightning demo 基于 ComfyUI,也同样支持 SD WebUI。
关于SDXL-Lightning的一些关键特点和工作原理:
1.快速生成高分辨率图像:
SDXL-Lightning能够在一步或少步骤内生成1024px分辨率的图像,这对于需要快速图像生成的应用场景非常有利。
2.渐进式和对抗式蒸馏:
模型结合了这两种蒸馏方法,以提高生成效率并保持图像质量。渐进式蒸馏简化了生成步骤,而对抗式蒸馏通过引入鉴别器来提高图像的真实性和质量。
3.优化的模型设计和训练策略:
SDXL-Lightning采用了预训练的扩散UNet编码器作为鉴别器,这有助于提高训练效率。同时,模型还采用了对抗性损失目标和稳定训练技术,确保了生成图像的高质量和训练过程的稳定性。
4.广泛可用性:
SDXL-Lightning模型已经开源,包括支持LoRA(LoRA是一种用于微调大型语言模型的技术)的版本和完整的UNet权重版本,这使得研究者和开发者可以在多种场景下应用和进一步研究这个模型。
5.插件兼容性:
模型支持与LoRA模块和控制插件的兼容性,这意味着它可以灵活应用于多种文本到图像的生成任务,包括风格化和特定主题的图像生成。
对于需要快速图像生成的应用场景,如实时广告创意、游戏角色设计等,具有重要意义。
论文:SDXL-Lightning: Progressive Adversarial Diffusion Distillation