AI智能绘画

Seedream 3.0-文生图

字节跳动新一代文生图图像生成模型Seedream 3.0

标签：文生图

链接直达手机查看

Seedream 3.0是字节近日发布的新一代文生图主力模型，目前已在即梦、豆包等平台全量开放。据Seedream 3.0技术报告，Seedream3.0是一个原生高分辨率、支持中英双语的图像生成基础模型，无需后处理即可实现 2K 分辨率图像直出，适配多比例场景，同时针对小字体高保真生成、多行文本排版等业界难题，模型也取得了突破性的效果表现。

　　值得一提的是，Seedream 3.0在3秒左右即可快速生成1K分辨率的高品质内容，相比之下，业界同类模型生成该分辨率内容的耗时基本在10秒以上，而此前文生图SOTA模型GPT-4o平均耗时为77秒。Seedream 3.0 在真实、图形设计与数字渲染、动漫、卡通与插图、复古风、传统艺术等不同风格，以及文字、商务、人像、自然、幻想等不同维度均表现领先。

为支持快速生成高品质图像，模型采用自研推理加速算法，依靠一致性噪声预测，叠加重要时间步采样，最终实现对模型的无损加速。在保障图文匹配、美学质量、结构准确度等指标的前提下，Seedream 3.0 生成1K分辨率图像仅需3秒。

　　Seedream3.0还大幅提升了小字体高保真生成、多行文本语义排版表现，满足设计师对海报设计的需求。团队在预训练阶段，引入跨模态旋转位置编码，补足传统方法模态特征对齐短板，进一步加强了文字渲染能力。