AI开发编程开源项目

LlamaGen-文生图模型

港大和字节推出的开源文生图模型

标签：开源模型

链接直达手机查看

广告也精彩

来自港大和字节的研究人员，提出了基于自回归模型Llama的图像生成方法。

目前该模型已经开源，并在GitHub斩获了近900颗星标。

研究团队将目标设定成了推出开源版的基于自回归图像生成模型。

针对现有的先进的图像生成模型，作者总结出其成功的三点关键设计：

图像压缩/量化器（Image Compressors/Tokenizers）
可scale up的图像生成模型（Scalable Image generation models）
高质量的训练数据（High-quality Training Data）

当输入更长的文本时，LlamaGen也可以生成兼具图文对齐与视觉质量的图像。

LlamaGen-文生图模型

目前该项目已经开源，而且还支持在线体验，感兴趣的话不妨一试。

在线体验：

https://huggingface.co/spaces/FoundationVision/LlamaGen

相关导航

Stirling-PDF

开源PDF操作工具

GameNGen-AI游戏引擎

谷歌推出世界首个 AI 游戏引擎

Lynx-开源跨平台UI框架

字节跳动团队跨平台 UI 框架

HuggingFace-开源社区

https://huggingface.co/

Void-开源代码编辑器

免费开源AI编码神器

Umi-OCR-开源OCR工具

开源免费的离线OCR软件

暂无评论

暂无评论...