FLUX.1

Announcing Black Forest Labs

Black Forest Labs 宣布推出,致力于开发和推进最先进的生成式深度学习模型,以生成图像和视频等媒体,并推动创造力、效率和多样性的界限。

Screenshot for Announcing Black Forest Labs

FLUX.1 介绍

Black Forest Labs: 引领生成式AI,打造媒体创作新纪元

Black Forest Labs,一家根植于生成式AI研究领域的创新公司,致力于开发和推进图像、视频等媒体的尖端生成式深度学习模型,突破创造力、效率和多样性的界限。

团队实力:打造行业标杆

Black Forest Labs拥有一支由杰出的AI研究人员和工程师组成的团队,他们在学术、工业和开源环境中开发基础生成式AI模型方面拥有卓越的成就。他们的创新包括创造了VQGAN、Latent Diffusion、Stable Diffusion模型(Stable Diffusion XL、Stable Video Diffusion、Rectified Flow Transformers)以及用于超快速实时图像合成的Adversarial Diffusion Distillation。

资金雄厚:获顶级投资机构支持

Black Forest Labs成功完成了3100万美元的种子轮融资,由主要投资者Andreessen Horowitz领投,天使投资者Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等AI研究和公司建设领域的知名专家也参与其中。General Catalyst和MätchVC也进行了后续投资,支持Black Forest Labs将欧洲最先进的AI技术带给全世界。

FLUX.1模型套件:定义图像合成新标准

Black Forest Labs发布了FLUX.1文本到图像模型套件,该套件在图像细节、提示依从性、风格多样性和场景复杂性方面树立了新的标准。

三种版本,满足不同需求

为了在可访问性和模型功能之间取得平衡,FLUX.1有三种版本:

  • FLUX.1 [pro]: FLUX.1的最佳版本,提供最先进的图像生成性能,具有顶级的提示跟踪、视觉质量、图像细节和输出多样性。
  • FLUX.1 [dev]: FLUX.1 [dev]是一个开放权重的指导蒸馏模型,用于非商业应用。
  • FLUX.1 [schnell]: 最快的模型,专为本地开发和个人使用而设计。

Transformer驱动的流模型

所有公开的FLUX.1模型都基于多模态和并行扩散Transformer块的混合架构,并扩展到120亿个参数。Black Forest Labs通过构建流匹配来改进之前的最先进的扩散模型,流匹配是一种用于训练生成模型的通用且概念上简单的方法,它包括扩散作为特例。此外,Black Forest Labs还通过结合旋转位置嵌入和并行注意层来提高模型性能并提高硬件效率。

图像合成的新基准

FLUX.1定义了图像合成的新标准。Black Forest Labs的模型在其各自的模型类别中树立了新标准。FLUX.1 [pro]和[dev]在视觉质量、提示跟踪、尺寸/纵横比可变性、排版和输出多样性等方面都超过了Midjourney v6.0、DALL·E 3 (HD)和SD3-Ultra等流行模型。

展望未来:面向所有人的SOTA文本到视频

Black Forest Labs发布了FLUX.1文本到图像模型套件。凭借其强大的创作能力,这些模型为即将推出的具有竞争力的生成性文本到视频系统套件奠定了坚实的基础。Black Forest Labs的视频模型将以前所未有的速度解锁高清的精确创建和编辑。Black Forest Labs致力于继续开拓生成媒体的未来。

总结

Black Forest Labs凭借其强大的研发团队、雄厚的资金支持以及突破性的FLUX.1模型套件,正引领着生成式AI领域的发展。其致力于打造行业标杆,为用户提供最先进的图像和视频生成技术,将极大地推动媒体创作的革新。未来,Black Forest Labs将继续探索生成式AI的无限可能,为我们带来更多惊喜。

FLUX.1 常见问题

  • Black Forest Labs 是什么?

    Black Forest Labs 是一家专注于生成式AI研究的公司,致力于开发先进的深度学习模型,用于生成图像、视频等媒体内容。他们相信生成式AI将成为未来所有技术的基石,并致力于将其模型推广给大众,以造福所有人。

  • Black Forest Labs 的团队成员有哪些背景?

    团队成员包括在学术界、工业界和开源环境中开发基础生成式AI模型方面拥有杰出成就的AI研究人员和工程师。他们的创新包括创建VQGAN、Latent Diffusion、Stable Diffusion模型(Stable Diffusion XL、Stable Video Diffusion、Rectified Flow Transformers)以及用于超快速实时图像合成的Adversarial Diffusion Distillation。

  • Black Forest Labs 获得了哪些融资?

    Black Forest Labs 成功完成了 3100 万美元的种子轮融资,由 Andreessen Horowitz 领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila 和 Vladlen Koltun 等天使投资人参投。后续还获得了 General Catalyst 和 MätchVC 的投资。

  • FLUX.1 模型系列有哪些版本?

    FLUX.1 模型系列有三个版本:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。FLUX.1 [pro] 提供最先进的性能;FLUX.1 [dev] 是一个开源权重模型,用于非商业应用;FLUX.1 [schnell] 是最快的模型,专为本地开发和个人使用而设计。

  • 如何访问和使用 FLUX.1 [pro] 模型?

    可以通过 Black Forest Labs 的 API、Replicate 和 fal.ai 访问 FLUX.1 [pro]。此外,他们还提供专门的定制企业解决方案,可以通过 [email protected] 联系。

  • FLUX.1 [dev] 模型的许可证是什么?

    FLUX.1 [dev] 是一个开源权重模型,用于非商业应用。如需在商业环境中使用,请联系 [email protected][email protected]

  • FLUX.1 模型系列有哪些技术特点?

    FLUX.1 模型基于多模态和并行扩散Transformer块的混合架构,并扩展到 120 亿个参数。它们建立在流匹配的基础上,并结合了旋转位置嵌入和并行注意力层,以提高模型性能和硬件效率。

  • FLUX.1 模型系列的性能如何?

    FLUX.1 [pro] 和 [dev] 在视觉质量、提示遵循、尺寸/纵横比可变性、排版和输出多样性方面超过了 Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra 等流行模型。FLUX.1 [schnell] 是迄今为止最先进的快速模型,其性能甚至超过了同类竞争对手以及 Midjourney v6.0 和 DALL·E 3 (HD) 等强大的非蒸馏模型。

  • Black Forest Labs 未来有什么计划?

    Black Forest Labs 计划推出一套具有竞争力的生成式文本到视频系统,这些系统将以高清和前所未有的速度实现精确的视频创建和编辑。

  • 如何加入 Black Forest Labs?

    Black Forest Labs 正在招聘机器学习和后端工程师。如果您有兴趣加入他们的团队,请发送邮件至 [email protected]