Stable Diffusion 3:Stability AI推出的最新图像生成模型
Stable Diffusion 3是什么?
Stable Diffusion 3 是由Stability AI推出的最新文本到图像模型,模型参数范围从 800M 到 8B,可适配不同类型设备,并称是迄今为止“最强大的文本到图像模型”。
Stable Diffusion 3 采用了类似Sora的新架构Diffusion Transformer ,结合了新技术 Flow Matching ,大大提高了多主题提示、图像质量、拼写能力的性能。
这个模型在多主题提示、图像质量和拼写能力方面有了显著的性能提升,特别擅长处理包含多个主题的复杂提示,能够生成更加精细和逼真的图像。
非常大的变化是,提示词支持使用自然语言了。例如下面的示例:
Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy.
提示词:史诗般的动漫艺术作品,一个巫师在夜晚的山顶上向黑暗的天空施放了一个宇宙咒语,上面写着“Stable Diffusion 3”,由五颜六色的能量组成。
Stable Diffusion 3生成图片示例
以下是官方发布的生成示例,确实在多主题提示、图像质量上有很大的提升。
Stable Diffusion 3适用人群
Stable Diffusion 3适用于需要快速、高效地从文本生成高质量图像的个人、开发者和企业。无论是艺术家寻求灵感、开发者构建应用程序,还是企业需要生成独特的视觉内容,Stable Diffusion 3都提供了一个强大的工具。
如何使用Stable Diffusion 3?
目前Stable Diffusion 3处于早期预览版,需要申请内测资格,点此申请加入候补名单。
申请通过后,官方会通过电子邮件通知并邀请你访问Stable Diffusion 3的 Discord 服务器体验。
数据评估
本站做视频AI导航网提供的Stable Diffusion 3:Stability AI推出的最新图像生成模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由做视频AI导航网实际控制,在2024年3月4日 下午1:09收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,做视频AI导航网不承担任何责任。