• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

Stable Diffusion 3 正式开源:超强文生图模型SD3-M登场引领创新潮流

Stable Diffusion 3 正式开源:超强文生图模型SD3-M登场引领创新潮流
AI TOP100
2024-06-13 10:50:14

知名开源大模型平台Stability AI于2024年6月12日晚上9点钟在推特上宣布正式开源了 Stable Diffusion 3 Medium(SD3-M) 权重知名开源大模型平台Stability AI于2024年6月12日晚上9点钟在推特上宣布正式开源了 Stable Diffusion 3 Medium(SD3-M) 权重,为广大用户带来了免费试用的机会。而且官方还宣称SD3-M是他们Stable Diffusion 3 系列钟最新、最先进的文本转图像AI模型!

Stable Diffusion 3 Medium地址

试玩地址:https://huggingface.co/spaces/stabilityai/stable-diffusion-3-mediumStable Diffusion 3 Medium地址

Stable Diffusion 3 Medium(SD3-M)关键要点:

  1. Stable Diffusion 3 Medium,由 Stability AI 推出,代表了我们迄今为止在文本到图像领域最前沿的开放模型技术。
  2. 这款模型设计紧凑,便于在常见的个人电脑、笔记本电脑,以及企业级图形处理单元(GPU)上高效运行。其优化的大小使其成为文本转图像应用的新一代标准。
  3. 现在,这些精心调整的模型权重可以在非商业性的开放许可证和面向创作者的低成本许可证下供您使用。如果您有大规模商业应用的需求,欢迎联系我们以获取更详细的许可信息。
  4. 想要体验 Stable Diffusion 3 模型的魅力,您可以通过 Stability AI 的平台 API 来尝试。我们还提供在 Stable Assistant 上注册即可享受的三天免费试用。此外,您还可以通过 Discord 加入 Stable Artisan,进一步探索模型的潜力。

什么让 SD3 Medium 脱颖而出?什么让 SD3 Medium 脱颖而出?

我们都知道SD3是一款强大的文生图模型,拥有20亿参数,因其高效的推理速度和卓越的生成效果而备受瞩目。

具有一些显著的特点:

  1. Stable Diffusion 3 Medium 模型以其卓越的图像生成能力而著称,能够输出具有照片级真实感的图像,细节丰富、色彩鲜艳、光照自然。通过采用创新的16通道VAE等技术,该模型显著提升了图像质量,尤其在手部和面部等细节上,克服了其他模型普遍存在的不足。
  2. 在理解复杂提示方面,Stable Diffusion 3 Medium 表现出色,能够深入理解空间关系、构图元素、动作和风格等复杂概念。用户可以根据需要选择使用一个或多个文本编码器,以平衡生成过程中的性能和效率。
  3. 排版质量也得到了显著提升,得益于其独特的扩散变压器架构,生成的文本在拼写、字距、字母形状和间距方面的错误大幅减少,提供了前所未有的文本质量。
  4. 此外,Stable Diffusion 3 Medium 模型在资源利用方面表现出色,其较小的VRAM占用使得它能够在标准消费者级GPU上高效运行,而不会牺牲性能。
  5. 模型的微调能力同样值得称赞,它能够从有限的数据集中学习细微的细节,使得定制化输出更加精确和完美。这些特点使得Stable Diffusion 3 Medium 成为市场上最具吸引力和实用性的文本到图像生成模型之一。

SD3-M版本的开源允许用户探索其在不同领域的应用潜力。该模型采用了多模态扩散变换器(MMDiT)架构,在图片质量、排版、复杂文本提示和资源效率等方面取得了显著提升。仅需2-10秒即可生成图像,对硬件需求相对较低,适用于PC、手机、平板等多种设备。

SD3-M还与英伟达、AMD合作

SD3-M还与英伟达、AMD合作进行了特定硬件的优化,针对RTX GPU、TensorRT、最新CPU以及MI-300X进行了优化,性能最高可提升50%。该模型使用了包含10亿张图片的公开和合成数据进行了预训练,并针对特定艺术风格和领域,使用了3000万张图片进行微调以及300万张偏好图片,使其对用户的文本提示理解和嵌入图片文字的效果更为优秀。

通过在线demo展示,SD3-M生成效果惊艳非凡,能够生成高耸的摩天大楼、宁静的海滩景色、热带雨林以及20世纪50年代的老式餐厅等各种图像。免费在线试用为用户提供了无限的探索可能。SD3-M生成效果惊艳非凡,能够生成高耸的摩天大楼、宁静的海滩景色、热带雨林以及20世纪50年代的老式餐厅等各种图像。

温馨提示:

需要注意的是,目前SD3-M仅用于学术研究,无法进行商业化应用。如有商业需求,用户需要联系Stability AI进行商业授权。

Stable Diffusion 3的开源和免费试用为用户提供了探索其在不同领域应用潜力的机会,有望为人工智能领域的发展带来更多的可能性和机遇。

Stability AI官方公告

地址:http://stability.ai/news/stable-diffusion-3-medium

Hugging Face模型链接 

地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium

Diffuseum测试文档及试用方案

地址:https://wbe2qcwjls.feishu.cn/docx/ZGLcdZt7coQM1YxVmrpcBvb0nhb

更多AI行业信息请关注AITOP100平台资讯专区: https://www.aitop100.cn/infomation/index.html

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
相关AI工具
  • Stable Diffusion:AI图像生成系统
相关资讯
  • 语音AI大突破!TEN Agent开源两模型,延迟低到飞起

  • AI动画神器ManimML:用Transformer可视化解锁机器学习教学新姿势

  • Cursor手机版闪亮登场!开发者随时随地编程不是梦

  • 飞利浦新品来袭:8号Pro AI耳机开启多语言沟通新方式!

  • 谷歌宣布Gemini2.5Pro API在Google AI Studio平台上免费使用

热点资讯

高考志愿填报新宠:夸克“深度搜索”成考生“智囊团”

5天前
高考志愿填报新宠:夸克“深度搜索”成考生“智囊团”

高考志愿填报遇热潮,夸克紧急扩容应对“大堵车”

5天前
高考志愿填报遇热潮,夸克紧急扩容应对“大堵车”

豆包网页版入口 | 官方链接直达 - 3秒免费使用

1天前
豆包网页版入口 | 官方链接直达 - 3秒免费使用

谷歌宣布Gemini2.5Pro API在Google AI Studio平台上免费使用

1天前
谷歌宣布Gemini2.5Pro API在Google AI Studio平台上免费使用

豆包AI全面升级解析:1.6大模型+视频生成+语音播客,字节跳动AI新突破

7天前
豆包AI全面升级解析:1.6大模型+视频生成+语音播客,字节跳动AI新突破
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有