• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

腾讯发布混元文生图大模型:业界首个中文原生DiT架构,全面开源助力视觉生成技术发展

腾讯发布混元文生图大模型:业界首个中文原生DiT架构,全面开源助力视觉生成技术发展
AI TOP100
2024-06-09 20:13:37

腾讯混元文生图大模型近日,腾讯推出了其混元文生图大模型(HunyuanDiT),这是一个具有划时代意义的开源模型。该模型采用了业内首个中文原生DiT架构,于2024年5月14日全面升级并开源。此次开源,腾讯不仅提供了模型权重和推理代码,还包括了完整的模型算法,使得企业和个人开发者可以免费商用。

腾讯官方宣布,混元 DiT 模型已大幅简化使用流程,用户现在可以通过 ComfyUI 的可视化界面轻松利用腾讯的混元文生图模型。此外,混元 DiT 模型也已集成至 HuggingFaceDiffusers 的通用模型库,用户仅需编写三行代码即可实现对该模型的调用,无需再下载整个代码库。用户现在可以通过 ComfyUI 的可视化界面轻松利用腾讯的混元文生图模型混元文生图大模型采用了与Sora相同的DiT架构,即全新的Hunyuan-DiT架构。,这是一个创新的基于Diffusion Transformer的文本到图像生成模型,它具备了中英文的细粒度理解能力。在混元DiT的研发过程中,腾讯精心设计了Transformer架构、文本编码器和位置编码,以确保模型能够深入理解双语文本。腾讯团队还构建了一个全面的数据处理流程,用于不断地更新和评估数据,以支持模型的持续优化。为了提升对文本细节的理解,腾讯训练了一个多模态大型语言模型,专门用于优化图像生成中的文本描述。因此,混元DiT能够与用户进行多轮互动,根据对话内容生成并改进图像,提供更加精准和丰富的视觉体验。混元文生图大模型采用了与Sora相同的DiT架构,即全新的Hunyuan-DiT架构。在性能方面,混元文生图大模型在多个维度上进行了评估,结果显示其性能远超目前开源的Stable Diffusion模型,被认为是目前效果最好的开源文生图模型之一。它的整体能力属于国际领先水平。

此外,混元文生图大模型在算法层面实现了多轮生图和对话能力,能够在一张初始生成图片的基础上,通过自然语言描述进行调整。这个模型还特别擅长处理细粒度文本提示生成,例如在古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色。

腾讯此次选择将混元文生图模型全面开源,旨在与行业共享其在文生图领域的实践经验和研究成果,丰富中文文生图开源生态,共建下一代视觉生成开源生态,推动大模型行业的发展。基于腾讯开源的文生图模型,开发者和企业无需从头训练,即可直接用于推理,从而节约大量人力和算力。

随着混元文生图大模型的发布和开源,我们有理由相信,这将极大地推动视觉生成技术的发展,为各行各业带来更多的创新可能。

AITOP100平台资讯专区: https://www.aitop100.cn/infomation/index.html

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 腾讯元宝
相关资讯
  • 清华大学发布首个系统性《人工智能教育应用指导原则》:为AI教育应用划定清晰边界

  • 夸克AI浏览器“外挂级”体验来袭:系统底层集成,Chrome插件时代落幕?

  • 阿里千问视觉模型SpatialBench登顶,实力碾压GPT-5.1和Gemini 3.0 Pro!

  • 200亿漫剧赛道,AI漫剧与真人短剧差异大揭秘

  • 森马上线“大森3.0”平台:集成600余个AI助理,推动全员智能协作

热点资讯

谷歌NotebookLM迎来史诗级更新!PPT制作神器Slide Decks正式上线,效率起飞!

6天前
谷歌NotebookLM迎来史诗级更新!PPT制作神器Slide Decks正式上线,效率起飞!

谷歌发布全新AI原生集成开发环境(IDE)Google Antigravity以“代理优先”理念,实现多智能体并行开发

8天前
谷歌发布全新AI原生集成开发环境(IDE)Google Antigravity以“代理优先”理念,实现多智能体并行开发

中国好创意暨全国数字艺术设计大赛:即梦AI AIGC创作专项大赛

7天前
中国好创意暨全国数字艺术设计大赛:即梦AI AIGC创作专项大赛

重磅!谷歌Nano Banana Pro图像生成模型正式上线,Gemini3加持,4K画质惊艳!

6天前
重磅!谷歌Nano Banana Pro图像生成模型正式上线,Gemini3加持,4K画质惊艳!

Vidu Q2模型升级:图生视频支持64秒超长输出与画质增强

8天前
Vidu Q2模型升级:图生视频支持64秒超长输出与画质增强
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有