• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

下一个token预测的技术:智源Emu3模型发布,革新图像、文本、视频多模态AI技术

下一个token预测的技术:智源Emu3模型发布,革新图像、文本、视频多模态AI技术
AI TOP100
2024-10-22 11:16:16

智源研究院

在人工智能技术的飞速发展中,多模态AI模型作为连接数字世界与物理世界的重要桥梁,正受到越来越多的关注。2024年10月21日,北京智源研究院宣布推出Emu3,一款原生多模态世界模型,它通过单一的基于下一个token预测的技术架构,实现了文本、图像、视频三种模态数据的统一理解和生成。

智源Emu3模型发布,革新图像、文本、视频多模态AI技术

Emu3模型的核心特点

  1. 统一的多模态处理能力: Emu3模型无需依赖于扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。这种统一的架构,极大提升了模型的灵活性与效率 。
  2. 强大的视觉Tokenizer: Emu3提供了一个强大的视觉Tokenizer,能够将视频和图像转换为离散token,这些视觉离散token可以与文本tokenizer输出的离散token一起送入模型中,为Any-to-Any的任务提供了更加统一的研究范式 。
  3. 卓越的性能表现: 在图像生成、视频生成、视觉语言理解等任务中,Emu3的表现超过了SDXL、LLaVA、OpenSora等知名开源模型。在图像生成任务中,基于人类偏好评测,Emu3优于SD-1.5与SDXL模型。在视觉语言理解任务中,对于12项基准测试的平均得分,Emu3优于LlaVA-1.6。在视频生成任务中,对于VBench基准测试得分,Emu3优于OpenSora 1.2 。
  4. 直接偏好优化(DPO): 受益于Emu3下一个token预测框架的灵活性,直接偏好优化(DPO)可无缝应用于自回归视觉生成,使模型与人类偏好保持一致 。


应用场景

  • 内容创作: 艺术家和设计师可以利用Emu3根据文本描述自动生成图像和视频,快速实现创意。
  • 教育: Emu3将复杂概念可视化,增强学生的学习体验。
  • 娱乐产业: 游戏和电影制作可以借助Emu3创造逼真的虚拟环境。
  • 设计和建筑: 设计师可以利用Emu3生成设计原型和建筑渲染图,提高设计效率。

Emu3,智源研究院

Emu3 为多模态 AI 指出了一条富有想象力的方向,有机会将 AI 基础设施收敛到单一技术路线上,为大规模的多模态训练和推理提供基础。统一的多模态世界模型未来有广泛的潜在应用,包括自动驾驶、机器人大脑、智能眼镜助手、多模态对话和推理等。预测下一个 token 有可能通往 AGI。


想了解更多AI行业资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
相关资讯
  • 腾讯混元Hunyuan-A13B模型API上线:AI开发新利器来袭

  • 墨刀AI正式上线:30秒让灵感秒变高保真可编辑原型!

  • 告别Manus!智谱AI Slides上线,免费无限制生成精美PPT

  • Vega AI停运公告解读:用户必知的后续安排与新动向

  • 重磅发布!Kimi首个Agent"深度研究"正式开启内测,AI研究助手新时代来临

热点资讯

夸克AI助力高考志愿填报,4000万考生家长的靠谱之选

4天前
夸克AI助力高考志愿填报,4000万考生家长的靠谱之选

豆包AI重磅更新:六大核心功能全面升级,开启智能办公新纪元

5天前
豆包AI重磅更新:六大核心功能全面升级,开启智能办公新纪元

Grok 4即将发布:马斯克xAI最新AI模型全面解析

4天前
Grok 4即将发布:马斯克xAI最新AI模型全面解析

AIGC大赛:北京动画周48小时AIGC原创动画挑战赛,邀您共赴创意盛宴!

2天前
AIGC大赛:北京动画周48小时AIGC原创动画挑战赛,邀您共赴创意盛宴!

AIGC大赛:2025新疆文旅AIGC宣传片创作大赛全球征片中

3天前
AIGC大赛:2025新疆文旅AIGC宣传片创作大赛全球征片中
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有