• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

大模型竞争白热化:豆包推UltraMem降本增效,字节跳动或接入DeepSeek?

大模型竞争白热化:豆包推UltraMem降本增效,字节跳动或接入DeepSeek?
AI TOP100
2025-02-13 15:29:10

大模型领域竞争加剧:豆包面临压力

近期,国内外大模型领域的竞争日趋激烈,已进入白热化阶段。字节跳动旗下的豆包大模型正面临着来自DeepSeek等强劲对手的挑战。豆包团队正在积极寻求突破,在AI基础层和应用层上均进行了全面布局,并持续迭代升级。

豆包推出UltraMem架构,力求降本增效

针对大模型推理成本高昂的问题,豆包大模型团队推出了全新的稀疏模型架构UltraMem。该架构旨在有效解决MoE(混合专家)架构推理时高额的访存问题,从而提升推理速度并降低推理成本。

根据豆包团队的研究,在Transformer架构下,模型性能与参数数量和计算复杂度呈对数关系。随着模型规模的扩大,推理成本会急剧增加,速度变慢。UltraMem通过解耦计算和参数,在保证模型效果的前提下,解决了推理的访存问题。

实验结果表明,在参数和激活条件相同的情况下,UltraMem在模型效果上超越了MoE,并将推理速度提升了2-6倍。此外,在常见batch size规模下,UltraMem的访存成本几乎与同计算量的Dense模型相当。

岩芯数智CEO刘凡平认为,降低大模型成本的关键在于技术和工程层面的突破,实现架构优化的“弯道超车”。他强调,新的架构研究至关重要,同时反向传播算法等基础算法也可能是深度学习的瓶颈。

DeepSeek异军突起,豆包面临挑战

DeepSeek以其低廉的训练成本和高效的运算效率迅速火爆,成为AI领域的黑马。数据显示,DeepSeek的日活跃用户数已突破4000万,成为中国移动互联网历史上快速崛起的应用之一。

为了应对挑战,豆包大模型团队连续发力,发布了视频生成实验模型“VideoWorld”。与Sora等主流多模态模型不同,VideoWorld在业界首次实现无需依赖语言模型即可认知世界。

豆包的AI产品矩阵涵盖多个领域,包括AI聊天助手豆包、猫箱、即梦AI、星绘、豆包MarsCode等。

中信证券研报认为,豆包AI的生态扩张将引发新一轮巨头的技术投资周期,拥有强网络效应和规模效应的头部AI应用将逐渐加强其竞争优势。

字节跳动内部讨论是否接入DeepSeek

作为一个开源模型,DeepSeek的低成本和高性能正在改变不少公司的模型选择策略。目前,华为、百度等公司的AI应用都宣布了接入DeepSeek。甚至字节跳动旗下的飞书和火山引擎也做了适配。

据记者了解,豆包团队内部也在讨论豆包App是否要接入DeepSeek。选择效果更优的模型固然重要,但放弃自家模型选择友商,也面临着股东压力以及新增模型带来的适配负担等问题。

因此,豆包在大模型领域的竞争,才刚刚开始。

豆包AI工具地址:【点击登录】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 豆包AI官网
  • 豆包AI视频模型
  • 豆包MarsCode
相关资讯
  • 阿里通义7款模型横扫Hugging Face,Qwen3-Omni凭什么登顶全球第一?

  • 2025年9月28日爆火!商汤Seko上线1个月吸粉10万,AI视频创作进入“傻瓜式”时代

  • 快手推出双模编程模型:开源KAT-Dev-32B与闭源KAT-Coder性能领先

  • 腾讯发布混元图像3.0:开源免费,支持文字、图片、视频、音频多模态生图

  • 国际数据公司(IDC)最新发布:2029年全球AI投资或将突破1.2万亿美元

热点资讯

字节跳动豆包翻译大模型上线:28种语言秒译,性能碾压GPT-4o,价格直接打“骨折”?

7天前
字节跳动豆包翻译大模型上线:28种语言秒译,性能碾压GPT-4o,价格直接打“骨折”?

万兴天幕AI×大艺博Online「艺想天开 兴海无垠」AI艺术创作大赛

5天前
万兴天幕AI×大艺博Online「艺想天开 兴海无垠」AI艺术创作大赛

阿里夸克重磅推出AI创作平台“造点”:AI生图+视频生成全免费,Midjourney V7+通义万相Wan2.5双引擎加持

5天前
阿里夸克重磅推出AI创作平台“造点”:AI生图+视频生成全免费,Midjourney V7+通义万相Wan2.5双引擎加持

Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

5天前
Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

2025年9月25日重磅:Meta上线320亿参数代码模型CWM,AI写代码竟能"先试后做"?

4天前
2025年9月25日重磅:Meta上线320亿参数代码模型CWM,AI写代码竟能"先试后做"?
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有