• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

DeepSeek 引爆 AI 革命:低成本模型挑战巨头,国产 AI 崛起新篇章

DeepSeek 引爆 AI 革命:低成本模型挑战巨头,国产 AI 崛起新篇章
AI TOP100
2025-01-29 09:30:44

AI 的浪潮已悄然来临,今年的春节,最引人注目的不再是传统互联网的红包大战,而是 AI 公司的技术突破。

在春节临近之际,各大 AI 模型公司纷纷推出更新的模型和产品,其中最受瞩目的便是去年崭露头角的 DeepSeek(深度求索)。

DeepSeek下载地址》》》

DeepSeek-R1:低成本高性能引发行业地震

1月20日晚,DeepSeek 公司发布了推理模型 DeepSeek-R1 正式版。令人震惊的是,该模型以极低的训练成本,实现了不输 OpenAI 推理模型 o1 的性能,并且完全免费开源,直接引发了行业地震。这是国产 AI 首次在全球,特别是美国科技圈引起如此大的震动。开发者纷纷表示,正在考虑使用 DeepSeek 进行“重构”,这一浪潮下,DeepSeek 的移动端应用迅速登顶美区苹果应用商店免费 App 排行第一,超越了 ChatGPT 以及其他热门应用。

DeepSeek 的成功甚至影响了美股,它在没有使用巨量昂贵 GPU 的情况下训练出的模型,让人们重新思考 AI 的训练路径,直接导致 AI 芯片巨头英伟达股价一度下跌 17%。

Janus-Pro:多模态模型再掀波澜

1 月 28 日凌晨,除夕夜前一晚,DeepSeek 又开源了其多模态模型 Janus-Pro-7B,宣布在 GenEval 和 DPG-Bench 基准测试中击败了 DALL-E 3 和 Stable Diffusion。DeepSeek 似乎真的要“血洗” AI 圈,从推理模型到多模态模型,用 DeepSeek “重构一切” 成为蛇年开年的第一主题。

Janus Pro 的创新架构

DeepSeek 这次深夜发布了两个模型,Janus-Pro-7B 和 Janus-Pro-1B (15 亿参数)。这两个模型均是对 2024 年 10 月发布的 Janus 模型的升级。Janus 模型采用了创新的架构,将视觉编码进行解耦,分别编码特征,然后用同一个 Transformer 处理输入信号,提升了模型训练的灵活性,有效缓解了单一视觉编码导致的冲突和性能瓶颈。

Janus 模型指令跟随能力强,有多语言能力,能够理解 meme 图像,并能处理 latex 公式转换和图转代码等任务。而 Janus Pro 系列模型则通过对训练流程的改进,直接在基准测试中击败了 DALL-E 3 和 Stable Diffusion。

同时发布的还有 Janus Flow 新型多模态 AI 框架,旨在统一图像理解与生成任务。Janus Pro 模型能够使用简短提示提供更稳定的输出,具有更好的视觉质量、更丰富的细节以及生成简单文本的能力。它既可以生成图像,也可以对图片进行描述,识别地标景点、图像中的文字,甚至对图像中的知识进行介绍。

许多用户已经在社交媒体上试用了新模型,并分享了测试结果,例如图像识别和生成。

Janus Pro 在高精度读图方面表现出色,能够识别数学表达式和文字的混合排版,这为未来搭配推理模型使用提供了更大的可能性。

小参数量解锁新应用场景

在多模态理解任务中,Janus-Pro 采用 SigLIP-L 作为视觉编码器,支持 384 x 384 像素的图像输入。而在图像生成任务中,则使用一个来自特定来源的分词器。尽管图像规模尺寸仍然较小,但其创新意义不容忽视。

Janus Pro 的大尺寸模型只有 70 亿参数,而对比的 DALL-E 3 则有 120 亿参数。更令人惊喜的是,Janus Pro 的 1B 模型只有 15 亿参数,外网已经有用户将其添加到了 transformers.js,这意味着模型可以在 WebGPU 上的浏览器中 100% 运行。

虽然目前笔者尚未成功在网页版上使用 Janus Pro 的新模型,但参数量小到可以在网页端直接运行,仍然是一项令人惊叹的进步。这意味着图片生成/图片理解的成本正在进一步下降,我们有机会在更多地方看到 AI 的应用,改变我们的生活。

2024 年的一大热点是多模态 AI 硬件如何介入我们的生活,而参数量越来越低的多模态模型,或许将推动 AI 硬件的进一步爆发。

DeepSeek 搅动新年

去年春节前后,OpenAI 的 Sora 模型曾搅动世界,而一年下来,中国公司已经在视频生成方面迎头赶上。今年,DeepSeek 则成为搅动世界的新力量。DeepSeek 并非传统的科技公司,但其以远低于美国大模型公司的成本,做出了创新模型,让美国同行感到震动。

DeepSeek 使用 560 万美元的训练成本就“破解”了 OpenAI 的推理模型,这引发了美国科技公司的巨大压力。OpenAI 首席执行官 Sam Altman 也不得不出来回应。

2025 年,会是中国 AI 冲击美国认知的一年吗?DeepSeek,手中还藏着什么秘密?这注定是一个不平凡的春节。

极客一问

今天你 DeepSeek 了吗?

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • MiniMax 2.7开源落地:从“小龙虾”插件到全功能开发助手

  • 阿里千问单日破万亿Token!OpenRouter榜首被中国模型霸占了?

  • 中国AI大模型全面突围:连续五周超越美国的深层逻辑

  • 谷歌Gemma 4震撼发布:3.8亿参数逆袭20倍巨头,AI终将装进你的口袋

  • 腾讯探梦DreamNow:从工具到平台,重构互动影游生产与消费

热点资讯

美团开源LongCat-AudioDiT:首创波形潜空间建模,刷新音色克隆SOTA

5天前
美团开源LongCat-AudioDiT:首创波形潜空间建模,刷新音色克隆SOTA

中国广电联合会演员委员会严正声明:AI换脸、声纹克隆侵权行为将被全面追责

4天前
中国广电联合会演员委员会严正声明:AI换脸、声纹克隆侵权行为将被全面追责

字节Seedance 2.0全面开放API:多模态视频生成进入"生产级"时代

5天前
字节Seedance 2.0全面开放API:多模态视频生成进入"生产级"时代

豆包日均Token破120万亿:国产大模型调用量首超海外,AI进入应用爆发期

5天前
豆包日均Token破120万亿:国产大模型调用量首超海外,AI进入应用爆发期

全国医保影像AI识图大赛:开启智慧医疗新征程,共筑健康中国新未来

4天前
全国医保影像AI识图大赛:开启智慧医疗新征程,共筑健康中国新未来
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有