• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

炸裂!DeepSeek-V3-0324偷偷上线,免费商用,自家电脑也能跑!

炸裂!DeepSeek-V3-0324偷偷上线,免费商用,自家电脑也能跑!
AI TOP100
2025-03-25 09:25:29

昨晚,DeepSeek偷偷搞了个大动作,发布了它最新的大型语言模型DeepSeek-V3-0324,这消息在人工智能圈子里一下子就炸开了锅!这个容量高达641GB的大家伙,悄咪咪地出现在了AI模型库Hugging Face上,事先一点儿风声都没透,还是延续了他们家那低调但超有影响力的发布风格。

性能飙升,能和Claude Sonnet3.5掰手腕

DeepSeek-V3- 0324一发布就这么受关注,可不只是因为它功能强大,它的部署方式和许可协议也很牛。早期测试的人都说,新模型在各项指标上都有了质的飞跃。

AI研究员Xeophon在X平台上就说了,DeepSeek V3在他们内部测试的时候,“所有测试的所有指标都有了巨大飞跃”,还说它现在是“最好的非推理模型,把Sonnet3.5都给比下去了”。要是这说法能得到更广泛的认可,那DeepSeek的新模型可就超越Anthropic那备受尊敬的商业AI系统Claude Sonnet3.5啦!

DeepSeek-V3

开源商用,打破付费门槛

和需要订阅才能用的Sonnet不一样,DeepSeek - V3 - 0324的模型权重是完全免费的,谁都能下载来用。

更厉害的是,这模型用的是MIT许可证,这就意味着它能随便用于商业用途。这和西方那些AI公司把模型藏在付费墙后面的做法比起来,那可真是天壤之别。

MoE架构,两大突破让效率飞起

DeepSeek V3 - 0324那突破性的架构,效率简直无敌了。它用了混合专家(MoE)架构,这可把大型语言模型的运行方式给彻底改变了。传统模型做每个任务的时候,所有参数都得激活,可DeepSeek的办法是,在特定任务里只激活6850亿参数里的约370亿个。这种有选择地激活参数,让模型效率有了巨大提升,计算需求大大降低了,性能还能和更大的完全激活模型差不多。

而且啊,这模型还用了两项超厉害的技术:多头潜在注意力(MLA)和多令牌预测(MTP)。MLA让模型在长文本里保持上下文的能力更强了,MTP呢,能每步生成多个令牌,不像以前一次只能生成一个。这些创新一起发力,把输出速度提高了将近80%呢!

DeepSeek-V3

硬件友好,消费级设备也能玩

开发者工具创建者Simon Willison在一篇博客文章里说,一个4位量化版本把存储占用降到了352GB,这就让在高端消费级硬件(比如配了M3Ultra芯片的Mac Studio)上运行成为可能。

AI研究员Awni Hannun在社交媒体上写道:“新的DeepSeek - V3 - 0324在配了mlx - lm的512GB M3Ultra上以>20个tokens/秒的速度运行!”虽说9499美元的Mac Studio可能超出了“消费级硬件”的范围,但在本地能运行这么大的模型,和通常需要数据中心级AI基础设施的最新AI比起来,那可太不一样了。

Mac Studio在推理的时候功耗不到200瓦,而传统的AI基础设施一般得靠好几个消耗数千瓦功率的Nvidia GPU。

风格转变,更偏技术范儿

早期用的人说,新模型的沟通风格有了明显的变化。以前的DeepSeek模型因为对话式、类似人类的语调受到表扬,可“V3 - 0324”变得更正式、更注重技术了。

有些用户在Reddit上说了这种变化,觉得新版本听起来“不那么像人类”,没了以前版本“像人类一样的语调”。这种转变可能是DeepSeek工程师故意这么设计的,想把模型重新定位到更专业、更技术性的应用上。

DeepSeek的发布策略体现了中国和西方公司在AI商业理念上的根本差别。美国那些领头羊,像OpenAI和Anthropic,把模型藏在付费墙后面,可中国AI公司越来越倾向于用宽松的开源许可。

这种开放性正快速改变着中国的AI生态系统,让初创公司、研究人员和开发者能在先进的AI技术上搞创新,还不用花大量的钱。百度、阿里巴巴和腾讯这些中国科技巨头也都纷纷推出或者打算推出开源AI模型。在获取尖端Nvidia芯片受限的情况下,中国公司更重视效率和优化,这反而成了一种潜在的优势。

DeepSeek - V3 - 0324的发布也被认为是它下一代推理模型DeepSeek - R2的基础。

考虑到Nvidia首席执行官黄仁勋最近说DeepSeek的R1模型“比非推理AI消耗多100倍的计算量”,DeepSeek在资源有限的情况下还能取得这么好的性能,真是太牛了。

要是DeepSeek - R2能延续R1的发展轨迹,那说不定能对OpenAI传闻中即将发布的GPT - 5构成直接挑战。DeepSeek这种开放、资源高效的战略和OpenAI封闭、资金雄厚的战略,代表了人工智能未来的两种不同愿景。

现在,用户能在Hugging Face下载完整的模型权重,也能通过OpenRouter等平台体验DeepSeek - V3 - 0324的API接口。DeepSeek自己的聊天界面可能也更新到新版本了。DeepSeek的开放战略正在重新定义全球AI格局,预示着一个更开放、更普及的AI创新时代要来了。

想了解更多AI创作软件工具请点击AI人工智能网站--AITOP100平台--AI工具集

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • DeepSeek-V3-0324
  • DeepSeek‌
相关资讯
  • 即梦AI正式上线火山引擎:企业级AI创意工具开放API,三折优惠助力「创意生产线」

  • 小白也能做!用Nano Banana秒出专属手办图,免费教程附提示词模板

  • Nano Banana出图比例自由了!最新的「垫图大法」解决此类问题

  • ElevenLabs音效模型V2重磅升级:长片段、无缝循环与高保真音频

  • 腾讯混元Voyager世界模型正式开源:业界首个支持原生3D重建的超长漫游AI模型

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

6天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

8天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

5天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

6天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互

2天前
阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有