DeepSeek V3迎来重大升级
DeepSeek V3迎来了更新,版本号升级至V3-0324。 尽管官方谦虚地称其为“小版本升级”,但实际测试结果显示,这次的提升绝非小幅改进。
例如,在小球弹跳测试中,DeepSeek V3-0324能够轻松应对四维空间超立方体的复杂场景,难度大幅提升。
如果这仅仅是一个小更新,很难想象未来的大更新会带来怎样的惊喜。
在编程方面,DeepSeek V3-0324仅需一句提示词,即可生成一个完整的响应式产品着陆页,包含自适应布局和动态效果,其能力被认为与Claude 3.7 Sonnet不相上下。
由于发布时间较短,目前尚未有全面的评测结果出炉。不过,开发者Xeophon的个人Benchmark显示,DeepSeek V3-0324在所有指标上均有显著提升,成为该测试中表现最佳的非推理模型。
非推理模型也拥有“啊哈时刻”
DeepSeek-V3-0324虽然不是推理模型,不会在回答问题前展示思考过程,但仍然遵循一定的逻辑思维来分解问题。
更令人惊喜的是,当陷入僵局时,它能够自主地回到上一步重新思考。
在解决了“9.11和9.9哪个大”、“Strawberry有多少个r”等基础问题后,开发者们开始尝试用更复杂的难题来考验AI,例如“如何让7米长的甘蔗通过2米高、1米宽的门”。
在量子位的测试中,DeepSeek-V3-0324最初也和其他AI一样遇到了困难。
但在碰壁之后,它开始重新审视题目本身的含义。虽然中间仍然出现了一些偏差,但在中文解题的过程中,突然穿插了一句英文思考,这与DeepSeek-R1技术报告中提到的“啊哈时刻”非常相似。
等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。
经过顿悟,DeepSeek-V3-0324最终找到了正确的方向,注意到了题目中隐藏的条件。
虽然从计算过程来看,它可能没有完全理解问题的本质,但至少给出了可行的解决方案,并意识到了自身的不足。
依旧免费,依旧开源
这样强大的模型依然保持免费和开源的策略,其权重文件已迅速上线HuggingFace,并采用最宽松的MIT协议。
所有权重文件总计约688GB,与初代v3保持一致,这表明它仍然是一个拥有671B参数的MoE模型。关于更多技术细节,还需要等待官方的进一步公告。
目前,用户可以通过DeepSeek官网、官方APP(关闭深度思考模式)以及HuggingFace等渠道体验v3-0324。
用户还可以将其上传到大模型竞技场,与其他模型进行PK,不过投票结果需要等待一段时间才能公布。
最令人期待的莫过于,在v3更新之后,R2还会远吗?
体验地址:
DeepSeek官网和HuggingFace