AITOP100平台获悉,3月25号消息,就昨儿晚上,DeepSeek在开源平台偷偷摸摸地放了个大招——升级版的DeepSeek - V3模型闪亮登场啦!这新模型叫DeepSeek - V3 - 0324,参数有6850亿呢,比之前的6710亿多了那么一丢丢。不过呢,DeepSeek还没把新版模型的系统卡放出来,咱现在也就只能眼巴巴地等着,没法知道更多关于这模型的事儿。
开源地址在这儿呢:DeepSeek-V3模型地址
还有啊,DeepSeek把DeepSeek - V3模型的开源协议也给换了,换成了和DeepSeek - R1一样的MIT协议。这协议可宽松多了,允许模型蒸馏,还能商用,给开发者们可算是松了绑,有了更多的自由。
新版DeepSeek - V3一上线,智东西就赶紧对它进行了全方位的测试,代码、数学、通用能力啥的都没落下,还盯着网友们的测试结果瞧呢。好多体验过这新模型的网友都说,升级后的DeepSeek - V3在代码和数学方面那性能提升得可不是一星半点。
有个海外的AI博主就讲啦,DeepSeek这下终于能在代码领域和Anthropic的Claude Sonnet 3.5掰掰手腕了。以前啊,Claude Sonnet 3.5在程序员圈子里那可是响当当的,不管别的模型在代码上表现得咋样,程序员们还是更喜欢用Claude系列的模型。
AITOP100平台测试的时候发现,新版DeepSeek - V3在网站开发能力和UI设计方面那进步简直绝了。就输入个“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词,嘿,2分钟就整出了一个400多行代码、设计得老精美的网站。这网站用了粒子背景动画、赛博朋克UI(霓虹光效、悬浮动画和科技感配色),标题还有打字机动画,按钮有光波扩散效果,老酷炫了。而且这网站还是响应式的,手机和桌面设备都能自动适配。
再看看旧版DeepSeek - V3,拿到同样的指令,解决方案才100多行代码,输出的效果在审美上和新版比起来,那差得可不是一点半点。
有网友就说,这次这“小更新”比他们想的可大多了,改进特别明显,尤其是在数学方面。智东西把之前把旧版DeepSeek - V3和DeepSeek - R1都难倒的一道数学题拿给新版DeepSeek - V3做。这次啊,DeepSeek - V3输出的token比原版多了好多,单次输出都到上限了,点了继续生成,它接着思考,不过答案还是错的。
不过呢,从这错答案里也能看出点新变化。现在的DeepSeek-V3模型给出最终答案后,还会反思反思,改改自己的解题过程。
在AITOP100之前测试的文科类问题上,新版DeepSeek - V3的答案也更全面了。就拿“布须曼人喝不喝牛奶?”这个问题来说,旧版DeepSeek - V3就回了三小段话,没啥信息量。
新版DeepSeek - V3呢,用了更结构化的回答方式,分析得更全面,还补充了好多背景信息,生成速度也挺快。
这也应了部分网友说的,新版DeepSeek - V3就像是V3和R1的结合体,更喜欢用长输出来解决问题。
新版DeepSeek - V3一发布,好多网友就开始琢磨了:新版V3都来了,R2和V4还会远吗?