DeepSeek引爆AI市场:崛起与挑战并存
今年以来,DeepSeek的横空出世,在投资界和资本市场引起了巨大的震动。
DeepSeek于2月21日在社交平台X上宣布,已组建一支探索AGI(通用人工智能)的小型团队,并将从下周开始开源五个代码库,以完全透明的方式分享其研究进展。
此前,有外媒报道DeepSeek正考虑进行首次外部融资,以满足不断增长的算力需求,但DeepSeek已否认该消息。另有传言称,阿里巴巴曾计划以100亿美元的估值投资DeepSeek,认购10%的股权,但阿里副总裁颜乔已公开辟谣。
尽管如此,今年以来,多家头部企业和投资机构都曾与DeepSeek接触。但DeepSeek背后拥有雄厚的资金支持,似乎并不急于融资。
那么,DeepSeek究竟有多强大?谁又将从中受益?
DeepSeek的技术实力
今年春节期间,DeepSeek发布了开源模型DeepSeek-R1,凭借强大的推理能力和极高的性价比迅速席卷全球,引起了业内外人士的广泛关注。
DeepSeek到底有多受欢迎?在苹果App Store中国区应用商店,DeepSeek一度荣登免费榜榜首,甚至在美国市场超越了ChatGPT、Meta旗下的社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技巨头的生成式AI产品。据统计,DeepSeek还在全球140个市场的应用商店下载榜上强势夺冠,成为全球用户追捧的对象。这一成绩充分体现了用户市场对DeepSeek的高度认可,也证明了其在全球人工智能市场上迅速崛起并占据了一席之地。
在DeepSeek之前,OpenAI开发的ChatGPT是全球AI行业内最引人注目的焦点。自2024年9月OpenAI发布o1-preview以来,市场上掀起了一股追赶浪潮,涌现出了许多性能可与之媲美甚至超越的推理模型。
DeepSeek之所以能够脱颖而出,关键在于它不仅率先达到了Open AI - o1模型的效果,而且将推理模型的成本压缩到了极低的水平。
具体来说,DeepSeek-R1的技术突破在于,采用纯深度学习的方法让AI自发涌现出推理能力。据DeepSeek官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有少量标注数据的情况下,极大地提升了模型的推理能力。在数学、代码、自然语言推理等任务上,其测评性能与OpenAI开发的GPT-o1模型正式版接近。o1模型首次实现了真正的通用推理能力,甚至在“博士级别”的科学问答环节中超越了人类专家。
DeepSeek R1的实力有多强?有测试者通过常用的碰撞检测来验证,要求大模型编写一个程序,使一颗小球在某个缓慢旋转的几何形状内弹跳,并保持小球停留在形状内。碰撞检测对模型的推理能力要求极高,稍有不慎就会导致出现肉眼可见的物理错误。测试结果表明,R1的表现明显优于OpenAI o1pro模式。
除了性能强大之外,R1的另一大优势在于其超高的性价比。据了解,DeepSeek-R1模型的训练成本仅为560万美元,远低于美国科技巨头在人工智能技术上动辄数亿甚至数十亿美元的投入,例如ChatGPT-4的训练成本高达1亿美元以上。另据技术报告显示,R1面向开发者的服务定价为每百万token(输入字符串)1—4元,仅为o1的1/30左右。
值得一提的是,DeepSeek采用了完全开源的策略,这不仅降低了用户的使用门槛,还吸引了大量开发者和研究人员的关注,进一步促进了AI开发者社区的协作生态繁荣,推动了AI技术的发展。
此前,OpenAI也曾表达了希望以最有可能造福全人类的方式推进数字智能发展,而不受产生财务回报需求的限制。但OpenAI的开源策略只坚持到了GPT-3发布之前,GPT-4发布之后更是隐藏了其训练数据和模型权重,逐渐走向封闭。
英伟达高级研究科学家JimFan在其个人社交平台表示,“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。”
DeepSeek这股“神秘的东方力量”让二级市场开始对美国科技行业的竞争力产生质疑,受此冲击,美国芯片巨头英伟达股价一度暴跌17%。
DeepSeek的母公司深度求索成立于2023年7月17日,由著名量化私募幻方基金支持,资金实力雄厚,这也为其不以盈利为目的持续深挖技术提供了坚实支持。
早在2024年5月7日,深度求索发布的DeepSeek-V2也采用了开源模式,一经发布便成为开源模型中中文综合能力(AlignBench)最强的代表,并在测评中与 GPT-4-Turbo、文心 4.0 等闭源模型并列;英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B;在知识、数学、推理、编程等榜单中名列前茅。
此外,其API价格只有 GPT-4o 的 2.7%,进一步激化了国内大模型的价格战。在此后一周,字节、阿里、百度、腾讯先后宣布降价。
2024年底,DeepSeek-V3发布,在知识类任务、长文本理解、编程和数学运算等领域,其性能接近甚至超越了国际顶尖的闭源模型,如GPT-4o和Claude-3.5-Sonnet。
谁在拥抱DeepSeek?
在DeepSeek浪潮下,据不完全统计,目前已有超过200家企业宣布接入DeepSeek,涵盖了基础电信企业、云计算、芯片、金融、汽车、手机等多个领域。其中包括华为、阿里、百度、腾讯、京东等多家云平台宣布接入DeepSeek大模型,约20家车企宣布在智舱场景或AI运营领域完成与DeepSeek的深度融合。此外,多家券商、银行、公募基金也表示已接入DeepSeek大模型。
事实上,国内大厂此前已经在自研AI大模型战略上有所布局,而现在主力APP接入第三方大模型服务,可以看作是国内大厂的一次战略转变,也是对企业未来的押注。
腾讯在最近一次灰度测试中上线了基于DeepSeek-R1的“AI搜索”功能,被看作是其积极拥抱AI的策略,紧接着又在腾讯地图、 QQ音乐、腾讯文档等产品中快速接入了DeepSeek。
紧接着百度搜索也跟进了DeepSeek。在宣布接入DeepSeek之前,百度已经改变了大模型发展路线,先是宣布全部免费使用,接着改变闭源策略,开始拥抱开源路线,并宣布推出文心大模型4.5系列。
当前几家互联网大厂中,字节对于拥抱接入DeepSeek的态度较为谨慎,目前只有飞书官宣上线了DeepSeek系列模型,但入口也较为隐蔽。
值得肯定的是,DeepSeek的开源生态极大加速了AI场景的落地进程,推动AI行业从硬件设施向软件应用层的进一步转变。大厂云服务率先接入DeepSeek,正是源于DeepSeek带来的空前热度和极低的成本优势,有望成为打破市场价格战的突破口,进一步巩固现有的市场地位。
DeepSeek有多强? 随着DeepSeek的爆火,大量流量涌入,导致DeepSeek官网偶尔会出现卡顿现象。
与其他大模型语言产品相比,DeepSeek在用户端展现了详尽的思考过程。
如何有效地利用AI大模型,使其成为提高工作效率的工具,也是一门学问。有网友总结出了一套规律,认为成为AI的领导者,就会像真正的领导一样面临用人的困境。
例如,“一个聪明但不干活的deepseek,一个愚蠢但很勤劳的豆包,一个水平中等但不提供情绪价值的kimi,以及一个海外留学但费用高昂的chatGPT。”
还有网友细心地总结道,需要运用一些管理技巧。首先使用聪明的deepseek制定策略(只有一次机会,需要珍惜),然后使用勤劳的豆包填充内容(可以无限次输出),kimi可以用于赛马,对比kimi和豆包的方案并择优,涉及海外的信息可以使用chatGPT进行核实。
但需要注意的是,这些AI都可能欺骗你,如果不认真分辨,很容易被误导。
DeepSeek的商业化前景与隐忧
随着DeepSeek的爆火,已经有一部分人从中获利。
在社交媒体平台上,一些人分享普通人如何通过DeepSeek搞副业、做自媒体创业,并收取学费,常用的宣传语包括“低门槛创业”、“爆款易出”以及“2025年最大的变现风口”等。
有博主表示,相关社群在4天内吸引了4000人付费加入,收入近20万元。
小红书上#deepseek话题的浏览量达到8.2亿次,讨论量526.3万;在抖音上,#deepseek话题的播放量达到114.6亿次。
有义乌的老板娘利用DeepSeek+AI做跨国生意,只需对着镜头说“12345”,就能生成几十种语言的视频。
有网友跟着DeepSeek买彩票中奖,也有人试图通过它来预测接下来一年的运势。
小红书用户@Yapie程序员哥 使用deepseek创作的歌曲《七天爱人》在网易云音乐上爆火,自2月11日至17日0时,该歌曲的有效播放量为18.6万,收藏量达9555,评论量为1769。这首歌也为他带来了日均150元的收益。
值得注意的是,随着DeepSeek的爆火,一些风险和挑战也逐渐显现出来。
一方面是数据泄露风险,网络攻击可能导致DeepSeek的用户数据、技术数据等被窃取。一旦发生数据泄露,不仅会损害用户的利益,还会使DeepSeek面临法律责任和声誉损失,甚至可能被竞争对手利用来获取商业利益。
另一方面,DeepSeek作为一家初创AI公司,其内部人才面临着来自国内阿里、百度、腾讯等大厂以及美国硅谷大厂的挖角风险。
此外,还存在来自美国政府的压力。美国以“国家安全”为由对DeepSeek展开调查,其背后是试图维护自身在AI领域的霸权地位。未来可能会出台更多针对DeepSeek的政策限制,甚至可能会联合其他国家对其进行联合打压,限制其在全球市场的发展。
最重要的是,尽管AI大模型蓬勃发展,但至今仍未看到大规模商业化落地的前景。在价格战的内卷之下,如何收回上亿研发成本仍需持续观察。