DeepSeek“爆红”背后的机遇与挑战
DeepSeek 近期热度持续攀升,但随之而来的“服务繁忙”问题也日益严峻。深度思考和联网搜索模式经常出现“服务器繁忙,请稍后重试”的提示,严重影响用户体验。
越来越多用户因为DeepSeek服务不稳定而转向接入DeepSeek模型的其他平台。
包括阿里云、腾讯云、火山引擎、百度云等云厂商,以及三大运营商云,众多国产AI芯片公司如壁仞科技、海光信息、摩尔线程、沐曦等,纷纷宣布接入DeepSeek模型。甚至,新能源汽车和智能手机厂商也纷纷加入。
DeepSeek的爆红带来了巨大的流量,各厂商都希望借助DeepSeek模型分一杯羹。
QuestMobile数据显示,DeepSeek日活跃用户(DAU)在1月28日首次超过豆包,2月1日突破3000万,成为国内DAU最高的AI对话产品,仅用了短短20天。
DeepSeek如果想进一步扩张,除了需要算力合作伙伴的支持,更需要具备C端、B端和G端落地经验的盟友。
科大讯飞:DeepSeek的最佳合作伙伴?
科大讯飞凭借其在C端、B端和G端的丰富落地经验,成为接入DeepSeek的又一家重要AI厂商。
2月10日,科大讯飞宣布全面接入DeepSeek全系大模型,包括“满血版”DeepSeek-V3、DeepSeek-R1等。与其他平台仅提供API接入不同,科大讯飞率先推出DeepSeek大模型精调服务。
通过讯飞开放平台,开发者可以根据自身行业场景,对DeepSeek进行行业数据训练,完成从应用开发到对接底层大模型的全流程。即使不对模型进行复杂修改,开发者也能以低成本的方式,快速定制专属的DeepSeek模型。
精调服务是AI应用落地的关键。科大讯飞此举体现了其对AI应用落地需求的深刻理解。
服务好开发者是赢得大模型竞争的关键,开发者是当前大模型落地应用的桥梁。
根据IDC报告,科大讯飞在大模型开发者规模方面已处于国内领先地位,拥有超过812万开发者团队,大模型直接相关的开发者数量超过109.3万。这使其成为国内大模型规模化落地应用的最有力竞争者。
AI落地一直是科大讯飞的优势,其应用覆盖工业、教育、医疗、金融、智慧城市等众多行业。DeepSeek的加入,为科大讯飞在服务政企客户、外部开发者和C端消费者方面提供了更大的空间。
通过接入DeepSeek,科大讯飞不仅能服务央国企客户,还能吸引那些因成本问题犹豫不决的中小企业。首发的精调服务满足了开发者与企业定制个性化DeepSeek模型的需求,从而实现效果、效率与成本的平衡。
目前,DeepSeek尚未支持文生图和语音输入等多模态功能。能够提供DeepSeek不具备的多模态能力的AI厂商,无疑将吸引更多开发者和用户,构建更丰富的大模型生态。
科大讯飞自主研发的讯飞星火APP,支持文字输入、图片生成、语音交互等多模态能力。讯飞星火在过去一年完成了五次迭代升级,最新模型讯飞星火4.0 Turbo在七大能力上超越GPT-4 Turbo,代码能力和数学能力超越 GPT-4o。
整合DeepSeek开源模型与讯飞自身优势技术,科大讯飞有望构建具备多模态能力的全新版本DeepSeek,激活新的竞争优势。
政企市场:大模型竞争的新战场
DeepSeek的低成本大模型训练策略,一度引发算力需求暴跌的担忧。但微软等科技巨头依然保持乐观。
微软CEO纳德拉表示,AI效率的提升和获取的便捷性,将导致使用量激增,需求永无止境,这印证了杰文斯悖论。
杰文斯悖论指的是技术进步提高效率,但资源消耗反而激增。
纳德拉认为,AI需求的使用量激增将通过B端、G端的政企客户开发和AI应用的爆发来实现,这也是DeepSeek爆火后行业形成的两大共识。
既要有底座大模型的研发能力,又要兼备大众市场和政企市场的落地经验,具备这些标签的大模型厂商屈指可数。
第三方机构智能超参数发布的《中国大模型中标项目监测报告(2024)》显示,在通用大模型厂商中标排行榜中,科大讯飞以91个中标项目、披露中标金额84780.8万元排名第一,成为2024年度标王。
政企市场快速发展的原因在于,经过两年发展,国内大模型领域正在形成新的评判标准,即更看重规模化收入和盈利能力,而不仅仅是论文数量和排行榜名次。
科大讯飞拿下大模型领域政企合作客户标王,有望借助DeepSeek进一步扩张。
DeepSeek的低成本策略降低了政企客户部署大模型的成本顾虑,有利于推动大模型在政企市场的新增长。
在AI大厂们相继接入DeepSeek模型后,竞争的核心因素再次回归到模型的性能和服务能力,而这正是科大讯飞的优势。
负责讯飞星火政企业务的王刚认为,政企客户选择大模型的两大阻碍在于场景和数据。数据指向对行业客户海量原始数据的清理和收集,场景则考验着大模型企业对细分行业的理解程度。
科大讯飞总结了一套可复制的方法论,构建了从“建算力、理数据、训模型”到“落场景、保安全、精运营”的全套解决方案。
科大讯飞创始人刘庆峰解释说,中标数量第一的原因在于,很多企业只能做到训练模型,而科大讯飞在数据整理和模型训练等方面的能力遥遥领先。
国产算力:AGI的关键制约因素
对于冲击AGI的大模型玩家而言,除了资金和信心,政策风险和高端算力芯片的限制也日益突出。
DeepSeek创始人梁文锋曾表示,面临的主要制约因素不是资金,而是高端算力的使用权。
自2023年10月起,英伟达因美国商务部的要求,不再向中国出售最新的高端算力芯片,转而推出阉割版芯片。
DeepSeek的崛起,使得这些阉割版芯片也面临被美国封禁的风险。
Scale AI创始人亚历山大·王认为,DeepSeek将受到芯片控制和出口管制的限制。
Anthropic创始人达里奥·阿莫迪认为,DeepSeek的突破印证了美国对华芯片出口管制政策的必要性。
阿莫迪认为,最快到2026或2027年,人类将制造出在几乎所有事情上都比人类更智能的人工智能,前提是需要投入数百万块芯片和数百亿美元。他认为,有效的出口管制是阻止中国获得数百万块芯片的唯一手段。
硅谷的态度使得国产算力替代方案从备选项转变为必选项。科大讯飞率先进行了探索。
2023年,科大讯飞联合华为打造了全国产万卡算力集群“飞星一号”,在昇腾910B的基础上,使得大模型训练能力从对标A100/A800的20%-30%提升到90%以上,讯飞星火也由此成为中国第一个基于国产算力训练出来的大模型。
为追逐AGI,科大讯飞还在布局更大的国产算力集群。去年10月,科大讯飞再度联手华为、合肥市大数据资产运营有限公司,打造了国产超大规模智算平台“飞星二号”。刘庆峰表示,自主可控的国产底座能力决定了公司能在这条路上走多远。
开放平台、政企端落地、国产算力适配经验成为科大讯飞承接DeepSeek流量外溢的三大抓手,也许讯飞最有机会被DeepSeek“带飞”。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html