AI圈“六小虎”放大招,智谱“沉思”Agent来袭!
最近,AI圈热闹得很,各家都忙着秀肌肉。DeepSeek R1和Manus已经把推理模型和AI Agent的概念炒得火热。作为国内AI大模型“六小虎”之一的智谱,终于憋出了个大招——AutoGLM 沉思,一个号称具有深度思考能力的Agent产品,直接免费上线了。
话说这“沉思”可不是初代AutoGLM那种发红包的小打小闹,这回直接奔着“实习生”的范儿去了。啥意思?就是能像个人一样,理解你抛出的问题,然后满世界搜索信息,帮你分析整理。
“沉思”这“实习生”有啥绝活?
可别小看这“实习生”,“沉思”比单纯的“联网搜索”厉害多了。它能访问各种不对外开放API的信源,比如知网、小红书、公众号、京东、巨潮资讯等等。更牛的是,它还能看懂网页上的图片和文字,多模态理解不在话下。
智谱的张鹏直接现场演示,用“沉思”运营小红书账号,两周涨粉5000,还接到了商单! 这效果,简直堪比专业运营团队。
涨粉秘籍大公开:
想在小红书上火起来,关键就是更新勤快,话题吸引人。“沉思”就能帮你搞定这些。只要你给它一个热门话题,比如“手冲咖啡全套设备种草攻略”,它就能从各个平台(小红书、知乎等等)搜集信息,自动整理出高质量的内容。
智谱用“沉思”运营的小红书。
“沉思” vs. Manus:秀肌肉还是真落地?
DeepSeek App的爆火,让大家明白了一个道理:最终的应用形态,就是模型本身;所谓的应用,其实就是模型能力的展示平台。
“沉思”的界面设计,也更强调模型本身的思考能力。它会展示整个思考过程:理解问题、拆解问题、信息检索、列出解决方案框架。而Manus更侧重于“行动”,直接展示AI调用工具的过程。
“沉思”和Manus的界面对比。上为“沉思”,下为Manus。
“沉思”和Manus的界面对比。上为“沉思”,下为Manus。
比起Manus那种“成为全球首款通用智能体”的野心,“沉思”更像是智谱展示模型实力的一个窗口。智谱AutoGLM负责人刘潇也坦言,目前提供给大众的只是一个预览版本,还有很多不足。
Manus可以调用Claude的Computer Use能力,实现跨平台操作,直接交付PPT、网页等具体形态的结果。比如,让它制作一个jellycat主题的吃豆人网页游戏,它真能给你整出来一个,虽然可能有点bug。
Manus交付的吃豆人网页游戏。
而“沉思”预览版,目前只能输出实现游戏的代码,还需要用户自己复制运行,对非技术人员来说,不太友好。
“沉思”交付的是游戏代码。
智谱员工透露,“沉思”还不能跨平台操作,要实现这一点,需要集成类似GLM-PC的电脑操作模型。
“沉思”背后:智谱的技术野心
OpenDay上,张鹏透露了“沉思”背后的秘密武器:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air,以及沉思模型GLM- Z1。这三款模型分别负责Agent的语言理解、问题分析和反思验证。
“沉思”背后的新模型。
智谱还提出了“沉思大模型”的概念,认为传统AI单纯依赖内部知识推理有局限性。“沉思”要求AI能够实时联网搜索、动态工具调用、深度分析和自我验证,保证结果的可靠性和实用性。
为了应对“价格屠夫”DeepSeek的竞争,智谱新发布的三款模型中,推理模型 GLM-Z1-Air的推理速度提升了8倍,但成本只有1/30,还能在消费级显卡上运行。而且,这三款模型将在4月14日全部开源。
“后DeepSeek时代”,智谱的思考
身处“后DeepSeek”时代,智谱也在思考预训练的重要性、商业化模式等等问题。
张鹏认为:
- 预训练仍然很重要。 预训练是基座模型的天花板,一定要坚持。
- 未来的应用形态,尤其是智能体,会回归到模型上。 应用会以模型为核心,模型能力提升,产品能力就提升。
- 产品化、工程化的方法是权宜之计。 最终目标是造出一个像人一样聪明的脑子。
- Agent也存在Scaling Law。
- 企业和用户面临的最大问题是如何用好模型。开源不开源,免费不免费,不是特别关键的问题,落地需要双方磨合。
- 服务是开源的商业模式。
- 通用Agent不能有短板。 能力参差不齐会导致应用成功率急剧下降。
- 规避拦截本质上是工程技术问题。
- 会在具身智能上布局,但需要时间。
- 不是To B的公司,只做自己认为有意义的事情。