AI Agent元年已至:2025年AI发展趋势前瞻
2025年开年以来,人工智能(AI)领域呈现爆炸式增长,DeepSeek R1、OpenAI CUA、Manus等创新成果令人目不暇接。本文将对近一个月来的思考进行总结,并对2025年AI发展趋势做出几点预判。
Manus:Agent时代的先行者
Manus的推出引发了广泛关注。经过深入体验测评,我们认为Manus的产品设计理念极具创意,虽有不足,但值得肯定。
Manus的核心架构基于“虚拟机+多Agent协同”模式,整合了GPT-4、Claude 3等底层大模型的API,实现了任务的动态分配与模型调用。它突破了传统AI助手仅提供建议的限制,实现了从需求输入到成果交付的闭环。
Manus提倡“Less Structure, More Intelligence”的交互理念,通过无代码化的自然语言接口降低用户门槛。
此外,Manus使用外置markdown文件管理Agent的任务规划,并将阶段性成果存储为独立文件,这是一种有趣的创新。
Manus的局限性与挑战
尽管Manus在MultiAgent领域提供了有益的思路,但仍存在一些明显的不足。
首先是“幻觉累加”问题。由于Agent本质是多次大模型问答的串并联,单次问答准确率的下降会导致最终结果的准确性大幅降低。
例如,在对某上市公司进行财务数据分析的任务中,Manus虽然成功导入了data_api模块,但却将revenue、gross_profit等数据“硬编码”到代码中,且部分数据存在错误,这使得后续分析毫无意义。
其次,Manus面临工具不足的挑战。在撰写“小米Su7”市场分析报告PPT的任务中,Manus能够完美拆解任务并检索大量新闻,但却无法生成PPT,因为它无法调用Office软件。目前Manus主要输出纯文本或网页内容,难以与人类工作流融合。
此外,互联网生态的“小院高墙”也对Manus造成阻碍。当Manus尝试分析AI智能眼镜的性价比时,虽然找到了淘宝页面,但却被淘宝判定为机器人而拒绝访问。类似地,在为非上市公司撰写商业分析报告时,Manus访问CrunchBase数据库也被拒绝。这些“围栏”内的优质信息难以获取,影响了Manus的工作效果。
总而言之,尽管面临挑战,Manus依然展示了MultiAgent的巨大潜力,为Agent元年奠定了基础。
OpenAI CUA:自主操作电脑的AI智能体
OpenAI发布了由CUA(Computer-Using Agent)驱动的AI智能体Operator。CUA融合了GPT-4o的视觉能力和通过强化学习实现的高级推理能力,能够将任务分解为多步骤计划,并在遇到挑战时进行调整和纠正。CUA本质上就是一个会操作电脑的Agent。
CUA同时接受文本指令和屏幕截图两种模态的输入,并生成一系列动作指令,例如“点击屏幕上坐标为(300,200)的点,并且输入XXX,按回车”。电脑执行指令后,将新的屏幕截图与新的任务指令返回给CUA,循环往复,直至获得最终答案。
OpenAI的官方测评显示,CUA在操作电脑和浏览器方面相比上一代SOTA有了显著提升,但与人类相比仍有差距。不过,这种差距有望在今年内得到质的改变。
Anthropic MCP:AI时代的TCP/IP协议
Anthropic推出了MCP(Model Context Protocol)来解决AI面临的“工具不足”问题。MCP定义了应用程序和AI模型之间交换上下文信息的方式,使开发者能够以一致的方式将各种数据源、工具和功能连接到AI模型。
MCP之于AI,类似于TCP/IP之于互联网。
MCP有三个重要特点:标准协议(统一AI与工具的交互接口)、动态发现(AI能够按需寻找并调用工具或服务)和双向通信(AI与工具之间双向有状态的通信)。
越来越多的工具和服务开始接入MCP,包括Google Maps、PGSQL、ClickHouse、Atlassian、Stripe等。
在Smithery平台上,你可以轻松查找不同功能对应的工具和服务。随着更多Server接入MCP协议,未来AI能够直接调用的工具将呈现指数级增长,从根本上打开Agent能力的天花板。
2025年AI发展新趋势:后训练、RL、MultiAgent
结合近几个月来的观察和思考,以下是2025年AI发展的几点重要趋势:
预训练即将终结,后训练成为重点。这已成为行业共识。Ilya认为数据是AI时代的化石燃料,而DeepSeek R1的论文也强调了后训练在大模型训练管线中的重要性。
针对后训练而言,强化学习将成为主流,监督学习的重要性逐渐下降。DeepSeek R1的启发在于:纯粹的RL可能是通向AGI的正确路径。随着TTS的增加,大模型会自我涌现出复杂的推理行为,而无需刻意引导。
研究表明,随着大模型RL步数的增加,大模型会自主地从“快思考”变成“慢思考”,从每次回答100个token到接近10000个token。
DeepSeek团队将这种现象称为“self-evolution”,并认为是“the emergence of sophisticated behaviors”,例如self-verification, reflection等。
这意味着未来监督学习在AI训练中扮演的角色将发生转变,或许不应该让AI模仿人类的思维方式来获得智能,而是让AI发展出更加原生的智能。
MultiAgent是确定性的大趋势。如果将AI和人脑进行类比,大模型就像是人脑中的“前额叶”。但仅仅有前额叶,大脑是无法处理复杂任务的。我们需要颞叶、顶叶、小脑和海马体等。
MultiAgent的定义恰恰就是让多个不同的模型之间互相协调,从单独的“前额叶”走向“完整的大脑”,从而处理更加复杂的现实任务。MCP在此蓝图中起到了协调统一数据通信接口的关键作用。
结论:迎接AI新时代
2025年是AI Agent元年,Manus的出现是第一声号角。OpenAI的CUA和Anthropic的MCP都指向了一个共同的未来,未来2年AI的发展速度将非常迅猛,让我们共同迎接AI新时代的到来!