2025年AI发展趋势预测：Agent元年、后训练与MultiAgent协同-AITOP100,AI资讯

AI Agent元年已至：2025年AI发展趋势前瞻

2025年开年以来，人工智能（AI）领域呈现爆炸式增长，DeepSeek R1、OpenAI CUA、Manus等创新成果令人目不暇接。本文将对近一个月来的思考进行总结，并对2025年AI发展趋势做出几点预判。

Manus：Agent时代的先行者

Manus的推出引发了广泛关注。经过深入体验测评，我们认为Manus的产品设计理念极具创意，虽有不足，但值得肯定。

ai agent

Manus的核心架构基于“虚拟机+多Agent协同”模式，整合了GPT-4、Claude 3等底层大模型的API，实现了任务的动态分配与模型调用。它突破了传统AI助手仅提供建议的限制，实现了从需求输入到成果交付的闭环。

Manus提倡“Less Structure, More Intelligence”的交互理念，通过无代码化的自然语言接口降低用户门槛。

manus

此外，Manus使用外置markdown文件管理Agent的任务规划，并将阶段性成果存储为独立文件，这是一种有趣的创新。

manus ai

ai agent

Manus的局限性与挑战

尽管Manus在MultiAgent领域提供了有益的思路，但仍存在一些明显的不足。

首先是“幻觉累加”问题。由于Agent本质是多次大模型问答的串并联，单次问答准确率的下降会导致最终结果的准确性大幅降低。

例如，在对某上市公司进行财务数据分析的任务中，Manus虽然成功导入了data_api模块，但却将revenue、gross_profit等数据“硬编码”到代码中，且部分数据存在错误，这使得后续分析毫无意义。

manus

其次，Manus面临工具不足的挑战。在撰写“小米Su7”市场分析报告PPT的任务中，Manus能够完美拆解任务并检索大量新闻，但却无法生成PPT，因为它无法调用Office软件。目前Manus主要输出纯文本或网页内容，难以与人类工作流融合。

manus

此外，互联网生态的“小院高墙”也对Manus造成阻碍。当Manus尝试分析AI智能眼镜的性价比时，虽然找到了淘宝页面，但却被淘宝判定为机器人而拒绝访问。类似地，在为非上市公司撰写商业分析报告时，Manus访问CrunchBase数据库也被拒绝。这些“围栏”内的优质信息难以获取，影响了Manus的工作效果。

manus

总而言之，尽管面临挑战，Manus依然展示了MultiAgent的巨大潜力，为Agent元年奠定了基础。

OpenAI CUA：自主操作电脑的AI智能体

OpenAI发布了由CUA（Computer-Using Agent）驱动的AI智能体Operator。CUA融合了GPT-4o的视觉能力和通过强化学习实现的高级推理能力，能够将任务分解为多步骤计划，并在遇到挑战时进行调整和纠正。CUA本质上就是一个会操作电脑的Agent。

manus

CUA同时接受文本指令和屏幕截图两种模态的输入，并生成一系列动作指令，例如“点击屏幕上坐标为(300,200)的点，并且输入XXX，按回车”。电脑执行指令后，将新的屏幕截图与新的任务指令返回给CUA，循环往复，直至获得最终答案。

OpenAI的官方测评显示，CUA在操作电脑和浏览器方面相比上一代SOTA有了显著提升，但与人类相比仍有差距。不过，这种差距有望在今年内得到质的改变。

manus

Anthropic MCP：AI时代的TCP/IP协议

Anthropic推出了MCP（Model Context Protocol）来解决AI面临的“工具不足”问题。MCP定义了应用程序和AI模型之间交换上下文信息的方式，使开发者能够以一致的方式将各种数据源、工具和功能连接到AI模型。

MCP之于AI，类似于TCP/IP之于互联网。

manus

MCP有三个重要特点：标准协议（统一AI与工具的交互接口）、动态发现（AI能够按需寻找并调用工具或服务）和双向通信（AI与工具之间双向有状态的通信）。

越来越多的工具和服务开始接入MCP，包括Google Maps、PGSQL、ClickHouse、Atlassian、Stripe等。

manus

在Smithery平台上，你可以轻松查找不同功能对应的工具和服务。随着更多Server接入MCP协议，未来AI能够直接调用的工具将呈现指数级增长，从根本上打开Agent能力的天花板。

manus

2025年AI发展新趋势：后训练、RL、MultiAgent

结合近几个月来的观察和思考，以下是2025年AI发展的几点重要趋势：

预训练即将终结，后训练成为重点。这已成为行业共识。Ilya认为数据是AI时代的化石燃料，而DeepSeek R1的论文也强调了后训练在大模型训练管线中的重要性。

manus

针对后训练而言，强化学习将成为主流，监督学习的重要性逐渐下降。DeepSeek R1的启发在于：纯粹的RL可能是通向AGI的正确路径。随着TTS的增加，大模型会自我涌现出复杂的推理行为，而无需刻意引导。

研究表明，随着大模型RL步数的增加，大模型会自主地从“快思考”变成“慢思考”，从每次回答100个token到接近10000个token。

manus

DeepSeek团队将这种现象称为“self-evolution”，并认为是“the emergence of sophisticated behaviors”，例如self-verification, reflection等。

这意味着未来监督学习在AI训练中扮演的角色将发生转变，或许不应该让AI模仿人类的思维方式来获得智能，而是让AI发展出更加原生的智能。

MultiAgent是确定性的大趋势。如果将AI和人脑进行类比，大模型就像是人脑中的“前额叶”。但仅仅有前额叶，大脑是无法处理复杂任务的。我们需要颞叶、顶叶、小脑和海马体等。

MultiAgent的定义恰恰就是让多个不同的模型之间互相协调，从单独的“前额叶”走向“完整的大脑”，从而处理更加复杂的现实任务。MCP在此蓝图中起到了协调统一数据通信接口的关键作用。

manus

结论：迎接AI新时代

2025年是AI Agent元年，Manus的出现是第一声号角。OpenAI的CUA和Anthropic的MCP都指向了一个共同的未来，未来2年AI的发展速度将非常迅猛，让我们共同迎接AI新时代的到来！