• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

2025年AI发展趋势预测:Agent元年、后训练与MultiAgent协同

2025年AI发展趋势预测:Agent元年、后训练与MultiAgent协同
AI TOP100
2025-03-19 09:51:54

AI Agent元年已至:2025年AI发展趋势前瞻

2025年开年以来,人工智能(AI)领域呈现爆炸式增长,DeepSeek R1、OpenAI CUA、Manus等创新成果令人目不暇接。本文将对近一个月来的思考进行总结,并对2025年AI发展趋势做出几点预判。


Manus:Agent时代的先行者

Manus的推出引发了广泛关注。经过深入体验测评,我们认为Manus的产品设计理念极具创意,虽有不足,但值得肯定。

ai agent

Manus的核心架构基于“虚拟机+多Agent协同”模式,整合了GPT-4、Claude 3等底层大模型的API,实现了任务的动态分配与模型调用。它突破了传统AI助手仅提供建议的限制,实现了从需求输入到成果交付的闭环。

Manus提倡“Less Structure, More Intelligence”的交互理念,通过无代码化的自然语言接口降低用户门槛。

manus

此外,Manus使用外置markdown文件管理Agent的任务规划,并将阶段性成果存储为独立文件,这是一种有趣的创新。

manus ai

ai agent

Manus的局限性与挑战

尽管Manus在MultiAgent领域提供了有益的思路,但仍存在一些明显的不足。

首先是“幻觉累加”问题。由于Agent本质是多次大模型问答的串并联,单次问答准确率的下降会导致最终结果的准确性大幅降低。

例如,在对某上市公司进行财务数据分析的任务中,Manus虽然成功导入了data_api模块,但却将revenue、gross_profit等数据“硬编码”到代码中,且部分数据存在错误,这使得后续分析毫无意义。

manus

其次,Manus面临工具不足的挑战。在撰写“小米Su7”市场分析报告PPT的任务中,Manus能够完美拆解任务并检索大量新闻,但却无法生成PPT,因为它无法调用Office软件。目前Manus主要输出纯文本或网页内容,难以与人类工作流融合。

manus

此外,互联网生态的“小院高墙”也对Manus造成阻碍。当Manus尝试分析AI智能眼镜的性价比时,虽然找到了淘宝页面,但却被淘宝判定为机器人而拒绝访问。类似地,在为非上市公司撰写商业分析报告时,Manus访问CrunchBase数据库也被拒绝。这些“围栏”内的优质信息难以获取,影响了Manus的工作效果。

manus

manus

总而言之,尽管面临挑战,Manus依然展示了MultiAgent的巨大潜力,为Agent元年奠定了基础。

OpenAI CUA:自主操作电脑的AI智能体

OpenAI发布了由CUA(Computer-Using Agent)驱动的AI智能体Operator。CUA融合了GPT-4o的视觉能力和通过强化学习实现的高级推理能力,能够将任务分解为多步骤计划,并在遇到挑战时进行调整和纠正。CUA本质上就是一个会操作电脑的Agent。

manus

CUA同时接受文本指令和屏幕截图两种模态的输入,并生成一系列动作指令,例如“点击屏幕上坐标为(300,200)的点,并且输入XXX,按回车”。电脑执行指令后,将新的屏幕截图与新的任务指令返回给CUA,循环往复,直至获得最终答案。

OpenAI的官方测评显示,CUA在操作电脑和浏览器方面相比上一代SOTA有了显著提升,但与人类相比仍有差距。不过,这种差距有望在今年内得到质的改变。

manus

Anthropic MCP:AI时代的TCP/IP协议

Anthropic推出了MCP(Model Context Protocol)来解决AI面临的“工具不足”问题。MCP定义了应用程序和AI模型之间交换上下文信息的方式,使开发者能够以一致的方式将各种数据源、工具和功能连接到AI模型。

MCP之于AI,类似于TCP/IP之于互联网。

manus

MCP有三个重要特点:标准协议(统一AI与工具的交互接口)、动态发现(AI能够按需寻找并调用工具或服务)和双向通信(AI与工具之间双向有状态的通信)。

越来越多的工具和服务开始接入MCP,包括Google Maps、PGSQL、ClickHouse、Atlassian、Stripe等。

manus

manus

在Smithery平台上,你可以轻松查找不同功能对应的工具和服务。随着更多Server接入MCP协议,未来AI能够直接调用的工具将呈现指数级增长,从根本上打开Agent能力的天花板。

manus

2025年AI发展新趋势:后训练、RL、MultiAgent

结合近几个月来的观察和思考,以下是2025年AI发展的几点重要趋势:

预训练即将终结,后训练成为重点。这已成为行业共识。Ilya认为数据是AI时代的化石燃料,而DeepSeek R1的论文也强调了后训练在大模型训练管线中的重要性。

manus

针对后训练而言,强化学习将成为主流,监督学习的重要性逐渐下降。DeepSeek R1的启发在于:纯粹的RL可能是通向AGI的正确路径。随着TTS的增加,大模型会自我涌现出复杂的推理行为,而无需刻意引导。

研究表明,随着大模型RL步数的增加,大模型会自主地从“快思考”变成“慢思考”,从每次回答100个token到接近10000个token。

manus

DeepSeek团队将这种现象称为“self-evolution”,并认为是“the emergence of sophisticated behaviors”,例如self-verification, reflection等。

这意味着未来监督学习在AI训练中扮演的角色将发生转变,或许不应该让AI模仿人类的思维方式来获得智能,而是让AI发展出更加原生的智能。

MultiAgent是确定性的大趋势。如果将AI和人脑进行类比,大模型就像是人脑中的“前额叶”。但仅仅有前额叶,大脑是无法处理复杂任务的。我们需要颞叶、顶叶、小脑和海马体等。

MultiAgent的定义恰恰就是让多个不同的模型之间互相协调,从单独的“前额叶”走向“完整的大脑”,从而处理更加复杂的现实任务。MCP在此蓝图中起到了协调统一数据通信接口的关键作用。

manus

结论:迎接AI新时代

2025年是AI Agent元年,Manus的出现是第一声号角。OpenAI的CUA和Anthropic的MCP都指向了一个共同的未来,未来2年AI的发展速度将非常迅猛,让我们共同迎接AI新时代的到来!


0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 阿里Wan2.2正式发布:开源AI视频生成模型全面超越Sora,支持4K高清视频制作

  • 美图WHEE“视频超清”上线:一键拯救废片,老视频也能“重获新生”!

  • 重磅!万兴科技天幕2.0模型冲进国内TOP4,联合华为云打造AI视频新生态

  • AI峰会:2025深圳(国际)通用人工智能大会暨博览会

  • AITOP100平台V2.8.7.5重磅更新:功能大升级,创作体验再飞跃!

热点资讯

豆包AI生图技术深度解析:引领中文图像生成新突破

8天前
豆包AI生图技术深度解析:引领中文图像生成新突破

YouTube Shorts大动作!AI特效来袭,照片秒变精彩视频

9天前
YouTube Shorts大动作!AI特效来袭,照片秒变精彩视频

阿里巴巴首款夸克AI眼镜惊艳亮相2025世界人工智能大会(WAIC)

6天前
阿里巴巴首款夸克AI眼镜惊艳亮相2025世界人工智能大会(WAIC)

创意加速!可灵AI"灵动画布"发布,多图参考功能迎来重大突破

5天前
创意加速!可灵AI"灵动画布"发布,多图参考功能迎来重大突破

豆包理解图片的能力升级了:深度思考模式重新定义AI视觉理解

4天前
豆包理解图片的能力升级了:深度思考模式重新定义AI视觉理解
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有