• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

通用AI Agent Manus横空出世:手脑并用,引领智能体时代

通用AI Agent Manus横空出世:手脑并用,引领智能体时代
AI TOP100
2025-03-06 09:34:38

科技圈热议:通用AI Agent Manus 引领新浪潮

昨晚苹果发布新品的同时,一款名为Manus的产品迅速席卷科技圈。这款被誉为全球首款真正意义上的通用AI Agent,凭借其独立思考、规划并执行复杂任务的能力,直接交付完整成果,引发了广泛关注。

相较于其他能够操作多任务或提供订餐、订酒店服务的Agent,Manus能够覆盖更广泛的领域,并实现更高质量的执行效果。它在权威的GAIA基准测试中,性能远超OpenAI的同类产品,刷新了纪录。

Manus的名字源自拉丁语“Mens et Manus”,意为“手脑并用”,这恰是麻省理工学院的校训,旨在鼓励学生将创意转化为实际成果。其创始人肖弘在产品发布前,于社交平台发布“高潮来临”的动态,并分享莎士比亚的一段摘录,预示着Agent(智能体)时代或将迎来真正的“高潮时刻”。

士比亚的一段摘录

尽管现在断定Manus的出现是AGI(通用人工智能)的里程碑为时尚早,但它极有可能加速Agent时代的到来。

Manus:不仅仅是聊天机器人,更是自主智能体

Manus被官方定位为真正的自主智能体(Agent),它不仅仅是一个能够聊天的对话式AI工具。当其他AI还停留在生成想法的阶段时,Manus已经能够独立思考并采取行动。官方将其视为人机协作的新范式,甚至是通往AGI的一个窗口。

与Manus一同走红的,还有一段长达四分钟的演示demo。在这些案例中,Manus完全自主地完成从规划到执行的全流程,展示了其真正的Agent能力,而非简单的助手功能。

案例一:高效筛选简历

演示从人力资源常见的任务——筛选简历开始。Manus接收到一个包含10份简历的压缩文件,随即像专业的招聘人员一样开始高效工作。它先解压文件,然后逐页浏览每份简历,并记录重要信息。Manus还能异步处理文件,方便用户随时关闭电脑,并在任务完成后收到通知。

Manus高效筛选简历

用户还可以随时向其发送新的指令。随后,继续上传5份简历。在认真阅读了所有15份简历后,Manus给出了排名建议,并提供了候选人资料和评估标准作为参考。更进一步,用户还可以让Manus生成电子表格,方便快捷。

Manus

由于Manus具备知识和记忆能力,因此下次执行类似任务时,它会直接以电子表格的形式交付结果。

案例二:纽约选房购房

在另一个演示案例中,结合家庭收入情况和孩子的上学要求,让Manus在纽约筛选一个安全、犯罪率低的社区,并购买符合标准的房产。

面对这类复杂任务,Manus同样能够有条不紊地将其拆解为多个步骤,并创建详细的待办清单:

Manus在纽约选房购房


搜索并阅读关于纽约最安全社区的文章。
研究纽约的中学情况。
编写Python程序来计算预算。
基于预算,在房地产网站上筛选合适的房源。
整合所有信息,撰写详细报告并整理相关资料。

案例三:股票分析师

在第三个案例中,Manus化身为专业的股票分析师,分析英伟达、迈威尔科技以及台积电在过去3年的股票价格之间的相关性。Manus通过API访问权威数据源,并在验证数据后,编写用于数据分析和可视化的代码。

Manus化身为专业的股票分析师

在完成数据分析和可视化后,Manus还能基于这些数据创建一个网站,并在用户的授权下,将网站部署至线上,并提供一个可供分享的链接。

Manus

X网友@DavidAIinchina体验Manus后,给出了极高的评价——“令人难以置信的用例”。

官方表示,以上展示的内容仅仅是Manus能力的冰山一角。Manus还分享了更多处理现实世界任务的案例,包括个性化旅行规划、深度股票分析、保险政策比较、供应商采购、财务报告分析以及专业数据整理等。

尽管Manus尚未全面开放,但其热度已席卷全网,各大平台上的用户纷纷涌入评论区询问邀请码,可见其火爆程度。

在评估通用AI助手在解决现实世界问题方面的能力的GAIA基准测试中,Manus在所有三个难度级别上都达到了SOTA(State-of-the-Art)水平。为了确保结果的可重复性,Manus使用与其正式版本完全一致的配置进行评测。

除了基准测试,Manus还在Upwork和Fiverr等平台上解决真实世界的问题,并在Kaggle竞赛中证明了自己的实力。

这一切都离不开优秀的开源社区,因此官方也希望能回馈社区。Manus采用多重签名(multisig)系统,由多个独立模型驱动。今年晚些时候,官方计划开源其中的一些模型,特别是Manus的推理(postering)部分。

Manus背后的中国团队和技术哲学

Manus AI背后的创始人肖弘,是华中科技大学软件工程专业2015届校友。毕业后,他连续创业,于2015年创立夜莺科技,推出了“壹伴助手”和“微伴助手”,服务超过200万B端用户,并获得了腾讯、真格基金等投资。

肖弘身上另一个鲜明的AI产品是Monica。这是一款号称All-in-One的AI助手,最初以浏览器插件的形式推出。通过集成主流大模型(如Claude 3.5、DeepSeek等),Monica提供聊天、翻译、文案处理等功能,用户可以通过自然语言创建定制化工具,并共享至工具广场。

Monica同样早期以海外市场为主,用户规模突破百万,成为AI插件领域的头部产品。今年2月份,Monica的中文版(monica.cn)已开启内测,目前免费向国内用户开放。该版本基于DeepSeek R1和V3模型打造,具备深度推理思考能力,并支持记忆功能和实时联网搜索。

Manus奉行的技术理念是“less structure more intelligence”(更少的结构,更多的智能)。他们认为,当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时,computer use、deep research、coding agent等能力会自然涌现,无需被设计为特定的产品功能。

作为大力出奇迹的代表之一,GPT-4-Turbo在GAIA公开排行榜上的平均成绩不到7%,即使是使用复杂多智能体系统的解决方案也仅达到40%。Manus的表现可以说是“遥遥领先”。

Manus

创始人肖弘在最近的一次访谈中,提前谈到了当时还未发布的Agent产品Manus。“看上去它确实应该就是一个chatbot,这是很符合大家想象的,同时在应用侧却很复杂,和Monica不一样,光用好不同模型就挺复杂。”

肖弘还将目前AI应用分为两类:一是填补主要应用产品的空档的不足,二是为特定场景提供独特解决方案的应用。

比如Perplexity(提供联网搜索功能)和Monica(浏览器插件形态)都属于此类,它们填补了现有产品留下的空白。而模型驱动的新场景这类应用,主要出现在图片和视频领域,直接由模型技术的进步驱动。像Pika和Runway等产品利用模型能力创造了新的应用场景。

有用户调侃Manus是“极致的套壳就是牛逼”,实际上肖弘并不忌讳让用户知道自己的产品用的是别人的模型。早在去年,他就把Monica比作消费电子产品,并把ChatGPT的Logo打在官网。

人机交互新时代:理性看待Manus

2024年初,有预测指出,大模型将成为智能手机新的操作系统,自然用户界面(NUI)将逐步替代现有的图形用户界面(GUI)。而实现这种新交互的重要入口,就是Agent。

去年,很多手机发布会上都展示了类似的案例,如AI订餐的Phone GPT,华为鸿蒙的小艺和意图框架,荣耀的YOYO智能体,以及智谱的AutoGLM,核心都是一样的:让AI模仿人类的Plan-Do-Check-Act(计划-执行-检查-行动)循环,从而像人类那样去操作设备。

智谱AI CEO张鹏之前提到,目前的Agent能力更像是在用户和应用之间,增加一个智能的调度层,链接所有应用甚至是所有设备。这可以看做是大模型通用操作系统LLM-OS的一种雏形,将对人机交互形式产生极大的影响。OpenAI创始成员、AI技术大牛Andrej Karpathy也曾多次谈到大语言模型操作系统(LLM OS)。

他认为大模型某种程度来说就是一种新的计算机和操作系统,它可以连接各种软件和硬件,以及所有模态信息组成的外设,并通过函数调用执行各种任务。

传统操作系统中,需要围绕CPU构建一堆外设,比如鼠标和键盘、磁盘存储以及缓存空间等。而在LLM OS中,大模型本身就是中央处理器。

I/O外设也不再是鼠标和键盘,因为LLM可以兼容更多模态的数据输入和输出。同时大模型调用的外部工具也将从传统软件升级为智能体工具。

其中跨应用的操作是非常关键的一环,这意味着Agent能实现更加复杂的自主连贯操作,也可能走向真正的商业化落地。至于各家互联网公司提供的服务能否打通,可能是未来实现这种交互最大的障碍。

不过现在很多AI助手实现代操作的方式,实际上是调用手机的无障碍功能 (accessibility features) 的权限,来控制屏幕点击。

Manus的出现,意味着Agent模式下的AI能够理解需求后独立工作,直到任务完成。这无疑是人机交互领域的一大步,它让我们看到了AI从工具向伙伴转变的潜力。

但要说我们已经一只脚迈入了AGI大门,也还为时尚早。肖弘自己也提到,早期的Agent更像是“功能机”,需要不断迭代和完善。目前的Agent仍需依赖于模型能力的提升,以及更完善的虚拟环境支持,才能真正胜任各种长尾任务。

如果类比智能驾驶,大概也相当于从L2级升级到L3级的辅助驾驶。虽然Manus在GAIA基准测试中表现出色,但这并不意味着它已具备通用人工智能的全部特征。通往AGI的道路依然漫长,需要解决模型能力、自主学习、任务泛化等多重挑战。

但因为有了Manus在自主性与通用性上的突破,通往AGI的大航海中,又多了一颗照亮我们的星。

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 快手可灵AI宣布降价:视频生成进入"抢用户"阶段

  • 淘宝短剧「AI剧百万激励计划」

  • PixVerse V6震撼发布:AI视频迈入"物理常识"时代

  • Qwen3.5-Omni震撼发布:215项SOTA开启全感官AI时代

  • Tunee上线MV智能体,AI音乐下半场进入"人人造星"时刻

热点资讯

第三届短剧生态大会|优秀AI短剧展映征集入围公示

9天前
第三届短剧生态大会|优秀AI短剧展映征集入围公示

每日AI资讯-2026年3月24日

8天前
每日AI资讯-2026年3月24日

🎬第79届戛纳国际电影节官方AI电影论坛即将开始

1天前
🎬第79届戛纳国际电影节官方AI电影论坛即将开始

郑在漫剧动能共聚|奇灵·第十届AI短剧产业大会

2天前
郑在漫剧动能共聚|奇灵·第十届AI短剧产业大会

微软开源语音模型VibeVoice火了:GitHub一天27K Star,能处理90分钟长音频

2天前
微软开源语音模型VibeVoice火了:GitHub一天27K Star,能处理90分钟长音频
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有