• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

告别“动嘴派”,谷歌Gemini开启“代打”模式:手机AI正式进化为执行代理

告别“动嘴派”,谷歌Gemini开启“代打”模式:手机AI正式进化为执行代理
AI TOP100
2小时前

一、 交互范式的革命:从“Siri式对话”到“Gemini式执行”

过去十年,我们对手机AI的认知被禁锢在“定闹钟、查天气”的浅层交互中。Siri也好,Google Assistant也罢,它们更像是一个信息检索终端,而非问题解决者。

但这一次,谷歌扔出了一枚“重磅炸弹”:Gemini 任务自动化(Task Automation)。

这不再是简单的语音指令反馈,而是AI作为数字替身(Digital Twin)直接接管你的手机。如果你对着Pixel 10 Pro说“帮我在DoorDash上点一份披萨”,接下来发生的事情将颠覆你的认知——AI会像一个真实的人类一样,自动解锁手机、找到DoorDash图标、点击进入、浏览菜单、甚至填写优惠码并完成支付。

这就是AI Agent(智能体)的核心定义:感知环境 -> 规划决策 -> 执行操作 -> 反馈结果。谷歌这一步,直接捅破了移动互联网十年的“信息查询”天花板,让手机具备了操作能力。

工具地址:谷歌Gemini网页版官网

谷歌Gemini

二、 深度实测:全程“无人驾驶”背后的得与失

根据OSCHINA的一线实测与我们的模拟推演,这项被称为“代打”的功能在体验上呈现出极强的未来感与现实骨感并存的状态。

1. 核心亮点:真正的后台异步运行

最令人兴奋的并非它能操作,而是它能“隐身”操作。
在执行点外卖任务时,屏幕底部会像直播弹幕一样滚动显示:“正在打开应用”、“正在识别菜单”、“正在确认地址”。最关键的是,你不需要盯着屏幕。你可以切出去刷YouTube、回复工作邮件,甚至锁屏。Gemini会在后台保持活跃,利用屏幕语义理解技术持续推理,直到任务完成或报错。

2. 致命短板:速度与容错率的博弈

必须诚实地面对目前的缺陷:慢,且笨。

  • 时间成本: 人类手动点外卖可能只需2分钟(选好常购店一键下单),而Gemini需要9分钟。因为它需要将屏幕截图上传云端,进行多模态大模型推理,再下发点击指令,这一过程的延迟目前无法避免。
  • 容错率低: 一旦App界面改版,或者出现了非标准化的弹窗(如“允许获取位置信息”),AI极易“卡死”,需要人工介入。

三、 技术破局:大模型如何“看懂”手机屏幕?

为什么以前的AI做不到?因为以前的AI只懂“文本”,不懂“像素”。

Gemini此次能实现自动化,核心依赖于谷歌最新的多模态大模型能力与屏幕解析技术的结合:

  1. UI元素识别: AI将手机屏幕视为一张图片,通过Vision模型识别出哪里是按钮、哪里是输入框。
  2. 逻辑链规划: 不同于简单的“如果A则B”,Gemini能理解长链条任务。比如“点外卖”包含了“选店-选餐-结算”三个子任务,且每个子任务都有容错逻辑。
  3. 跨App协同: 目前虽仅限于Uber、DoorDash等标准化应用,但这证明了AI打破App孤岛的可能性——未来它可以把美团的订单自动同步到高德地图。

四、 巨头暗战:2026,AI Agent元年的序曲

不要以为谷歌是孤独的领跑者,这场战役才刚刚开始。

  • OpenAI: 正在打磨“Operator”项目,目标是让ChatGPT直接操控电脑浏览器完成复杂工作。
  • 苹果: Apple Intelligence 深度集成在iOS 18+系统底层,虽然动作谨慎,但其“系统级权限”是谷歌最大的威胁。
  • 国内厂商: 华为、小米、OPPO均在布局“意图识别”与“自动执行”,但在大模型云端推理的合规性上面临更大挑战。

2026年被行业公认为“AI Agent元年”。谷歌选择在Pixel 10 Pro和Galaxy S26 Ultra上抢先落地,意在抢占高频生活场景。谁能先让AI替用户“干活”,谁就掌握了下一代移动互联网的入口——不再是搜索框,而是执行流。

五、 冷静思考:我们真的准备好把手机交给AI了吗?

尽管“自动点外卖”听起来很酷,但在大规模普及前,有两座大山必须翻越:

  1. 安全与隐私的红线: 当AI接管支付权限时,如何防止恶意指令盗刷?如何保证生物识别信息不被上传云端?这是比技术更难的信任问题。
  2. 生态围墙: 目前仅支持极少数App。如果AI不能操作微信、不能操作淘宝,它的价值就被锁死在“外卖和打车”这两个场景里,无法成为真正的通用助手。

结语

谷歌Gemini的这次更新,虽然在速度上还显得有些“笨拙”,甚至不如人类手动操作快,但它指明了一个不可逆转的方向:AI正在从“工具”进化为“代理”。

我们不需要一个只会陪聊的机器人,我们需要一个能帮我们处理繁琐操作的数字管家。当AI的操作速度追平人类,当它的容错率足够高时,我们与手机的交互方式将被彻底改写——那时,手机不再是一个需要我们去“操作”的设备,而是一个能主动“服务”的智能体。

这一天,比我们想象的要近。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码AI大赛社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 谷歌Gemini
相关资讯
  • 告别“图一乐”式生成:CapCut上线Dreamina Seedance 2.0,AI视频终于能讲完整的故事了

  • 告别“动嘴派”,谷歌Gemini开启“代打”模式:手机AI正式进化为执行代理

  • 字节跳动Seedance 2.0全球上线:力压Sora与Veo3,登顶Artificial Analysis视频排行榜

  • Cursor承认Composer 2核心基座源自国产大模型Kimi,双方已达成授权合作

  • 零基础、免教程:Reelful让视频剪辑像聊天一样简单

热点资讯

第二届“牡丹花都”全球AI创作者大赛火热开启,牡丹花都·AI见洛阳

4天前
第二届“牡丹花都”全球AI创作者大赛火热开启,牡丹花都·AI见洛阳

央视网AI短片《流金谷恩仇录》为何10小时点赞破百万?深度拆解“武侠+AI”的破圈密码

5天前
央视网AI短片《流金谷恩仇录》为何10小时点赞破百万?深度拆解“武侠+AI”的破圈密码

AIGC大赛:2026“马栏山杯”AIGC原创动漫创意大赛邀您共创

4天前
AIGC大赛:2026“马栏山杯”AIGC原创动漫创意大赛邀您共创

AI大赛:美太咨询2026校园AI应用大赛重磅开启

4天前
AI大赛:美太咨询2026校园AI应用大赛重磅开启

九章云极x Online百业千模·共创营

3天前
九章云极x Online百业千模·共创营
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有