人机对决仅差192件!Figure AI人形机器人120小时不间断分拣直播,估值390亿美元的具身智能走到哪了
估值390亿美元的具身智能巨头Figure AI在其圣何塞总部发起了一场持续超过120小时的机器人包裹分拣全网直播,并在周末引入实习生与旗下人形机器人展开10小时同台竞技。
最终人类以12924个总分拣量险胜,比机器人多出192件。但数据很有意思——人类平均单件用时2.79秒,机器人2.83秒,差距极其微小。比赛中途人类因劳动法规定的用餐及休息被机器人一度反超,最终凭借速度优势重夺领先。
这场直播的核心战略意图在于验证Figure人形机器人在工业场景下不间断、高可靠性的24小时轮班作业能力。三台人形机器人通过轮流无缝补位充电的方式,24小时内完成超3万个包裹分拣,已稳定运行超六天。俄亥俄州立大学工程学院院长Ayanna Howard等专家指出,机器人长时间无故障运行令人印象深刻,但偶发包裹掉落或条形码面朝上等精度问题仍需解决。
这场直播不只是营销噱头——通过社交媒体的病毒式传播,Figure AI向外界直观展示了人形机器人从实验室走向严苛工业环境压力测试阶段的真实进度。390亿美元估值的故事,正在被一个个真实搬运的包裹夯实。

不足90克!XREAL发布Project Aura空间计算眼镜,谷歌I/O现场实测手势识别惊艳
在2026年谷歌I/O开发者大会上,AR行业先锋XREAL正式揭晓Project Aura智能眼镜,官宣将于2026年年底前全面出货。这款基于安卓XR架构打造的设备,在轻量化设计上取得了实质性突破。
Project Aura采用"分离式计算"方案:将处理器、电池及触控模组从镜框移出,集成进一个可轻松夹在口袋上的外接盒。眼镜本体重量成功控制在90克以内,佩戴体感极佳。外接模块集成了实体触控板,眼镜框集成了3枚广视角摄像头,现场实测对手势的识别范围与灵敏度表现抢眼,运动中也能轻松完成移动与捏合操作。
作为谷歌Android XR平台的先锋之作,Project Aura能原生访问全套空间应用,现场展示了Google Maps沉浸式3D导航和YouTube 180度/360度VR视频全屏播放。最大的技术看点是对多模态Gemini AI的深度集成——通过DisplayPort连接笔记本电脑时,系统自动将平面文档、网页及App实时转换为"悬浮"在视觉空间中的3D环境。
搭载XREAL自研X1S空间计算芯片,协同高通骁龙XR平台,目前支持约4小时连续使用。年底出货,瞄准大众娱乐与轻办公场景——空间计算从"极客玩具"到"标配设备"的跨越,或许就在这一步。

整合150款AI模型API!阿里云发布"千问云"官网,一句指令调模型无需写代码
在2026年阿里云峰会上,阿里云正式发布全新AI产品官网"千问云"。这个专为Agent设计的平台整合了超过150款主流AI模型API,包括Qwen、GLM、Kimi、DeepSeek、Wan和HappyHorse等。
千问云的界面经过全面重构,用户可以获得不同模型的详细对比信息,包括参数、能力、价格、上下文长度和适用场景等,简单几步即可进入模型体验页面快速验证输出效果。平台特别推出的"Skills"和"CLI"工具大幅简化了使用流程——用户不再需要编写复杂代码或查阅冗长文档,只需一句指令,Agent工具即可轻松调用所需能力。
千问云的Skills和CLI功能已开源,提供按量付费和Token Plan订阅两种收费模式,特别适合高频AI编程和Agent场景。用户还可以实时拉取模型用量数据,获得自动化趋势分析和成本优化建议。
这个平台的核心价值在于:把"选模型-调模型-用模型-管成本"的全链路做成了一个统一的入口。对于正在大量使用AI API的开发者来说,不用在各个平台之间来回切换,一个平台搞定所有模型的选择、调用、认证配置和成本管理——这个效率提升是实打实的。
官网地址: https://www.qianwenai.com/

连续运行35小时零中断!通义Qwen3.7-Max发布,"正交解耦"技术拿下多项国内第一
通义实验室正式发布新一代AI Agent基座大模型Qwen3.7-Max,在多项权威评测中斩获国内第一,直指当前智能体在长链路生产环境中易断片、易崩溃的行业痛点。
一个数据很能说明问题:在针对未知硬件平台ZW-M890L PPU的极限压力测试中,该模型在无任何文档和先验数据的工程环境下,连续运行35小时、跨越1158次工具调用零中断,最终在多项工作负载上斩获10.0倍的几何平均加速。
为了解决AI模型对特定开发框架"过拟合"的行业痼疾,Qwen3.7-Max独创了"任务-运行框架-验证器"正交解耦设计,将强化学习训练从合成数据推向真实分布,实现真正的通用智能体策略与跨框架泛化能力。这意味着它不依赖某个特定框架,换个环境照样能干活。
目前Qwen3.7-Max即将通过阿里云百炼平台正式上线,全面对齐OpenAI与Anthropic API协议,与Claude Code、OpenClaw及Qwen Code等主流智能体框架实现即插即用的无缝集成。AI Agent正在从"理论可行"加速迈向"工程现实"。
模型地址:通义千问官网

谷歌版"小龙虾"Gemini Spark发布:关掉电脑它还在干活,由3.5 Flash驱动
在2026年谷歌I/O大会上,谷歌正式发布名为"Gemini Spark"的全时在线AI代理平台,由新一代Gemini 3.5 Flash模型驱动。核心架构依托谷歌云虚拟机运行——即使你关掉电脑,Spark仍在后台持续执行撰写邮件、生成学习指南、监控订阅账单等复杂任务。
Gemini Spark深度打通Gmail、Docs、Sheets等原生工作区应用,还通过"模型上下文协议"(MCP)实现了与Canva、OpenTable、Instacart等第三方应用的无缝互联。交互形式上,用户可以像使用即时通讯软件一样与Spark对话——这个设计很聪明,把AI代理的门槛降到了"聊天"级别。
发展路线图显示,Spark将于今夏获得macOS本地文件交互权限,未来通过全新的"Android Halo"交互界面提供实时任务更新。安全性方面,执行付款或发送邮件等高风险操作前必须征得用户明确许可。
Gemini Spark本周已向受信任测试者开放,下周向美国境内Google AI Ultra订阅用户推出测试版。谷歌正在推动AI从"回答问题"转向"替你办事"——当你的AI能在你睡觉的时候帮你写好邮件、整理好日程,Agent时代的意义才真正体现出来。

速度狂飙4倍!谷歌发布最强模型Gemini 3.5 Flash,免费开放直逼GPT-5.5
谷歌在I/O 2026开发者大会上正式推出Gemini 3.5 Flash,作为谷歌迄今能力最强的智能体与编程模型。更狠的是:即日起面向全球所有用户免费开放。
基准数据很硬:在多项针对智能体和编码的测试中,成绩超越了上一代旗舰模型Gemini 3.1 Pro,在多模态理解测试CharXiv Reasoning中拿下了全场最高分。运行效率上,输出速度超过每秒280个Token——达到GPT-5.5和Claude Opus 4.7的4倍之多。
谷歌官方强调,Gemini 3.5 Flash非常适合处理长周期的复杂智能体任务,综合使用成本不到其他前沿模型的一半。过去开发者需要数天、审计人员需要数周才能完成的繁琐工作,现在都能快速搞定。
免费+高性能+低延迟,这个组合对开发者生态的冲击力非常大。在Cursor刚用Composer 2.5把编程AI价格打到极低的背景下,谷歌直接免费开放旗舰级模型,大模型行业的价格战已经进入了白热化阶段。最终受益的是开发者——选择的余地更大,试错的成本更低。
工具地址:谷歌Gemini官网 (海外网站需要科学上网)

告别复杂提示词!谷歌推出原生AI设计工具Pics,点击就能改图,直指Canva和Claude Design
谷歌在2026年I/O大会上正式推出面向Google Workspace的全新AI设计与图像生成应用Pics,直接切入由Canva和Claude Design主导的AI驱动设计市场。
Pics的核心创新在于"双向交互":用户不仅能通过文本提示生成社交媒体图片、营销材料及模型等视觉内容,还能像在Google文档中添加评论一样,点击图像特定区域进行精确修改,也可以直接手动调整文本等具体元素。生成与微调无缝结合,彻底摆脱了"写提示词→生成不满意→重新写提示词"的死循环。
底层技术由全新模型Nano Banana 2提供支撑,重点强化了精准的文本渲染能力、现实世界知识图谱以及精细的视觉输出质量。作为Workspace原生应用,Pics支持跨应用的视觉协作,可完成下载、打印或共享。
Pics已在大会期间面向部分测试人员开放,计划于今年夏季向Google AI Ultra订阅用户推出。谷歌在I/O上连发数款AI产品(Gemini 3.5 Flash、Gemini Spark、Pics),从模型层到Agent层再到应用层全面铺开——这次不是试水,是全面出击。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










