Google Assistant明年3月停用,Gemini全面接棒时间表出炉
谷歌近日在官方博客明确了语音助手的切换安排,Google Assistant将于2026年3月31日正式停止服务,现在已经进入功能迁移阶段。目前Gemini已经接管了Android、Wear OS、Chrome和智能音箱等核心平台,用户在设置里就能手动切换,整个过渡期会持续到2026年第一季度结束。
关键的时间节点需要记好:
- 2024年12月起,Gemini就开始默认处理语音搜索、闹钟这些高频指令;
- 2025年6月,Nest音箱等设备全面用上Gemini,支持连续对话;
- 2026年1月,Assistant应用会从应用商店下架;
- 到3月31日服务器关闭后,所有设备都会强制切换。
两者的功能差异挺明显,Gemini支持100万tokens上下文,还能跨应用执行任务,而Assistant只保留基础功能不再更新。对用户来说,Android10以上设备会自动更Gemini插件,智能音箱需要手动确认迁移,不然明年4月就没法唤醒了。不过放心,历史数据和个性化设置都能一键导入。
详情查看:Google Assistant将于2026年3月退役,由Gemini全面接管

单图生成可仿真3D资产,PhysX-Anything开源了
南洋理工大学和上海人工智能实验室联合搞出个好东西——PhysX-Anything框架,只要一张普通RGB图片,就能输出带几何、关节和物理参数的完整3D资产,直接就能导入MuJoCo这些工具做机器人训练,而且已经开源了。
这个框架的技术亮点不少:
- 采用由粗到细的处理流程,先算整体物理属性再细化部件,避免了只顾样子不顾物理逻辑的问题。
- 搞了新型压缩3D表示,把各种参数编码进8K维隐向量,生成速度比现有最好的方法快2.3倍。
- 训练时用了12万组真实物理数据监督,保证仿真效果。
实测成绩很亮眼,几何和物理误差分别降低18%和27%,尺度误差不到2厘米。在真实场景测试里,用它生成的资产训练机器人,抓取成功率提高12%,训练步数还少了30%。现在GitHub上能找到项目,权重和数据都开放了,团队说明年第一季度会出V2版,支持视频输入。
技术论文: https://arxiv.org/pdf/2511.13648

全球首个纯AMD训练的MoE大模型ZAYA1发布,性能对标Qwen3
AMD联手IBM和Zyphra搞出了ZAYA1,这是全球首个全程用AMD硬件训练的MoE基础模型,预训练用了14T tokens,综合性能和Qwen3系列差不多,数学和STEM推理不用微调就接近Qwen3专业版。
训练规模不小,用了IBM Cloud的128个节点,每个节点8张AMD Instinct MI300X,总共1024张卡,峰值算力达750PFLOPs。数据方面采用课程学习,从通用网页逐步过渡到数学、代码等专业内容。
架构上有两项创新:
- CCA注意力让显存占用降32%,长上下文吞吐提18%;
- 线性路由MoE优化了专家利用效率,稀疏度70%时还能保持高性能。
基准测试中,ZAYA1-Base和Qwen3-Base打平,数学领域更出色。Zyphra说指令版明年第一季度推出,AMD则表示要推进纯AMD方案普及,目标明年实现成本对标NVIDIA。
详情查看:全球首个纯AMD训练的MoE大模型ZAYA1发布,性能对标Qwen3

腾讯HunyuanOCR开源,1B参数拿下多项SOTA
腾讯最近开源了HunyuanOCR模型,参数量才1B,却在多个行业标准测试里拿了SOTA。这款模型基于腾讯混元多模态架构,采用端到端设计,一次推理就能出最优结果,用起来很方便。
它由原生分辨率视频编码器等三大组件构成,和其他OCR模型不同,全程端到端训练推理,还结合了大规模应用数据和在线强化学习。复杂文档解析测试中,它拿了94.1分,超过了Gemini3-pro等知名模型。
不管是文档、艺术字、手写还是街景文字,它都能精准识别,在综合测试里拿了860分,是3B参数以下模型里的佼佼者。还支持14种语种翻译,能把扫描件里的文本按阅读顺序整理,公式和表格还能分别导出成LaTe和HTML格式。实际应用中,语种解析、票据抽取、字幕识别这些场景都能用得上。
详情查看:腾讯混元开源HunyuanOCR模型

MrBeast前策略师推出Palo平台,帮创作者数据化造爆款
短视频创作越来越卷,MrBeast前内容主管杰伊·尼奥联合两位工程师搞了个Palo平台,靠AI分析帮创作者找爆款方向,每月250美元起,专门服务10万粉丝以上的创作者,已经拿到380万美元融资。
尼奥18岁就加入MrBeast团队,曾靠“巴黎买法棍”视频拿了18亿播放,后来创的频道月观看量也破10亿。他把这些经验融入Palo,平台核心有三大功能:AI创意规划、数据分析和创作者社区。创作者绑定账号后,平台就会分析所有视频表现,拆解钩子、受众情绪等关键信息。
CTO库马尔介绍,Palo用多模型提取数据,再通过LLM聚合分析,还能生成脚本和分镜。测试阶段已经和40位百万粉创作者合作。投资人认为它能解决“内容倦怠”,但也有人担心会让创作模式固化。尼奥表示,Palo只是引导方向,核心还是创作者的直觉,就像喜剧演员靠观众反馈迭代段子一样。
工具地址:Palo官网 (海外网站需要科学上网)

谷歌NotebookLM升级,新增幻灯片和信息图功能
谷歌旗下的AI笔记工具NotebookLM最近升级了,新增幻灯片生成器和信息图功能,不管是学生整理资料还是职场人做汇报,都能用得上。这两个功能背后,是谷歌Nano Bana Pro模型在支撑,其实就是Gemini3Pro图像生成模型。
以前把笔记转幻灯片要花大量时间排版,现在用这个新功能,很快就能生成简洁的演示草稿,还能优化已有幻灯片的视觉效果。信息图功能也很实用,能把复杂信息变成直观图形,让观众一眼抓住重点。谷歌说这个模型厉害的地方在于,能把详细提示转成文字丰富的精准图像。
目前生成的幻灯片可以导出成PDF,谷歌透露正在开发Google Slides和PowerPoint导出功能。不过要注意,现在虽然已经开放使用,但每日使用次数会根据账户类型限制,应该是为了保障服务稳定。对学生来说整理笔记、做汇报更高效了,职场人做项目展示也能省不少事,后续功能完善后应该会更好用。
工具地址:谷歌NotebookLM (海外网站需要科学上网)
阿里千问启用qianwen.com域名,多模型版本可选
11月24日,阿里AI助手“千问”正式启用qianwen.com新域名,网页端就能直接用,和App端体验一致,访问起来更方便了。这次升级后,专业用户有了更多选择,网页端开放了十余款Qwen3系列模型,像Qwen3-Max-Thinking-Preview、Qwen3-Coder都能体验。
网页端还针对性优化了功能,代码编写、深度研究这些适合电脑操作的功能都有强化,新增的“对话分组”功能也很实用,能把不同场景的对话记录分类管理。作为阿里进军AI to C市场的核心项目,千问基于开源的Qwen3模型,不仅免费,还和各种生活场景深度结合,直接和ChatGPT竞争。
千问11月17日开启公测后势头很猛,最新数据显示,一周内App累计下载量就破了1000万次,超过了ChatGPT、Sora等同期增长速度,刷新了行业纪录,成了增长最快的AI应用。这次域名升级和功能优化,应该能吸引更多专业用户,进一步扩大用户规模。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









