每日AI资讯-2025年11月25日-AITOP100,AI资讯

Google Assistant明年3月停用，Gemini全面接棒时间表出炉

谷歌近日在官方博客明确了语音助手的切换安排，Google Assistant将于2026年3月31日正式停止服务，现在已经进入功能迁移阶段。目前Gemini已经接管了Android、Wear OS、Chrome和智能音箱等核心平台，用户在设置里就能手动切换，整个过渡期会持续到2026年第一季度结束。

关键的时间节点需要记好：

2024年12月起，Gemini就开始默认处理语音搜索、闹钟这些高频指令；
2025年6月，Nest音箱等设备全面用上Gemini，支持连续对话；
2026年1月，Assistant应用会从应用商店下架；
到3月31日服务器关闭后，所有设备都会强制切换。

两者的功能差异挺明显，Gemini支持100万tokens上下文，还能跨应用执行任务，而Assistant只保留基础功能不再更新。对用户来说，Android10以上设备会自动更Gemini插件，智能音箱需要手动确认迁移，不然明年4月就没法唤醒了。不过放心，历史数据和个性化设置都能一键导入。

详情查看：Google Assistant将于2026年3月退役，由Gemini全面接管

Google Assistant

单图生成可仿真3D资产，PhysX-Anything开源了

南洋理工大学和上海人工智能实验室联合搞出个好东西——PhysX-Anything框架，只要一张普通RGB图片，就能输出带几何、关节和物理参数的完整3D资产，直接就能导入MuJoCo这些工具做机器人训练，而且已经开源了。

这个框架的技术亮点不少：

采用由粗到细的处理流程，先算整体物理属性再细化部件，避免了只顾样子不顾物理逻辑的问题。
搞了新型压缩3D表示，把各种参数编码进8K维隐向量，生成速度比现有最好的方法快2.3倍。
训练时用了12万组真实物理数据监督，保证仿真效果。

实测成绩很亮眼，几何和物理误差分别降低18%和27%，尺度误差不到2厘米。在真实场景测试里，用它生成的资产训练机器人，抓取成功率提高12%，训练步数还少了30%。现在GitHub上能找到项目，权重和数据都开放了，团队说明年第一季度会出V2版，支持视频输入。

技术论文： https://arxiv.org/pdf/2511.13648

PhysX-Anything

全球首个纯AMD训练的MoE大模型ZAYA1发布，性能对标Qwen3

AMD联手IBM和Zyphra搞出了ZAYA1，这是全球首个全程用AMD硬件训练的MoE基础模型，预训练用了14T tokens，综合性能和Qwen3系列差不多，数学和STEM推理不用微调就接近Qwen3专业版。

训练规模不小，用了IBM Cloud的128个节点，每个节点8张AMD Instinct MI300X，总共1024张卡，峰值算力达750PFLOPs。数据方面采用课程学习，从通用网页逐步过渡到数学、代码等专业内容。

架构上有两项创新：

CCA注意力让显存占用降32%，长上下文吞吐提18%；
线性路由MoE优化了专家利用效率，稀疏度70%时还能保持高性能。

基准测试中，ZAYA1-Base和Qwen3-Base打平，数学领域更出色。Zyphra说指令版明年第一季度推出，AMD则表示要推进纯AMD方案普及，目标明年实现成本对标NVIDIA。

详情查看：全球首个纯AMD训练的MoE大模型ZAYA1发布，性能对标Qwen3

ZAYA1

腾讯HunyuanOCR开源，1B参数拿下多项SOTA

腾讯最近开源了HunyuanOCR模型，参数量才1B，却在多个行业标准测试里拿了SOTA。这款模型基于腾讯混元多模态架构，采用端到端设计，一次推理就能出最优结果，用起来很方便。

它由原生分辨率视频编码器等三大组件构成，和其他OCR模型不同，全程端到端训练推理，还结合了大规模应用数据和在线强化学习。复杂文档解析测试中，它拿了94.1分，超过了Gemini3-pro等知名模型。

不管是文档、艺术字、手写还是街景文字，它都能精准识别，在综合测试里拿了860分，是3B参数以下模型里的佼佼者。还支持14种语种翻译，能把扫描件里的文本按阅读顺序整理，公式和表格还能分别导出成LaTe和HTML格式。实际应用中，语种解析、票据抽取、字幕识别这些场景都能用得上。

详情查看：腾讯混元开源HunyuanOCR模型

腾讯HunyuanOCR开源

MrBeast前策略师推出Palo平台，帮创作者数据化造爆款

短视频创作越来越卷，MrBeast前内容主管杰伊·尼奥联合两位工程师搞了个Palo平台，靠AI分析帮创作者找爆款方向，每月250美元起，专门服务10万粉丝以上的创作者，已经拿到380万美元融资。

尼奥18岁就加入MrBeast团队，曾靠“巴黎买法棍”视频拿了18亿播放，后来创的频道月观看量也破10亿。他把这些经验融入Palo，平台核心有三大功能：AI创意规划、数据分析和创作者社区。创作者绑定账号后，平台就会分析所有视频表现，拆解钩子、受众情绪等关键信息。

CTO库马尔介绍，Palo用多模型提取数据，再通过LLM聚合分析，还能生成脚本和分镜。测试阶段已经和40位百万粉创作者合作。投资人认为它能解决“内容倦怠”，但也有人担心会让创作模式固化。尼奥表示，Palo只是引导方向，核心还是创作者的直觉，就像喜剧演员靠观众反馈迭代段子一样。

工具地址：Palo官网 (海外网站需要科学上网)

Palo平台

谷歌NotebookLM升级，新增幻灯片和信息图功能

谷歌旗下的AI笔记工具NotebookLM最近升级了，新增幻灯片生成器和信息图功能，不管是学生整理资料还是职场人做汇报，都能用得上。这两个功能背后，是谷歌Nano Bana Pro模型在支撑，其实就是Gemini3Pro图像生成模型。

以前把笔记转幻灯片要花大量时间排版，现在用这个新功能，很快就能生成简洁的演示草稿，还能优化已有幻灯片的视觉效果。信息图功能也很实用，能把复杂信息变成直观图形，让观众一眼抓住重点。谷歌说这个模型厉害的地方在于，能把详细提示转成文字丰富的精准图像。

目前生成的幻灯片可以导出成PDF，谷歌透露正在开发Google Slides和PowerPoint导出功能。不过要注意，现在虽然已经开放使用，但每日使用次数会根据账户类型限制，应该是为了保障服务稳定。对学生来说整理笔记、做汇报更高效了，职场人做项目展示也能省不少事，后续功能完善后应该会更好用。

工具地址：谷歌NotebookLM （海外网站需要科学上网）

阿里千问启用qianwen.com域名，多模型版本可选

11月24日，阿里AI助手“千问”正式启用qianwen.com新域名，网页端就能直接用，和App端体验一致，访问起来更方便了。这次升级后，专业用户有了更多选择，网页端开放了十余款Qwen3系列模型，像Qwen3-Max-Thinking-Preview、Qwen3-Coder都能体验。

网页端还针对性优化了功能，代码编写、深度研究这些适合电脑操作的功能都有强化，新增的“对话分组”功能也很实用，能把不同场景的对话记录分类管理。作为阿里进军AI to C市场的核心项目，千问基于开源的Qwen3模型，不仅免费，还和各种生活场景深度结合，直接和ChatGPT竞争。

千问11月17日开启公测后势头很猛，最新数据显示，一周内App累计下载量就破了1000万次，超过了ChatGPT、Sora等同期增长速度，刷新了行业纪录，成了增长最快的AI应用。这次域名升级和功能优化，应该能吸引更多专业用户，进一步扩大用户规模。

阿里千问

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码：

aitop100官方交流30群