全球首个跨本体导航大模型导航大模型NavFoM问世,机器人实现“零样本”全域导航
近日,银河通用团队联合多所顶尖高校,发布了全球首个跨本体全域环视导航基础大模型——NavFoM。这一创新成果标志着机器人导航技术迈入了一个新纪元,实现了无需预先建图、无需环境适配的零样本全域导航能力。
NavFoM的核心优势在于其全场景泛化能力。无论是商场、工厂还是户外街区,机器人都能在陌生环境中即时启动导航任务,无需依赖传统SLAM建图或激光雷达标定。这不仅降低了机器人部署的门槛,更让“即插即用”成为现实。
技术上,NavFoM采用了TVI Tokens与BATS策略,构建了迄今规模最大的跨任务导航数据集。该数据集涵盖了多种极端场景,确保了模型在真实世界中的鲁棒性与适应性。
NavFoM的诞生,预示着机器人导航正从“定制化工程”向“基础模型驱动”转变。未来,一个通用导航基座将支撑起千行百业的智能移动需求,服务机器人、物流机器人乃至自动驾驶系统的落地成本将显著下降,商业规模化进程有望加速。
随着NavFoM等基础模型的普及,机器人将真正具备“人类级”的环境理解与路径规划能力,智能体融入日常生活的愿景正逐步成为现实。

双11选旅游套餐不用愁:飞猪AI助手帮你精准挑
随着双11购物节的临近,消费者在海量商品中挑选心仪之物变得愈发困难。为此,飞猪AI“问一问”团队推出了双11选品助手,帮助用户高效找到适合的商品。
这款智能助手能根据用户需求,精准推荐机票、酒店套餐等双11活动商品。用户只需简单提问,如“推荐周末不加价酒店套餐”,助手便能迅速筛选出符合要求的选项,如君澜酒店、君亭酒店等高性价比套餐,且可预约日期覆盖周末及节假日。
飞猪AI选品助手不仅能理解用户对目的地和品牌的需求,还能像专业导购一样解答疑问,提供详细分析。这种基于AI技术的交互方式,极大提升了需求匹配的准确性,让消费者决策更加轻松。
此外,飞猪“问一问”自推出以来就具备“可交易”特性,用户获取旅行攻略的同时,能实时访问飞猪报价,直接收藏和预订商品,极大提升了购物体验。
随着AI在消费决策中扮演越来越重要的角色,飞猪双11选品助手无疑将成为用户大促季节的购物利器,提供更智能、更便捷的选择。

网易云音乐AI调音大师上线:听歌能自动适配音效
近日,网易云音乐正式推出了全新的音效功能——“AI调音大师”。这一创新工具依托AI技术,能动态解析歌曲特征,实现音效的智能适配。
“AI调音大师”通过分析歌曲内容属性,自动匹配专属音效参数,为用户呈现最佳听感。播放过程中,用户不仅能实时看到音效波谱,还能根据个人喜好选择“厚重”、“清亮”等调音关键词,实现音效的可视化调节。
此外,该功能还支持个性化定制。用户可在偏好设置中进一步调节,如选择“低频增强”或“提升现场感”等选项。AI调音大师会在确保整体听歌体验的基础上,叠加用户个性化偏好,让每一首歌都更贴合用户需求。
“AI调音大师”的推出,不仅丰富了网易云音乐的音效选择,更提升了用户的听歌体验。无论是追求极致音质的音乐发烧友,还是喜欢个性化设置的普通用户,都能在这一功能中找到属于自己的音乐世界。
详情查看:网易云音乐推出“AI调音大师”,实现音效智能匹配与可视化调节

字节火山引擎高薪招人才:发力人形具身机器人研发
近日,字节跳动旗下火山引擎团队启动了一项高规格招聘,公开寻求“操作算法资深专家(具身智能)”,并开出了每月高达9.5万元至12万元人民币的顶尖待遇。这一举动显示,字节跳动正实质性发力人形具身机器人赛道。
根据招聘信息,该职位将主导研发人形具身机器人的操作算法,参与具身大模型的预训练与部署,并推动算法在硬件上的系统集成与部署。这表明字节跳动意在打造一个集成先进大模型、具备复杂操作能力的具身智能体。
此次招聘开出的高薪范围远超行业平均水平,凸显了字节跳动对顶尖人才的志在必得,也侧面印证了当前人形机器人领域核心技术人才的稀缺性。职位对应聘者的要求极高,需具备计算机科学、自动化、人工智能等相关领域的硕士或博士学历。
行业分析认为,字节跳动此次通过火山引擎平台重金招募具身智能专家,标志着其正式加入了全球人形机器人研发竞赛,并将该赛道视为未来的战略高地。这一举动无疑将加剧人形机器人领域的竞争,推动行业技术的快速发展。

谷歌Nano Banana2将发布:AI图像生成再升级
据最新消息,谷歌正加紧准备发布其备受关注的AI图像生成模型Nano Banana2,内部代号“GEMPIX2”。这一动态预示着谷歌在生成式AI领域的创新步伐将进一步加速。
Nano Banana系列作为谷歌DeepMind团队的核心产品,自首代推出以来便以其出色的图像编辑和生成能力迅速走红。该模型在早期预览中就登顶LMArena图像编辑排行榜,凭借“多轮对话”式交互和高度一致的角色保持功能,帮助用户轻松融合照片、更改背景或生成艺术风格图像。
此次Nano Banana2的曝光显示,新版模型将延续前作的创意焦点,针对专业创作者和开发者优化视觉生成速度与艺术风格多样性。同时,它可能与Gemini3.0系列深度整合,进一步提升多模态处理能力。
谷歌方面尚未公布具体细节,但公告的出现通常预示着发布窗口已近在咫尺。分析人士指出,Nano Banana的成功不仅源于其技术领先,还得益于与Gemini应用的无缝融合。随着AI工具从文本向视觉领域的全面渗透,Nano Banana2的发布或将引发新一轮行业热议。
详情查看:谷歌新一代AI图像模型Nano Banana2预告,性能提升,整合Gemini 3.0

AI艺术家Xania Monet登Billboard榜,音乐圈震动
2025年11月03日,AI艺术家Xania Monet创作的单曲《How Was I Supposed to Know?》成功跻身Billboard公告牌的电台排行榜,成为首个进入该榜单的AI创作音乐作品。这一成就不仅标志着AI在音乐创作领域的突破,更引发了音乐界的广泛关注与讨论。
这首歌曲最初在TikTok等社交媒体平台上走红,随后迅速占领了流媒体平台和数字音乐零售市场。其影响力之大,甚至在R&B数字歌曲销量榜和热门R&B歌曲榜中取得了不俗的成绩。
Xania Monet的创作背后是由诗人Telisha Jones基于Suno技术打造的虚拟音乐人。这一创新的音乐形式为音乐创作带来了新的可能性,同时也引发了关于AI对传统音乐人影响的讨论。
尽管存在争议,但Xania Monet已经与唱片公司签署了一份高额合约,这显示出业界对AI音乐创作的重视与潜力。随着AI在音乐创作领域的逐渐普及,未来的音乐市场将可能出现更多这样的AI艺术家,为音乐创作带来全新的变革。
详情查看:AI艺术家Xania Monet首登Billboard电台榜,音乐界炸锅了!

OpenAI Sora安卓版上线:手机就能做AI视频
2025年11月04日,全球瞩目的AI视频应用OpenAI Sora正式在Android平台部署上线,其官方下载地址已在多个国家和地区的Google Play商店开放。这标志着继iOS平台成功上线后,Sora正式将这款主打类似TikTok短视频浏览体验的应用带给广大的安卓用户群体。
此次Sora安卓版覆盖了北美、亚洲等七个关键市场,用户现可通过访问Google Play商店搜索并下载Sora应用。Sora的核心吸引力在于其“Cameo”功能,允许用户或好友直接化身为AI生成影片的主角,为视频创作带来了全新的可能性。
针对深度伪造和版权议题,OpenAI采取了关键措施。除了允许版权方选择内容不被用于AI创作外,还上线了新的“角色Cameo”功能,旨在创建可重复使用的虚拟角色。官方计划未来让版权持有者能从这些角色的使用中获得额外收益,为AI时代的创作者生态开辟新的商业模式。
随着Sora安卓版的上线,AI视频创作将迈入一个新的发展阶段。未来,我们有理由期待更多创新的AI视频应用涌现,为视频创作领域带来更多的惊喜与变革。
详情查看:OpenAI Sora安卓版上线,“付费角色”功能引发热议

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









