Meta开源SAM 3D,单图秒变3D模型超神奇
2025年11月19日,Meta AI搞了个大动作,发布了Segment Anything系列最新模型SAM3D。这SAM3D可不得了,它有两套权重,分别是SAM3D Objects和SAM3D Body。前者适合通用物体和场景,后者专注人像重建。
以前生成3D模型可麻烦了,现在有了SAM3D,只需一张2D照片,就能输出带纹理、材质和几何一致性的3D资产。在真实世界图像上,它比现有的NeRF与Gaussian Splatting方案强太多了。
这SAM3D为啥这么牛呢?它采用了“空间位置 - 语义”联合编码,能给每个像素预测3D坐标和表面法向,让模型具备物理正确性,直接用在AR/VR、机器人和影视后期都没问题。
Meta还特别大方,同步开源了权重、推理代码和评测基准。而且在Facebook Marketplace上线了“View in Room”功能,用户能把商品3D模型投射到自己房间预览,购物体验直接拉满。
官方测试显示,SAM3D Objects在公开数据集上Chamfer Distance降低了28%,法向一致性提升了19%;SAM3D Body在AGORA - 3D基准的MPJPE指标比现有最佳单图方法好14%,还支持一键绑定Mixamo骨架驱动。
更棒的是,这模型已经集成到Quest3与Horizon Worlds创作工具里了,开发者通过Edits与Vibes应用调用API,按量计费才0.02美元/模型,2026年Q1还会发布实时手机端推理SDK,未来可期啊!
详情查看:Meta发布SAM3D模型通过单张图片生成带纹理的3D资产
OpenAI新模型GPT - 5.1-Codex-Max,代码生成超强大
OpenAI又放大招啦,推出了GPT - 5.1 - Codex - Max,这模型是专门为复杂软件工程项目打造的,能支持数十万行代码上下文一致性生成。
它有个厉害的“compaction”动态压缩机制,在任务运行时能自动整理记忆,保留关键状态,大大降低了长会话中信息丢失的风险。
从性能数据来看,那叫一个惊艳。SWE - bench准确率从73.7%提升到了77.9%,独立贡献软件工程师任务更是跃升到79.9%,而且令牌消耗还减少了约12%。不过,它的网络安全能力还没达到“高能力”标准,不安全内容检测“illicit”评分虽然从0.860升到了0.920,但还得人工复核。
Codex - Max已经取代旧版成了Codex系列默认模型,通过ChatGPT Enterprise、API与GitHub Copilot向开发者和企业开放。定价也很合理,每百万输入token5美元,输出token15美元,批量调用还能享受50%折扣。
OpenAI还计划在2026年Q1推出“Codex - Max - Enterprise”专用版本,支持私有部署和自定义代码风格规则。这对于开发者和企业来说,无疑是个好消息,以后代码生成会更高效、更便捷啦!
模型地址:ChatGPT网页版官网入口 (海外网站需要科学上网)

蚂蚁集团“灵光”AI助手,上线即火爆,下载量突破50万
2025年11月18日,蚂蚁集团发布的全模态通用AI助手“灵光”一上线就火了。第一天下载量就破了20万,两天多下载量突破50万,第三天直接冲上App Store总榜第七,App Store免费工具榜第一,这热度简直爆棚。
“灵光”为啥这么受欢迎呢?它开创性地在移动端实现了“自然语言30秒生成小应用”,而且生成的小应用还能编辑、交互和分享,让普通人也能轻松手搓应用。
它还是业内首个全代码生成多模态内容的AI助手,支持3D、音视频、图表、动画、地图等全模态信息输出和可视化互动,信息美感十足。
在这个科技飞速发展的时代,大家对新鲜事物的接受度越来越高,“灵光”的出现正好满足了大家对于便捷创作和互动的需求。无论是想做个小应用娱乐一下,还是进行一些创意展示,“灵光”都能轻松搞定。
而且蚂蚁集团一直以技术实力著称,“灵光”的背后肯定有着强大的技术支持。相信在未来,“灵光”还会不断优化和升级,给我们带来更多惊喜,让我们一起期待它在移动端AI领域的更多精彩表现吧!

华纳音乐与Udio达成和解,携手打造AI音乐新平台
华纳音乐集团和人工智能音乐初创公司Udio之前因为版权侵权闹得不可开交,不过最近双方达成了和解,还签署了许可协议,打算在2026年推出一个全新的AI音乐创作服务。
这个平台可不简单,它是个“下一代音乐创作、聆听与发现平台”,采用经过授权和许可的音乐训练的生成式AI模型。这样一来,既能为艺术家和词曲创作者创造新的收入来源,又能确保他们的作品受到保护。
用户在这个平台上可以使用参与的艺术家的声音和词曲创作者的作品,制作混音、翻唱以及新歌曲。而且平台会确保艺术家和词曲创作者得到应有的信用和报酬。
华纳音乐首席执行官罗伯特・金克尔表示,他们一直致力于保护艺术家和词曲创作者的权益,这次合作符合他们更广泛的努力,旨在负责任地释放AI的潜力。
签约华纳音乐的艺术家有很多大牌,像Lady Gaga、Coldplay、The Weeknd和Sabrina Carpenter等。Udio联合创始人兼首席执行官安德鲁・桑切斯也说,这是实现技术增强创造力、为艺术家和词曲创作者解锁新机会的重要一步。
这次和解标志着音乐产业在AI应用方面有了重大转变,相信这个新平台会给音乐行业带来新的活力和机遇。
工具地址:Udio AI网页版官网入口 (海外网站需要科学上网)

海螺AI与蜜雪冰城合作,UGC二创开启新玩法
海螺AI和蜜雪冰城联合搞了个大动作,发布了“雪王IP共创计划”,还向C端免费开放了角色、动作与场景模板。用户通过海螺AI小程序,就能一键生成“雪王大战东方明珠”等二创视频,还能一键投稿至品牌官方频道。
这计划一上线就火了,7天时间UGC作品量就突破了12万条,微博话题阅读量达到3.8亿,二次转发率高达38%,这效果比传统品牌广告强太多了。
从技术层面来看,这个工具包很实用。它提供了“角色骨骼 + 商用曲库 + 自动授权”的组合,AI能自动识别侵权元素并拦截,确保商用安全。品牌方还能通过后台设置二创范围,禁止血腥、政治等内容,实现“可控的创意裂变”。
在11月16日的“天天爱白日梦”演唱会上,主办方把粉丝的AI视频实时投屏,艺人现场模仿二创动作,现场弹幕互动量提升了210%,这验证了AI视频线下化的新可能。
行业分析认为,IP方通过“模板开源 + 授权内置”降低了创作门槛,用户二创又能反哺品牌热度,形成了“内容即广告”的闭环。随着海螺AI计划把工具包开放给更多影视与游戏IP,UGC二创说不定会成为粉丝经济的标准配置呢!
详情查看:海螺AI助力蜜雪冰城UGC活动,7天产出12万条视频,微博阅读3.8亿

快手KlingAI与ElevenLabs达成合作,提供“视觉+音频”一站式AI创意方案
2025年11月20日,中国快手旗下的视觉生成大模型KlingAI和全球领先的AI语音技术服务商ElevenLabs达成了战略协作,这消息在业内引起了不小的轰动。
这次合作构建了“视觉生成 + 音频赋能”的完整创意链路。创意人员先通过KlingAI生成1080p高清视觉内容,不管是文生视频、图生视频还是多模态编辑需求,都能精准呈现。然后再接入ElevenLabs的Playground平台,一键匹配情感丰富的语音配音、定制化音乐及场景音效,让创意作品全方位升级。
KlingAI作为“中国Sora”,凭借重构的Diffusion Transformer架构,能生成最长3分钟的连贯视频,5秒视频生成成本还控制在1元,首创的多模态视觉语言交互模式也很实用。ElevenLabs在AI语音合成领域也很有技术壁垒,能生成高保真、带情感语调的语音内容。
双方的合作打通了创意生产的“任督二脉”,以广告行业为例,这种一体化解决方案能让短视频广告制作周期从3天缩短到数小时,制作成本降低40%以上。
而且这场合作还展现了中外AI企业技术互补的可能性。双方将向全球创意者开放协作工具,涵盖内容创作、游戏开发、影视制作等多元场景。随着多模态技术不断成熟,创意行业“人人皆可创作”的时代或许真的要来了。
工具地址:快手KlingAI官网 (海外网站需要科学上网)

AI时代,漫剧投手如何变身“超级玩家”
在科技飞速发展的今天,AI正以惊人的速度重塑各个行业,漫剧投手这个岗位也不例外。很多人担心AI会让投手失业,其实不然,投手的工作不仅没消失,反而迎来了全新进化。
以前,传统投手更像是“操作工”,每天忙着报表整理、计划创建、基础调价等重复性工作。而AI时代,投手要进化成“战略家”,从操作层面上升到决策层面。
优秀投手得具备核心能力金字塔。底层是基础执行与心态,要有责任心、学习能力和沟通协同能力。中层是创意与洞察和数据科学与AI协同,要能直击用户内心,让AI成为得力助手。顶层是战略思维,要关注核心指标,提前布局。
虽然AI很强大,但有些事还得人来做。比如设定战略目标,AI不知道飞行的商业目的是什么;应对突发状况,遇到数据暴跌等情况,AI只会执行标准程序;在广告计划冷启动期或攻坚高难度客群时,需要人手动介入;AI能告诉你“发生了什么”,但不会告诉你“为什么发生”,这需要人的洞察和思考。
AI是工具,人是核心。在AI时代,投手们要向上思考,具备战略眼光、创意嗅觉和深度数据分析能力,这样才能不被AI取代,进化成“超级玩家”,在漫剧投放领域大展身手。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









