2025年9月30日,OpenAI正式上线了其旗舰级视频+音频生成模型——Sora 2。这款模型不仅在技术上实现了重大突破,更在产品形态上进行了根本性变革。它究竟能否成为AI影视领域的“ChatGPT 3.5”,甚至打开一扇通往全新社交媒介的“星际之门”?
体验地址:Sora 2网页版官网入口 (海外网站需要科学上网)
技术升级:从“特效”到“世界模拟”
相较于前代产品,Sora 2最显著的变化在于其对物理世界的理解能力大幅提升。研究人员指出,用户初次接触Sora 2时,最直观的感受是其反应更加自然、真实。这种真实感并非源于画面质量的提升,而是模型开始遵循物理规律。
案例对比:
场景 | Sora 1表现 | Sora 2表现 |
---|---|---|
篮球运动员投篮未中 | 球“瞬移”进篮筐或跳过结果 | 球撞到篮板后弹回,呈现失败过程 |
花样滑冰运动员头顶猫 | 猫消失、人物穿模、画面崩塌 | 猫保持平衡,人物完成跳跃后稳稳落地 |
技术负责人Thomas Dimson解释道,Sora 1时期模型过于追求“成功”,导致违背常理;而Sora 2开始接受并呈现失败,这是AI首次具备“物理感”。它不仅能理解重力、惯性、摩擦力等基本物理概念,还能模拟人物翻身跳跃后的落地动作。
更令人惊叹的是,Sora 2支持一次性生成多镜头的长场景,并同步生成背景音、人物语音及唇形。这意味着AI不再仅仅是“视频特效师”,而是开始“建立自己的世界观”,模拟真实世界的运行逻辑。
Cameo功能:让用户成为内容主角
Sora 2的核心创新在于Cameo功能。用户只需录制一段10秒的视频,系统即可抓取其外貌、声音和表情。此后,用户可以将自己“放入”任何生成的场景中,与朋友同框出现在“太空战斗”或“浪漫广告”里,甚至无需亲自拍摄,只需授权即可被朋友“加入”视频项目。
使用场景示例:
- 与OpenAI CEO Sam Altman同框出演广告,唇形、动作自然切换;
- 将宠物狗以动漫风格加入雪地视频;
- 在Cameo设定中添加偏好,如“总是戴金链子”“想穿西装”等。
产品团队领导Rohan强调,Cameo的权限机制设计得非常细致。用户可以完全控制谁可以使用自己的形象,从“仅自己”到“完全公开”分为四个等级。每个视频若使用用户肖像,用户都会收到提醒,并可随时撤回授权或永久删除相关内容。
社交方向:从内容消费到共同创作
Sora 2的信息流设计也体现了其社交导向。默认信息流优先展示熟人生成的视频和互动过的账户内容,而非算法推荐的热门话题。每个视频下方都设有显眼的“Remix”按钮,用户可点击后直接加入自己的形象,修改画面、动作、主题或讲述新版本的故事。
设计细节:
- 反无限滑动机制:用户滑屏过久时,系统会弹窗提醒尝试创作;
- 青少年保护设置:未成年用户默认不开放无限浏览权限,信息流观看时长自动限制;
- 情绪引导设计:信息流顶部设有测试功能,用户可用一句话表达需求,如“我想放松一下”“找创作灵感”等。
OpenAI首席执行官Sam Altman表示,Sora 2的成功标准在于半年后用户是否觉得“自己变得更有创造力”。他强调,Sora 2不是工具,而是新一代创作和连接的媒介。
避开竞品,探索新路
尽管Sora 2在视觉风格上与TikTok等短视频平台相似,但其核心定位截然不同。TikTok等平台依赖算法推荐内容,用户动机是观看而非创作;而Sora 2则通过关系链和创作意愿,鼓励用户参与内容生成。
为什么说Sora 2不是在挑战TikTok?
- TikTok已拥有超10亿级用户,内容分发网络强大;
- 生成式视频成本高、速度慢,远不及滑动播放现有视频的效率;
- Sora 2押注的是“怎么让你愿意做一条视频,拉上朋友一起玩”。
结语:入口变了,未来已来
Sora 2的上线,标志着AI视频生成领域从“内容工具”向“社交媒介”的转变。它不靠信息流争夺注意力,而是靠用户之间的关系激发创作欲望。当生成视频成为社交表达,当AI不再是工具而是媒介,视频的使用场景将彻底改变。
未来,AI视频竞争的比拼将不再是内容质量或流量大小,而是谁能让用户产生一个念头:“我想做一个视频,把我和你放进去。”这正是Sora 2所探索的“朋友圈入口”的意义所在。这些故事才刚开始,而主角是你,是你的朋友。
文章素材来源:OpenAI官方
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: