• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

腾讯版Sora视频生成模型震撼发布,发布即开源

腾讯版Sora视频生成模型震撼发布,发布即开源
AI TOP100
2024-12-03 16:54:15

腾讯版Sora视频生成模型震撼发布,发布即开源

根据AITOP100平台获悉,腾讯公司正式推出了其自主研发的视频生成模型——腾讯版Sora,并宣布该模型即日起在GitHub与Hugging Face平台全面开源。作为目前参数量最大的开源视频生成模型,Sora的发布无疑为国内AI视频生成领域注入了新的活力。

目前已知参数是130亿,成为当前参数量最大的开源视频生成模型。其模型的权重、推理代码、模型算法等全部上传GitHub和Hugging Face,这次是一点也没藏着。

腾讯版Sora模型凭借其超写实画质、高语义一致、运动画面流畅以及原生镜头转换等四大特点,迅速吸引了业界的广泛关注。其高清质感和真实感使得生成的视频内容能够直接应用于工业级商业场景,为广告、影视等行业带来了全新的创作可能。同时,Sora模型能够准确表达出文本的内容,确保生成的视频与用户的创意需求高度契合。

在实测中,腾讯版Sora模型展现出了出色的性能。无论是冲浪题材中的流畅运镜,还是镜子题材中对光影的细腻处理,Sora都表现出了卓越的视频生成能力。尤其值得一提的是,Sora模型原生具备自动生成多视角同主体的镜头切换画面功能,这一能力在业界大部分模型中都是不具备的,进一步提升了视频叙事的丰富性和观赏性。

技术方面,腾讯版Sora模型同样亮点频出。其文本编码器适配了新一代多模态大语言模型,使得模型的语义跟随能力更加强大;自研的3D视觉编码器则支持混合图片/视频训练,有效提升了压缩重建性能;而全注意力机制的采用,则确保了画面流畅度的大幅提升。这些技术亮点的融合,使得Sora模型在文本视频一致性、运动质量和画面质量等多个维度上都取得了领先的效果。

为了让更多用户能够体验到Sora模型的魅力,腾讯公司已经将Sora模型上线至腾讯元宝APP的AI应用中的“AI视频”板块。用户可以在此申请试用,感受Sora模型带来的全新视频生成体验。同时,腾讯还同步开放了API测试,开发者可以通过腾讯云接入,进一步拓展Sora模型的应用场景。

腾讯元宝APP中目前每天免费生成3次:

腾讯公司已经将Sora模型上线至腾讯元宝APP的AI应用中的“AI视频”板块

prompt提示词用法(官方的写prompt小tips):

用法1:提示词=主体+场景+运动

用法2:提示词=主体(主体描述)+场景(场景描述)+运动(运动描述)+(镜头语言)+(氛围描述)+(风格表达)

用法3:提示词=主体+场景+运动+(风格表达)+(氛围描述)+(运镜方式)+(光线)+(景别)

多镜头生成:提示词=[场景1]+镜头切换到[场景2]

两个动作生成:提示词=[主体描述]+[动作描述]+[然后、过了一会等连接词]+[动作描述2]

实测视频展示效果:


总结而言,腾讯版Sora视频生成模型的发布即开源,不仅为AI视频生成领域带来了新的突破和机遇,也为广大开发者和用户提供了更加便捷、高效的视频创作工具。我们期待在未来的日子里,能够看到更多基于Sora模型的精彩作品和创意应用。

,腾讯版Sora视频生成模型的发布即开源

各位看官老爷,元元给大家总结如下:

模型介绍:

  • 模型名称:腾讯版Sora
  • 参数量:130亿,是目前参数量最大的开源视频生成模型
  • 开源平台:GitHub与Hugging Face

模型特点:

  • 超写实画质:具备高清质感、真实感,可用于工业级商业场景
  • 高语义一致:能够准确表达出文本的内容
  • 运动画面流畅:可生成大幅度的合理运动,不易变形
  • 原生镜头转换:模型原生具备自动生成多视角同主体的镜头切换画面

实际应用:

  • 上线平台:腾讯元宝APP的AI应用中的“AI视频”板块
  • 试用申请:用户可在上述平台申请试用
  • API测试:同步开放测试,开发者可通过腾讯云接入

实测效果:

  • 冲浪题材:表现出流畅运镜的能力,但在“最后定格在…”的要求上稍显不足
  • 镜子题材:考验模型对光影的理解及镜子内外主体运动的一致性,但在幽灵脚部细节上有所欠缺
  • 多镜头切换:表现优秀,是业界大部分模型所不具备的能力

技术亮点:

  • 文本编码器:适配新一代多模态大语言模型,获得更强大的语义跟随能力
  • 视觉编码器:自研3D视觉编码器,支持混合图片/视频训练,提升压缩重建性能
  • 全注意力机制:从头到尾用full attention机制,没有用时空模块,提升画面流畅度

官方评估:

  • 腾讯混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先

prompt用法提示:

  • 提示词用法:给出了多种提示词组合的用法,帮助用户更好地使用模型

总结:腾讯版Sora是一款具备高画质、高语义一致、运动画面流畅及原生镜头转换等特点的开源视频生成模型,用户可在腾讯元宝APP申请试用,并通过腾讯云接入API。其技术亮点包括适配新一代多模态大语言模型的文本编码器、自研3D视觉编码器及全注意力机制。官方评估显示,该模型在多个维度效果领先。

官网:https://aivideo.hunyuan.tencent.com

代码:https://github.com/Tencent/HunyuanVideo

模型:https://huggingface.co/tencent/HunyuanVideo

更多实用AI工具推荐请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 腾讯混元3D
  • 腾讯元宝
相关资讯
  • 阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互

  • 蚂蚁开源MedResearcher-R1:医疗AI推理的“智能引擎”,为精准医疗研究注入新动能

  • 上海AI实验室重磅开源书生·万象InternVL3.5:多模态大模型技术再突破,推理性能提升16%

  • 重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

  • 9月1日AI内容标识新规落地!从业者必知的生存指南:不合规直接承担法律风险

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

4天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

8天前
2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

2天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

5天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

4天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有