字节跳动震撼发布Seedance 1.0：AI视频生成领域迎来新巅峰-AITOP100,AI资讯

Seedance 1.0

2025年6月11日-12日在北京举办的《2025火山引擎FORCE原动力大会·春》上字节跳动Seed团队正式揭开新一代视频生成基础模型Seedance 1.0的神秘面纱，并同步公开其技术报告。这一成果堪称AI视频生成领域的一次重大飞跃，Seedance 1.0在多镜头叙事、运动生成效果、风格创作以及推理速度等多个维度展现出卓越实力，为内容创作领域开辟了全新的可能性。

Seedance 1.0

目前Seedance 1.0视频生成基础模型已经可以在即梦AI和 Dreamina ai：字节跳动即梦AI海外版上面使用了，不过小编吐槽一下，有点小贵！生成一个5秒的视频需要50积分，生成一个10秒视频需要100积分。

地址：Dreamina ai：字节跳动即梦AI海外版

地址：即梦AI：字节跳动AI视频绘画工具

一、核心能力大升级，重塑视频生成新标杆

（1）原生多镜头叙事，打造电影级视觉盛宴

Seedance 1.0具备令人瞩目的原生多镜头叙事能力，能够支持生成包含2 - 3个镜头切换的10秒视频，实现远、中、近景画面的自然过渡，极大地提升了视频的叙事层次和感染力。

比如，当输入“女孩弹钢琴，多镜头切换，电影质感”的指令时，模型仿佛一位专业的电影导演，精准地生成多个镜头无缝衔接的视频。先以全景展现钢琴与演奏环境，让观众仿佛置身于音乐现场；接着切换到中景，聚焦女孩灵动的手部动作，感受她指尖在琴键上的跳跃；最后以特写捕捉女孩专注的面部表情，将情感细腻地传递给观众，完美营造出电影级的叙事效果。

Seedance 1.0

再如，“多个镜头。一名侦探进入一间光线昏暗的房间。他检查桌上的线索，手里拿起桌上的某个物品。镜头转向他正在思索”的指令，模型同样出色地执行。通过不同镜头的巧妙转换，营造出紧张悬疑的氛围，让观众仿佛身临其境，跟随侦探一起探寻真相。

Seedance 1.0

（2）运动生成效果飞跃，动态画面自然流畅

相较于以往的模型，Seedance 1.0在画面与主体动态效果上实现了质的飞跃。它对主体动作的捕捉更加精准，结构稳定性更强，细节把控能力也更为出色，生成崩坏率显著降低。

在“滑雪者在滑雪，他转弯时扬起大片雪雾，沿着山坡逐渐加速，镜头平稳地移动着”的生成任务中，模型不仅准确还原了滑雪者的动作轨迹，还细腻地表现出雪雾扬起的动态效果，镜头移动平稳自然，画面流畅得如同真实拍摄一般。

Seedance 1.0

而在“一位身着黑色露背礼服的模特优雅地走在鲜艳的红色T台上。光线展现出面料的流动感。观众席间的目光追随模特，最后灯光渐暗”的场景中，模特的步态、礼服面料的流动感以及光线的变化都被处理得恰到好处，充分展现了模型在动态生成方面的卓越能力。

Seedance 1.0

（3）多元风格创作支持，满足多样化创意需求

Seedance 1.0能够精准响应指令，生成写实、动漫、影视、广告等不同风格的高品质视频内容。其画质更加真实，美感更强，为创作者提供了广阔的创意空间。

无论是追求真实感的写实风格视频，让观众仿佛置身于现实世界；还是充满想象力的动漫风格作品，带领观众进入奇幻的二次元世界；亦或是具有强烈视觉冲击力的影视、广告风格视频，吸引观众的眼球，Seedance 1.0都能轻松胜任，满足创作者多样化的创作需求。

（4）高速推理与低成本优势，大幅提升创作效率

通过对模型结构的精心设计和极致的推理加速，Seedance 1.0实现了40 + 秒的高速推理，大幅降低了创作成本。以5秒1080p分辨率的视频生成任务为例，基于L20测试的实测推理耗时仅为41.4秒。这一速度优势使得创作者能够更快地将创意转化为视频内容，极大地提升了创作效率，让创意不再被时间所束缚。

图片风格

二、权威榜单大放异彩，综合实力稳居榜首

在第三方评测榜单Artificial Analysis上，Seedance 1.0在文生视频和图生视频两个任务中均表现出色，力压群雄，位居首位。

在文生视频任务中，其Arena ELO达到1314，领先于谷歌的Veo 3 Preview（1252）、Veo2（1131），快手的Kling 2.0（1114）、Kling 1.5(Pro)（1053）以及OpenAI的 Sora（1053）等模型。在图生视频任务中，Seedance 1.0的Arena ELO为1365，同样超越了谷歌的Veo 3 Preview（1240）、快手的Kling 2.0（1194）等竞争对手。

Seedance 1.0

为了更全面、客观地评估模型性能，团队还建立了一个综合基准，邀请影视导演、业内专家联合制定评估标准，涵盖主体生成、动作稳定性、镜头切换和表达、美感、指令遵循等多个维度。

测试结果显示，Seedance 1.0在动态图像生成的各维度上都有出色的综合表现，尤其在动作生成、指令遵循等关键能力上处于业界前列。此外，在推理速度和用户好评度等方面，该模型也表现突出，赢得了广泛认可。

三、技术创新驱动突破，全方位优化模型性能

数据处理：构建多元数据集，提升数据利用率

在数据构建过程中，Seedance 1.0团队聚焦于视频多源采集与描述说明获取，构建了多种类型、风格、来源的大规模视频数据集。团队采集了视频的时长、分辨率、主题、场景、艺术风格、镜头运动等关键维度信息，使模型能够充分提取不同场景、风格、主题、镜头画面、尺寸下的主体轮廓与动作特征。

为了提高数据利用率，团队引入自动镜头边界检测技术，通过帧间差异分析精准分割视频片段，还基于启发式规则与物体检测自适应裁剪帧，最大化保留主体内容，并进行精准数据筛选，同步提升了数据量级与多样性，为模型的训练提供了丰富且高质量的数据支持。

下图是Seedance 1.0文生视频任务综合评测：

Seedance 1.0文生视频任务综合评测

下图是Seedance 1.0图生视频任务综合评测：

Seedance 1.0图生视频任务综合评测

精准描述模型：增强模型理解力，精准响应用户指令

针对实际训练中精准描述数据缺失的问题，团队专门训练了“精准描述模型”来生成视频描述作为训练数据。该模型采用动静态特征融合的密集描述架构，动态侧用于精细刻画视频的动作变化与镜头运动，静态侧则负责深度解析特定一帧的核心主体与场景信息。

通过这种架构，提升了模型对动态和静态信息的理解力，确保模型能够准确响应用户指令并生成复杂内容，让生成的视频更符合用户的预期。

预训练框架：统一高效，支持多任务处理

Seedance 1.0通过高效的模型结构设计、多模态交织的位置编码和多任务统一建模，实现了无缝支持多镜头视频创作，并且作为单个模型可同时支持文生视频和图生视频等任务。

下图是Seedance 1.0 的数据处理流程：

其预训练框架采用了解耦的空间与时间层，空间层在单帧内部执行注意力聚合，时间层专注于跨帧的注意力计算，提升了训练和推理效率。同时，引入多镜头多模态旋转位置编码（MM - RoPE），支持视觉token与文本token的交错序列，加强了模型的多镜头生成能力和多模态理解力。此外，统一的任务框架通过二元掩码指示控制条件，实现了不同生成任务之间的相互学习，降低了模型应用门槛，提高了模型的通用性和灵活性。

后训练优化：构建复合奖励系统，提升画面质量

在后训练阶段，团队通过高质量的精调数据集、多维度的奖励模型和反馈学习算法，提升了Seedance 1.0在运动生动性、结构稳定性、画面质量等维度的表现。

构建的复合奖励系统包括基础奖励模型（聚焦图文对齐与结构稳定性）、运动奖励模型（抑制视频伪影，提升运动幅度、生动性与稳定性）和美学奖励模型（赋予模型影视级美感）。在RLHF训练中，采用最大化多个奖励模型奖励值的方法，针对文本 - 视频对齐度、运动质量及美学表现等维度进行优化，结合视频定制化的反馈学习，实现了模型多维能力的协同进化，让生成的视频在各个方面都更加出色。

推理加速：算法与底层协同，实现极致加速

为实现极致推理加速，Seedance 1.0采用模型算法与底层推理的协同优化技术。在算法层面，引入分段轨迹一致性、分数匹配与人类偏好引导的对抗蒸馏机制，在极低推理步数下实现生成质量与速度的更优协同，同时使用通道结构细化的轻量级VAE解码器，实现视频生成路径中感知质量无损的双倍加速。

在底层推理方面，通过融合算子优化、异构量化稀疏策略、自适应混合并行、异步卸载与VAE并行分解等系统级改造，构建了面向长序列视频生成的高效推理路径，实现了端到端吞吐与内存效率的更优协同，让模型在实际应用中能够快速、稳定地运行。

开放使用，Seedance 1.0已公开技术报

目前，Seedance 1.0已公开技术报告，并通过即梦、豆包及火山引擎API接口开放使用。用户可以访问项目主页（https://seed.bytedance.com/seedance）查看完整技术报告并体验交流，亲身感受这一强大模型的魅力。

对于未来发展，Seedance团队有着清晰而宏伟的规划。在模型优化方面，将探索更高效的结构设计与加速方法，构建效果更好、成本更低、生成更快的视频生成模型，并在此基础上开发可实时交互且精准可控的视频生成模型，让视频生成更加便捷、高效。

在智能化提升方面，将拓展模型对世界知识的理解，增强生成真实感和物理规律合理性，探索多模态信息融合，如赋予模型音频输入输出能力，让生成的视频更加生动、丰富。

此外，还将探索数据、模型量级、奖励模型等维度的Scaling现象，推进视频生成模型的能力进一步涌现，为视频生成领域带来更多的创新和突破。

随着Seedance 1.0的发布，AI视频生成技术又向前迈进了一大步。它不仅为内容创作者提供了强大的工具，也为视频生成领域的发展指明了方向。

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集