LTX官方正式发布未来路线图,宣布下一版 LTX-2 将于本季度内推出。此次迭代不仅是对1月版本 的延续,更将围绕 “细节保留、对齐一致性、音频稳定、图像到视频行为、提示理解” 五大核心维度进行深度优化,旨在解决真实创作痛点,持续贴近专业工作流。
核心技术迭代:VAE、对齐与音频
1. 新一代 VAE:重塑细节保留能力在视频生成中,为了保证速度,通常需要将视频压缩到紧凑的 Token 空间,这往往导致细节丢失。下一版 LTX-2 将引入 全新的 VAE(变分自编码器),旨在保留更多原始信号的同时保持生成效率。这一改进将带来更锐利的纹理表现、更稳定的精细结构,并显著减少长序列生成中的细节衰减。
2. 条件对齐:精准遵循输入意图针对图像到视频(Image-to-Video)和重绘(Retake)工作流,新版本将大幅提升模型对 条件输入(Conditioning Inputs) 的遵循能力。重点优化包括更紧密地对齐参考帧、在多次运行中保持输出一致性,以及减少生成内容意外偏离源素材的漂移现象,让创作者能更精确地控制生成结果。
3. 音频生成:从 “可用” 到 “可靠”团队致力于解决音频生成中的痛点,目标是 减少静音输出 并提升整体稳定性。通过降低噪声干扰和生成过程中的不稳定性,新版本将使音频行为在真实工作流中变得可预测,让音频成为创作者可以信赖的元素,而非需要反复重试的 “抽卡” 环节。
工作流贴近与 Prompt 理解强化
图像到视频:拒绝 “伪运动”基于真实用户的反馈,LTX-2 将重点改善图像到视频的动态表现。改进方向包括减少 冻结片段(frozen clips) 和低运动幅度的静态输出,并优化场景切换与转场处理。目标是让生成的运动看起来具有意图性和连续性,而非仅仅是技术上有效但视觉上呆滞的 “惰性” 画面。
Prompt 理解:更懂你的指令通过更新文本编码连接器及其与管线的集成方式,新版本将显著增强 Prompt 理解能力。这意味着模型将能更准确地解释和遵循复杂的文本指令,减少语义偏差,让用户的创意意图能更直接地转化为画面。
持续演进的季度计划官方强调,1 月发布的版本只是起点而非终点。下一版 LTX-2 预计将在 本季度内 发布,团队将继续保持快速迭代的节奏,确保持续交付价值。
AITOP100小编总结
LTX-2 的迭代重点并非单纯的 “炫技”,而是务实地解决真实工作流中的摩擦。通过提供更好的细节、更强的对齐、更稳定的音频与运动,以及更懂提示的生成能力,LTX 团队承诺将继续以 “公开、以使用为导向” 的方式推进开发,打造真正经得起生产环境考验的视频生成模型。
LTX工具体验: https://www.aitop100.cn/tools/ltx.studio
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










