LTX-2路线图发布：视频生成模型迈向真实工作流-AITOP100,AI资讯

LTX官方正式发布未来路线图，宣布下一版 LTX-2 将于本季度内推出。此次迭代不仅是对1月版本的延续，更将围绕 “细节保留、对齐一致性、音频稳定、图像到视频行为、提示理解” 五大核心维度进行深度优化，旨在解决真实创作痛点，持续贴近专业工作流。

核心技术迭代：VAE、对齐与音频

1. 新一代 VAE：重塑细节保留能力在视频生成中，为了保证速度，通常需要将视频压缩到紧凑的 Token 空间，这往往导致细节丢失。下一版 LTX-2 将引入全新的 VAE（变分自编码器），旨在保留更多原始信号的同时保持生成效率。这一改进将带来更锐利的纹理表现、更稳定的精细结构，并显著减少长序列生成中的细节衰减。

2. 条件对齐：精准遵循输入意图针对图像到视频（Image-to-Video）和重绘（Retake）工作流，新版本将大幅提升模型对条件输入（Conditioning Inputs）的遵循能力。重点优化包括更紧密地对齐参考帧、在多次运行中保持输出一致性，以及减少生成内容意外偏离源素材的漂移现象，让创作者能更精确地控制生成结果。

3. 音频生成：从 “可用” 到 “可靠”团队致力于解决音频生成中的痛点，目标是减少静音输出并提升整体稳定性。通过降低噪声干扰和生成过程中的不稳定性，新版本将使音频行为在真实工作流中变得可预测，让音频成为创作者可以信赖的元素，而非需要反复重试的 “抽卡” 环节。