我们希望Vidu Ai的无限可能,可以帮助实现您的个人艺术创想。为了保证更好地画面效果,丰富而准确的提示词对于将要创作的视频至关重要。
本指南提供了基本示例结构、关键词以及风格化提示技巧,以帮助您更好地呈现创意灵感。请谨记,这些示例仅仅只是起点,您可以自由探索和创新,发挥自己天马行空的想象。

初阶教程
提示词词典
通过一些特定提示词可以触发 Vidu 的生成效果变化,例如 prompt 带有“大动态”生成的视频运动幅度会更大一些。




提示词调优
往往第一次编写的提示词生成的效果不稳定,当发现缺陷后,再针对性的修改提示词进行优化基本上是必须的。
当然也需要注意的是提示词并非万能,当有些效果无论怎么修改都无法达到时,可能是由于模型本身的效果限制。
功能-图片
Idea 预期效果(变身3D人)
输入图片如下:

原始提示词:图片中的人物变身为3D卡通人
调优后提示词:
# 主题:通过 3D 渲染过程将图像 1 转变为皮克斯/迪士尼风格的人物。
# 风格: 3D渲染
# 要求:1.详细描述图像 1 中的主体。 2.详细描绘转变过程。 3.详细描绘最终的皮克斯/迪士尼风格的人物,包括超大的眼睛、红润的脸颊、手、腿、动作、面部表情、夸张的头身比例
案例分析
原始提示词:会有一定概率无法变成3D卡通人
优化后提示词:增加了关于变化过程和变化后的人物的细节要求。
进阶教程
1、轻松玩转「主体库」
1.1 基础操作指引

1.2 如何提升主体的一致性?
建立主体核心是 2 步,1 是上传图片,2 是对描述进行确认。图片建议上传三视图(正面、侧面、背面),如果没有,也可上传多角度图片,或者立体感的图片。描述需要仔细查看,对于不符合的地方可修改矫正,提升识别准确性。
1.3 提示词中如何使用我的主体?
有 2 种方式,1 是在我的主体中勾选,2 是在提示词输入框中输入@调取。
在提示词撰写中,可以将主体放置在提示词最后面,也可以将主体穿插在提示词中间。

1.4 如何提升提示词的可控性?
1.使用的图片总量不建议超过 7 张,主体总量不超过 4 个。

2.如果发现物体的动作不符合预期,可尝试对主体加特征词,例如扎着丸子头的小男孩@哪吒,带着蓝色脖套的@小狗。
3.可调整提示词的结构,比如首帧 xxxx,中间帧 xxxx,尾帧 xxxx,或者第 1 秒 xxxx,第2 秒 xxx。

参考生介绍
1、参考生功能介绍
1.1 复杂主体的精准控制
无论是细节丰富的角色,还是复杂的物体,Vidu都能保证其在多个不同视角下的一致性。
示例
造型复杂的3D动画风格角色,无论视角如何变化,Vidu始终确保头型、服饰的全角度细节一致,避免了传统视频模型在复杂视角切换时产生的瑕疵。
1.2 人物面部特征和动态表情的自然一致
在人物特写镜头中,Vidu能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象。精细的面部控制使Vidu在创作细腻、真实角色时具有显著的优势。
1.3 多主体一致性
Vidu允许用户上传多个主体图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。例如,用户可以上传主体、客体和环境的图片,创建定制角色身穿特定服装、在定制空间内自由动作的场景。Vidu还支持多个主体之间的互动,用户可以上传多个自定义角色,让它们在指定空间内进行交互。
此外,Vidu还支持融合不同主体特征,例如将角色A的正面与角色B的反面无缝融合,创造出全新的角色或物体。
1.4 镜头控制
通过镜头提示词的使用,可以控制镜头的运动方式,并可实现两种镜头的组合使用。

Vidu Prompt 基本构成
1、提示词基础架构
主体/场景——场景描述——环境描述——艺术风格/媒介

- 调整句式和语序,避免主体物过多/复杂,主体物分散的句式描述;
- 避免模糊的术语表达,尽可能准确;
- 使用更加流畅准确的口语化措辞,避免过度文学化的叙述;
- 丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。
2、提示词与画面联想程度的说明
为了帮助你更好的地理解,让我们使用单帧图像作为最简单的例子,来向您介绍提示词与画面联想的关系。
示例图如下:

- 基础词:玻璃桌上的咖啡杯,杯子外面写着单词 LOVE。
- 适度联想扩充:花园里(具体的位置描述)的透明(材质描述)玻璃桌上的咖啡杯,杯子外面写着单词 LOVE,周围满是盛开的鲜花(具体的位置描述/环境描述),和煦的阳光洒满整个花园(环境描述),Claude Monet(艺术家风格),印象派风格(艺术流派风格)。
- 联想关键点:
- 具体详实的位置描述/环境描述:笼统来讲就是在进行构图,可以帮助构建画面的基本呈现效果;
- 艺术风格描述:进一步提升效果和氛围,统一画面风格。
3、效果示例
3.1 概述
当提示词遵循主体/场景(主要指具体内容),场景描述,环境描述和艺术风格/媒介的基本结构时,可以在一定程度上提升视频生成效果。
在提示词的不同位置重复和强化关键内容的风格描述,可以适度提高输出风格的一致性和画面丰富程度。
3.2 具体示例
游泳”为例
Capture a serene moment featuring a baby Corgi swimming gracefully in a large, sunlit pool. The underwater perspective showcases the puppy, its gentle smile illuminated by soft, golden hour lighting that filters through the water, creating a dance of light and shadow on the pool's bottom. The scene is set in soft pastel colors, enhancing the dreamlike, ethereal quality of the atmosphere. The high-resolution photography captures every delicate detail of the water's texture and the Corgi's joyful expression, creating a simple yet cinematic portrait of tranquility and innocence. This minimalist yet emotive setup conveys a sense of calm and happiness, ideal for a serene and visually captivating film sequence.
捕捉柯基犬宝宝在阳光照耀下的大泳池中优雅游泳的宁静时刻。水下的视角展现了小狗温柔的笑容,柔和的金色灯光穿过水面,在池底形成光影的舞动。场景以柔和的粉色为主色调,烘托出梦幻般的空灵氛围。高分辨率的摄影作品捕捉到了水的纹理和柯基犬欢快表情的每一个精致细节,创造出一幅简单而又充满电影感的宁静和纯真的肖像。这种简约而富有情感的设置传达出一种平静和幸福的感觉,是宁静而具有视觉吸引力的电影镜头的理想选择。
3.3 提示词分析
原始提示词:A baby corgi swims in a large pool
联想提示词:Capture a serene moment featuring a baby Corgi swimming gracefully in a large, sunlit pool. The underwater perspective showcases the puppy, its gentle smile illuminated by soft, golden hour lighting that filters through the water, creating a dance of light and shadow on the pool's bottom. The scene is set in soft pastel colors, enhancing the dreamlike, ethereal quality of the atmosphere. The high-resolution photography captures every delicate detail of the water's texture and the Corgi's joyful expression, creating a simple yet cinematic portrait of tranquility and innocence. This minimalist yet emotive setup conveys a sense of calm and happiness, ideal for
3.3.1 “柯基犬游泳”视频生成需求
- 温馨宁静的氛围
- 电影画面及质感
- 柔和的光影效果
基于上述的视频生成需求,按照提示词基本架构进行调整和优化,在基本的框架下对主体/场景(“柯基犬游泳)进行扩写,重点在于营造视频整体温馨纯真的电影视觉效果。
同时,为了强化效果和氛围的一致性,需要对整体氛围进行多次强调和细化,在提示词的不同位置也可以适度强调氛围提示词内容。
注:氛围提示词,可以重复进行强调和细化。如“柯基犬游泳”的提示词所示,为了整体温馨宁静的氛围,提示词内多次出现温柔、柔和、优雅、宁静等符合整体氛围的不同氛围词,以此强化整体的氛围效果。
3.3.2 “柯基犬游泳”视频提示词架构

Vidu Prompt 关键词
以“Teddy bear/泰迪熊”为主角进行风格化的效果演示,通过关键词的使用,帮助实现多种电影风格以及拍摄方式的呈现,更好地完成个人的视频生成需求。
基础提示词:A melancholic teddy bear, dressed in rugged attire with a wide-brimmed hat and a bandolier, gazes at the camera, its lips trembling slightly as it exhales a puff of smoke. The warm glow of its cigarette illuminates its face, casting shadows that emphasize its somber mood. Its paws rest on the porch railing in a relaxed pose, but its button eyes betray a deeper sadness. As it slowly turns its head to the left, its gaze shifts to the distant horizon, lost in thought. The lighting is low, with cool blue tones contrasting the warm light from the cigarette, enhancing the mood of quiet reflection. The setting, a porch with wooden panels and a window behind it, completes the Western ambiance, capturing a moment of introspective solitude amidst the vast, open landscape.
风格化提示词:In classical romantic movie style(电影风格/拍摄方式/媒介), a melancholic teddy bear, dressed in rugged Western attire with a wide-brimmed hat and a bandolier, gazes at the camera, its lips trembling slightly as it exhales a puff of smoke. The warm glow of its cigarette illuminates its face, casting shadows that emphasize its somber mood. Its paws rest on the porch railing in a relaxed pose, but its button eyes betray a deeper sadness. As it slowly turns its head to the left, its gaze shifts to the distant horizon, lost in thought. The lighting is soft, with a blend of pink and golden hues from a setting sun, enhancing a romantic atmosphere. The setting, a porch with wooden panels and a window behind it, completes the Western ambiance, capturing a moment of introspective solitude amidst the vast, open landscape.
1、电影风格
基础风格
科幻 (Sci-fi)
西部(Western)
犯罪 (Crime)
恐怖 (Horror/Thriller)
其它....
更多详情请查看:【Vidu AI官方视频教程指南】








