用 Claude 写出电影级 Prompt,Seedance 2.0 AI 视频制作全流程

频道:AI Samson · 时长:12:59

📺 AI Samson ⏱ 12:59 🗓 2026-05-19

视频信息

项目 内容
标题 Claude x Seedance 2.0 = This Changes AI Video Forever (Full Process)
教程编号 05
视频 ID 2FK2R83c3IY
时长 12:59
频道 AI Samson
上传日期 2026-04-20
URL https://www.youtube.com/watch?v=2FK2R83c3IY
主题 利用 Claude 的 Skill 功能系统化生成图像/视频 Prompt,结合 Seedance 2.0 制作电影级 AI 视频

引言

“SeaDance 2 is creating the best AI video we’ve ever seen, but only if you know how to prompt it. And prompting is getting infinitely more complex, and that’s why we’re leveraging the power of Claude to write articulate, defined, and descriptive prompts.”

AI 视频生成正在经历一场质变。Seedance 2.0 能够产出前所未有的高质量视频,但前提是你得会写 prompt。问题在于,视频 prompt 比图像 prompt 复杂得多——你不仅要描述画面中有什么,还要描述摄像机怎么动、主体在做什么、声音设计是什么样的。每一个变量都需要精确定义,否则 AI 就会自作主张,生成它”认为最好”的东西。

这就是为什么 AI Samson 选择用 Claude 来解决这个问题。他把 Claude 比作一个”master spellcaster(咒语大师)“,而你是一个年轻的学徒,把你粗糙的想法交给它,它帮你重新组织成精确、连贯、细致的语言——让 AI 视频生成器能够准确执行你的创意意图。

本教程将完整拆解他的三阶段工作流:从图像 prompt 生成、到视频 prompt 构建、再到多镜头序列制作。他还分享了一个可免费下载的 Claude Skill(自定义技能),把他数天的研究成果打包成了一个随时可用的 prompt 公式系统。


第一阶段 — 为什么需要 Claude 来写 Prompt

核心问题:直接写 prompt 效率太低

你可能会想:我直接在 AI 视频生成器里写 prompt 不就行了,为什么还要多走一步用 Claude?AI Samson 的回答非常直接:

“Claude can write clearer, better, and more specific prompts. You can imagine Claude as a master spellcaster, and you are a young Padawan offering it your idea, and it reimagines it in specific, coherent, and articulate language that allows us to get exactly what we’re looking for.”

关键点在于”specific(具体)“和”articulate(清晰表达)“。人类写 prompt 时往往模糊、笼统——”一个男人在神庙旁边走”,这种描述给了 AI 太多自由发挥的空间。而 Claude 能把你的想法展开成非常具体的镜头语言、色彩描述和动作细节。

三阶段工作流概览

整个流程分三步:

  1. 图像 Prompt 构建:用 Claude 生成精准的图像描述,生成第一帧画面
  2. 视频 Prompt 构建:以图像为起点,用 Claude 构建完整的视频 prompt
  3. 多镜头 Prompt 构建:进阶到一个 prompt 包含多个镜头的复杂序列

“We’re going to take this through in three stages. The first is generating images using an image prompt builder. The second is taking that image and then combining it with a video prompt to create a video. And thirdly, we’re going to push this to create multi-shot prompts.”


第二阶段 — Claude Skill 的构建与安装

什么是 Claude Skill

Claude Skill 是一种可自定义的信息模块,你可以把它上传到 Claude,让 Claude 在对话中反复使用。AI Samson 把它打包成了一个可下载的文件,包含三种 prompt 构建器:

Skill 是怎么做出来的

“The skill started as a problem I kept running into myself. Every time I sat down to generate an image or video, I was reinventing the wheel, trying to remember what elements to include, what order to put them in, what language actually works.”

AI Samson 的构建过程:

  1. 深度研究:研究了各种图像生成器的官方 prompting 指南
  2. 收集素材:整理了自己之前创建过的最佳 prompt
  3. 大量测试:测试了大量生成结果,找出哪些元素能持续产出电影级效果
  4. 提炼公式:把研究成果精炼成一套结构化的公式——图像一套、视频一套、多镜头一套
  5. 打包为 Skill:把公式封装成一个 Claude Skill

“It took me days to get this right, but you can have it in about 30 seconds.”

安装步骤

  1. 从视频描述中的链接下载 Skill 文件
  2. 打开 Claude,点击 Customize(自定义)
  3. 进入 Skills(技能) 选项卡
  4. 点击 Plus(加号)Create Skill(创建技能)Upload a Skill(上传技能)
  5. 将下载的文件拖放到上传框中

图像 Prompt 公式的核心要素

安装 Skill 后,Claude 在生成图像 prompt 时会自动套用以下结构:

要素 说明
Subject & Action(主体与动作) 谁在做什么
Location & Context(场景与背景) 在哪里、什么环境
Composition(构图) 镜头构图方式
Lighting(光线) 光照条件
Aesthetic(美学风格) 整体视觉风格
Camera & Lenses(相机与镜头) 模拟的摄影器材
Color Grading(调色) 色彩处理风格

第三阶段 — 图像 Prompt 实战:纪录片阿兹特克场景

输入你的创意想法

使用 Skill 时,你只需要用自然语言描述你的想法。AI Samson 的示例输入是:

“Write an image prompt for turning me into a documentarian walking through an ancient Aztec sacrifice ritual. Show me at the side of a temple in a classic documentary attire, white shirt, beige trousers. Have me in a medium shot, and the action on the right. Make it cinematic, realistic, and gritty.”

几个关键细节: - 描述了具体的角色定位(纪录片主持人) - 指定了服装(白衬衫、米色长裤) - 规定了构图(中景、动作在右侧) - 设定了视觉风格(电影感、写实、粗粝) - 附上了一张自己的参考照片

Claude 输出的亮点

Claude 生成的 prompt 包含了几个人类很难自己想到的精妙细节:

“First of all, we have a camera with a specific lens. This means that we’ll be carrying through this exact aesthetic from shot to shot.”

  1. 具体的镜头参数:指定了特定的相机镜头,确保从一个镜头到下一个镜头的美学一致性
  2. 精确的色彩调校:包含了详细的 color grading 描述
  3. 风格参照:用了”National Geographic meets Apocalypto”这样的跨领域类比

“And it’s this type of language that allows us to accurately define exceptional image prompts.”

在 Artlist 中生成图像

AI Samson 选择在 Artlist 平台(视频赞助商)中生成图像,但强调这个 prompt 构建器可以在任何图像生成器中使用。操作步骤:

  1. 进入 Artlist 的 AI Image 板块
  2. 粘贴 Claude 生成的 prompt
  3. 添加参考图像
  4. 选择图像模型(示例中使用了 Nano Banana Pro)
  5. 选择宽高比、分辨率和生成数量
  6. 点击生成

生成结果准确地呈现了他站在阿兹特克祭祀场景旁的画面。


第四阶段 — 视频 Prompt 构建:从静态到动态

为什么视频需要专门的 Prompt

这是本教程最核心的认知:图像 prompt 和视频 prompt 是完全不同的东西。

“A video is not an image. An image is a single frozen moment. You describe what’s in the frame, and you’re done. A video is time, it’s movement, it’s a camera that starts somewhere and ends somewhere else.”

视频涉及的变量远超图像: - 时间维度:动作有先后顺序 - 摄像机运动:推、拉、摇、移、跟 - 声音设计:对话、音效、环境音 - 主体动作:不是静止的,而是在做具体的事

“Unless we are dictating this, the AI video generator will create whatever it thinks is best. The video prompt is how you take back creative control.”

这是一个从”生成素材”到”导演一个场景”的认知升级:

“That’s the difference between generating footage and directing a scene.”

视频 Prompt 的公式结构

视频 prompt 遵循严格的顺序,这个顺序本身就很重要:

第一层:Cinematography(摄影) - 镜头类型:Wide shot(全景)、Close-up(特写) - 摄像机运动:Tracking(跟踪)、Dolly(推轨)、Crane(摇臂)、Handheld(手持)

“This goes first because it tells the generator the emotional relationship between the camera and the subject.”

第二层:Subject(主体) - 用物理层面的精确描述来定义动作 - 不说”he moves forward”,而说”he walks at a slow and deliberate pace, eyes forward, jaws set”

第三层:Context & Environment(场景与环境) - 环境描述 - 时间(一天中的什么时候) - 氛围 - 微妙的电影效果

第四层:Style & Color Grade(风格与调色) - 视觉风格 - 色彩分级——这是获得电影感的关键

第五层:Audio(音频) - 对话(用引号标注) - 音效(明确标注为 sound effects) - 环境音(增加真实感和沉浸感)

“Every element is in its place, in order, every time. That structure is what turns a vague idea into a precise set of directions the generator can actually execute.”

实战:阿兹特克纪录片视频

AI Samson 把之前生成的图像作为第一帧,输入 Claude:

“Write a video prompt, 15 seconds, starting with this frame. The man talks in a documentary style, English accent, about the ancient Aztecs, dramatic, engaging. He walks towards the camera as the camera pulls back. He passes a priest who is oblivious to him. He then claps, and time stops. He then talks about the sacred headdress the priest wears and touches its feathers. He then continues walking, claps, and time restarts.”

注意这个输入有多”粗糙”——它只是一个想法的草稿。Claude 的工作就是理解你的意图,把它转化成 AI 能完全理解的精确指令。

Claude 输出的两种 Prompt

Claude 会生成两个版本的 prompt:

  1. 短版 Prompt:2,500 字符以内,适用于有字符限制的平台
  2. 完整版 Prompt:不限长度,包含所有细节

“The reason there are two prompts is because some platforms have a character limit, and then if you engage any specific issue, you can take elements from the longer prompt and replace them in the shorter prompt.”

Prompt 内容亮点

Claude 生成的视频 prompt 包含了极其专业的电影术语:

“Getting Claude to write this for us saves us not only time, but it also helps us get much closer to our desired idea.”

在 Seedance 2 中生成视频

操作步骤: 1. 将 Claude 生成的 prompt 粘贴到 Seedance 2 2. 设置视频长度(15秒) 3. 选择分辨率 4. 确认使用 Seedance 2 模型 5. 发送生成


第五阶段 — 迭代与调试:当 AI 不听话时

常见问题:动作执行不准确

AI Samson 在实际操作中遇到了一个典型问题——他想让角色鼓掌(clap),但 AI 的理解出了偏差:

“I was having a little bit of trouble with this idea to actually get my protagonist to clap. As you can see here, he seems to either slap the priest in the face or do one odd one-handed clap.”

两种调试策略

策略一:直接重跑 Prompt

“Every time you send it in, you’ll get a different output.”

同一个 prompt 每次生成的结果都不一样。有时候问题不在 prompt,而在随机种子。简单地重新运行一次就可能得到你想要的结果。

策略二:在 Claude 中定向修正

如果重跑无效,回到 Claude,明确告诉它哪里出了问题,让它针对性地修改 prompt:

“What I simply do is ask Claude to rewrite the video prompt to emphasize a two-hand clap because currently this is not working.”

修改后的 prompt 重新送入 Seedance 2,鼓掌动作就被准确渲染了。这个迭代过程非常高效——你不需要从头来过,只需要在 Claude 中微调出问题的部分。


第六阶段 — 进阶:多镜头蒙太奇序列

挑战升级:15 个镜头,15 秒

最后一个阶段是整个工作流的终极测试——创建一个包含 15 个镜头的 15 秒蒙太奇视频。AI Samson 的创意概念是:

“I want to take myself in ancient Rome as a gladiator training in a beautiful montage for a big fight. It’s a sort of Rocky meets 300.”

完整的多镜头工作流

第一步:生成图像

第二步:构建多镜头 Prompt

回到 Claude,上传刚生成的图像,并给出详细指令:

第三步:生成并检查

将 prompt 粘贴到 Seedance 2,注意匹配视频长度和宽高比,发送生成。

多镜头输出的关键质量

“We’ve got consistent character, lighting, and aesthetic from shot to shot, and this rapid montage that’s taking us through this dramatic sequence.”

成功的多镜头序列需要三个一致性: 1. 角色一致性:每个镜头中的人物看起来是同一个人 2. 光线一致性:照明风格在镜头之间保持连贯 3. 美学一致性:色彩调校和视觉风格统一

这正是 Claude Skill 的价值所在——它在每个 prompt 中都嵌入了相同的镜头参数、色彩调校和风格语言,确保多个镜头之间的视觉连贯性。


第七阶段 — 工作流的哲学与方法论

从”生成素材”到”导演场景”

这个工作流的核心思想不仅仅是技术层面的——它代表了一种创作哲学的转变。大多数人使用 AI 视频生成器时,只是在”生成素材”——输入一个模糊的想法,看 AI 给你什么。而 AI Samson 的方法是”导演一个场景”——你对每一个变量都有明确的控制。

“This is the way that you can take your ideas and turn them into complex videos using SeaDance 2. AI video is becoming exceptionally good, but only if you know how to use it.”

Claude 作为”翻译层”

Claude 在这个工作流中扮演的角色本质上是一个”翻译层”——它把人类的模糊创意翻译成 AI 能准确执行的技术指令。你不需要自己记住所有的电影术语、镜头参数和 prompt 结构,Claude 替你持有这些知识,并且每次都系统化地应用。

“So, now instead of me having to remember all of this, Claude holds the formula and applies it systematically every single time.”


核心概念速查表

概念 定义 应用场景
Claude Skill 可上传到 Claude 的自定义信息模块,让 Claude 反复使用特定公式 标准化 prompt 生成流程
Image Prompt Builder 图像 prompt 构建器,包含主体、场景、构图、光线、美学、镜头、调色等要素 生成 AI 视频的第一帧
Video Prompt Builder 视频 prompt 构建器,按固定顺序包含摄影、主体动作、场景、风格、音频 将静态图像转化为动态视频
Multi-shot Prompt Builder 多镜头 prompt 构建器,在单个 prompt 中定义多个连续镜头 创建蒙太奇或叙事序列
Color Grading 色彩分级/调色,定义画面的整体色彩风格 确保电影感和镜头间一致性
Anamorphic DOF 变形镜头景深效果,模拟电影级别的焦点虚化 增强电影质感
Gimbal Dolly 稳定器推轨运动,摄像机平滑后退/前进 定义摄像机运动方式
First Frame 视频生成的第一帧图像,决定了视频的起始画面 用图像 prompt 先生成,再作为视频起点
Short Prompt vs Full Prompt Claude 输出的两种长度的 prompt,短版<2500字符,长版不限 适配不同平台的字符限制
Seedance 2.0 当前最先进的 AI 视频生成模型之一 视频生成的执行引擎

实用技巧总结

  1. 先图像后视频:不要直接写视频 prompt,先用 Claude 生成图像 prompt,生成第一帧,再以此为基础构建视频 prompt。这个”图像→视频”的两步流程大幅提升成功率。

  2. 安装 Claude Skill 而不是每次手写:把 prompt 公式封装成 Skill,让 Claude 自动套用,避免”每次都在重新发明轮子”。

  3. 用自然语言描述你的想法:不需要用专业术语输入 Claude,你的想法可以很粗糙、很随意。Claude 会帮你翻译成精确的技术语言。

  4. 附上参考图片:给 Claude 一张你自己(或目标角色)的照片作为参考,生成结果会更贴合你的预期。

  5. 指定色彩偏好:在输入中明确你想要的色彩基调(如”blue hues dominate”),Claude 会把这个偏好贯穿到所有 prompt 中。

  6. 善用两版 Prompt:短版适用于有字符限制的平台;如果某个细节没渲染好,从长版中提取对应描述替换到短版中。

  7. 迭代而非重来:如果生成结果某个部分不对,不要从头开始——先试试直接重跑,再试在 Claude 中针对性修改出问题的部分。

  8. 注意 Prompt 中元素的顺序:摄影参数在前,主体动作在中间,风格和音频在后。这个顺序不是随意的,它告诉 AI 生成器各元素的优先级。

常见误区

  1. 误区:直接在视频生成器里写 prompt 就够了 事实:人类写的 prompt 往往模糊、遗漏关键细节。Claude 能系统化地覆盖所有必要元素——摄影、动作、场景、风格、声音,每个都不遗漏。

  2. 误区:图像 prompt 和视频 prompt 可以通用 事实:图像是”一个冻结的瞬间”,视频是”时间、运动、摄像机从一个位置到另一个位置”。它们需要完全不同的描述结构。

  3. 误区:Prompt 越长越好 事实:很多平台有字符限制(如 2,500 字符)。Claude 的双版本输出就是为了解决这个问题——短版精炼、长版详尽,按需选用。

  4. 误区:一次生成不成功说明 prompt 有问题 事实:同一个 prompt 每次生成的结果都不同。第一次不成功时,先简单重跑几次再决定是否修改 prompt。

  5. 误区:只要描述画面内容就行 事实:不描述摄像机运动、声音设计和色彩调校,AI 会自己决定这些——而它的决定往往不是你想要的。“Video prompt is how you take back creative control.”

  6. 误区:Prompt 中元素的排列顺序无所谓 事实:顺序非常重要。摄影参数放在最前面,因为它决定了”摄像机和主体之间的情感关系”。

  7. 误区:多镜头视频需要一个一个镜头分别生成 事实:Claude 的多镜头 prompt 构建器可以在一个 prompt 中定义所有镜头,一次性生成完整序列,并保持角色、光线、美学的一致性。

  8. 误区:Claude Skill 只是一个简单的 prompt 模板 事实:它是经过大量研究、测试和提炼的结构化公式系统,包含三种不同的 prompt 构建器,每种都针对不同的生成场景优化。

  9. 误区:AI 视频生成不需要学习,直接用就行 事实:正如 AI Samson 所说——“AI video is becoming exceptionally good, but only if you know how to use it.” 工具强大不等于你不需要学会使用它。

  10. 误区:动作描述用笼统的词就够了 事实:不说”he moves forward”,要说”he walks at a slow and deliberate pace, eyes forward, jaws set”。物理层面的精确描述是让 AI 准确执行动作的关键。

关键要点

  1. Seedance 2.0 能产出顶级 AI 视频,但前提是 prompt 写得好——prompt 质量直接决定了输出质量。

  2. Claude 是你的”prompt 翻译层”——它把你模糊的创意想法翻译成 AI 能精确执行的技术指令。

  3. Claude Skill 把数天的研究打包成了 30 秒就能用的工具——一次安装,反复使用。

  4. 图像 prompt 的七大要素:主体与动作、场景与背景、构图、光线、美学风格、相机与镜头、色彩调校。

  5. 视频 prompt 的五层结构,顺序很重要:摄影→主体→场景→风格与调色→音频。

  6. “图像→视频”的两步流程是成功的关键:先生成第一帧,再以此为基础生成视频。

  7. Claude 输出双版本 prompt(短版 + 长版),适配不同平台的字符限制,并方便定向修改。

  8. 迭代是正常的工作流程——先重跑,再定向修改,不需要每次从头来过。

  9. 多镜头序列的核心是一致性——角色、光线、美学风格必须在镜头之间保持连贯。

  10. 从”生成素材”到”导演场景”的认知升级——精确控制每一个变量,而不是让 AI 替你做决定。

  11. Prompt 中的专业电影术语(如 gimbal dolly、anamorphic DOF)不需要你自己记——Claude 会帮你写,你只需要用自然语言描述你的想法。

  12. 这套方法论适用于任何图像/视频生成器,不局限于 Artlist 或 Seedance 2——prompt 构建器的逻辑是通用的。

结论

AI 视频生成正在快速进化,Seedance 2.0 这样的模型已经能产出令人惊叹的电影级画面。但工具的能力和使用者的能力之间存在一个巨大的鸿沟——而 Claude 正好填补了这个鸿沟。

AI Samson 的这套三阶段工作流(图像 prompt → 视频 prompt → 多镜头序列)本质上是在解决一个核心问题:如何把人脑中模糊的创意,精确地传达给 AI。通过 Claude Skill 系统化 prompt 公式、通过双版本输出适配不同平台、通过迭代修正逐步逼近理想效果——这是一套完整的、可复制的创作方法论。

“AI video is becoming exceptionally good, but only if you know how to use it. Now, what are you waiting for? Go ahead and try it out yourself.”

最重要的认知转变是:你不是在”用 AI 生成视频”,你是在”用 Claude 当翻译、用 AI 当摄影师、自己当导演”。当你学会导演一个场景而不是仅仅生成素材时,AI 视频的质量将发生质的飞跃。