如果你已经试过「一句话生成一段视频」,但经常遇到人物漂移、动作发软、镜头像幻灯片、或者多素材叠在一起时模型「不知道听谁的」,那么 Seedance 2.0 这类多模态、可引用素材的模型,核心差异在于:它允许你把创作拆成「素材分工 + 语言调度」。本文从能力、参数、模式、写法到迭代,做一次系统梳理。具体额度、入口与界面以即梦(及官方说明)实时为准,下文中的数量与时长多为社区与产品说明中的常见表述,使用前请在产品内再次核对。

Seedance 2.0 是什么,适合谁

Seedance 2.0 是字节 Seed 路线上的新一代 AI 视频生成能力,强调在一次生成链路里统筹画面与声音相关的表达(具体是否「音画一体输出」以当前产品版本为准)。与早期「只喂一句话」不同,它更鼓励你同时准备文本、图片、参考视频、参考音频,并用自然语言说明各自承担什么任务——例如谁决定长相、谁决定动作、谁决定镜头节奏、谁决定配乐气质。

它特别适合:要做短广告、剧情小片段、角色短片、产品展示、舞蹈或动作复刻、需要相对稳定人设的内容;也适合愿意把 Prompt 当成「场记单 + 分镜说明」来写的人。若你完全不想管镜头与素材,只想要随机灵感,它也能用,但会浪费模型在可控性上的长处。

先建立心智模型:从「生成」到「导演」

可以把自己的工作分成三层:

  1. 素材层:有哪些图、参考片、参考曲、文案关键词。
  2. 分工层:每一块素材在成片里扮演什么(首帧、角色锁定、动作参考、运镜参考、情绪与节奏参考等)。
  3. 语言层:用提示词写清时间、空间、动作、镜头、光线、风格,以及不要发生什么

Seedance 2.0 的关键工具,是把第 2 层说清楚——通常通过 @ 提及把「第几号素材」写进句子,并点名用途。这样模型较少出现「猜你想用哪张图」的低效试错。

输入规格与规划原则(务必以产品内为准)

社区与教程里常见的参考上限大致如下,用于排期与分镜,不代表永久不变:

  • 成片时长:常见上限约 15 秒 量级(不同套餐或模式可能不同)。
  • 图片:约 9 张,用于人物、场景、首帧、细节约束等。
  • 参考视频:约 3 段,总时长常与成片上限联动(例如合计不超过约 15 秒)。
  • 音频:约 3 个 MP3,总时长同样受限。
  • 引用文件总数:有说明提到约 12 个 为上限。
  • 分辨率:常见可达 1080P 或更高,视账号与线路而定。

规划建议:不要第一次就把槽位塞满。更稳的路径是:单张主图 + 一段清晰提示词跑通主体与光影;再增加「参考视频」专门解决动作或镜头;最后再引入音频做情绪对齐。每增加一类素材,提示词里就要多写一句「谁负责什么」,否则容易出现风格打架、动作来源不明、镜头语义含糊等问题。

两种主流程:从轻到重

1. 首尾帧 / 图生视频向流程

这是上手最快的路径:上传关键一帧或首尾帧,用自然语言描述「谁在做什么、在什么环境、镜头怎么动」。它适合:让插画或写真动起来、做一个镜头内的情绪表演、验证你对模型口味的基本判断。

要点是:主语清晰(谁)、动作可执行(可观察的身体动作,而不是抽象形容词堆砌)、镜头有动词(推、拉、摇、移、跟、俯拍、环绕等)、光线与材质有锚点(逆光、阴天柔光、霓虹反射、胶片颗粒等)。

2. 全能参考 / 多模态流程

当你需要角色在不同镜头里仍然像同一个人、或者要把某段参考片里的舞步、运镜迁移到新场景时,就适合进入「多素材 + @」流程。你可以把它理解成:你在给模型一份极简制片表——「A 图负责脸和服装」「B 视频负责动作轨迹」「C 音频负责节奏与情绪」。

这一档的难度不在于「会点按钮」,而在于约束是否自洽:参考视频里的动作与提示词里的场景是否冲突、音频情绪与画面叙事是否一致、多人物时是否写清了互动关系。

@ 语法:把「分工」写进句子里

在支持的环境下,输入 @ 往往会弹出已上传素材列表,也可通过界面上的 @ 按钮插入。写作时尽量遵循:

  • 点名 + 用途:不只写 @图片1,而要写「@图片1 作为首帧构图与人物外观参考」这类完整分工句。
  • 一材一职或少职:同一段素材尽量不要同时承担互相矛盾的任务(例如既要求严格锁定五官,又要求完全换成另一个人的表演风格)。
  • 与提示词主句对齐:主句里的主体、动作、场景应与 @ 分工一致,避免主句写「室内」却用 @ 强绑一个纯户外参考视频导致语义撕裂。

示例思路(需按你实际上传的素材序号调整):

  • @图片1 作为首帧,人物转向镜头微笑,缓慢推近,暖色侧光,电影感。」
  • @图片1 中角色为唯一主角,动作与节奏参考 @视频1,整体风格为都市夜景。」
  • 「画面情绪与 @音频1 同步,不要改变 @图片1 的发型与服装。」

Prompt 怎么写:公式与结构化模板

基础公式

实践中反复验证有效的结构是:

主体(谁) + 动作(做什么) + 运镜(镜头怎么说) + 风格与环境(光、色彩、材质、时代感)

可以把它想成一句话新闻加上摄影指导。形容词尽量可画面化:与其说「很好看」,不如说「柔焦前景、高光轮廓、浅景深、肤色自然」。

S-A-C-S-C 模板(便于长提示词不跑偏)

  • S(Subject 主体):谁出镜;若有定妆图,用 @ 锁定外观。
  • A(Action 动作):具体肢体行为与节奏(走、转身、举手、对视、跳舞步名等)。
  • C(Camera 运镜):机位与运动方式,必要时写速度(缓慢/快速)。
  • S(Style 风格):场景、光线、材质、时代、片种气质(广告/纪录/二次元写实等)。
  • C(Constraint 约束):禁止项——不换装、不换脸、不跳切、不形变、不额外角色等。

镜头词汇速查(可逐步积累)

  • 景别:远景、全景、中景、近景、特写。
  • 机位高度:平视、俯拍、仰拍、过肩。
  • 运动:固定、横摇、纵摇、推轨、跟拍、手持感、环绕、升降。
  • 特殊语感:希区柯克变焦、长镜头气质、剪辑感弱化(若你希望少切镜可在约束里写清)。

迭代方法:少改、可对比、先短后长

  1. 每次只改一个变量:同一套素材下,先改运镜,再改光线,再改动作强度;不要十行一起重写,否则你无法知道有效变化来自哪里。
  2. 先短后长:先用较短时长(例如 4~6 秒)把身份稳定主动作跑顺,再尝试更长段落或更复杂调度。
  3. 失败分类:把坏结果分成「跟 prompt 无关的随机」「跟 prompt 冲突」「跟素材冲突」「跟模式不匹配」,对症改写法而不是盲目重抽。

常见误区(可直接对照自查)

  • 风格矛盾:同一段里「极简留白」与「极繁装饰」「赛博高饱和」与「低调纪实」混写。
  • 运镜缺失:不写镜头状态,模型默认「乱动」或「呆站」,画面会像素材拼贴而非拍摄。
  • @ 不写用途:只堆素材不解释,模型优先级混乱。
  • 动作不可执行:写「她感到人生充满希望」而不写「她抬头深吸气、嘴角轻微上扬、看向窗外」。
  • 多人互动含糊:不写视线、站位、先后动作,容易出现穿模或角色黏连。

场景化建议(按需取用)

角色一致性:定妆图 + @ 锁定外观;约束里写清「保持同一人物」;避免在同一段引入会抢脸信息的强风格参考。

双人/多人对手戏:写清谁对谁做什么、视线方向、先后次序;比单人多用两句空间关系(左右、前后、距离)。

动作复刻(舞蹈、武术、手势):用参考视频 + @ 绑定动作来源;提示词里写「跟随参考的节奏与关键姿态」,并约束「不改变角色外观」。

配乐与情绪:音频参考 + 画面关键词对齐(紧张/舒缓/史诗);若产品支持更细的音画控制,以界面选项为准。

续拍或延长:在前一片段结尾画面清晰的前提下,用文本写衔接动作连续运镜,减少跳变;具体是否支持「接龙式延长」以版本为准。

局部修改诉求(如只换发型或背景):必须显式写出保留项与修改项,并预期可能需要多轮;极端局部控制有时仍受模型能力边界限制。

电商与产品:产品主图锁定 Logo 与材质;约束「文字清晰可读」「不扭曲商标」;镜头避免过快推拉导致读不清卖点。

结语

Seedance 2.0 的价值,不在于替代剪辑软件,而在于把「我想拍成什么样」翻译成模型能稳定执行的分工指令:用 @ 管理素材角色,用结构化 Prompt 管理动作、镜头与约束。把上限当作制片预算,把迭代当作测光与走位,你会更快从「抽卡式生成」过渡到可预期、可复用的短片工作流。开始创作前,记得在即梦或官方渠道确认最新规则与入口,再按项目需求逐步加码素材与复杂度即可。