Seedance 2.0 综合入门 - Seedance 2.0 博客

如果你已经试过「一句话生成一段视频」，但经常遇到人物漂移、动作发软、镜头像幻灯片、或者多素材叠在一起时模型「不知道听谁的」，那么 Seedance 2.0 这类多模态、可引用素材的模型，核心差异在于：它允许你把创作拆成「素材分工 + 语言调度」。本文从能力、参数、模式、写法到迭代，做一次系统梳理。具体额度、入口与界面以即梦（及官方说明）实时为准，下文中的数量与时长多为社区与产品说明中的常见表述，使用前请在产品内再次核对。

Seedance 2.0 是什么，适合谁

Seedance 2.0 是字节 Seed 路线上的新一代 AI 视频生成能力，强调在一次生成链路里统筹画面与声音相关的表达（具体是否「音画一体输出」以当前产品版本为准）。与早期「只喂一句话」不同，它更鼓励你同时准备文本、图片、参考视频、参考音频，并用自然语言说明各自承担什么任务——例如谁决定长相、谁决定动作、谁决定镜头节奏、谁决定配乐气质。

它特别适合：要做短广告、剧情小片段、角色短片、产品展示、舞蹈或动作复刻、需要相对稳定人设的内容；也适合愿意把 Prompt 当成「场记单 + 分镜说明」来写的人。若你完全不想管镜头与素材，只想要随机灵感，它也能用，但会浪费模型在可控性上的长处。

先建立心智模型：从「生成」到「导演」

可以把自己的工作分成三层：

素材层：有哪些图、参考片、参考曲、文案关键词。
分工层：每一块素材在成片里扮演什么（首帧、角色锁定、动作参考、运镜参考、情绪与节奏参考等）。
语言层：用提示词写清时间、空间、动作、镜头、光线、风格，以及不要发生什么。

Seedance 2.0 的关键工具，是把第 2 层说清楚——通常通过 @ 提及把「第几号素材」写进句子，并点名用途。这样模型较少出现「猜你想用哪张图」的低效试错。

输入规格与规划原则（务必以产品内为准）

社区与教程里常见的参考上限大致如下，用于排期与分镜，不代表永久不变：

成片时长：常见上限约 15 秒 量级（不同套餐或模式可能不同）。
图片：约 9 张，用于人物、场景、首帧、细节约束等。
参考视频：约 3 段，总时长常与成片上限联动（例如合计不超过约 15 秒）。
音频：约 3 个 MP3，总时长同样受限。
引用文件总数：有说明提到约 12 个 为上限。
分辨率：常见可达 1080P 或更高，视账号与线路而定。

规划建议：不要第一次就把槽位塞满。更稳的路径是：单张主图 + 一段清晰提示词跑通主体与光影；再增加「参考视频」专门解决动作或镜头；最后再引入音频做情绪对齐。每增加一类素材，提示词里就要多写一句「谁负责什么」，否则容易出现风格打架、动作来源不明、镜头语义含糊等问题。

两种主流程：从轻到重

1. 首尾帧 / 图生视频向流程

这是上手最快的路径：上传关键一帧或首尾帧，用自然语言描述「谁在做什么、在什么环境、镜头怎么动」。它适合：让插画或写真动起来、做一个镜头内的情绪表演、验证你对模型口味的基本判断。

要点是：主语清晰（谁）、动作可执行（可观察的身体动作，而不是抽象形容词堆砌）、镜头有动词（推、拉、摇、移、跟、俯拍、环绕等）、光线与材质有锚点（逆光、阴天柔光、霓虹反射、胶片颗粒等）。

2. 全能参考 / 多模态流程

当你需要角色在不同镜头里仍然像同一个人、或者要把某段参考片里的舞步、运镜迁移到新场景时，就适合进入「多素材 + @」流程。你可以把它理解成：你在给模型一份极简制片表——「A 图负责脸和服装」「B 视频负责动作轨迹」「C 音频负责节奏与情绪」。

这一档的难度不在于「会点按钮」，而在于约束是否自洽：参考视频里的动作与提示词里的场景是否冲突、音频情绪与画面叙事是否一致、多人物时是否写清了互动关系。

`@` 语法：把「分工」写进句子里

在支持的环境下，输入 @ 往往会弹出已上传素材列表，也可通过界面上的 @ 按钮插入。写作时尽量遵循：

点名 + 用途：不只写 @图片1，而要写「@图片1 作为首帧构图与人物外观参考」这类完整分工句。
一材一职或少职：同一段素材尽量不要同时承担互相矛盾的任务（例如既要求严格锁定五官，又要求完全换成另一个人的表演风格）。
与提示词主句对齐：主句里的主体、动作、场景应与 @ 分工一致，避免主句写「室内」却用 @ 强绑一个纯户外参考视频导致语义撕裂。

示例思路（需按你实际上传的素材序号调整）：

「@图片1 作为首帧，人物转向镜头微笑，缓慢推近，暖色侧光，电影感。」
「@图片1 中角色为唯一主角，动作与节奏参考 @视频1，整体风格为都市夜景。」
「画面情绪与 @音频1 同步，不要改变 @图片1 的发型与服装。」

Prompt 怎么写：公式与结构化模板

基础公式

实践中反复验证有效的结构是：

主体（谁） + 动作（做什么） + 运镜（镜头怎么说） + 风格与环境（光、色彩、材质、时代感）

可以把它想成一句话新闻加上摄影指导。形容词尽量可画面化：与其说「很好看」，不如说「柔焦前景、高光轮廓、浅景深、肤色自然」。

S-A-C-S-C 模板（便于长提示词不跑偏）

S（Subject 主体）：谁出镜；若有定妆图，用 @ 锁定外观。
A（Action 动作）：具体肢体行为与节奏（走、转身、举手、对视、跳舞步名等）。
C（Camera 运镜）：机位与运动方式，必要时写速度（缓慢/快速）。
S（Style 风格）：场景、光线、材质、时代、片种气质（广告/纪录/二次元写实等）。
C（Constraint 约束）：禁止项——不换装、不换脸、不跳切、不形变、不额外角色等。

镜头词汇速查（可逐步积累）

景别：远景、全景、中景、近景、特写。
机位高度：平视、俯拍、仰拍、过肩。
运动：固定、横摇、纵摇、推轨、跟拍、手持感、环绕、升降。
特殊语感：希区柯克变焦、长镜头气质、剪辑感弱化（若你希望少切镜可在约束里写清）。

迭代方法：少改、可对比、先短后长

每次只改一个变量：同一套素材下，先改运镜，再改光线，再改动作强度；不要十行一起重写，否则你无法知道有效变化来自哪里。
先短后长：先用较短时长（例如 4～6 秒）把身份稳定与主动作跑顺，再尝试更长段落或更复杂调度。
失败分类：把坏结果分成「跟 prompt 无关的随机」「跟 prompt 冲突」「跟素材冲突」「跟模式不匹配」，对症改写法而不是盲目重抽。

常见误区（可直接对照自查）

风格矛盾：同一段里「极简留白」与「极繁装饰」「赛博高饱和」与「低调纪实」混写。
运镜缺失：不写镜头状态，模型默认「乱动」或「呆站」，画面会像素材拼贴而非拍摄。
@ 不写用途：只堆素材不解释，模型优先级混乱。
动作不可执行：写「她感到人生充满希望」而不写「她抬头深吸气、嘴角轻微上扬、看向窗外」。
多人互动含糊：不写视线、站位、先后动作，容易出现穿模或角色黏连。

场景化建议（按需取用）

角色一致性：定妆图 + @ 锁定外观；约束里写清「保持同一人物」；避免在同一段引入会抢脸信息的强风格参考。

双人/多人对手戏：写清谁对谁做什么、视线方向、先后次序；比单人多用两句空间关系（左右、前后、距离）。

动作复刻（舞蹈、武术、手势）：用参考视频 + @ 绑定动作来源；提示词里写「跟随参考的节奏与关键姿态」，并约束「不改变角色外观」。

配乐与情绪：音频参考 + 画面关键词对齐（紧张/舒缓/史诗）；若产品支持更细的音画控制，以界面选项为准。

续拍或延长：在前一片段结尾画面清晰的前提下，用文本写衔接动作与连续运镜，减少跳变；具体是否支持「接龙式延长」以版本为准。

局部修改诉求（如只换发型或背景）：必须显式写出保留项与修改项，并预期可能需要多轮；极端局部控制有时仍受模型能力边界限制。

电商与产品：产品主图锁定 Logo 与材质；约束「文字清晰可读」「不扭曲商标」；镜头避免过快推拉导致读不清卖点。

结语

Seedance 2.0 的价值，不在于替代剪辑软件，而在于把「我想拍成什么样」翻译成模型能稳定执行的分工指令：用 @ 管理素材角色，用结构化 Prompt 管理动作、镜头与约束。把上限当作制片预算，把迭代当作测光与走位，你会更快从「抽卡式生成」过渡到可预期、可复用的短片工作流。开始创作前，记得在即梦或官方渠道确认最新规则与入口，再按项目需求逐步加码素材与复杂度即可。