若你試過「一句話生成一段影片」,卻常遇到人物飄移、動作發軟、鏡頭像幻燈片,或多素材疊在一起時模型「不知道聽誰的」,Seedance 2.0 這類多模態、可引用素材的模型,核心在於把創作拆成「素材分工 + 語言調度」。本文從能力、參數、模式、寫法到迭代做系統整理。額度、入口與介面以即夢(及官方說明)即時為準;下文數量與時長多為常見說明,請於產品內再次核對。
Seedance 2.0 是什麼,適合誰
Seedance 2.0 是字節 Seed 路線上的新一代 AI 影片生成能力,強調在一次生成鏈路中統籌畫面與聲音相關表達(是否「音畫一體輸出」依當前版本而定)。與早期「只餵一句話」不同,它鼓勵同時準備文字、圖片、參考影片、參考音訊,並用自然語言說明各自任務——例如誰決定長相、動作、鏡頭節奏、配樂氣質。
特別適合:短廣告、劇情片段、角色短片、產品展示、舞蹈或動作複刻、需相對穩定人設的內容;也適合願意把 Prompt 當成「場記單 + 分鏡說明」的創作者。若完全不想管鏡頭與素材,也能用,但較難發揮可控性。
心智模型:從「生成」到「導演」
工作可分三層:
- 素材層:圖、參考片、參考曲、關鍵字。
- 分工層:每份素材在成片中的角色(首幀、角色鎖定、動作/運鏡參考、情緒節奏等)。
- 語言層:提示詞寫清時空、動作、鏡頭、光線、風格及不要發生什麼。
Seedance 2.0 的關鍵是說清第 2 層——通常用 @ 提及把「第幾號素材」寫進句並點名用途,減少模型瞎猜。
輸入規格與規劃(務必以產品內為準)
常見參考上限大致如下(僅供排期,非永久不變):
- 成片時長:約 15 秒 量級。
- 圖片:約 9 張。
- 參考影片:約 3 段,總長常與成片上限聯動。
- 音訊:約 3 個 MP3。
- 引用檔案總數:約 12 個。
- 解析度:常見 1080P 或更高。
建議:第一次勿塞滿槽位。單張主圖 + 清晰提示詞跑通後,再加參考影片解決動作/鏡頭,最後再加音訊對齊情緒;每多一類素材,就多一句「誰負責什麼」。
兩種主流程
1. 首尾幀/圖生影片
上傳關鍵一幀或首尾幀,描述誰在做什麼、環境、鏡頭怎麼動。適合讓插畫/寫真動起來、單鏡情緒表演。
要點:主語清楚、動作可觀察、鏡頭有動詞、光線與材質有錨點。
2. 全能參考/多模態
需跨鏡頭角色一致,或把參考片中的舞步、運鏡遷到新場景時,用「多素材 + @」。想像成極簡製片表:A 圖負責臉與服裝、B 片負責動作軌跡、C 音負責節奏情緒。難在約束自洽:參考動作與文案場景是否衝突、音畫是否一致、多人時互動是否寫清。
@ 語法
輸入 @ 常會彈出素材列表,亦可用 @ 按鈕。原則:點名 + 用途;一材一職;與主句主體/場景一致。
示例(序號請依實際上傳調整):
- 「
@圖片1作為首幀,人物轉向鏡頭微笑,緩慢推近,暖色側光,電影感。」 - 「
@圖片1角色為唯一主角,動作與節奏參考@影片1,整體都市夜景。」 - 「畫面情緒與
@音訊1同步,勿改@圖片1髮型與服裝。」
Prompt:公式與 S-A-C-S-C
主體 + 動作 + 運鏡 + 風格與環境。形容詞盡量可畫面化。
- S 主體:誰;有定妝圖用
@鎖外觀。 - A 動作:具體肢體與節奏。
- C 運鏡:機位與運動、快慢。
- S 風格:場景、光線、材質、片種氣質。
- C 約束:禁止換裝、換臉、跳切、形變、多餘角色等。
鏡頭詞:遠/全/中/近/特寫;平視、俯拍、仰拍、過肩;固定、搖、推軌、跟拍、手持感、環繞、升降;希區考克變焦、長鏡頭氣質、少切鏡(寫在約束裡)。
迭代
- 每次只改一個變數。
- 先短後長(如 4~6 秒)穩身份與主動作。
- 失敗分類:隨機/prompt 衝突/素材衝突/模式不符,對症修改。
常見誤區
風格矛盾、運鏡缺失、@ 無用途、動作不可執行、多人互動含糊。
場景建議
角色一致:定妝 + @ + 約束「同一人」。多人:誰對誰、視線、順序、空間關係。動作複刻:參考片 + @ 綁來源。配樂情緒:音訊與畫面關鍵詞對齊。續拍:銜接動作與連續運鏡(依版本)。局部修改:明寫保留與修改項。電商:主圖鎖 Logo/材質;字可讀、不扭曲商標;避免過快推拉。
結語
Seedance 2.0 的價值是把「想拍成什麼樣」變成分工指令:@ 管素材角色,結構化 Prompt 管動作、鏡頭與約束。把上限當製片預算、迭代當走位測光,就能從抽卡式生成走向可預期、可複用的短片流程。創作前請在即夢或官方渠道確認最新規則與入口。