12 лютого 2026 року команда Seed ByteDance офіційно представила Seedance 2.0 — мультимодальну модель генерації відео ШІ нового покоління. Вона використовує єдину архітектуру спільної мультимодальної аудіо-відео генерації з підтримкою тексту, зображення, аудіо та відео на вході й задає нові стандарти у фізично точному русі, узгодженості персонажів і режисерському контролі камери. Одна генерація видає високоякісний аудіовізуальний контент для задач промислового рівня.

Що таке Seedance 2.0

Seedance 2.0 — найпросунутіша на сьогодні модель генерації відео ШІ ByteDance. На відміну від ранніх рішень з одним текстовим або графічним входом, вона побудована на єдиній мультимодальній архітектурі, що приймає текст, зображення, аудіо та відео, і використовує систему згадок @ природною мовою, щоб точно задати роль кожного матеріалу (наприклад, зовнішність персонажа з зображення, рух і камера з відео, ритм і стиль з аудіо). Парадигма «від промпту до режисера» дозволяє творцям керувати всією генерацією як зйомкою, пропонуючи рідкісний повний набір мультимодальних посилань та редагування.

У бенчмарку SeedVideoBench-2.0 Seedance 2.0 лідирує за якістю руху, візуальною точністю, фізичною коректністю, дотриманням промпту та часовою узгодженістю, задаючи новий орієнтир для «придатної, керованої та якісної» генерації відео ШІ.

Основні можливості

Мультимодальні посилання та система @

Користувачі можуть завантажувати до 9 зображень, 3 відео та 3 аудіокліпів одночасно і за допомогою природної мови та згадок @ вказувати, чи використовується кожен матеріал для «руху», «стилю», «персонажа», «камери» чи «аудіо-ритму». Одна генерація об’єднує мульти-джерельні посилання без покрокової композиції чи пост-синхронізації.

Нативна спільна генерація аудіо-відео

Seedance 2.0 видає аудіо та відео разом в одній генерації, а не «спочатку картинка, потім звук». Підтримує діалог з синхронізацією губ, звукові ефекти, узгоджені з дією на екрані, фонову музику за візуальним ритмом і виразний закадровий голос при підтримці стерео. Формати на кшталт talking head, сюжету чи реклами можна проєктувати «аудіо-відео єдиним цілим» з самого початку без окремого аудіо-постпродакшену.

Фізично точний рух і складна взаємодія

У сценах з жорсткою фізикою та складною взаємодією (парне катання, багатокористувацькі змагання, робота з технікою) модель помітно покращує природність, зв’язність і фізичну правдоподібність руху. «Придатність» у складних сценах взаємодії та руху досягає передового галузевого рівня.

Режисерський контроль камери

Користувачі можуть задавати зум Хічкока, орбіту, трекінг, тележку, handheld і складну хореографію з переходами безпосередньо природною мовою або завантажувати референсне відео, щоб модель відтворювала його прийоми камери та ритм монтажу в нових сценах.

Узгодженість персонажів та об’єктів

Після завантаження референсних зображень персонажа чи продукту Seedance 2.0 зберігає риси обличчя, одяг і логотипи узгодженими у всіх кадрах, ракурсах та освітленні. Ідентичність і зовнішній вигляд залишаються стабільними без правки по кадрах чи ручного трекінгу.

Редагування та продовження відео

Підтримується цільове редагування існуючого відео: заміна вказаних сегментів, персонажів чи дій або «продовжити зйомку» за промптом для генерації послідовних кадрів і подовження/продовження відео.

Сценарії та доступ

Seedance 2.0 підходить для комерційної реклами, кіно-VFX, e-commerce відео, ігрового CG, короткого відео та освітніх пояснень, істотно знижуючи витрати та цикл від ідеї до готового монтажу. Доступний на Jiemeng web, у додатку Doubao та в центрі досвіду Volcano Ark.

Підсумок

Завдяки єдиній мультимодальній архітектурі, нативній спільній генерації аудіо-відео, фізично точному руху, узгодженості персонажів і режисерському контролю камери Seedance 2.0 переносить генерацію відео ШІ від «точкової можливості» до «керованого по всьому пайплайну промислового створення». Бренди, продюсерські команди та окремі творці можуть вбудувати цю можливість у наявні робочі процеси і отримувати більш узгоджений та професійний аудіовізуальний контент за менше кроків. Seedance 2.0 покликаний стати однією з ключових частин інфраструктури мультимодального створення відео.