O Seedance 2.0 está fazendo sucesso no mundo todo. Esta atualização tem uma palavra-chave de verdade: referência multimodal. Imagem, vídeo, áudio e texto podem ser combinados na entrada; você atribui o papel de cada recurso com “@nome do recurso” e a criação de vídeo fica mais controlável.
Site oficial: chat.gpt4.chat
Este post escolhe 10 casos representativos da biblioteca oficial: consistência de personagem, clone de movimento, extensão de vídeo, edição, efeitos de legenda, continuidade de plano e sincronia com o beat. Aqui estão, um a um.
01 Consistência de personagem
“Substituir a garota em @video1 por uma dan (花旦) de ópera, cena em um palco elegante. Referenciar @video1 para movimento de câmera e transições, fazer a lente acompanhar o movimento do personagem, estética de palco forte, alto impacto visual.”
Capacidade central: manter movimento e câmera, trocar só o assunto. Bom para troca de papel e adaptação de IP.
02 Consistência de produto
“Criar apresentação comercial para a bolsa em @image2. Usar @image1 para a vista lateral e @image3 para o material da superfície. Mostrar todos os detalhes da bolsa. Música de fundo grandiosa e atmosférica.”
Fusão multi-imagem; estrutura e material do produto controláveis separadamente. Muito prático para e-commerce.
03 Clone de movimento de dança
“Usar a estrela de @image1 como assunto. Referenciar @video1 para movimentos de câmera push/pull/pan rítmicos. Os movimentos da estrela também referenciam a dança da mulher em @video1. Atuação animada no palco.”
Clone duplo de movimento + câmera. Clona tanto a imagem quanto o ritmo.
04 Clone de movimento de artes marciais
“Referenciar video1 para ações do personagem e video2 para linguagem de câmera em órbita. Gerar luta entre personagem1 e personagem2. Luta à noite sob as estrelas, poeira branca durante a luta, luta ornamentada e tensa.”
Uso de vários vídeos de referência separadamente. Ação e linguagem de câmera controláveis de forma independente.
05 Replicação de plano comercial
“Referenciar movimento de câmera e ritmo de corte de video1. Replicar com o superesportivo vermelho de image1.”
Replicação de ritmo de anúncio clássico. Aplicável diretamente a promos de produto.
06 Extensão de vídeo
“Estender o vídeo de 15 s. Referenciar @image1 e @image2 para o personagem burro-na-moto. Adicionar segmento de anúncio criativo: Plano 1: ângulo lateral fixo, burro na moto sai da cerca, galinhas se assustam. Plano 2: burro na moto em círculos na areia, primeiro close do pneu, depois corte para vista aérea, poeira. Plano 3: montanha nevada ao fundo, burro de bicicleta saltando ladeira. Slogan atrás do assunto, mascarado para aparecer ‘Inspire Creativity, Enrich Life’. Fim com a bike passando e poeira.”
Teste da capacidade “continuar o plano”. Chave: luz e movimento se conectarem naturalmente.
07 Edição de vídeo (virada na história)
“0–3 s: Homem de terno no bar, calmo, girando suavemente a taça. Push-in lento, iluminação high-end, tom sério. Homem diz em voz baixa ‘Este negócio é grande.’ 3–6 s: Mulher atrás pergunta nervosa ‘Quão grande?’ Ele olha, voz baixa: ‘Muito grande.’ Corte para close da mão—ele pousa a taça. 6–9 s: De repente ele puxa de baixo da mesa—uma caixa de snacks exagerada, ‘tum’ na mesa. 9–12 s: A mão da mulher na cintura passa de tensa a relaxada. 13–15 s: Homem lhe dá um snack. Câmera recua para o bar, imagem desvanece—legenda: ‘Por mais ocupado, lembre de um snack~’”
Reescrita local da história. Teste de controle de edição e narrativa.
08 VFX de legenda
“Abrir em preto. Referenciar video1 para efeito de partículas e material. Areia dourada da esquerda para a direita. Referenciar @video1 para dispersão de partículas. O texto de @image1 aparece gradualmente no centro.”
Controle de efeito de partículas e texto. Utilizável diretamente para aberturas.
09 Plano contínuo único
“@image1 @image2 @image3 @image4 @image5. Um único plano de seguimento contínuo: seguir o corredor da rua pelas escadas, corredor, telhado, terminando na vista da cidade.”
Teste de continuidade espacial e consistência física. Indicador importante de maturidade do modelo.
10 Sincronia com o beat musical
“@image1 a @image6 paisagens. Referenciar @video para o ritmo de quadro; fazer o estilo de transição e o beat musical coincidirem.”
Sincronização áudio-visual. Bom para MV e reels de paisagem.
Para concluir
Depois desses 10 casos, uma coisa fica clara: o que o Seedance 2.0 realmente melhora não é “exibição” e sim controle. Se os personagens são estáveis, o movimento coerente, os planos lógicos e o ritmo controlável—isso antes exigia edição, correção de cor e pós em equipe. Agora está sendo integrado em um modelo. Ainda não substitui totalmente equipes profissionais, mas já dá a criadores individuais algo próximo do “nível diretor”. Isso importa.
Se você dedicar tempo a entender a lógica da referência multimodal em vez de digitar um prompt e esperar um milagre, o teto do Seedance 2.0 é mais alto do que você imagina.
Experimente agora: chat.gpt4.chat