UNCATEGORIZED

Cómo animar diálogos en video con IA — Guía práctica

junio 7, 2026 4 min de lectura

Hay mucho que contar sobre inteligencia artificial y creación de video. Cada quien tiene su forma de aprender y su manera de aportar valor a su audiencia. La mía es compartir lo que descubro en el trabajo real — lo que me encuentro cada día como creador de videos con IA. Y créanme, siempre hay un nuevo desafío esperando. He superado muchos obstáculos, pero siguen apareciendo.

Lo que quiero mostrarles hoy es cómo crear un video con IA donde dos personajes tienen un diálogo interesante. ¿Es lo más impresionante que se puede hacer con inteligencia artificial? Probablemente no — hay cosas mucho más llamativas. Entonces, ¿por qué molestarse en escribir una guía sobre esto?

Porque, como dije, esto viene del trabajo real. Si estás creando anuncios con IA o contenido para redes sociales — videos para TikTok, reels para Instagram — vas a encontrarte construyendo muchas escenas con diálogo. Es útil para concursos de cine con IA, contenido explicativo, publicidad, humor y cientos de aplicaciones creativas más. Y si en este momento estás bloqueado creativamente, el diálogo puede ser exactamente el ángulo que vale la pena explorar.

A veces no sabes por dónde empezar

Cuando entré al mundo de la IA, la capacidad de generar 8 segundos de animación cuadro por cuadro (fotograma inicial + fotograma final) parecía magia. Cada escena había que descomponerla en planos individuales, y generabas enormes cantidades de imágenes y clips cortos para expresar algo complejo. Luego llegó Seedance 2 y simplificó todo.

Pero que todo sea más simple no significa que tu cabeza lo siga. Seguimos tendiendo a complicarlo — a darle demasiadas vueltas, a romper todo en mil micro-pasos por costumbre. Ese es probablemente un problema de los de la vieja escuela. Cuando te han entrenado para descomponer cada idea en un desglose cuadro por cuadro, soltar ese instinto toma un momento.

Guía práctica para crear diálogos en video con IA

Todo lo que necesitas son 3 imágenes y una pista de audio

Una imagen del Personaje A
Una imagen del Personaje B
Una imagen de ambos juntos
El diálogo — un archivo de audio que creaste con ElevenLabs

Tres imágenes de personajes para el diálogo en video con IA

Las herramientas: GPT-4o para generar las imágenes (aunque cualquier generador puede funcionar), y Seedance 2 como modelo de video. Kling también podría funcionar técnicamente, pero Seedance es la opción más fluida y capaz disponible ahora mismo — así que esta guía está construida alrededor de él.

Algo importante sobre la duración del diálogo: mi diálogo dura aproximadamente 30 segundos, pero Seedance 2 limita el audio de entrada a 13 segundos. Así que generé solo la primera mitad en ElevenLabs — exactamente 13 segundos — y luego construí la segunda parte por separado, usando el resultado de la primera generación como prompt para la continuación.

Sube las tres imágenes y el archivo de audio a Seedance. Una vez cargados, usa el siguiente prompt:

Use the attached audio file as the master dialogue track and build the scene timing around it.
Shot 1 (0-2s) - Wide Establishing Shot
Both characters sit on the bench beside the Amsterdam canal. Calm atmosphere, subtle idle movements, natural breathing, slight head movements. No dialogue. Establish the relationship between the two characters and the environment.
Shot 2 (2-8s) - Medium Close-Up on the Young Woman
Focus on the young woman with green skin and pink hair. She looks thoughtful and slightly unsettled, gazing away toward the canal as she speaks. Subtle eye movements, natural blinking, introspective expression. Sync lip movements precisely to the audio.
Shot 3 (8-16s) - Medium Close-Up on the Older Woman
Cut to the older woman with blue hair. She slowly turns her eyes toward the young woman while smoking. Calm, philosophical delivery with minimal movement. Slight cigarette motion, subtle facial expressions, occasional blink. Sync lip movements precisely to the audio.
Style: Cinematic, realistic puppet characters, shallow depth of field, natural lighting, smooth cuts, high facial detail, believable eye contact, subtle performance, Amsterdam canal background consistent across all shots. Use the attached audio for dialogue timing and lip sync.

Después de ejecutar el prompt, obtuve esto:

Luego subí ese primer video de vuelta a Seedance — sin imágenes, sin archivo de audio esta vez. Solo un prompt de texto pidiéndole que continuara, con las líneas exactas de diálogo de cada personaje:

Extend this video. The young woman is saying "then who's listening to me right now?". The old woman answers: "Maybe the part of you that doesn't need a name to exist."

Lo que aprendimos

Seedance 2 trabaja con múltiples imágenes de referencia simultáneamente — no hace falta dividir la escena en planos separados manualmente
El modelo acepta un archivo de audio como entrada — y sincroniza los movimientos de labios con sorprendente precisión
Seedance puede construir continuidad — el primer video generado se convierte en la base del segundo

Si quieres profundizar en el trabajo con animación de IA y la construcción de escenas complejas, hay más guías en el blog de Electric Puma.

Síguenos en Instagram para más contenido sobre creación de videos con IA.