Seguimos con el capítulo 17 de “Inteligencia artificial generativa para gente real. Tu brújula para usarla bien”, una serie semanal para la Cadena Ser, en «A vivir Cantabria». Hoy seguimos profundizando en la IA generativa de vídeo, continuando con lo avanzado la semana pasada.
¿Recuerdas aquel vídeo viral de Will Smith comiendo espaguetis? Si lo viste en 2023, probablemente te echaste a reír (o tuviste pesadillas). Era un amasijo de rostros derretidos, dedos que se fusionaban con la pasta y bocas multiplicadas. En aquel entonces, muchos sentenciaron que la Inteligencia Artificial nunca lograría nada decente en el terreno audiovisual.
Hoy, apenas dos años después, la historia es radicalmente distinta. Bienvenidos a la segunda parte de nuestro análisis sobre la IA de vídeo, donde vamos a explorar cómo hemos pasado de los «monstruos de feria» a producciones que desafían nuestra capacidad para distinguir la realidad de la ficción. Se puede escuchar el programa aquí, a partir del minuto 41:17: https://cadenaser.com/audio/ser_cantabria_avivircantabria_20260308_130425_140000/
Un viaje en el tiempo: de la pesadilla al hiperrealismo
La evolución tecnológica que estamos viviendo no se mide en décadas, sino en meses. El punto de inflexión absoluto ocurrió en febrero de 2024, cuando OpenAI presentó Sora. De repente, pasamos de los espaguetis de Will Smith a vídeos de personas paseando por Tokio con reflejos perfectos en los charcos y movimientos naturales.
Si hoy lanzamos exactamente el mismo «prompt» (instrucción de texto) de Will Smith en un modelo actual, el resultado es hiperrealista: un hombre sentado a la mesa, comiendo con naturalidad y bajo una iluminación cinematográfica profesional. Es el mismo texto, pero la tecnología ha dado un salto descomunal en un tiempo récord.
El sonido: la pieza que faltaba en el puzle
Hasta hace muy poco, los vídeos generados por IA eran mudos. Eran clips espectaculares, sí, pero vacíos de vida. Si querías audio, tenías que buscar música o efectos por separado.
Esto ha cambiado de forma radical con modelos como Veo, de Google, que ya integran audio nativo. Si le pides un bosque bajo la lluvia, el modelo no solo dibuja las gotas; genera el sonido del trueno y el canto de los pájaros de forma coherente. Incluso podemos generar a una persona y hacer que diga exactamente lo que escribimos, con su voz clonada y una sincronización labial perfecta.
El riesgo y la oportunidad: Esta capacidad de combinar imagen, voz y sincronización hace que los deepfakes sean casi indistinguibles de la realidad. Sin embargo, también abre puertas maravillosas en educación (imagina a un personaje histórico explicando su propia vida) o en accesibilidad (generando vídeos en lengua de signos automáticamente).
Casos reales: ¿qué se está haciendo hoy?
La IA ya no es solo para experimentos rápidos en redes sociales; ha llegado para quedarse en la creación de contenido serio:
Festivales de cine: Ya existen categorías específicas para cortos generados íntegramente con IA. Lo que antes requería un equipo de 20 personas y miles de euros, ahora lo crea una sola persona desde su habitación.
Recreaciones históricas: Desde ver el Titanic zarpando hasta pasear por la antigua Roma. Eso sí, cuidado con los errores históricos (vestimentas o edificios fuera de época), que son, por cierto, una excelente herramienta para entrenar nuestro pensamiento crítico.
El lado oscuro: No todo es creatividad. Hemos visto vídeos falsos de patos robando pan en telediarios, fotos inventadas de accidentes reales (como algunas imágenes generadas al hilo del accidente de tren en Adamuz) o desastres naturales que nunca ocurrieron. Ante esto, la receta es clara: sentido crítico y verificar antes de compartir.
Guía práctica: los 5 ingredientes de un buen prompt de vídeo
Si quieres pasar de «ver» a «crear», no basta con escribir cualquier cosa. Escribir un buen prompt es un arte. Aquí tienes mis cinco claves fundamentales:
La acción: La IA necesita movimiento. No pidas un «perro en la playa», pide un «golden retriever corriendo por la orilla y salpicando agua».
Movimiento de cámara: Dale intención cinematográfica. Usa términos como «plano aéreo de dron», «cámara siguiendo al sujeto» o «zoom lento».
Iluminación y ambiente: Define la atmósfera. «Luz dorada de atardecer», «neones nocturnos» o «ambiente brumoso».
Estilo visual: Sé específico. ¿Quieres realismo, animación tipo Pixar, blanco y negro clásico o estética de acuarela?
Simplicidad: Mi consejo de oro: menos es más. No satures a la IA con quince elementos. Un sujeto, una acción y un escenario claro funcionan mucho mejor.
¿Sustituirá la IA a los profesionales?
Es la pregunta del millón. Mi visión es clara: el perfil profesional está mutando. Los editores y animadores que usan estas herramientas están multiplicando su capacidad, haciendo en una tarde lo que antes les llevaba una semana.
Los trabajos más mecánicos y repetitivos desaparecerán, pero nacerán otros nuevos: supervisores de calidad, especialistas en flujos de IA, etc. La IA no sustituye al creativo, pero el creativo que usa la IA probablemente sustituirá al que no lo haga.
Estamos viviendo un momento histórico. Lo que hace dos años era un chiste, hoy está cambiando el cine, la educación y la publicidad. Y lo mejor de todo es que no necesitas un ordenador de la NASA para empezar; solo curiosidad y ganas de experimentar.
¿Te atreves a crear tu primer clip profesional? Cuéntame en los comentarios qué idea te gustaría ver hecha realidad con IA y te ayudo a dar con el prompt perfecto.
¡Hasta la semana que viene!

