El mismo día en que Google presentaba Gemini 1.5, lanzando el mensaje de cuán en serio se toma retar el liderazgo de ChatGPT en el ámbito de los chatbots, la compañía desarrolladora de este último, OpenAI, ha optado por lanzar otro mensaje: "Ya tenemos una IA de generación de texto y otra de generación de imágenes... sólo nos faltaba el vídeo, y acabamos de solucionar eso".
Y, lo ha logrado lanzando Sora, un modelo generativo capaz de convertir texto en vídeos de hasta 60 segundos, una extensión notablemente superior a la mayoría de sus rivales en este campo, como Pika o Runway.
Y así, marcamos, otro momento crucial en la carrera tecnológica de la IA generativa.
Una ventana al futuro de la creación de vídeos
Sora representa un salto cualitativo en la generación de contenido, permitiendo a los usuarios crear escenas realistas relativamente extensas a partir de simples descripciones textuales en lenguaje natural.
Este modelo no solo es capaz de generar imágenes en movimiento, sino que también comprende y ejecuta instrucciones detalladas sobre el movimiento de los personajes y la ambientación de las escenas.
Prompt: Tour of an art gallery with many beautiful works of art in different styles.
Prompt: Historical footage of California during the gold rush.
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. …