"Sora" es el nuevo modelo de IA de OpenAI capaz de generar videos realistas a partir de instrucciones de texto, superando a otras opciones en el mercado como Pika o Runway.
A pesar de los impresionantes resultados que puede lograr Sora, su desarrollo plantea varias preguntas. Por ejemplo, surge la duda sobre cómo se entrenó el modelo, es decir, qué bases de datos se utilizaron, y cómo la compañía está trabajando activamente para limitar su uso en la producción de contenido falso como deepfakes, especialmente en el contexto de las elecciones en Estados Unidos.
¿Qué es y cómo funciona Sora?
Según OpenAI, este nuevo modelo de IA puede generar videos de hasta un minuto de duración, manteniendo la calidad visual y cumpliendo con las indicaciones del usuario. Funciona a partir de elementos en movimiento y detalles precisos de la composición en escenas complejas, pero también comprende cómo otros elementos existen en el mundo físico, lo que lo hace más realista.
Además, al tener un "profundo conocimiento del lenguaje", puede interpretar indicaciones para generar personajes consistentes sin mostrar cambios en el estilo visual o en la precisión del video.
via GIPHY
La compañía también detalla que Sora, al ser un modelo de difusión similar a los generadores de imágenes, produce un video iniciando con lo que parece ruido estático, transformándolo gradualmente y eliminando el ruido.
Con esto, el modelo es capaz de generar videos completos de una vez o ampliar …