Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 19/02/2024 09:48

Escrito por: Marcos Merino

Sora nos acerca más a la 'IA general'... pero no por generar vídeos, sino por simular mundos

Sora nos acerca más a la 'IA general'... pero no por generar vídeos, sino por simular mundos

En el mundo de la inteligencia artificial, el reciente lanzamiento de Sora por parte de OpenAI ha marcado, para muchos, un antes y un después con el lanzamiento de Sora.

Sin embargo, lo verdaderamente revolucionario de Sora no radica en su habilidad para crear vídeos ultrarrealistas de alta calidad, sino en su potencial como simulador del mundo físico... y en cómo eso podría acercarnos a la 'IA General'.

Sora combina modelos de difusión, similares a los utilizados en DALL-E 3, con una arquitectura de transformadores, similar a la que permite funcionar a ChatGPT. Esto le permite procesar secuencias temporales de imágenes como si fueran textos, lo que a su vez se traduce en:

Vídeos con una adherencia impresionante al texto.
Creación de nuevos vídeos a partir de videos existentes.
Posibilidad de prolongar los vídeos agregando transiciones a nuevas escenas.
Capacidad de crear bucles.

Cuando hablamos de 'transiciones a nuevas escenas' no nos referimos a un fundido a negro, sino a esto:








Sora no es simplemente un modelo de generación de video; es una ventana hacia la creación de mundos interactivos 3D y la simulación de interacciones físicas realistas

Y cosas así sólo son posibles porque el análisis de grandes cantidades de vídeos permitirían a la IA, en teoría, aprender implícitamente las reglas físicas que gobiernan nuestro mundo.

No es que sea Sora sea perfecto, ni mucho menos: todavía demuestra estar sujeto a limitaciones, como reconocer correctamente la causa …

Top noticias del 19 de Febrero de 2024