Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 28/03/2025 09:50

Escrito por: José Alberto Lizana

El gran logro de GPT-4o no son las imágenes tipo Ghibli, sino cómo ejecuta nuestros prompts para conseguir lo que parecía imposible

El gran logro de GPT-4o no son las imágenes tipo Ghibli, sino cómo ejecuta nuestros prompts para conseguir lo que parecía imposible

Que una inteligencia artificial genere una imagen de una copa llena hasta los bordes puede parecer una tarea muy sencilla. Sin embargo, la realidad es que hasta ahora esto ha sido un gran reto, en parte por la limitación de sus datos de entrenamiento, Ha sido con el nuevo modelo de generación de GPT-4o, que ha destacado por sus espectaculares imágenes de Studio Ghibli, cuando por fin se ha conseguido este logro, tal y como ha compartido Antonio Ortiz.

Detrás de cualquier inteligencia artificial hay una base de datos con una gran cantidad de información, derivada del proceso de entrenamiento. Hasta ahora, la IA se basaba en numerosas imágenes de copas que estaban llenas solo hasta dos tercios de su capacidad, lo que condicionaba los resultados. Esto hacía que fuera casi incapaz de generar una copa totalmente llena, ya que no había recibido el entrenamiento necesario para 'saber' cómo se representa ese escenario.

ChatGPT ha conseguido superar el 'reto de la copa de vino'

GPT-4o ha llegado para cambiar esto. Ahora, no se limitará únicamente a reproducir patrones aprendidos durante su entrenamiento, sino que también comprenderá mejor el prompt que el usuario introduce y tratará de interpretarlo con mayor flexibilidad.





Para entender el porqué de este logro, es necesario acudir a la documentación técnica que proporciona OpenAI de su modelo. Es ahí donde nos llevamos la grata sorpresa: estamos ante un modelo de generación de imágenes autorregresivo.

Tal y como explica Amazon en su …

Top noticias del 28 de Marzo de 2025