Después de que internet se llenase de fotografías tuneadas al estilo Ghibli la semana pasada gracias a la generación de imágenes de GPT-4o y que la anterior nos bombardearan con muñecos de acción personalizados a partir de una foto, estos días OpenAI ha lanzado al mundo o3 y o4-mini y aunque prometen un sinfín de mejoras y novedades, ha habido una consencia mucho más mundana y peligrosa: la gente está usando ChatGPT para averiguar dónde se ha tomado una foto.
Porque ChatGPT ya no solo genera imágenes con precisión y buenos resultados o describe imágenes de forma exhaustiva, sino que gracias a o3 y o4-mini es capaz de razonar a partir de fotografías y lo hace con un acierto tan sorprendente que asusta. Y a los hechos me remito: ha sido capaz de averiguar dónde vivo con una foto bastante random de la calle.
No hay GeoGuessr que se le resista a O3 de ChatGPT
Sí, antes ya describía a fondo tanto y de sus datos podía obtener información clave para localizar, pero ahora recorta, rota, hace zoom en las imágenes (incluso aunque estén borrosas y con mucho ruido) para un análisis que deja con la boca abierta. Si juntamos por un lado esa capacidad de análisis visual y por otro la habilidad de los modelos para buscar en internet, tenemos un monstruo para localizar geográficamente una foto. Con lo último de OpenAI, ChatGPT se pasa GeoGuessr de calle.
Así, o3 resulta …