Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 08/04/2025 07:00

Escrito por: José Alberto Lizana

El modelo Llama 4 de Meta sorprendió por sus buenos benchmarks. Ahora se ha visto que estaban alterados

Este sábado Meta lanzó sus nuevos modelos de Llama 4: Scout y Maverick. La compañía destacó entre sus principales avances la capacidad de comprensión visual mejorada, que busca ofrecer una experiencia más personalizada. La atención se centró especialmente en Maverick, que prometía superar a competidores como GPT-4o y Gemini, según los primeros resultados publicados por la plataforma de referencia LMArena.

LMArena evalúa modelos de lenguaje de manera sencilla, pero efectiva: diferentes IA responden a una misma pregunta y, posteriormente, una persona valora cuál es la mejor respuesta. Es, en esencia, un enfrentamiento directo entre inteligencias artificiales en una arena virtual, del que sale una puntuación que genera el ránking global.

La valoración del modelo enviado con Meta no se correspondía con la realidad

Según Meta, Maverick obtuvo una puntuación de 1.417 puntos, colocándose rápidamente en segunda posición, por delante de GPT-4o y Gemini 2.5 Pro. Sin embargo, las cosas comenzaron a desmoronarse cuando los investigadores analizaron la documentación de Meta donde se refleja:

Llama 4 Maverick ofrece la mejor relación rendimiento-costo de su clase con una versión de chat experimental con puntuación ELO de 1417 en LMArena.

Esto reveló que el modelo evaluado no era el mismo que Meta había puesto a disposición de los usuarios, sino una versión experimental optimizada específicamente para destacar en las preferencias humanas. Dicho de otro modo, el modelo había sido ajustado para ofrecer respuestas más atractivas a los evaluadores humanos.

Desde LMArena reaccionaron rápidamente mediante un comunicado en …

Lee toda la nota original aquí

Top noticias del 8 de Abril de 2025

Notasbit

Las mejores noticias de tecnología en un sólo lugar

El modelo Llama 4 de Meta sorprendió por sus buenos benchmarks. Ahora se ha visto que estaban alterados

Top noticias del 8 de Abril de 2025

Potencia de gama alta por 267 euros: este smartphone con batería de 6000 mAh y cámara Sony hunde su precio

El error fatídico de Movistar Plus+ que trae sin cuidado a los usuarios de PC: estos ajustes han logrado que no sucediera más

Dyson lanza su primera solución friegasuelos para sus dispositivos y revoluciona la forma que tenemos de limpiar una vez más

¿Por qué las empresas migran a blockchain para pagos internacionales?

Google Maps se vuelve más confiable gracias a la inteligencia artificial

Totalplay ofrecerá internet simétrico gratuito tras reunirse con Profeco

Revelan por qué los precios de los juegos de Nintendo nunca bajan

¿Qué tanto se verá afectado el precio de Switch 2 en México?