Si le pidiéramos a cualquier 'usuario medio' que nos dijera cuál es el mejor modelo de IA (al menos, de IA generadora de texto) la mayoría de la gente respondería "ChatGPT". Al fin y al cabo, lo lleva siendo desde su lanzamiento, pese a la creciente competencia. Y, sin embargo, aunque sin hacer aún mucho ruido, el statu quo de la IA parece estar cambiando.
Hace casi un mes, nos hacíamos eco del lanzamiento del modelo de lenguaje Claude 3, desarrollado por Anthropic, y que desembarcaba en el mercado apuntando maneras... tanto, que se estrenaba superando a GPT-4 en diversas pruebas que medían toda clase de habilidades.
Después, supimos que Claude 3 rivalizaba incluso con los seres humanos en cociente intelectual e, incluso, según la interpretación de algunos expertos, en autoconsciencia.
Chatbot Arena ha hablado
Ahora, el prestigioso ranking Chatbot Arena (que evalúa, como su nombre indica, a las IAs que se usan como 'cerebros' de los chatbots) se ha pronunciado. Y la conclusión es que GPT-4 ya no es el rey de la categoría: ¡larga vida a Claude 3!
Chatbot Arena es una iniciativa de la organización Large Model Systems (LMSYS ORG) en colaboración con varias universidades de renombre, y ya se ha convertido en referencia para la evaluación objetiva de los modelos de lenguaje a gran escala (LLMs).
Gracias a un método interactivo que permite a los usuarios votar por el modelo que mejor responde a sus consultas o tareas …