Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 14/11/2024 12:45

Escrito por: Marcos Merino

Pensábamos que la IA era muy buena en matemáticas: este nuevo test acaba de demostrar que no es así. Nosotros tampoco lo somos

Las matemáticas avanzadas son un terreno complicado porque no sólo requieren cálculo o reglas, sino también pensamiento lógico preciso y creativo. Además, los problemas matemáticos suelen requerir de una comprensión profunda del contexto, algo que las IA actuales no logran dominar.

Por eso, los actuales modelos de IA (como GPT-4) son muy buenos generando código, textos e imágenes, pero cuando se trata de abordar problemas matemáticos que vayan más allá de lo básico, por requerir de razonamiento avanzado, la prometedora inteligencia artificial naufraga bastante rápido.

Las soluciones matemáticas exigen pensar paso a paso, y un único error puede invalidar todo el trabajo

Por qué FrontierMath es un desafío tan notable

Sí, es cierto: ya existen pruebas como GSM/8K, en las que las IA logran puntuaciones superiores al 90%, pero muchas veces la clave radica en que los resuelven meramente por haber practicado antes con problemas similares (un mero caso de 'contaminación de datos').

Ahora, un nuevo e innovador punto de referencia, FrontierMath, está exponiendo lo lejos que está la IA a la hora de estar en condiciones de suplir a los matemáticos.

En Genbeta

Bill Gates tenía casi decidido ser matemático. Esto fue lo que le hizo apostar por los ordenadores

Esta prueba fue diseñada por Epoch AI con el objetivo específico de exponer estas limitaciones. Los problemas no se parecen a ningún conjunto de datos de entrenamiento existente y requieren razonamiento profundo, …

Lee toda la nota original aquí

Top noticias del 14 de Noviembre de 2024

Notasbit

Las mejores noticias de tecnología en un sólo lugar

Pensábamos que la IA era muy buena en matemáticas: este nuevo test acaba de demostrar que no es así. Nosotros tampoco lo somos

Top noticias del 14 de Noviembre de 2024

Cómo saber si te están escuchando por el micrófono del móvil

Amazon Fire TV lanza nuevas series Omni Mini-LED y Soundbar Plus

YouTube Shorts presenta Dream Tracks: la nueva herramienta de IA para reestilizar música en videos cortos

AMD despide al 4% de su plantilla y redirige recursos al desarrollo de chips de IA

Te explicamos cómo puedes migrar y usar BlueSky: Una alternativa a X o Twitter

La película de superhéroes de la que Ryan Reynolds no quiere hablar y sorpresa, ni de Marvel ni de DC: una producción de 2009 que pocos conocen

Microsoft dice que Xbox ya no es únicamente la consola

Este nuevo teléfono barato de OPPO funcionará con Android 15, es muy resistente y no cuesta ni 115 euros