Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 26/02/2025 03:56

Escrito por: Antonio Vallejo

Los investigadores de OpenAI tienen un veredicto: ni siquiera la mejor IA puede resolver la mayoría de problemas de programación

Tras la aparición de cada vez mejores y más avanzados modelos de IA, herramientas tales como ChatGPT, Gemini, Copilot y otras tantas son utilizadas a diario para todo tipo de propósitos, algunos cada vez más complejos. Si bien ahora empezamos a ver toda una oleada de modelos con modos de razonamiento profundo, aún hay tareas de las que no podemos depender enteramente del desempeño de este tipo de asistentes.

Sin ir más lejos, investigadores de OpenAI han admitido que, incluso los modelos más avanzados de IA aún no pueden superar a los programadores humanos. Si bien Sam Altman, máximo responsable de la compañía, insiste en que la IA logrará superar a los ingenieros de software de ‘bajo nivel’ a finales de este año, el estudio lanzado por unos investigadores de OpenAI difiere en esa afirmación.

Los modelos de IA son cada vez más avanzados, pero no superan a un programador de software

En este paper, los investigadores de la firma concluyeron que, incluso aquellos modelos más sofisticados, “siguen siendo incapaces de resolver la mayoría de las tareas de programación”. Para ello, utilizaron un benchmark desarrollado recientemente denominado SWE-Lancer.

Este benchmark ha sido desarrollado con la ayuda de más de 1.400 problemas de desarrollo de software del sitio web para programadores autónomos Upwork. Habiendo hecho uso del benchmark, los investigadores hicieron la prueba con tres modelos de IA: o1, GPT-4o y Claude 3.5 Sonnet de Anthropic.

Resultados de los modelos de IA en el benchmark …

Lee toda la nota original aquí

Top noticias del 26 de Febrero de 2025

Notasbit

Las mejores noticias de tecnología en un sólo lugar

Los investigadores de OpenAI tienen un veredicto: ni siquiera la mejor IA puede resolver la mayoría de problemas de programación

Top noticias del 26 de Febrero de 2025

Los mejores 6 portátiles con Inteligencia Artificial que puedes comprar ahora mismo

Roaming vs eSIM: diferencias y cuál es mejor para viajar

Cuándo, a qué hora y cómo ver el Pokémon Presents 2025 desde México: el evento con los nuevos juegos y contenidos de Pokémon

OpenAI amplía el acceso a Deep Research y aviva la competencia en la investigación con IA

Se cayó Facebook hoy, usuarios reportan fallas

Lanzamiento confirmado, Samsung prepara la nueva serie Galaxy A

Esta televisión 4K con pantalla QLED de 50 pulgadas y Dolby Atmos es una ganga (su precio ha caído 200 euros)

Microsoft presentó «Muse» una inteligencia artificial para crear escenas de videojuegos