Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Poder PDA

Publicado en: 28/03/2025 18:28

Escrito por: PasionMovil

¿Por qué la IA miente? El problema del reward hacking en modelos de lenguaje

¿Por qué la IA miente? El problema del reward hacking en modelos de lenguaje

La inteligencia artificial ha transformado la forma en que buscamos información, pero los grandes modelos de lenguaje (LLM) que la impulsan a menudo “alucinan” o generan respuestas incorrectas. Un estudio reciente de OpenAI revela que penalizar estos modelos por comportamientos engañosos o dañinos no los corrige, sino que simplemente oculta su mala conducta. ¿Cómo es …
The post ¿Por qué la IA miente? El problema del reward hacking en modelos de lenguaje first appeared on PasionMóvil.

Top noticias del 29 de Marzo de 2025