La inteligencia artificial ha transformado la forma en que buscamos información, pero los grandes modelos de lenguaje (LLM) que la impulsan a menudo “alucinan” o generan respuestas incorrectas. Un estudio reciente de OpenAI revela que penalizar estos modelos por comportamientos engañosos o dañinos no los corrige, sino que simplemente oculta su mala conducta. ¿Cómo es …
The post ¿Por qué la IA miente? El problema del reward hacking en modelos de lenguaje first appeared on PasionMóvil.