La retroalimentación humana hace que la IA pueda engañarnos mejor, según un estudio
En un estudio previo a revisión los investigadores hallaron que entrenar a un modelo de lenguaje con retroalimentación humana le enseña a generar respuestas incorrectas.