GPT-2 y GPT-3, dos inteligencias artificiales desarrolladas por OpenAI, llevan desde el año pasado sorprendiendo al mundo con su capacidad para responder y completar textos de la misma forma en que podría hacerlo un ser humano.
Un ejemplo paradigmático de sus capacidades pueden observarse en el siguiente tuit, en el que se ve a GPT-3 rellenando datos históricos y demográficos sobre EE.UU en un documento Excel: que Alaska se convirtió en un estado en 1906 y que Michigan cuenta con una población de 10,3 millones de personas.
=GPT3()... the spreadsheet function to rule them all.Impressed with how well it pattern matches from a few examples.The same function looked up state populations, peoples' twitter usernames and employers, and did some math. pic.twitter.com/W8FgVAov2f— Paul Katsen (@pavtalk) July 21, 2020
Datos ambos muy factibles, en apariencia, pero... totalmente falsos. El problema de las IA como GPT-3, conocidas como 'modelos de lenguaje' es que son buenas imitadoras (es decir, capaces de reproducir patrones de escritura humanos), pero no están capacitadas para escribir datos ajustados a la realidad porque, sencillamente, no entiendem lo que leen.
Necesitamos IAs que entiendan lo que leen
Y eso reduce terriblemente la utilidad de las inteligencias artificiales. De modo que existen ya intentos de resolver este problema. La startup Diffbot, por ejemplo, ha desarrollado una IA dedicada a la tarea de aprender (o, como mínimo, extraer aquellos datos que sea capaz de reconocer) mediante el revolucionario método de leer. Leer mucho.
…