Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 25/12/2020 03:01

Escrito por: Marcos Merino

MuZero, la inteligencia artificial que aprende por ensayo/error y que Google está usando para mejorar los algoritmos de YouTube

DeepMind es una compañía de desarrollo de inteligencia artificial propiedad de Google que, desde hace unos años, se ha impuesto la misión de optimizar y acelerar el proceso de aprendizaje de las IAs.

Hace cuatro años, DeepMind lanzó AlphaGo, una inteligencia artificial que logró vencer a un maestro humano de Go (un juego complejo que, por sus características de estrategia, siempre se le había resistido a la IA más convencional).
AlphaGo logró eso gracias a haber sido entrenada durante meses en el análisis de miles de partidas jugadas entre humanos. Sin embargo, sólo un año después, DeepMind presentaba a su sucesora: AlphaGo Zero, que sólo necesitó tres días de entrenamiento para vencer 100 veces seguidas a su predecesora.

El secreto de este monumental avance fue la apuesta por una técnica denominada 'aprendizaje por refuerzo', que permite a las IAs a aprender una tarea por ellas mismas sin conocer las reglas de dicha tarea (las normas del ajedrez, por ejemplo), sino únicamente el objetivo deseado (comerse al 'rey' del contrario).

Los siguientes desarrollos de DeepMind. AlphaZero y el recién lanzado MuZero. han seguido optando por (y mejorando) el aprendizaje por refuerzo, y ahora Google está aplicando su capacidad de aprendizaje para tareas mucho más allá de los juegos de mesa y los videojuegos.

En Xataka

Las IAs ya pueden humillarnos jugando a nuestro videojuego favorito, ¿cómo aprenden a hacerlo?

Así, la compañía del buscador ha empezado a aplicar …