Durante décadas, la robótica ha sido un elemento esencial en nuestras visiones del futuro. Sin embargo, hasta ahora, la tecnología necesaria para hacer realidad estos sueños han sido esquiva. Google DeepMind ha presentado un avance significativo en la robótica que nos acerca a un futuro lleno de robots útiles. Se trata del Robotics Transformer 2 (RT-2), un modelo de visión-lenguaje-acción (VLA) sin precedentes. El RT-2, un modelo basado en Transformers y entrenado con texto e imágenes de la web, puede generar directamente acciones robóticas. Al igual que los modelos de lenguaje se entrenan con texto de la web para aprender