El gigante de la inteligencia artificial OpenAI ha dado un paso enorme en la evolución de las herramientas basadas en inteligencia artificial al presentar 'Operator', un agente de IA diseñado para automatizar tareas en la web, desde rellenar formularios hasta realizar reservas o compras online. Ya se veía venir que 2025 sería el año de los agentes autónomos, y esto lo confirma.
¿Qué es Operator y cómo funciona?
Operator, estará disponible inicialmente sólo para los suscriptores Pro de ChatGPT, y puede interactuar con interfaces gráficas de usuario, tal como lo haría un humano (haciendo clics en botones, desplegando menús, haciendo scroll, introduciendo contenido en campos de texto...).
Interfaz de Operator
Así, a través de su modelo "Computer-Using Agent" (CUA), el sistema es capaz de navegar en entornos digitales sin depender de APIs específicas proporcionadas por los sistemas operativos o navegadores.
"El operador puede 'ver' (a través de capturas de pantalla) e 'interactuar' (utilizando todas las acciones que permiten un mouse y un teclado) con un navegador, lo que le permite realizar acciones en la web sin necesidad de integraciones API personalizadas".
"La capacidad de utilizar las mismas interfaces y herramientas con las que los humanos interactúan a diario amplía la utilidad de la IA".
Detalle curioso: durante la 'demo', una de las webs con las que han querido usar la herramienta ha bloqueado el acceso al identificarla como un 'bot'
…