En estos últimos días, tanto OpenAI (inmerso en su campaña de 12 días consecutivos de anuncios navideños) como Google han ofrecido novedades relativas a sus principales IAs, ChatGPT (y Sora), por un lado, y Gemini, por otro. Mientras que la compañía liderada por Sam Altman ostenta el liderato en la carrera por la IA, Google está obligado a ser más ambicioso y superar el listón impuesto por su rival.
Y todo indica que el asalto de esta semana se lo lleva Google, que, con el lanzamiento de Gemini 2.0 Flash, logra marcar un hito en la evolución de la IA multimodal (combinando texto, imágenes, vídeo y audio en tiempo real) y redefinir cómo interactuamos con la tecnología.
Y de paso, claro, también intensifica la competencia entre los gigantes del sector.
Gemini 2.0 Flash: La revolución multimodal en tiempo real
El lanzamiento de Gemini 2.0 Flash representa un cambio de paradigma en la IA. Ahora, los usuarios pueden interactuar en tiempo real con vídeos capturados desde sus teléfonos móviles, algo que antes sólo habíamos podido ver en demostraciones. A través de Google AI Studio, cualquiera puede probar esta tecnología, que promete aplicaciones revolucionarias en educación, creación de contenido y más.
¿Qué ofrece Gemini 2.0? ¿Y qué tiene de especial?
Empecemos respondiendo por el final: su sistema de análisis de vídeo en tiempo real es gratis, está disponible en escritorio y se puede usar en la UE... mientras que su función rival para ChatGPT …