En los dos últimos años hemos visto cómo la inteligencia artificial ha ido conquistando Internet a través de múltiples herramientas y aplicaciones. Además de los chatbots existentes, hoy día podemos encontrar herramientas muy realistas para generación de imágenes, de audio, de vídeo e incluso para pasar de audio a vídeo. Para lo último mencionado, Alibaba tiene preparada una sorprendente herramienta que nos permitirá hacer que cualquier imagen cobre vida mediante una canción o con tan solo hablar.
El gigante chino ha desarrollado una aplicación que nos permite tomar una imagen como referencia y una pista de audio y combinarlas para generar un vídeo de la persona que aparece en la foto cantando o hablando. Si bien esta técnica no es nueva, sí es la primera vez que vemos resultados tan realistas.
Alibaba crea EMO, la IA que convierte una foto y un audio en vídeo
El equipo de investigadores del instituto de inteligencia computacional en Alibaba han llamado a su IA ‘EMO’, un acrónimo de ‘Emote Portrait Alive’. La herramienta es capaz de animar la fotografía de un retrato y generar vídeos de la persona mientras habla o canta.
A través de la página oficial del proyecto se han mostrado múltiples ejemplos del funcionamiento de esta tecnología. Desde Alibaba han creado además un ejemplo tomado del vídeo que mostró OpenAI con Sora, su IA para generar vídeos realistas. Según el documento del estudio, la IA es capaz de crear movimientos faciales fluidos y expresivos, así como poses de cabeza que …