Una IA que permite a cualquiera, y en cuestión de segundos, clonar la voz de cualquier otra persona (o, por supuesto, de uno mismo) está empezando a arrasar en Internet. El polémico pero popular foro 4chan, sin ir más lejos, viene siendo inundado con deepfakes de audio de celebridades como Emma Watson o Joe Rogan llenos de comentarios violentos o pornográficos.
Y todo desde que, este pasado fin de semana, se abriera públicamente el acceso a la plataforma ElevenLabs, quizá una de las muestras más significativas de cuánto han avanzado las tecnologías basadas en IA dedicadas a la clonación y síntesis de audio.
Al margen del innegable realismo de su síntesis de voz (a años luz de voces enlatadas como Loquendo, tan popular hace años), la propia compañía presume de que los clips de audio que genera requieren de poca o ninguna edición, lo que incentiva su uso en tareas como el doblaje o la producción de audiolibros:
AI narrates The Great Gatsby.Listen to a fragment from the classic by F. Scott Fitzgerald. Narrated by a fully AI-generated voice. No corrections were made. pic.twitter.com/vQdorBjQK6— ElevenLabs (@elevenlabsio) January 29, 2023
Cuando surgieron los deepfakes de vídeo, todos pensamos que se inauguraba una era de desinformación masiva... y al final su principal aplicación fue la generación de porno. Está por ver qué pasará con sus equivalentes en audio
En Xataka
No te creas nada de lo que oigas, llegan …