Stable Diffusion ha sido la gran novedad de 2022 en el mundo de la inteligencia artificial. Cuando ya todos estábamos con la boca abierta gracias a otras IAs generadoras de imágenes, como DALL-E 2 y MidJourney, de pronto, a finales de verano, llegó este otro modelo de IA con la novedad de su condición 'open source' y, con ella, de su infinita disponibilidad y adaptabilidad para toda clase de proyectos, desde la generación de desnudos (bloqueada en la versión original) hasta su implementación como plugin en editores de imágenes.
Es tal la adaptabilidad de Stable Diffusion que hay quien ha logrado llevarlo un paso más allá, usándolo como base para crear ("por mero hobby") una nueva IA que ni siquiera genera ya imágenes, sino música. O quizá lo más correcto sería decir que genera imágenes con música (y no estamos hablando de vídeos).
Stable Diffusion es un modelo de IA que permite que lo optimicemos para generar tipos muy concretos de imágenes: acuarelas, estética 'manga' o... como en este caso, espectrogramas
Y es que Seth Forsgren y Hayk Martiros, los dos creadores de Riffusion (tal es su nombre) está optimizada para generar espectrogramas, representaciones gráficas del espectro de una señal con la particularidad de poder 'traducirse' a clips de audio. En declaraciones de ambos a Techcrunch,
"Hayk y yo tocamos juntos en una pequeña banda, y comenzamos el proyecto simplemente porque amamos la música y no sabíamos si sería posible para Stable Diffusion crear una imagen …