WaveGlow: un nuevo modelo teórico para sintetizar habla

Un equipo de investigadores de NVIDIA han desarrollado recientemente una técnica llamada WaveGlow, que es una red de flujo que puede generar voz a partir de espectrogramas, los cuales son representaciones de los sonidos en el dominio del tiempo y la frecuencia. El método usado, bosquejado en un artículo pre-publicado en arXiv, usa una sola red neuronal entrenada con una sola función de costo, haciendo que el procedimiento de entrenamiento sea más sencillo y más estable.
Te decimos cómo activar el Modo Dios para Windows y qué es lo que hace
“La mayoría de las redes neuronales para sintetizar voz eran muy lentas para nosotros“, comenta Ryan Prenger, uno de los investigadores del estudio. “Estaban limitados en velocidad porque su sistema lo diseñaron para generar una sola muestra a la vez”. Las excepciones fueron un trabajo de Google y Baidu, que generaron audio muy rápidamente en paralelo. Sin embargo, estos enfoques usan redes de maestros y alumnos, que son muy complejas de replicar”.

Los científicos se inspiraron entonces en Glow, una red de flujo basada en OpenAI, la cual puede generar imágenes de alta calidad en paralelo, reteniendo una estructura muy simple. Usando una convolución de 1×1 invertible, Glow permitió obtener resultados notables, produciendo así imágenes realistas. Con ello en mente, los investigadores decidieron usar la misma idea pero en la síntesis del habla.
“Piense en el ruido blanco que aparece en la radio cuando no está ésta sintonizada en ninguna estación”, explica Prenger. “Ese ruido blanco es súper fácil de generar. La …

Notasbit

Las mejores noticias de tecnología en un sólo lugar

WaveGlow: un nuevo modelo teórico para sintetizar habla

Top noticias del 26 de Noviembre de 2018

¿Por qué asegurar navegadores es crucial para su negocio?

El científico loco que quiere que pienses como un niño y vivas el presente

Cinco innovaciones para revolucionar el futuro de los pagos

David Broncano: tecnología hecha chiste

Razones para empezar a usar el Asistente de Google

Donald Trump impondría una tarifa de importación a los iPhone y MacBook fabricados en China

Neon Genesis Evangelion: la legendaria serie de anime llegará a Netflix en México

Huawei podría lanzar un teléfono sin biseles o notch en diciembre