La maquinaria de OpenAI a la hora de crear productos de inteligencia artificial no para. Tras el popularísimo ChatGPT, cuya versión GPT-5 podría estar más cerca de lo que parece, o su reciente y prometedor Sora, el sistema para crear vídeos de hasta 60 segundos tan realistas que parecen auténticos, ahora la compañía ha anunciado un nuevo software llamado Voice Engine, capaz de recrear la voz humana con IA.
Así, mientras los deepfakes proliferan, OpenAI perfecciona la tecnología para clonar voces... aunque según la empresa lo hace 'de forma responsable'. Voice Engine lleva aproximadamente dos años en desarrollo y es una expansión de la ya existente API de conversión de texto a voz. La idea es la siguiente: permitir a usuarios y usuarias cargar cualquier muestra de voz de 15 segundos para generar una copia sintética de esa voz.
Como la anteriormente mencionada Sora, Voice Engine todavía no está disponible para el público general. De hecho, se encuentra en fase de pruebas para un pequeño grupo de empresas, lo que da a OpenAI un margen de tiempo antes de un lanzamiento general para seguir depurando el modelo y también, para explicar cómo funciona el modelo y sus implicaciones éticas.
Qué es y cómo funciona Voice Engine
Como cuenta OpenAI en la entrada de su blog destinada a la presentación de Voice Engine, el desarrollo de este software data de finales de 2022 y desde entonces lo ha utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de …