En la última conferencia para desarrolladores de Microsoft, la compañía anunció su contribución a la carrera de la inteligencia artificial: un software capaz de generar nuevos avatares y voces o replicar la apariencia y el habla de un usuario existente, generando preocupaciones sobre el impulso a la creación de deepfakes, videos hechos por IA de eventos que nunca sucedieron.
Anunciado en el Microsoft Ignite 2023, Azure AI Speech está entrenado con imágenes humanas y permite a los usuarios introducir un guion que puede ser «leído» en voz alta por un avatar fotorrealista creado con inteligencia artificial.
Los usuarios pueden elegir un avatar predefinido de Microsoft o cargar imágenes de una persona cuya voz y apariencia deseen replicar. Microsoft mencionó en una publicación de blog que la herramienta podría ser utilizada para construir «agentes conversacionales, asistentes virtuales, chatbots y más».
La publicación dice: «Los clientes pueden elegir entre una voz neural preconstruida o personalizada para su avatar. Si se usa la voz neural personalizada y la apariencia de la misma persona para el avatar, este se parecerá estrechamente a esa persona».
La compañía aseguró que el nuevo software de texto a voz se lanza con una serie de límites y salvaguardias para prevenir el mal uso.
«Como parte del compromiso de Microsoft con la IA responsable, el avatar de texto a voz está diseñado con la intención de proteger los derechos individuales y sociales, fomentar una interacción transparente entre humanos y computadoras, y contrarrestar la proliferación de deepfakes perjudiciales y contenido engañoso.
Los clientes pueden cargar su …