Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Microsiervos

Publicado en: 28/02/2025 06:27

Escrito por: [email protected] (Alvy)

El «valle inquietante» conversacional de la voz artificial también existe, y lo estamos cruzando a pasos agigantados

El «valle inquietante» conversacional de la voz artificial también existe, y lo estamos cruzando a pasos agigantados

En su día hablamos del concepto de «valle inquietante» como ese punto en el que un sistema artificial como un robot o una IA nos resultan demasiado humanos cuando somos conscientes de que no lo son. Hoy en día resulta que con los algoritmos conversacionales de voz también se está ya cruzando ese valle. Pero no es ya que puedan simular la voz humana y te engañen en una llamada de telemárketing; es que están yendo varios pasos más allá.

Un grupo llamado Sesame trabaja muy activamente en este tipo de técnicas, las cuales pueden verse en una nota y una demostración que recomiendo probar. Basta conectar unos auriculares y activar el micrófono y ponerse a hablar con Maya o con Miles.

Sesame trabaja buscando una forma de conversar auténtica, haciendo que la IA conteste, interrumpa (poco) y permita interrupciones. Intenta que la latencia (retardo) sea lo más baja posible y es capaz de adaptar el tono: alegre, seria, dicharachera…

En esta búsqueda de la expresividad y la velocidad emplean nuevos modelos y los combinan de diversas maneras, por ejemplo para que el arranque de las respuestas sean más rápidos. También tiene que analizar lo que la persona está diciendo, y no solo el texto, sino el contexto. Las claves que analiza son, según sus creadores:

Inteligencia emocional: comprende y responde a emociones.
Dinámicas conversacionales: gestiona pausas, interrupciones y énfasis.
Conciencia contextual: adapta tono y estilo a cada situación.
Personalidad coherente: mantiene un comportamiento estable y confiable.

Según las evaluaciones que han …

Top noticias del 28 de Febrero de 2025