OpenAI continúa presentando novedades para ChatGPT. En su más reciente actualización, la compañía ha revelado que su chatbot de inteligencia artificial ahora tendrá una nueva interfaz "más intuitiva", además de un nuevo soporte para dar indicaciones usando la voz.
Adicionalmente, será posible mostrarle a la IA una imagen de referencia o fotografía para tener una conversación a partir de ese contenido, para por ejemplo, tomar fotos de lo que hay en la despensa del refrigerador y obtener posibles recetas a preparar.
Hablando con ChatGPT
ChatGPT ya contaba con soporte para indicaciones de voz, pero se limitaba a grabar lo que el usuario decía, procesarlo e ingresarlo en el bloque de texto de su interfaz. Ahora es posible tener una "conversación" casi en tiempo real con el chatbot, ya que, además de escuchar, también cuenta con voz para responder.
En total, ChatGPT incluye cinco voces diferentes que se podrán activar desde la sección "configuración" y "nuevas funciones".
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.Sound on 🔊 pic.twitter.com/3tuWzX0wtS— OpenAI (@OpenAI) September 25, 2023De acuerdo con OpenAI, esta capacidad está impulsada por un nuevo modelo de conversión de texto a voz que puede generar audio "similar al humano" a partir de texto, produciendo en pocos segundos una muestra de voz.
Para este reconocimiento de voz, OpenAI revela que se usa Whisper para transcribir las palabras …